JP2018525728A - コンピュータ環境からのストリーミングデータセットを分析するための分散型機械学習分析フレームワーク - Google Patents

コンピュータ環境からのストリーミングデータセットを分析するための分散型機械学習分析フレームワーク Download PDF

Info

Publication number
JP2018525728A
JP2018525728A JP2018501850A JP2018501850A JP2018525728A JP 2018525728 A JP2018525728 A JP 2018525728A JP 2018501850 A JP2018501850 A JP 2018501850A JP 2018501850 A JP2018501850 A JP 2018501850A JP 2018525728 A JP2018525728 A JP 2018525728A
Authority
JP
Japan
Prior art keywords
data
host device
series
data elements
elements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018501850A
Other languages
English (en)
Inventor
セルゲイ, エー レイジン,
セルゲイ, エー レイジン,
ヨクキ トー,
ヨクキ トー,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sios Technology Corp
Original Assignee
Sios Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sios Technology Corp filed Critical Sios Technology Corp
Publication of JP2018525728A publication Critical patent/JP2018525728A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3419Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45591Monitoring or debugging support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Computation (AREA)
  • Computer Hardware Design (AREA)
  • Probability & Statistics with Applications (AREA)
  • Data Mining & Analysis (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本発明の実施形態は、コンピュータインフラから一連のデータ要素を受信するように構成されたコントローラを含むホスト装置に関し、前記一連のデータ要素は、前記コンピュータインフラの少なくとも1つのコンピュータ環境リソースの少なくとも1つの属性に関連している。前記コントローラは、前記一連のデータ要素の各データ要素に関連する時間統計識別子に基づいて前記一連のデータ要素の各データ要素をデータ保持場所に割り当て、トレーニングデータセットと選択されたデータ保持場所に関連する前記データ要素とを比較して前記一連のデータ要素に関連するデータ異常を検出するように構成されている。前記選択されたデータ保持場所に関連するデータ要素に関連する前記データ異常の検出に応答して、前記コントローラは、データ異常通知を生成するように構成されている。【選択図】図1

Description

企業は、さまざまな構成要素を有するコンピュータシステムを利用する。例えば、これらの従来のコンピュータシステムは、例えばスイッチやルータなどの通信装置によって相互接続された1つ以上のサーバおよび1つ以上のストレージ装置を含みうる。サーバは、動作中に1つ以上の仮想マシン(VM)を実行するように構成されうる。各VMは、1つ以上のアプリケーションまたは作業負荷を実行するように構成されうる。
ある場合において、コンピュータインフラは、当該インフラのさまざまな側面に関する大量のデータを生成しうる。例えば、コンピュータインフラは、関連したVM、ストレージ装置、および通信装置の動作に関連するレイテンシデータを生成しうる。次に、コンピュータインフラは、記憶および/または処理のためにデータをリアルタイムでホスト装置に提供しうる。
コンピュータインフラと共に使用される従来のホスト装置は、さまざまな欠点を抱えている可能性がある。例えば、上記のように、ホスト装置は、コンピュータインフラからリアルタイムデータを受信し、データを記憶および/または処理するように構成されている。しかし、企業は、通常、一定期間にわたって大量のデータを生成する。リアルタイムでデータを受信すると、ホスト装置は、中央のストレージ場所にデータを保持するが、これは、データセットが時間と共に増加するにつれて管理が難しくなる可能性がある。
また、データの変換および処理は、通常、非常に制限され、柔軟性がなく、多くの場合、ホスト装置にハードコードされている。したがって、処理の変更は全て、異なる変換(例えば、使用)の場合に対処するために、時間とエンジニアリングに多額の投資を必要とする。
従来のコンピュータインフラデータ管理技術に比べると、本発明の実施形態は、コンピュータ環境からのストリーミングデータセットを分析するための分散型機械学習分析フレームワークに関する。1つの構成では、ホスト装置は、時間と共にコンピュータまたは企業システムから受信したデータ要素の移動および分析を自動化するように構成された機械学習エンジンを実行する。例えば、機械学習エンジンは、コンピュータ環境に関連する大きな数値データセットを取り込み、分類し、記憶するように構成されたデータ保持機能を含みうる。また、データ保持機能は、ホスト装置によって維持される古くなったデータ要素を識別し再分類することによって、古くなったデータ要素の精度低下に対処するように構成されている。別の例では、機械学習エンジンは、コンピュータインフラに関連する異常アクティビティをほぼ継続的に識別するためのトレーニングデータセットに対して、データ要素(ホスト装置によって保持場所に保持されている)を変換し、分析するようにも構成されている。
1つの構成では、ホスト装置は、保持されたデータセットに基づいてトレーニングデータセットを作成するように構成されている。例えば、ホスト装置は、選択された保持場所にアクセスし、選択された保持場所のデータ要素を分類またはクラスタリングしてトレーニングデータセットを作成するように構成されている。したがって、トレーニングデータセットは、特定のデータセットの学習された行動パターンを定義する。使用時、ホスト装置は、トレーニングデータセットの学習された行動パターンを保持場所から取り出したデータ要素と比較して、コンピュータインフラにおける異常な挙動を示す異常データ要素を検出するように構成されている。
このような構成により、ホスト装置の機械学習エンジンは、必要に応じて異なるアルゴリズム、ツール、およびフレームワークに対してのみならずデータ要素の分散・並行分析の要求に対しても機械学習分析機能を採用するように容易に構成可能である。例えば、ホスト装置の機械学習エンジンの分散構成は、システム管理者に、機械学習エンジンの機能を互いに独立して調整する能力を提供する。
1つの構成では、本発明の実施形態は、ホスト装置においてコンピュータインフラからの一連のデータ要素を分析する方法に関する。本方法は、前記ホスト装置が、前記コンピュータインフラから前記一連のデータ要素を受信するステップを含む。前記一連のデータ要素は、前記コンピュータインフラの少なくとも1つのコンピュータ環境リソースの少なくとも1つの属性に関連している。本方法は、前記ホスト装置が、前記一連のデータ要素の各データ要素に関連する時間統計識別子に基づいて、前記一連のデータ要素の各データ要素をデータ保持場所に割り当てるステップを含む。本方法は、前記ホスト装置が、トレーニングデータセットと、選択されたデータ保持場所に関連する前記データ要素とを比較して、前記一連のデータ要素に関連するデータ異常を検出するステップを含む。本方法は、前記選択されたデータ保持場所に関連するデータ要素に関連する前記データ異常の検出に応答して、前記ホスト装置が、データ異常通知を生成するステップを含む。
1つの構成では、本発明の実施形態は、メモリおよびプロセッサを備えるコントローラを有するホスト装置に関し、前記コントローラは、コンピュータインフラから一連のデータ要素を受信し、また、前記一連のデータ要素の各データ要素に関連する時間統計識別子に基づいて、前記一連のデータ要素の各データ要素をデータ保持場所に割り当てるように構成されている。前記一連のデータ要素は、前記コンピュータインフラの少なくとも1つのコンピュータ環境リソースの少なくとも1つの属性に関連している。前記コントローラは、トレーニングデータセットと、選択されたデータ保持場所に関連する前記データ要素とを比較して、前記一連のデータ要素に関連するデータ異常を検出し、また、前記選択されたデータ保持場所に関連するデータ要素に関連する前記データ異常の検出に応答して、データ異常通知を生成するように構成されている。
上記および他の目的、特徴、および効果は、添付の図面に示したように、本発明の特定の実施形態の以下の説明から明らかになるであろう。添付の図面では、異なる図面を通じて同様の参照文字は同一の部分を示している。図面は、必ずしも一定の縮尺ではなく、むしろ本発明のさまざまな実施形態の原理を説明することに重点が置かれている。
は、1つの構成に係るコンピュータシステムの概略図である。
は、1つの構成に従って構成された、図1のホスト装置によって実行される手順の一例を示すフローチャートである。
は、1つの構成に係る、コンピュータインフラからのデータ要素を処理する図1のホスト装置の概略図である。
は、1つの構成に係る、保持機能を実行する図2のホスト装置の構成を示す図である。
は、1つの構成に係る、トレーニング機能および分析機能を実行する図2のホスト装置の構成を示す図である。
は、1つの構成に係る、一連のデータ要素に対する分類機能の適用を示す図である。
本発明の実施形態は、コンピュータ環境からのストリーミングデータセットを分析するための分散型機械学習分析フレームワークに関する。ホスト装置は、時間と共にコンピュータまたは企業システムから受信したデータ要素の移動および分析を自動化するように構成された機械学習エンジンを実行する。例えば、機械学習エンジンは、コンピュータ環境に関連する大きな数値データセットを取り込み、分類するように構成されたデータ保持機能を含みうる。また、データ保持機能は、ホスト装置によって維持される古くなったデータ要素を識別し再分類することによって、古くなったデータ要素の精度低下に対処するように構成されている。別の例では、機械学習エンジンは、コンピュータインフラに関連する異常アクティビティをほぼ継続的に識別するためのトレーニングデータセットに対して、データ要素の一部を変換し、分析するようにも構成されている。
このような構成により、ホスト装置の機械学習エンジンは、必要に応じて異なるアルゴリズム、ツール、およびフレームワークに対してのみならずデータ要素の分散・並行分析の要求に対しても機械学習分析機能を採用するように容易に構成可能である。例えば、ホスト装置の機械学習エンジンの分散構成は、システム管理者に、機械学習エンジンの機能を互いに独立して調整する能力を提供する。
図1は、ホスト装置25と電気通信するように配置された少なくとも1つのコンピュータインフラ11を含むコンピュータシステム10の構成を示している。コンピュータインフラ11は、さまざまな方法で構成可能であるが、1つの構成では、コンピュータ環境リソース12を含む。例えば、コンピュータ環境リソース12は、例えばコンピュータ化された装置などの1つ以上のサーバ装置14、例えばスイッチやルータなどの1つ以上のネットワーク通信装置16、および例えばディスクドライブやフラッシュドライブなどの1つ以上のストレージ装置18を含む。
各サーバ装置14は、例えばメモリおよびプロセッサなどのコントローラまたはコンピュータハードウェア20を含みうる。例えば、サーバ装置14−1は、コントローラ20−1を含み、サーバ装置14−Nは、コントローラ20−Nを含む。各コントローラ20は、1つ以上の仮想マシン22を実行するように構成可能であり、各仮想マシン(VM)22は、1つ以上のアプリケーションまたは作業負荷23を実行するようにさらに構成されている。例えば、コントローラ20−1は、第1の仮想マシン22−1および第2の仮想マシン22−2を実行可能であり、これらはそれぞれ順に1つ以上の作業負荷23を実行するように構成されている。各コンピュータハードウェア要素20、ストレージ装置要素18、ネットワーク通信装置要素16、およびアプリケーション23は、コンピュータインフラ11の属性に関係している。
1つの構成では、ホスト装置25は、例えばメモリおよびプロセッサなどのコントローラ26を有するコンピュータ化された装置として構成されている。ホスト装置25は、コンピュータインフラ11およびディスプレイ51の両方と電気通信するように配置されている。ホスト装置25は、通信ポート(図示せず)を介して、コンピュータインフラ11の少なくとも1つのコンピュータ環境リソースから一連のデータ要素24を受信するように構成されている。一連のデータ要素24の各データ要素28は、コンピュータ環境リソース12の属性に関連している。例えば、データ要素28は、コンピュータ環境リソース12の計算レベル(計算属性)、ネットワークレベル(ネットワーク属性)、ストレージレベル(ストレージ属性)、および/またはアプリケーションもしくは作業負荷レベル(アプリケーション属性)に関連しうる。また、一構成では、各データ要素28は、例えばコンピュータインフラ11のイベント、統計、および構成などコンピュータインフラ11に関連する追加情報を含みうる。その結果、ホスト装置25は、サーバ装置14のコントローラ構成および利用(つまり、計算属性)、各サーバ装置14の仮想マシンのアクティビティ(つまり、アプリケーション属性)、ならびにコンピュータインフラ11に関連する現在の状態および履歴データに関するデータ要素28を受信しうる。
一連のデータ要素24の各データ要素28は、さまざまな方法で構成可能である。1つの構成では、各データ要素28は、オブジェクトデータおよび統計データを含む。オブジェクトデータは、送信元コンピュータ環境リソース12の関連属性を識別することができる。例えば、オブジェクトデータは、データ要素28を、対応するコンピュータ環境リソース12の計算属性、ストレージ属性、ネットワーク属性、またはアプリケーション属性に関連していると識別することができる。統計データは、少なくとも1つのコンピュータ環境リソースに関連する挙動を特定することができる。
ホスト装置25は、さらに、例えばストリームによって、コンピュータインフラ11からデータ要素28を受信し、動作中にそのデータ要素28の移動および分析を自動化するように構成された分散型機械学習分析フレームワークまたはエンジン27で構成されている。例えば、後述するように、機械学習エンジン27を実行するとき、ホスト装置25は、時間と共にデータ要素28を変換し、記憶し、分析するように構成されている。データ要素28の受信に基づいて、ホスト装置25は、ほぼ継続的にシステム10内の異常を識別するために、コンピュータインフラ11を連続的に分析することができる。
1つの構成では、機械学習エンジン27は、分散して構成されたいくつかの機能を含む。例えば、図3を参照して以下に詳細に述べられるように、機械学習エンジン27は、均一性機能34、データ保持機能40、変換機能42、トレーニング機能43、および分析機能44を含む。このような分散型の構成により、システム管理者は、機械学習エンジン27のさまざまな機能を容易に適合させて、異なるアルゴリズム、ツール、およびフレームワーク構成要素を利用することができる。
図1に戻って、ホスト装置25のコントローラ26は、機械学習分析フレームワーク用のアプリケーションを記憶することができる。例えば、機械学習分析アプリケーションは、コンピュータプログラム製品32からコントローラ26にインストールされる。いくつかの構成では、コンピュータプログラム製品32は、例えば収縮包装パッケージ(例えば、CD−ROMやディスケット、テープなど)のような標準的な市販形態で入手可能である。他の構成では、コンピュータプログラム32は、例えばダウンロード可能なオンライン媒体などの異なる形態で入手可能である。ホスト装置25のコントローラ26上で実行されると、機械学習分析アプリケーションは、ホスト装置25に、時間と共にコンピュータインフラ11から受信したデータ要素28の移動および分析を自動化させる。
図2は、機械学習分析アプリケーション27を実行するときに図1のホスト装置25によって実行される方法の一例を示すフローチャート100である。
図2の工程要素102に記述のとおり、ホスト装置25は、コンピュータインフラ11から一連のデータ要素24を受信するように構成されている。一連のデータ要素24の各データ要素28は、コンピュータインフラの少なくとも1つのコンピュータ環境リソース12の少なくとも1つの属性に関連している。例えば、図3を参照すると、動作中、ホスト装置25は、コンピュータインフラ11の計算、ストレージ、およびネットワーク属性に関するデータ要素28を受信するために、例えばパブリックアプリケーションプログラムインタフェース(API)コール30によって、コンピュータ環境リソース12からデータを要求するように構成されている。上記のように、ホスト装置25は、サーバ装置14のコントローラ構成および利用(つまり、計算属性)、各サーバ装置14の仮想マシンのアクティビティ(つまり、アプリケーション属性)、ならびにコンピュータインフラ11に関連する現在の状態および履歴データに関するデータ要素28を受信することができる。
ホスト装置25は、さまざまな方法でコンピュータインフラ11からデータ要素28を受信することができるが、1つの構成では、ホスト装置25は、ほぼリアルタイムストリームの一部としてデータ要素28を受信するように構成されている。後述するように、ほぼリアルタイムのストリームとしてデータ要素28を受信することによって、ホスト装置25は、コンピュータインフラのアクティビティをほぼ継続的に監視することができる。これにより、ホスト装置25は、時間と共にほぼ継続的にコンピュータインフラ11内の変化に応答して1つ以上のコンピュータ環境リソース12に関連する異常アクティビティを検出することができる。
1つの構成では、図3を続けて参照すると、ホスト装置25は、1つ以上のエンジン機能45を使用して分析するためにデータ要素28を機械学習エンジン27に向けるように構成されている。例えば、上記のように、機械学習エンジン27は、さまざまな方法でデータ要素28を処理するために、多くのエンジン機能45で構成されうる。以下、エンジン機能45のさまざまな例について説明する。
1つの構成では、コンピュータインフラ11からの一連のデータ要素24の受信に応答して、ホスト装置25は、さらなる処理のために一連の正規化データ要素28’を生成するように構成されている。例えば、ホスト装置25は、一連のデータ要素24に均一性機能34を適用して、フォーマットが調整された一連の正規化データ要素28’を生成するように構成されうる。使用時、任意の数のコンピュータ環境リソース12が、独自仕様のフォーマット(例えば、特定のリソース12それ自体に特有のフォーマット)でホスト装置25にデータ要素28を提供することができる。このような場合、ホスト装置25は、データ要素28が後の処理のために正規化されたまたは非独自仕様のフォーマットで提供されるように、データ要素28に均一性機能34を適用するように構成されている。
例えば、ホスト装置25が、コンピュータインフラ11の複数のネットワーク装置16から、各ネットワーク装置16の入力/出力(IO)速度を識別するデータ要素28を受信する場合を想定する。さらに、データ要素28が秒(s)またはミリ秒(ms)でIO速度を識別すると想定する。この場合、ホスト装置25の機械学習エンジン27は、均一性機能34を適用して、データ要素28を一貫した正規化速度(例えば、ms)に整えるように構成されている。別の例では、ホスト装置25が時間と共にデータ要素28を受信するため、データ要素28は、比較的多大な変動を含むストレージ装置18またはネットワーク装置16のそれぞれに関する情報を含むことができる。このような場合、ホスト装置25の機械学習エンジン27は、データ要素28に均一性機能34を適用してデータ要素に関連する平均値を生成するように構成されている。
上記のように、1つの構成では、コンピュータインフラ11は、データ要素28をホスト装置25にストリームとしてほぼリアルタイムで提供するように構成されている。受信の特定の時間に基づいてデータ要素25を分析するために、ホスト装置25は、年齢に基づいてデータ要素28を整理するように構成されている。例えば、図2に示すフローチャート100に戻ると、工程要素104において、機械学習分析アプリケーション27を実行するとき、ホスト装置25は、一組のデータ要素24の各データ要素28に関連する時間統計識別子55に基づいて、一連のデータ要素24の各データ要素28をデータ保持場所60に割り当てるように構成されている。
図4を参照すると、年齢に基づいてデータ要素を整理するために、ホスト装置25は、データ要素28にデータ保持機能40(つまり、水平ロールアップ機能)を適用するように構成されている。上記のように、データ保持機能40は、各データ要素28に関連する時間統計識別子55に従って一連のデータ保持場所60の間でデータ要素28を分離して記憶するようにホスト装置25を構成する。時間統計識別子55は、さまざまな方法で構成可能であるが、1つの構成では、時間統計識別子55は、ホスト装置25がデータ要素28を受信した時間に対するデータ要素28の年齢を示す。
例えば、図4に示すように、ホスト装置25は、実時間(real-time)の時間統計識別子55を有するデータ要素28(例えば、年齢が受信から20秒までのデータ要素)を記憶する第1保持場所60−1で構成されうる。ホスト装置25は、日時間(daily-time)の時間統計識別子55を有するデータ要素28(例えば、年齢が受信から20秒と1日の間であるデータ要素)を記憶する第2保持場所60−2で構成されうる。また、ホスト装置25は、週時間(weekly-time)の時間統計識別子55を有するデータ要素28(例えば、年齢が受信から1日と1週間の間であるデータ要素)を記憶する第3保持場所60−3で構成されうる。さらに、ホスト装置25は、月時間(monthly-time)の時間統計識別子55を有するデータ要素28(例えば、年齢が受信から1週間と1月の間であるデータ要素)を記憶する第4保持場所60−4で構成されうる。また、ホスト装置25は、年時間(yearly-time)の時間統計識別子55を有するデータ要素28(例えば、年齢が受信から1月と1年の間であるデータ要素)を記憶する第5保持場所60−5で構成されうる。
動作中に、データ保持機能40を実行するとき、ホスト装置25がコンピュータインフラ11からデータ要素28を受信すると、ホスト装置25は、各データ要素28に関連する時間統計識別子55をレビューし、時間統計識別子55に基づいてデータ要素28を特定の保持場所60に割り当てるように構成されている。例えば、ホスト装置25はデータ要素28をコンピュータインフラ11からストリームとして受信するため、ホスト装置25は、各データ要素28に関連する時間統計識別子55をレビューし、データ要素28をリアルタイムデータ要素(例えば、年齢が受信から20秒未満である)であると識別して、データ要素28を第1保持場所60−1に割り当てる。
なお、データ保持機能40を実行するとき、ホスト装置25は、保持ポリシー65に対応する特定の期間の間、各保持場所60にデータ要素28を保持するように構成されている。
引き続き図4を参照すると、動作中、データ保持機能40は、データ要素28を次の精度低下した保持場所60に再割り当てするために、古くなったデータ要素28(例えば、精度が低下したデータ要素28)の各保持場所60を見直すようにもホスト装置25を構成する。例えば、特定の保持場所60に対して、データ保持機能40は、各データ要素28に関連する時間統計識別子55をデータ保持場所60に関連する保持ポリシー65と比較するようにホスト装置25を構成する。データ保持場所60の特定のデータ要素28の時間統計識別子55が保持ポリシー65を満たす(例えば、保持ポリシー65によって設定された期間以上である)場合、ホスト装置25は、第2保持ポリシー65を有する第2データ保持場所60にデータ要素28を割り当てるように構成されている。第2保持ポリシー65は、以前の保持ポリシー65によって定義された保持時間よりも長い持続時間を定義する。
例えば、第4データ保持場所60−4が、年齢が受信から1週間と1月の間であるデータ要素28を記憶するように構成されていることを示す保持ポリシー65−4を、第4データ保持場所60−4が含むと想定する。ホスト装置25が第4データ保持場所60−4内のデータ要素28を見直す場合、データ保持機能40は、データ要素28を年齢が受領から1月を超えるとして識別する時間統計識別子55を有するデータ要素を識別するようにホスト装置25を構成する。ホスト装置25がこのような基準で1つ以上のデータ要素28を検出した場合、ホスト装置25は、データ保持機能40による指示どおりに、データ要素28を第5保持場所60−5に進めるように構成されている。
データ保持機能40のこのような構成により、ホスト装置25は、コンピュータ環境11に関連するオブジェクトのための大きな数値データセット24を保持することができる。加えて、データ保持機能40を実行することにより、データ要素28の年齢に基づいてデータ要素28を即時に分析することができる。すなわち、データ保持機能40は、ホスト装置25によって収取されたデータ要素28の精度全体(つまり、相対経時)に対処することによって、リアルタイムのデータ要素28を分析する。例えば、データ保持機能40は、時間単位、週単位、または月単位の時間統計に基づいてデータ要素28を分離するようにホスト装置25を構成する。したがって、ホスト装置25は、特定のデータ要素28(例えば、CPUの使用に関するデータ要素など)を特定のデータ保持場所(例えば、日単位の保持場所60−2など)から取り出して特定の傾向を分析する(例えば、CPUの使用状況を日単位で分析する)ように後で構成可能である。
また、データ保持機能40は、古くなったデータ要素28をデータ保持場所60から削除するようにホスト装置25を構成することもできる。例えば、データ保持機能40を実行するとき、ホスト装置25は、最小限の精度(例えば、年時間の時間統計識別子)しか有しないデータ要素28を記憶する、一連の保持場所中の最後の保持場所(この例では、第5保持場所60−5)を見直すように構成されている。ホスト装置25が、データ保持場所60−5の精度レベル構成またはポリシーレベル65−5よりも大きい(例えば、受信から1年を超えている)時間統計識別子55を有するデータ要素28を検出したとき、ホスト装置25は、保持場所60−5からそのデータ要素28を削除するように構成されている。
図4を参照すると、1つの構成では、ホスト装置25は、データ保持場所60に関連するデータ要素28に変換機能42を提供するように構成されている。図示のように、分析機能44を適用する前に、ホスト装置25は、特定のデータ保持場所60に関連する一連のデータ要素24に変換機能42を適用して、一連の変換データ要素28’を生成することができる。
1つの構成では、変換機能42は、変換ポリシー50に従ってコンピュータ環境リソース12に関連するデータ要素28を操作するように構成されている。例えば、データ保持場所60が、コンピュータ環境リソース12のストレージ装置18によって利用されるストレージ量を特定するデータ要素28を記憶する場合を想定する。さらに、ホスト装置25が、コンピュータ環境リソース12のストレージ装置18に関連する毎月のコストを分析するように構成されていると想定する。この構成に基づいて、変換機能42は、第4データ保持場所60−4(つまり、月時間の時間統計識別子55を有するデータ要素28を記憶するデータ保持場所60−4)から、ストレージ装置18によって利用されたストレージ量に関連するデータ要素28を検索する。さらに、変換ポリシー50は、各データ要素28にコストを乗算する。結果として生じる一連の変換データ28’は、ストレージ装置18に関連する毎月のコストに関する。その結果、ホスト装置25が変換機能42を利用する場合、ホスト装置25は、選択されたデータ保持場所60に関連する一連の変換データ28’に分析機能44を適用するように構成されている。
1つの構成では、変換機能42は、特定のデータ保持場所60からデータ要素28を選択し、必要な分析の種類および/またはデータ要素28の必要状態に基づいて変換データ要素28’を次の分析機能44および/またはトレーニング機能43に提供するように構成されている。例えば、ホスト装置25が、コンピュータインフラ11のコントローラ20のCPU使用率(つまり、ホスト装置25の必要状態)を見直すように構成されている場合を想定する。このような場合、第1データ保持場所60−1(例えば、ほぼリアルタイムのデータ要素28に対するストレージ場所)におけるCPU使用率を表すデータ要素28は、比較的多大な変動を有しうる。したがって、変換機能42は、ホスト装置25の必要状態を検出し(例えば、コンピュータインフラ11のコントローラ20のCPU使用率を見直し)、その必要状態に基づいて適切なデータ保持場所60を選択するように構成されている。例えば、この場合、変換機能42は、例えば年齢が受信から20秒と1日の間であるデータ要素28を記憶するデータ保持場所60−2など、変動量が低減したデータ要素28を提供しうるデータ保持場所60を選択することができる。選択後、変換機能42は、さらなる処理のために、選択された変換データ要素28を分析機能44に提供するように構成されている。
図2に示すフローチャート100に戻ると、工程要素106において、機械学習分析アプリケーション27を実行するとき、ホスト装置25は、トレーニングデータセット47と、選択されたデータ保持場所60に関連するデータ要素28とを比較して、一連のデータ要素28に関連するデータ異常70を検出するように構成されている。1つの構成では、ホスト装置25は、そのような比較を行うために分析機能44をトレーニングデータセット47およびデータ要素28の両方に適用するように構成されている。上記のように、ホスト装置25は、変換機能42からの変換データ要素28’に分析機能44を提供するように構成されうる。しかし、一例として、以下に、選択された保持場所60からのデータ要素28への分析機能44の適用について説明する。また、後述するように、トレーニングデータセット47およびデータエレメント28の両方に分析機能44を適用することにより、ホスト装置25は、コンピュータインフラ11のさまざまなコンピュータ環境リソース12に関する異常な挙動の存在を検出することができる。
図5を参照すると、分析機能44の適用前に、ホスト装置25は、例えばトレーニング機能43の使用などによって、トレーニングデータセット47を作成するように構成されている。トレーニングデータセット47は、コンピュータ環境リソース12の特定の挙動パターンまたは傾向を識別する一連の基本データ(つまり、一連の学習された挙動データ)として構成されている。1つの構成では、トレーニング機能43の実行によって、ホスト装置25は、選択されたデータ保持場所60からの一連のデータ要素28にアクセスして、トレーニングデータセット47を作成するように構成されている。例えば、コンピュータインフラ11の毎週のCPU使用率に関するトレーニングデータセット47を作成するために、ホスト装置25は、週単位の保持場所60−3からCPU使用率に関連するデータ要素28を検索し、このデータ要素28をトレーニングデータセット47として記憶することができる。
特定のまたは選択された保持場所60からのデータ要素28の検索に応答して、トレーニング機能43を実行するとき、ホスト装置25は、選択されたデータ保持場所60からのデータ要素28に分類機能80を適用してトレーニングデータセット47を定義するように構成されている。
分類機能80は、さまざまな方法で構成可能であるが、1つの構成では、分類機能80は、例えばクラスタリング機能などの半教師付き機械学習機能として構成されている。クラスタリングは、クラスタと呼ばれる同じグループ内のオブジェクトが他のグループまたはクラスタ内のオブジェクトよりも互いに類似するような方法で、一連のオブジェクトをグループ化するタスクである。クラスタリングは、機械学習、パターン認識、画像解析、情報検索、およびバイオインフォマティクスを含む多くの分野で使用される、統計的データ分析のための従来の技術である。オブジェクトのクラスタへのグルーピングは、クラスタを構成するものの概念およびそれらを効率的に見つける方法の概念が大きく異なるさまざまなアルゴリズムによって達成することができる。例えば、既知のクラスタリングアルゴリズムは、階層的クラスタリング、重心ベースのクラスタリング(つまり、k平均法クラスタリング)、分布に基づくクラスタリング、および密度に基づくクラスタリングを含む。クラスタリングに基づいて、ホスト装置25は、コンピュータインフラ11のさまざまな構成要素に関連する異常または性能低下を検出するように構成されている。
図6は、選択されたデータ保持場所60からのデータ要素28にクラスタリング機能80を適用してトレーニングデータセット47を生成する一例を示す図である。1つの構成では、データ要素28への分類(つまり、クラスタリング)機能80の適用の結果として一連のクラスタ82が生成されうる。例えば、特性化機能80を適用した後、トレーニングデータセット47は、第1、第2、および第3クラスタ82−1、82−2、82−3を含みうる。各クラスタ82−1〜82−3は、ある共通の類似性を有するコンピュータインフラ属性を識別する。
1つの構成では、ホスト装置25は、選択されたデータ保持場所60から時間と共にデータ要素28を受信することによって、トレーニングデータセット47をほぼ連続的かつ継続的に作成するように構成されている。例えば、図5を参照すると、コンピュータインフラ11の特定の属性(例えば、CPU使用率)に対するトレーニングデータセット47を作成するために、ホスト装置25は、一定期間にわたって、特定のデータ保持場所60(例えば、第1データ保持場所60−1、これはCPU使用率に関係する)からのデータ要素28のほぼリアルタイムのストリームにアクセスするように構成可能である。ホスト装置25は、データ要素28にトレーニング機能43を適用して、データ要素28の継続的ストリームに基づいてトレーニングデータセット47を連続的に作成し訓練するように構成されている。したがって、コンピュータインフラの属性値が時間と共に変化する(例えば、コンピュータインフラ11の特定のコントローラに対するCPU使用率の増減を示す)ため、トレーニングデータセット47も、時間と共に変化しうる。
上記のように、また図5を続けて参照すると、ホスト装置25は、例えば変換機能42によって提供された、特定のデータ保持場所60からのデータ要素28を、トレーニングデータセット47と、例えば分析機能44の適用によって、比較するように構成されている。分析機能44のこのような適用によって、ホスト装置25は、データ要素28に関連する傾向およびコンピュータ環境リソース11に関連する異常な挙動の存在を決定することができる。
例えば、ホスト装置25が、コンピュータインフラ11内のリアルタイムCPU使用率の偏差を検出するように構成されていると想定する。このような場合、ホスト装置25は、前の週のCPU使用率に関連するデータ要素28を、週単位のデータ保持場所60−3から、トレーニングデータセット47として検索することができる。また、ホスト装置25は、例えばリアルタイムのデータ保持場所60−1などの選択されたデータ保持場所から、例えば変換機能42によって提供される、リアルタイムCPU使用率を表すデータ要素28を受信することもできる。
分析機能44の実行により、保持場所60からのデータ要素28をトレーニングデータセット46と比較することによって、ホスト装置25は、外れデータ要素84を、コンピュータインフラ11に関連する異常アクティビティを表すデータ異常として識別するように構成されている。例えば、図6を参照すると、保持場所60からのデータ要素28をトレーニングデータセット47と比較することにより、クラスタ82の外にある多数のデータ要素28が得られる。分析(例えば、分析機能の適用)の結果として、ホスト装置25は、外れデータ要素84を、コンピュータインフラ11に関連する異常な挙動(例えば、レイテンシ)を示す異常データ要素90として識別することができる。
1つの構成では、図5を参照して、外れ要素84の数を制限し、データ要素28に関連するベストプラクティスを示すために、ホスト装置25は、トレーニングデータセット47と選択されたデータ保持場所60からのデータ要素28とにルール機能46を適用するようにも構成されている。ルール機能46は、コンピュータインフラの動作における潜在的な異常を識別するのに使用されるデータ要素28の一部(subset)を定義するように構成されている。
例えば、図6を参照すると、ルール機能46が、CPU使用率が90%未満である外れデータ要素84を識別するように構成されていると想定する。ルール機能86を適用することにより、外れ要素84は、CPU使用率が90%未満である第1サブセット87と、CPU使用率が90%を超える第2サブセット88とに分かれる(例えば、不良または誤ったデータ要素を示す)。ルール機能46の適用の結果として、ホスト装置25は、第1サブセット87のデータ要素を異常データ要素90として識別することができる。異常データ要素90は、一連のクラスタ82または第2データサブセット88のいずれにも属しない。
図2に示すフローチャート100に戻ると、工程要素106において、機械学習分析アプリケーション27を実行するとき、選択されたデータ保持場所60に関連するデータ要素28に関連するデータ異常90の検出に応答して、ホスト装置は、データ異常通知52を生成するように構成されている。
図5に示すように、また図3をさらに参照すると、データ要素28に分析機能44を適用し、データ異常90を検出した後、ホスト装置25は、データ異常通知52をアプリケーションプログラムインタフェース(API)によってディスプレイ51に出力するように構成されている。1つの構成では、ホスト装置25は、データ異常通知52をグラフィカルユーザインタフェース(GUI)の一部としてディスプレイ51に表示するように構成されている。データ異常通知52は、コンピュータインフラ11のさまざまな側面の異常動作(例えば、1日のレイテンシや1ヶ月間にわたるレイテンシなど)に関するエンドユーザへの通知を提供する。
1つの構成では、コンピュータインフラ内の異常な挙動の検出に応答して、ホスト装置25は、GUI50によって1つ以上のインフラ通知53をエンドユーザに提供することができる。例えば、ホスト装置25は、インフラ通知53として、検出した異常90に基づいて、分析、予測、および推奨通知をAPI48によってエンドユーザに提供することができる。
エンジン機能45が個別のモジュール(例えば、均一性機能34、データ保持機能40、変換機能42、トレーニング機能43、分析機能44、およびルール機能46)として構成されているため、管理者は、必要な処理の種類に応じて、さまざまな個別の異なるエンジン機能45を有するホスト装置25を更新することができる。したがって、処理のいかなる変更も、異なる変換(例えば、使用)の場合に対処するために、時間とエンジニアリングに最小限の投資しか必要としない。さらに、エンジン機能45を使用することにより、ホスト装置25は、異なるアルゴリズム、ツール、フレームワーク、および分散・並行分析の要求に対して、その分析フレームワークを採用することができる。
さらに、データ要素28のストリームの分析に基づいて、また、データ要素をデータ保持場所のサブセットに分けることに基づいて、ホスト装置25は、時間と共にインフラ11内の異常を連続的に識別するために、コンピュータ環境リソースをほぼ連続的に分析するように構成されている。
さらに、異常について継続的にインフラからのデータ要素28を分析することによって、ホスト装置25は、コンピュータインフラ11の動作を改善するように構成されている。例えば、コンピュータインフラ11から受信したデータ要素28を継続的に監視し学習することによって、ホスト装置25は、コンピュータ環境リソース12に関連するいかなる異常も容易に検出することができる。
以上特に本発明のさまざまな実施形態を示し説明してきたが、当業者であれば、添付の特許請求の範囲によって定義された本発明の精神および範囲から逸脱することなく、形式および詳細のさまざまな変更を行うことができることを理解するであろう。

Claims (18)

  1. ホスト装置においてコンピュータインフラからの一連のデータ要素を分析する方法であって、
    前記ホスト装置が、前記コンピュータインフラから前記一連のデータ要素を受信するステップであって、前記一連のデータ要素は、前記コンピュータインフラの少なくとも1つのコンピュータ環境リソースの少なくとも1つの属性に関連している、ステップと、
    前記ホスト装置が、前記一連のデータ要素の各データ要素に関連する時間統計識別子に基づいて、前記一連のデータ要素の各データ要素をデータ保持場所に割り当てるステップと、
    前記ホスト装置が、トレーニングデータセットと、選択されたデータ保持場所に関連する前記データ要素とを比較して、前記一連のデータ要素に関連するデータ異常を検出するステップと、
    前記ホスト装置が、前記選択されたデータ保持場所に関連するデータ要素に関連する前記データ異常の検出に応答して、データ異常通知を生成するステップと、
    を有する方法。
  2. 前記ホスト装置が、前記コンピュータインフラからの前記一連のデータ要素の受信に応答して、前記一連のデータ要素に均一性機能を適用して一連の正規化データ要素を生成するステップであって、前記均一性機能は、前記一連のデータ要素に関連するフォーマットを調整するように構成されている、ステップ、
    をさらに有する、請求項1に記載の方法。
  3. 前記ホスト装置が、前記一連のデータ要素の各データ要素の前記データ保持場所への割り当てに応答して、前記データ要素に変換機能を適用して一連の変換データ要素を生成するステップ、をさらに有し、
    前記トレーニングデータセットと前記選択されたデータ保持場所に関連する前記データ要素とを比較するステップは、前記ホスト装置が、前記トレーニングデータセットと、前記選択されたデータ保持場所に関連する前記一連の変換データ要素とを比較して、前記一連の変換データ要素に関連するデータ異常を検出するステップを含む、
    請求項2に記載の方法。
  4. 前記トレーニングデータセットと前記選択されたデータ保持場所に関連する前記データ要素とを比較するステップは、前記ホスト装置が、前記トレーニングデータセットと前記選択されたデータ保持場所に関連する前記データ要素とにルール機能を適用するステップであって、前記ルール機能は、前記一連のデータ要素の一部のデータ要素を定義するように構成されている、ステップをさらに含む、請求項1に記載の方法。
  5. 前記ホスト装置が、選択されたデータ保持場所からの一連のデータ要素にアクセスして前記トレーニングデータセットを作成するステップと、
    前記ホスト装置が、前記選択されたデータ保持場所からの前記一連のデータ要素に分類機能を適用して前記トレーニングデータセットを定義するステップと、
    をさらに有する、請求項1に記載の方法。
  6. 前記選択されたデータ保持場所からの前記一連のデータ要素に前記分類機能を適用して前記トレーニングデータセットを定義するステップは、前記ホスト装置が、前記選択されたデータ保持場所からの前記一連のデータ要素に分類機能を適用して、前記トレーニングデータセットを、前記選択されたデータ保持場所に関連する前記データ要素の一連のクラスタとして定義するステップを含む、請求項5に記載の方法。
  7. 前記ホスト装置が、第1データ保持場所に対して、各データ要素に関連する前記時間統計識別子を前記第1データ保持場所に関連する第1保持ポリシーと比較するステップと、
    前記ホスト装置が、前記第1データ保持場所のデータ要素の前記時間統計識別子が前記第1データ保持場所に関連する前記第1保持ポリシーを満たすとき、前記データ要素を、第2保持ポリシーを有する第2データ保持場所に割り当てるステップであって、前記第2保持ポリシーは、前記第1保持ポリシーによって定義された保持時間よりも長い保持時間を定義する、ステップと、
    をさらに有する、請求項1に記載の方法。
  8. 前記選択されたデータ保持場所からの前記一連のデータ要素にアクセスするステップは、前記ホスト装置が、前記選択されたデータ保持場所からほぼリアルタイムでデータ要素ストリームにアクセスして、前記トレーニングデータセットをほぼ連続的に作成するするステップであって、前記データ要素ストリームは、前記コンピュータインフラの少なくとも1つのコンピュータ環境リソースの少なくとも1つの属性に関連している、ステップを含む、請求項7に記載の方法。
  9. 前記コンピュータインフラからの前記一連のデータ要素を受信するステップは、前記ホスト装置が、前記コンピュータインフラからほぼリアルタイムでデータ要素ストリームを受信するステップであって、前記データ要素ストリームは、前記コンピュータインフラの少なくとも1つのコンピュータ環境リソースの少なくとも1つの属性に関連している、ステップを含む、請求項1に記載の方法。
  10. メモリおよびプロセッサを備えるコントローラを有し、前記コントローラは、
    コンピュータインフラから一連のデータ要素を受信し、前記一連のデータ要素は、前記コンピュータインフラの少なくとも1つのコンピュータ環境リソースの少なくとも1つの属性に関連している、
    前記一連のデータ要素の各データ要素に関連する時間統計識別子に基づいて、前記一連のデータ要素の各データ要素をデータ保持場所に割り当て、
    トレーニングデータセットと、選択されたデータ保持場所に関連する前記データ要素とを比較して、前記一連のデータ要素に関連するデータ異常を検出し、
    前記選択されたデータ保持場所に関連するデータ要素に関連する前記データ異常の検出に応答して、データ異常通知を生成する、
    ように構成されている、ホスト装置。
  11. 前記コンピュータインフラからの前記一連のデータ要素の受信に応答して、前記コントローラは、前記一連のデータ要素に均一性機能を適用して一連の正規化データ要素を生成するように構成され、前記均一性機能は、前記一連のデータ要素に関連するフォーマットを調整するように構成されている、請求項10に記載のホスト装置。
  12. 前記一連のデータ要素の各データ要素の前記データ保持場所への割り当てに応答して、前記コントローラは、前記データ要素に変換機能を適用して一連の変換データ要素を生成するように構成され、
    前記トレーニングデータセットと前記選択されたデータ保持場所に関連する前記データ要素とを比較するとき、前記コントローラは、前記トレーニングデータセットと、前記選択されたデータ保持場所に関連する前記一連の変換データ要素とを比較して、前記一連の変換データ要素に関連するデータ異常を検出するように構成されている、
    請求項11に記載のホスト装置。
  13. 前記トレーニングデータセットと前記選択されたデータ保持場所に関連する前記データ要素とを比較するとき、前記コントローラは、前記トレーニングデータセットと前記選択されたデータ保持場所に関連する前記データ要素とにルール機能を適用するように構成され、前記ルール機能は、前記一連のデータ要素の一部のデータ要素を定義するように構成されている、請求項10に記載のホスト装置。
  14. 前記コントローラは、
    選択されたデータ保持場所からの一連のデータ要素にアクセスして前記トレーニングデータセットを作成し、
    前記選択されたデータ保持場所からの前記一連のデータ要素に分類機能を適用して前記トレーニングデータセットを定義する、
    ように構成されている、請求項10に記載のホスト装置。
  15. 前記選択されたデータ保持場所からの前記一連のデータ要素に前記分類機能を適用して前記トレーニングデータセットを定義するとき、前記ホスト装置は、前記選択されたデータ保持場所からの前記一連のデータ要素に分類機能を適用して、前記トレーニングデータセットを、前記選択されたデータ保持場所に関連する前記データ要素の一連のクラスタとして定義するように構成されている、
    請求項14に記載のホスト装置。
  16. 前記コントローラは、
    第1データ保持場所に対して、各データ要素に関連する前記時間統計識別子を前記第1データ保持場所に関連する第1保持ポリシーと比較し、
    前記第1データ保持場所のデータ要素の前記時間統計識別子が前記第1データ保持場所に関連する前記第1保持ポリシーを満たすとき、前記データ要素を、第2保持ポリシーを有する第2データ保持場所に割り当て、前記第2保持ポリシーは、前記第1保持ポリシーによって定義された保持時間よりも長い保持時間を定義する、
    ようにさらに構成されている、請求項10に記載のホスト装置。
  17. 前記選択されたデータ保持場所からの前記一連のデータ要素にアクセスするとき、前記ホスト装置は、前記選択されたデータ保持場所からほぼリアルタイムでデータ要素ストリームにアクセスして、前記トレーニングデータセットをほぼ連続的に作成するように構成され、前記データ要素ストリームは、前記コンピュータインフラの少なくとも1つのコンピュータ環境リソースの少なくとも1つの属性に関連している、請求項16に記載のホスト装置。
  18. 前記コンピュータインフラからの前記一連のデータ要素を受信するとき、前記コントローラは、前記コンピュータインフラからほぼリアルタイムでデータ要素ストリームを受信するように構成され、前記データ要素ストリームは、前記コンピュータインフラの少なくとも1つのコンピュータ環境リソースの少なくとも1つの属性に関連している、請求項10に記載のホスト装置。
JP2018501850A 2015-07-14 2016-07-14 コンピュータ環境からのストリーミングデータセットを分析するための分散型機械学習分析フレームワーク Pending JP2018525728A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562192548P 2015-07-14 2015-07-14
US62/192,548 2015-07-14
PCT/US2016/042298 WO2017011667A1 (en) 2015-07-14 2016-07-14 Distributed machine learning analytics framework for the anaylsis of streaming data sets from a computer enviroment

Publications (1)

Publication Number Publication Date
JP2018525728A true JP2018525728A (ja) 2018-09-06

Family

ID=57757748

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018501850A Pending JP2018525728A (ja) 2015-07-14 2016-07-14 コンピュータ環境からのストリーミングデータセットを分析するための分散型機械学習分析フレームワーク

Country Status (4)

Country Link
US (1) US20170017902A1 (ja)
EP (1) EP3323047A4 (ja)
JP (1) JP2018525728A (ja)
WO (1) WO2017011667A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10963797B2 (en) * 2017-02-09 2021-03-30 Caterpillar Inc. System for analyzing machine data
US10635565B2 (en) * 2017-10-04 2020-04-28 Servicenow, Inc. Systems and methods for robust anomaly detection
US11210587B2 (en) 2019-04-23 2021-12-28 Sciencelogic, Inc. Distributed learning anomaly detector
US11392469B2 (en) * 2019-06-20 2022-07-19 Microsoft Technology Licensing, Llc Framework for testing machine learning workflows

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090287744A1 (en) * 2008-05-15 2009-11-19 International Business Machines Corporation Apparatus, system and method for healthcheck of information technology infrastructure based on log data
WO2012086443A1 (ja) * 2010-12-24 2012-06-28 日本電気株式会社 監視データ分析装置、監視データ分析方法および監視データ分析プログラム
JP2014507727A (ja) * 2011-02-14 2014-03-27 インターナショナル・ビジネス・マシーンズ・コーポレーション パフォーマンス・メトリックを監視するためのコンピュータによって実施される方法、コンピュータ可読記憶媒体、およびシステム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7346751B2 (en) * 2004-04-30 2008-03-18 Commvault Systems, Inc. Systems and methods for generating a storage-related metric
US7739082B2 (en) * 2006-06-08 2010-06-15 Battelle Memorial Institute System and method for anomaly detection
US20110119100A1 (en) * 2009-10-20 2011-05-19 Jan Matthias Ruhl Method and System for Displaying Anomalies in Time Series Data
US8688620B2 (en) * 2011-09-23 2014-04-01 Hewlett-Packard Development Company, L.P. Anomaly detection in data centers
US9112895B1 (en) * 2012-06-25 2015-08-18 Emc Corporation Anomaly detection system for enterprise network security
US8914317B2 (en) * 2012-06-28 2014-12-16 International Business Machines Corporation Detecting anomalies in real-time in multiple time series data with automated thresholding
US10148548B1 (en) * 2013-01-29 2018-12-04 Axway, Inc. System and method for real-time analysis of incoming data
US8874755B1 (en) * 2013-07-31 2014-10-28 Splunk, Inc. Provisioning of cloud networks with services
US9652354B2 (en) * 2014-03-18 2017-05-16 Microsoft Technology Licensing, Llc. Unsupervised anomaly detection for arbitrary time series
US9544321B2 (en) * 2015-01-30 2017-01-10 Securonix, Inc. Anomaly detection using adaptive behavioral profiles

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090287744A1 (en) * 2008-05-15 2009-11-19 International Business Machines Corporation Apparatus, system and method for healthcheck of information technology infrastructure based on log data
WO2012086443A1 (ja) * 2010-12-24 2012-06-28 日本電気株式会社 監視データ分析装置、監視データ分析方法および監視データ分析プログラム
JP2014507727A (ja) * 2011-02-14 2014-03-27 インターナショナル・ビジネス・マシーンズ・コーポレーション パフォーマンス・メトリックを監視するためのコンピュータによって実施される方法、コンピュータ可読記憶媒体、およびシステム

Also Published As

Publication number Publication date
WO2017011667A1 (en) 2017-01-19
EP3323047A4 (en) 2019-03-27
US20170017902A1 (en) 2017-01-19
EP3323047A1 (en) 2018-05-23

Similar Documents

Publication Publication Date Title
CN109844781B (zh) 用于从日志文件识别处理流并使流可视化的系统和方法
US10133775B1 (en) Run time prediction for data queries
JP6424273B2 (ja) コンピュータ・インフラストラクチャの管理におけるポリシーの自己調整のための半教師あり機械学習の活用
US20220385529A1 (en) Dynamic anomaly reporting
US20200004591A1 (en) Self-managed intelligent elastic cloud stack
US11327869B2 (en) Distributed architecture for determining performance parameters
US10089207B2 (en) Identification of software phases using machine learning
JP2018525728A (ja) コンピュータ環境からのストリーミングデータセットを分析するための分散型機械学習分析フレームワーク
US10148505B2 (en) Provisioning resources for datacenters
CN110474799A (zh) 故障定位方法及装置
US9473572B2 (en) Selecting a target server for a workload with a lowest adjusted cost based on component values
Balliu et al. A big data analyzer for large trace logs
US11237740B2 (en) Automatically determining sizing configurations for storage components using machine learning techniques
US11627193B2 (en) Method and system for tracking application activity data from remote devices and generating a corrective action data structure for the remote devices
JPWO2021192191A5 (ja) 異常アクセス予測システム、異常アクセス予測方法および異常アクセス予測プログラム
WO2018085418A1 (en) Apparatus and method of adjusting a sensitivity buffer of semi-supervised machine learning principals for remediation of issues
US20190138931A1 (en) Apparatus and method of introducing probability and uncertainty via order statistics to unsupervised data classification via clustering
US8838414B2 (en) Determining when to create a prediction based on deltas of metric values
Jehangiri et al. Distributed predictive performance anomaly detection for virtualised platforms
US11882124B1 (en) Account integration with an event-driven application programing interface call manager
Nguyen et al. Hipervr: A virtual reality model for visualizing multidimensional health status of high performance computing systems
US20210232950A1 (en) Information processing system and method for controlling information processing system
US20220147370A1 (en) Management of computing devices
US10225134B1 (en) Categorizing systems at scale using system attributes
성민영 A Machine Learning-based Methodology to Detect I/O Performance Bottlenecks for Hadoop Systems

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180315

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190305

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20191015