JP2015529036A5 - 大規模データ処理システムにおいて孤立した異常の検出を行うための方法 - Google Patents
大規模データ処理システムにおいて孤立した異常の検出を行うための方法 Download PDFInfo
- Publication number
- JP2015529036A5 JP2015529036A5 JP2015520945A JP2015520945A JP2015529036A5 JP 2015529036 A5 JP2015529036 A5 JP 2015529036A5 JP 2015520945 A JP2015520945 A JP 2015520945A JP 2015520945 A JP2015520945 A JP 2015520945A JP 2015529036 A5 JP2015529036 A5 JP 2015529036A5
- Authority
- JP
- Japan
- Prior art keywords
- data processing
- service
- processing device
- quality
- destination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000012545 processing Methods 0.000 title claims description 148
- 238000000034 method Methods 0.000 title claims description 31
- 238000001514 detection method Methods 0.000 claims description 24
- 238000003780 insertion Methods 0.000 claims description 20
- 230000037431 insertion Effects 0.000 claims description 20
- 238000013500 data storage Methods 0.000 claims description 9
- 238000009877 rendering Methods 0.000 claims description 7
- 230000005856 abnormality Effects 0.000 claims description 4
- 238000002955 isolation Methods 0.000 claims 1
- 238000007726 management method Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
Description
本発明のコンテキストにおける大規模データ処理システムの例は、テレビ、インターネット、およびテレフォニーサービスが何百万もの加入者に提供されるトリプルプレイオーディオビジュアルサービス提供システムである(ここでは、オーディオビジュアルサービスの受信およびレンダリングがデータ処理である)。大規模データ処理システムの別の例は、何千ものストレージノードがストレージサービスを提供する(分散)データストレージシステムである(ここでは、ストレージサービスの提供がデータ処理である)。オペレータの何百万ものクライアントによって享受されるトリプルプレイサービスのサービス品質(QoS)における異常を検出するために、または分散データストレージシステムにおけるストレージデバイスの機能時の異常を検出するために、異常検出システムの一部である集中型エラー検出サーバは、データ処理デバイスをモニタする。ここでは、孤立した異常の検出が問題である。これは、異常管理システムが、そのシステムに接続されている何百万ものデータ処理デバイスが原因で、異常管理システムによってデータ処理デバイスから異常管理システムに個々のメッセージ送信が可能となる時に発生する可能性があるオーバーロードをそのシステム自体で防がなければならない理由による。例えば、通信パスが何らかの理由でダウンすると、この通信パスを介して少なくとも部分的に(トリプルプレイの例として)用いられるか又は(分散データストレージの例として)相互通信する何千または何百万ものデータ処理デバイスは、(トリプルプレイの例として)QoS(サービス品質)の突然の低下、又は(分散ストレージの例として)接続の突然の喪失を経験し、エラーメッセージを異常管理システムに大量に送信するであろう。異常管理システムは、その後、非常に短い時間期間で到着する大量のメッセージに対処することができないであろう。これらの大規模データ処理システムのために、オペレータは、従って、個々のデバイスに関する可能性を制限してエラーメッセージを異常管理システムに送信する傾向がある。遠隔管理技術はTR−069又はSNMP(Simple network management protocol)などである。これらのプロトコルは、サーバ・クライアント指向であり、すなわちサーバが複数のデータ処理デバイスを遠隔管理する。本質により、この中央遠隔管理アーキテクチャは、単一のサーバがそのような大規模なデバイスセットを効果的に監視できないときに、何百万ものデータ処理デバイスにスケーリング(scale)しない。従来技術によると、異なる監視アーキテクチャは、従って、これらのデータ処理デバイスが正しく機能し続けることかどうかを検証するために、監視システムがサービス分散ネットワークトポロジーの分散パスにおけるいくつかのデータ処理デバイスを頻繁に監視する場所を設置する。明らかに、異常管理システムのオーバーロードに対するこの保護バリアは、如何なる細粒異常検出も不可能にする。次に、個別基準の異常検出は不可能になる。
本発明は、サービスを提供するデータ処理デバイスにおいて孤立した異常の検出を行う方法であって、前記データ処理デバイスによって提供された少なくとも1つのサービスのサービス品質に応じてソース品質バケットに前記データ処理デバイスを挿入する第1の挿入するステップであって、前記データ処理装置によって実装され、品質バケットは前記少なくとも1つのサービスに関するサービス品質の予め定められた範囲を有するデータ処理デバイスのグループを表す、第1の挿入ステップと、前記データ処理デバイスによって提供された前記サービス品質が前記第1の品質バケットの前記予め定められた範囲を超えて展開する場合、宛先品質バケットに前記データ処理デバイスを挿入する第2の挿入ステップと、ソース品質バケットが前記データ処理デバイスの前記品質バケットと同一である前記宛先品質バケットにおけるデータ処理デバイスの総数を表すカウンタが閾値を下回るとき、孤立した異常の検出を表すメッセージを送信するステップと、を含む、前記方法を提供することを目的とする。
本発明の方法の特定の実施形態によると、前記データ処理デバイスによって提供される前記サービスは、データストレージサービスである。
本発明の方法の特定の実施形態によると、前記データ処理デバイスによって提供される前記サービスは、音響映像レンダリングサービスである。
本発明はまた、サービスを提供するデータ処理デバイスのための孤立した異常の検出配置であって、前記データ処理デバイスによって提供された少なくとも1つのサービスのサービス品質に応じてソース品質バケットに前記データ処理デバイスを挿入する第1の挿入手段であって、品質バケットは前記少なくとも1つのサービスに関するサービス品質の予め定められた範囲を有するデータ処理デバイスのグループを表す、第1の挿入ステップと、前記データ処理デバイスによって提供された前記サービス品質が前記第1の品質バケットの前記予め定められた範囲を超えて展開する場合、宛先品質バケットに前記データ処理デバイスを挿入する第2の挿入手段と、ソース品質バケットが前記データ処理デバイスの前記品質バケットと同一である前記宛先品質バケットにおけるデータ処理デバイスの総数を表すカウンタが閾値を下回るとき、孤立した異常の検出を表すメッセージを送信する手段と、を備えた、前記配置に関する。
本発明の配置の特定の実施形態によると、前記データ処理デバイスによって提供される前記サービスは、データストレージサービスである。
本発明の配置の特定の実施形態によると、前記データ処理デバイスによって提供される前記サービスは、音響映像レンダリングサービスである。
本明細書において、用語「異常の検出」は、「エラー検出」よりもむしろ使用される。これは、意図的に行われる。実際には、異常は、QoSにおける「非正常的(abnormal)」変更と見なされる。このような異常は、肯定的(より良いQoS)または否定的(より悪いQoS)のいずれかとすることができ、従って、「エラー」またはエラーでないかが区別されなければならない。異常モニタリングの目的で、エラー検出に加えて、ノードが、例えば、トラブルシューティングの目的で、より良いQoSを有することを検出することも興味深い。
データ処理システムでは、異常管理システムに対する通信複雑度がスケーラビリティの鍵である。本明細書の先行技術の項において論じたように、大規模データ処理システムにおいて微細な異常検出は、グループ化された異常検出のためにトレードオフされる。なぜならば、異常モニタリングシステムは、多数のデバイスからの異常メッセージを同時に処理することができないからである。本発明は、従って、何千あるいはさらに何百万ものデバイスが1または複数のデータ処理サービスを提供する大規模データ処理システムにおいて使用するために特によくスケーリングする孤立した異常の検出のソリューションを定義する。スケーラビリティに関する本発明の重要な特徴は、デバイスが、それらのデバイスが提供するデータ処理サービスのQoSにおける著しい劣化、または反対に、著しい改善に遭遇する際の異常の検出の後、アラームによる報知を最小限にする能力である。現在の発明の目的は、QoSの劣化/改善がデバイス、またはデバイスの限定されたセットに特有なものであると評価される事例に対するアラーム報告を減らすことである。このため、本発明は、大規模または超大規模を含む、任意の規模のデータ処理システムに適している異常検出の自己組織化方法を提案する。
処理ユニット53は、マイクロプロセッサ、カスタムチップ、専用(マイクロ)コントローラなどとして実装することができる。メモリ55は、RAM(Random Access Memory)、ハードディスクドライブ、不揮発性ランダムアクセスメモリ、EPROM(Erasable Programmable ROM)などのような、任意の形式の揮発性および/または不揮発性メモリに実装することができる。デバイス500は、本発明の方法によるデータ処理デバイスを実装するのに適している。データ処理デバイス500は、データ処理デバイスによって提供される少なくとも1つのサービスに関連する同一の第1のサービス品質値を有するデータ処理デバイスの第1のグループに挿入するための手段(53、54)と、データ処理デバイスのサービス品質値が所定の閾値を超えている第2のサービス品質値に展開するかどうかを判定するためのサービス品質展開判定手段(52)と、同一のサービス品質を有するデータ処理デバイスの第2のグループに挿入するための手段(53、54)と、データ処理デバイスの第2のグループが第1の値と等しい以前のサービス品質値を有していた多数のデータ処理デバイスを含むかどうか、及びその数が所定の値以下であるかどうかを判定するための計算手段(53)と、孤立した異常の検出を示すメッセージを送信するための手段(54)とを有する。
図6は、フローチャートの形式において特定の実施形態による本発明の方法を図示している。初期化する第1のステップ60において、本発明の実行に必要である変数は、メモリ、例えば、デバイス500のメモリ55において初期化される。次のステップ61において、デバイスは、データ処理デバイスによって提供される少なくとも1つのサービス品質に応じてデバイス自体を品質バケット(「ソース」品質バケット)に挿入する。品質バケットは、少なくとも1つのサービスに関するサービス品質の事前定義された範囲を有するデータ処理デバイスのグループを表す。言い換えれば、デバイスは、データ処理デバイスによって提供される少なくとも1つのサービス品質を含むサービス品質の範囲を有する品質バケットにデバイス自体を挿入する。品質バケットへの「挿入」は、デバイスが品質バケットを表すグループのメンバになることを意味する。特定の実施形態によれば、このような挿入は、デバイスを表す識別子を、品質バケットを表すデバイスのグループのリストに付加することによって行われる。変形実施形態によれば、挿入は、品質バケットを表すデバイスのセットへのネットワーク接続を作ることによって行われ、その品質バケットは、品質バケット内にあるデバイス間のネットワーク接続によって特徴付けられる。判定ステップ62において、データ処理デバイスによって提供されるサービス品質が、挿入された(メンバである)品質バケットの事前定義された範囲を超えて展開するかどうかが判定される。これは、その品質バケットの範囲に含まれていた所与の瞬時でのサービス品質と、後の瞬時でのサービス品質との間で、後者がその品質バケットの範囲内にもはや入らない、即ち、QoSの展開が品質バケットの変更、即ち、「ソース」から「宛先」品質バケットに変更する結果となるのに十分重要であることを意味する。デバイスは、従って、データ処理デバイスによって提供されるサービス品質が第1の品質バケットの事前定義された範囲を超えて展開した場合、データ処理デバイスを宛先品質バケットに挿入する第2の挿入するステップ(63)において別の品質バケットに挿入されることになる。その後、品質バケットの変更が孤立した事例であったかどうかがステップ64において判定される。このために、ソース品質バケットがデータ処理デバイスの品質バケットと同一である宛先品質バケットにおけるデータ処理デバイスの総数が所定の値以下であることをカウンタが表しているかどうかが判定される。そうである場合、孤立した異常が検出され、デバイスは、孤立した異常の検出の発生を表すメッセージを送信/送出する。特定の実施形態によれば、メッセージは、デバイスの識別子を含む。変形実施形態によれば、メッセージは、オペレータがデバイスに異常の理由を問い合わせることなく介入することができるように、異常検出の理由を含む。
[付記1]
サービスを提供するデータ処理デバイスにおいて孤立した異常の検出を行う方法であって、前記方法は、前記データ処理装置によって実装され、
前記データ処理デバイスによって提供された少なくとも1つのサービスのサービス品質に応じてソース品質バケットに前記データ処理デバイスを挿入する第1の挿入ステップ(61)であって、品質バケットは前記少なくとも1つのサービスに関するサービス品質の予め定められた範囲を有するデータ処理デバイスのグループを表す、第1の挿入ステップと、
前記データ処理デバイスによって提供された前記サービス品質が前記第1の品質バケットの前記予め定められた範囲を超えて展開する場合、宛先品質バケットに前記データ処理デバイスを挿入する第2の挿入ステップ(63)と、
ソース品質バケットが前記データ処理デバイスの前記品質バケットと同一である前記宛先品質バケットにおけるデータ処理デバイスの総数を表すカウンタが閾値(64)を下回るとき、孤立した異常の検出を表すメッセージを送信するステップ(65)と、
を含む、前記方法。
[付記2]
前記方法は、前記ソースバケット上及び前記第2の挿入ステップのタイムスタンプ上で動作されるハッシュ関数に従って前記カウンタを格納することを担当する前記宛先品質バケットにおけるデータ処理デバイスのアドレスを判定するステップであって、前記タイムスタンプは、前記データ処理デバイス間で共有された共有クロックから得られるタイムスロットを表す、ステップをさらに含む、付記1に記載の方法。
[付記3]
前記データ処理デバイスは、品質バケットに関するエントリポイントを表すルートデータ処理デバイスを備えるデータ処理デバイスのネットワークにおいて組織化され、前記第2の挿入ステップは、その宛先品質バケットの宛先ルートデータ処理デバイスのアドレスを得るためのそのソース品質バケットの第1のルートデータ処理デバイスに第1の要求を送信するステップをさらに含む、付記1又は2に記載の方法。
[付記4]
前記方法は、前記宛先品質バケットに前記データ処理デバイスを挿入するためのその宛先品質バケットの前記宛先ルートデータ処理デバイスに第2の要求を送信するステップをさらに含む、付記3に記載の方法。
[付記5]
前記データ処理デバイスのネットワークは、2つのレベルのオーバーレイ構造に従って組織化され、前記オーバーレイ構造は、前記ルートデータ処理デバイス間のネットワーク接続を組織化する1つの上部オーバーレイと、同一の品質バケットのデータ処理デバイス間のネットワーク接続を組織化する多数の底部オーバーレイとを備える、付記3又は4に記載の方法。
[付記6]
前記データ処理デバイスによって提供される前記サービスは、データストレージサービスである、付記1乃至5のいずれかに記載の方法。
[付記7]
前記データ処理デバイスによって提供される前記サービスは、音響映像レンダリングサービスである、付記1乃至5のいずれかに記載の方法。
[付記8]
サービスを提供するデータ処理デバイスのための孤立した異常の検出配置であって、
前記データ処理デバイスによって提供された少なくとも1つのサービスのサービス品質に応じてソース品質バケットに前記データ処理デバイスを挿入する第1の挿入手段であって、品質バケットは前記少なくとも1つのサービスに関するサービス品質の予め定められた範囲を有するデータ処理デバイスのグループを表す、第1の挿入ステップと、
前記データ処理デバイスによって提供された前記サービス品質が前記第1の品質バケットの前記予め定められた範囲を超えて展開する場合、宛先品質バケットに前記データ処理デバイスを挿入する第2の挿入手段と、
ソース品質バケットが前記データ処理デバイスの前記品質バケットと同一である前記宛先品質バケットにおけるデータ処理デバイスの総数を表すカウンタが閾値を下回るとき、孤立した異常の検出を表すメッセージを送信する手段と、
を備えた、前記配置。
[付記9]
前記ソースバケット上及び前記第2の挿入のタイムスタンプ上で動作されるハッシュ関数に従って前記カウンタを格納することを担当する前記宛先品質バケットにおけるデータ処理デバイスのアドレスを判定する手段であって、前記タイムスタンプは、前記データ処理デバイス間で共有された共有クロックから得られるタイムスロットを表す、手段をさらに備えた、付記8に記載の配置。
[付記10]
前記データ処理デバイスは、品質バケットに関するエントリポイントを表すルートデータ処理デバイスを備えるデータ処理デバイスのネットワークにおいて組織化され、前記第2の挿入は、その宛先品質バケットの宛先ルートデータ処理デバイスのアドレスを得るためのそのソース品質バケットの第1のルートデータ処理デバイスに第1の要求を送信する手段をさらに備えた、付記8又は9に記載の配置。
[付記11]
前記宛先品質バケットに前記データ処理デバイスを挿入するためのその宛先品質バケットの前記宛先ルートデータ処理デバイスに第2の要求を送信する手段をさらに含む、付記10に記載の配置。
[付記12]
前記データ処理デバイスのネットワークは、2つのレベルのオーバーレイ構造に従って組織化され、前記オーバーレイ構造は、前記ルートデータ処理デバイス間のネットワーク接続を組織化する1つの上部オーバーレイと、同一の品質バケットのデータ処理デバイス間のネットワーク接続を組織化する多数の底部オーバーレイとを備える、付記10又は11に記載の配置。
[付記13]
前記データ処理デバイスによって提供される前記サービスは、データストレージサービスである、付記8乃至12のいずれかに記載の配置。
[付記14]
前記データ処理デバイスによって提供される前記サービスは、音響映像レンダリングサービスである、付記8乃至12のいずれかに記載の配置。
[付記1]
サービスを提供するデータ処理デバイスにおいて孤立した異常の検出を行う方法であって、前記方法は、前記データ処理装置によって実装され、
前記データ処理デバイスによって提供された少なくとも1つのサービスのサービス品質に応じてソース品質バケットに前記データ処理デバイスを挿入する第1の挿入ステップ(61)であって、品質バケットは前記少なくとも1つのサービスに関するサービス品質の予め定められた範囲を有するデータ処理デバイスのグループを表す、第1の挿入ステップと、
前記データ処理デバイスによって提供された前記サービス品質が前記第1の品質バケットの前記予め定められた範囲を超えて展開する場合、宛先品質バケットに前記データ処理デバイスを挿入する第2の挿入ステップ(63)と、
ソース品質バケットが前記データ処理デバイスの前記品質バケットと同一である前記宛先品質バケットにおけるデータ処理デバイスの総数を表すカウンタが閾値(64)を下回るとき、孤立した異常の検出を表すメッセージを送信するステップ(65)と、
を含む、前記方法。
[付記2]
前記方法は、前記ソースバケット上及び前記第2の挿入ステップのタイムスタンプ上で動作されるハッシュ関数に従って前記カウンタを格納することを担当する前記宛先品質バケットにおけるデータ処理デバイスのアドレスを判定するステップであって、前記タイムスタンプは、前記データ処理デバイス間で共有された共有クロックから得られるタイムスロットを表す、ステップをさらに含む、付記1に記載の方法。
[付記3]
前記データ処理デバイスは、品質バケットに関するエントリポイントを表すルートデータ処理デバイスを備えるデータ処理デバイスのネットワークにおいて組織化され、前記第2の挿入ステップは、その宛先品質バケットの宛先ルートデータ処理デバイスのアドレスを得るためのそのソース品質バケットの第1のルートデータ処理デバイスに第1の要求を送信するステップをさらに含む、付記1又は2に記載の方法。
[付記4]
前記方法は、前記宛先品質バケットに前記データ処理デバイスを挿入するためのその宛先品質バケットの前記宛先ルートデータ処理デバイスに第2の要求を送信するステップをさらに含む、付記3に記載の方法。
[付記5]
前記データ処理デバイスのネットワークは、2つのレベルのオーバーレイ構造に従って組織化され、前記オーバーレイ構造は、前記ルートデータ処理デバイス間のネットワーク接続を組織化する1つの上部オーバーレイと、同一の品質バケットのデータ処理デバイス間のネットワーク接続を組織化する多数の底部オーバーレイとを備える、付記3又は4に記載の方法。
[付記6]
前記データ処理デバイスによって提供される前記サービスは、データストレージサービスである、付記1乃至5のいずれかに記載の方法。
[付記7]
前記データ処理デバイスによって提供される前記サービスは、音響映像レンダリングサービスである、付記1乃至5のいずれかに記載の方法。
[付記8]
サービスを提供するデータ処理デバイスのための孤立した異常の検出配置であって、
前記データ処理デバイスによって提供された少なくとも1つのサービスのサービス品質に応じてソース品質バケットに前記データ処理デバイスを挿入する第1の挿入手段であって、品質バケットは前記少なくとも1つのサービスに関するサービス品質の予め定められた範囲を有するデータ処理デバイスのグループを表す、第1の挿入ステップと、
前記データ処理デバイスによって提供された前記サービス品質が前記第1の品質バケットの前記予め定められた範囲を超えて展開する場合、宛先品質バケットに前記データ処理デバイスを挿入する第2の挿入手段と、
ソース品質バケットが前記データ処理デバイスの前記品質バケットと同一である前記宛先品質バケットにおけるデータ処理デバイスの総数を表すカウンタが閾値を下回るとき、孤立した異常の検出を表すメッセージを送信する手段と、
を備えた、前記配置。
[付記9]
前記ソースバケット上及び前記第2の挿入のタイムスタンプ上で動作されるハッシュ関数に従って前記カウンタを格納することを担当する前記宛先品質バケットにおけるデータ処理デバイスのアドレスを判定する手段であって、前記タイムスタンプは、前記データ処理デバイス間で共有された共有クロックから得られるタイムスロットを表す、手段をさらに備えた、付記8に記載の配置。
[付記10]
前記データ処理デバイスは、品質バケットに関するエントリポイントを表すルートデータ処理デバイスを備えるデータ処理デバイスのネットワークにおいて組織化され、前記第2の挿入は、その宛先品質バケットの宛先ルートデータ処理デバイスのアドレスを得るためのそのソース品質バケットの第1のルートデータ処理デバイスに第1の要求を送信する手段をさらに備えた、付記8又は9に記載の配置。
[付記11]
前記宛先品質バケットに前記データ処理デバイスを挿入するためのその宛先品質バケットの前記宛先ルートデータ処理デバイスに第2の要求を送信する手段をさらに含む、付記10に記載の配置。
[付記12]
前記データ処理デバイスのネットワークは、2つのレベルのオーバーレイ構造に従って組織化され、前記オーバーレイ構造は、前記ルートデータ処理デバイス間のネットワーク接続を組織化する1つの上部オーバーレイと、同一の品質バケットのデータ処理デバイス間のネットワーク接続を組織化する多数の底部オーバーレイとを備える、付記10又は11に記載の配置。
[付記13]
前記データ処理デバイスによって提供される前記サービスは、データストレージサービスである、付記8乃至12のいずれかに記載の配置。
[付記14]
前記データ処理デバイスによって提供される前記サービスは、音響映像レンダリングサービスである、付記8乃至12のいずれかに記載の配置。
Claims (14)
- サービスを提供するデータ処理デバイスにおいて孤立した異常の検出を行う方法であって、前記方法は、
前記データ処理デバイスによって提供された少なくとも1つのサービスの品質に応じてサービスのソース品質バケットに前記データ処理デバイスを挿入する第1の挿入ステップであって、サービスの品質バケットは、データ処理デバイスのグループに関して、少なくとも1つのサービスに関するサービスの品質の範囲を表す、第1の挿入ステップと、
前記データ処理デバイスによって提供された前記少なくとも1つのサービスの前記品質が前記サービスのソース品質バケットの範囲を超えて展開した場合、前記データ処理デバイスによってレンダリングされた前記少なくとも1つのサービスの前記品質に応じてサービスの宛先品質バケットに前記データ処理デバイスを挿入する第2の挿入ステップと、
前記サービスの宛先品質バケット内にあり、前記データ処理デバイスと同じように前記サービスのソース品質バケットから前記サービスの宛先品質バケットへ前記少なくとも1つのサービスの品質の展開を経ているデータ処理デバイスの総数を表すカウンタがある値を下回るとき、孤立した異常の検出を表すメッセージを送信するステップと、
を含む、前記方法。 - 前記方法は、前記サービスのソース品質バケット及び前記第2の挿入ステップのタイムスタンプに対して導出したハッシュ関数に従って前記カウンタを格納することを担当する前記サービスの宛先品質バケットにおけるデータ処理デバイスのアドレスを判定するステップであって、前記タイムスタンプは、前記データ処理デバイス間で共有された共有クロックから得られるタイムスロットを表す、前記ステップをさらに含む、請求項1に記載の方法。
- 前記データ処理デバイスは、サービスの品質バケットに関するエントリポイントを表すルートデータ処理デバイスを備えるデータ処理デバイスのネットワークにおいて組織化され、前記第2の挿入ステップは、そのサービスの宛先品質バケットの宛先ルートデータ処理デバイスのアドレスを得るためにそのサービスのソース品質バケットの第1のルートデータ処理デバイスに第1の要求を送信するステップをさらに含む、請求項1又は2に記載の方法。
- 前記方法は、前記サービスの宛先品質バケットに前記データ処理デバイスを挿入するためにそのサービスの宛先品質バケットの前記宛先ルートデータ処理デバイスに第2の要求を送信するステップをさらに含む、請求項3に記載の方法。
- 前記データ処理デバイスのネットワークは、2つのレベルのオーバーレイ構造に従って組織化され、前記オーバーレイ構造は、前記ルートデータ処理デバイス間のネットワーク接続を組織化する1つの上部オーバーレイと、同一のサービスの品質バケットのデータ処理デバイス間のネットワーク接続を組織化する多数の底部オーバーレイとを備える、請求項3又は4に記載の方法。
- 前記データ処理デバイスによって提供される前記サービスは、データストレージサービスである、請求項1から5のいずれかに記載の方法。
- 前記データ処理デバイスによって提供される前記サービスは、音響映像レンダリングサービスである、請求項1から5のいずれかに記載の方法。
- サービスを提供するデータ処理デバイスのための孤立した異常の検出システムであって、
前記データ処理デバイスによって提供された少なくとも1つのサービスの品質に応じてサービスのソース品質バケットに前記データ処理デバイスを挿入する第1の挿入手段であって、サービスの品質バケットは、データ処理デバイスのグループに関して、少なくとも1つのサービスに関するサービスの品質の範囲を表す、前記第1の挿入手段と、
前記データ処理デバイスによって提供された前記少なくとも1つのサービスの前記品質が前記サービスのソース品質バケットの範囲を超えて展開した場合、前記データ処理デバイスによって提供された前記少なくとも1つのサービスの前記品質に応じてサービスの宛先品質バケットに前記データ処理デバイスを挿入する第2の挿入手段と、
前記サービスの宛先品質バケット内にあり、前記データ処理デバイスと同じように前記サービスのソース品質バケットから前記サービスの宛先品質バケットへ前記少なくとも1つのサービスの品質の展開を経ているデータ処理デバイスの総数を表すカウンタがある値を下回るとき、孤立した異常の検出を表すメッセージを送信する手段と、
を備えた、前記システム。 - 前記サービスのソース品質バケット及び前記第2の挿入手段のタイムスタンプに対して演算したハッシュ関数に従って前記カウンタを格納することを担当する前記サービスの宛先品質バケットにおけるデータ処理デバイスのアドレスを判定する手段であって、前記タイムスタンプは、前記データ処理デバイス間で共有された共有クロックから得られるタイムスロットを表す、前記手段をさらに備えた、請求項8に記載のシステム。
- 前記データ処理デバイスは、サービスの品質バケットに関するエントリポイントを表すルートデータ処理デバイスを備えるデータ処理デバイスのネットワークにおいて組織化され、前記第2の挿入手段は、そのサービスの宛先品質バケットの宛先ルートデータ処理デバイスのアドレスを得るためにそのサービスのソース品質バケットの第1のルートデータ処理デバイスに第1の要求を送信する手段をさらに備えた、請求項8又は9に記載のシステム。
- 前前記サービスの宛先品質バケットに前記データ処理デバイスを挿入するためにそのサービスの宛先品質バケットの前記宛先ルートデータ処理デバイスに第2の要求を送信する手段をさらに含む、請求項10に記載のシステム。
- 前記データ処理デバイスのネットワークは、2つのレベルのオーバーレイ構造に従って組織化され、前記オーバーレイ構造は、前記ルートデータ処理デバイス間のネットワーク接続を組織化する1つの上部オーバーレイと、同一のサービスの品質バケットのデータ処理デバイス間のネットワーク接続を組織化する多数の底部オーバーレイとを備える、請求項10又は11に記載のシステム。
- 前記データ処理デバイスによって提供される前記サービスは、データストレージサービスである、請求項8から12のいずれかに記載のシステム。
- 前記データ処理デバイスによって提供される前記サービスは、音響映像レンダリングサービスである、請求項8から12のいずれかに記載のシステム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP12305851 | 2012-07-13 | ||
EP12305851.3 | 2012-07-13 | ||
EP12306237.4 | 2012-10-10 | ||
EP12306237.4A EP2720406A1 (en) | 2012-10-10 | 2012-10-10 | Method for isolated anomaly detection in large-scale data processing systems |
PCT/EP2013/064405 WO2014009321A1 (en) | 2012-07-13 | 2013-07-08 | Method for isolated anomaly detection in large-scale data processing systems |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015529036A JP2015529036A (ja) | 2015-10-01 |
JP2015529036A5 true JP2015529036A5 (ja) | 2016-08-25 |
Family
ID=48790429
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015520945A Withdrawn JP2015529036A (ja) | 2012-07-13 | 2013-07-08 | 大規模データ処理システムにおいて孤立した異常検出を行うための方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20150207711A1 (ja) |
EP (1) | EP2873194A1 (ja) |
JP (1) | JP2015529036A (ja) |
KR (1) | KR20150031470A (ja) |
CN (1) | CN104488227A (ja) |
WO (1) | WO2014009321A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL232254A0 (en) * | 2014-04-24 | 2014-08-31 | Gershon Paz Tal | A travel planning platform for providing quality tourist information |
US11386107B1 (en) * | 2015-02-13 | 2022-07-12 | Omnicom Media Group Holdings Inc. | Variable data source dynamic and automatic ingestion and auditing platform apparatuses, methods and systems |
US10489368B1 (en) * | 2016-12-14 | 2019-11-26 | Ascension Labs, Inc. | Datapath graph with update detection using fingerprints |
KR102413096B1 (ko) | 2018-01-08 | 2022-06-27 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
CN113778730B (zh) * | 2021-01-28 | 2024-04-05 | 北京京东乾石科技有限公司 | 分布式系统的服务降级方法和装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5991264A (en) * | 1996-11-26 | 1999-11-23 | Mci Communications Corporation | Method and apparatus for isolating network failures by applying alarms to failure spans |
US6643260B1 (en) * | 1998-12-18 | 2003-11-04 | Cisco Technology, Inc. | Method and apparatus for implementing a quality of service policy in a data communications network |
US7058707B1 (en) * | 2000-08-01 | 2006-06-06 | Qwest Communications International, Inc. | Performance modeling in a VDSL network |
US8087025B1 (en) * | 2004-06-30 | 2011-12-27 | Hewlett-Packard Development Company, L.P. | Workload placement among resource-on-demand systems |
US8549180B2 (en) * | 2004-10-22 | 2013-10-01 | Microsoft Corporation | Optimizing access to federation infrastructure-based resources |
US20080046266A1 (en) * | 2006-07-07 | 2008-02-21 | Chandu Gudipalley | Service level agreement management |
EP2368348B1 (en) * | 2008-12-02 | 2015-07-08 | Telefonaktiebolaget LM Ericsson (publ) | Method and apparatus for influencing the selection of peer data sources in a p2p network |
CN101626322B (zh) * | 2009-08-17 | 2011-06-01 | 中国科学院计算技术研究所 | 网络行为异常检测方法及系统 |
US8423637B2 (en) * | 2010-08-06 | 2013-04-16 | Silver Spring Networks, Inc. | System, method and program for detecting anomalous events in a utility network |
US9069761B2 (en) * | 2012-05-25 | 2015-06-30 | Cisco Technology, Inc. | Service-aware distributed hash table routing |
-
2013
- 2013-07-08 CN CN201380037387.1A patent/CN104488227A/zh active Pending
- 2013-07-08 WO PCT/EP2013/064405 patent/WO2014009321A1/en active Application Filing
- 2013-07-08 US US14/414,626 patent/US20150207711A1/en not_active Abandoned
- 2013-07-08 EP EP13736876.7A patent/EP2873194A1/en not_active Withdrawn
- 2013-07-08 KR KR20157003603A patent/KR20150031470A/ko not_active Application Discontinuation
- 2013-07-08 JP JP2015520945A patent/JP2015529036A/ja not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10305746B2 (en) | Network insights | |
JP2015529036A5 (ja) | 大規模データ処理システムにおいて孤立した異常の検出を行うための方法 | |
US11968077B2 (en) | Link fault monitoring method and apparatus | |
KR101645598B1 (ko) | 네트워크에서의 침입 탐지 방법 | |
US20150009840A1 (en) | Packet time stamp processing methods, systems, and apparatus | |
CN109787827B (zh) | 一种cdn网络监控的方法及装置 | |
US10567195B2 (en) | Network nodes in a ring network | |
CN108418710A (zh) | 一种分布式监控系统、方法及装置 | |
CN106302001B (zh) | 数据通信网络中业务故障检测方法、相关装置及系统 | |
CN113572654B (zh) | 网络性能监控方法、网络设备及存储介质 | |
US10833889B2 (en) | Method and device for monitoring control systems | |
JP2015529036A (ja) | 大規模データ処理システムにおいて孤立した異常検出を行うための方法 | |
CN105071986B (zh) | 一种监控系统运行状态的方法 | |
WO2015011827A1 (ja) | 情報処理装置、フィルタリングシステム、フィルタリング方法、及びフィルタリングプログラム | |
WO2016082509A1 (zh) | 一种检测标签交换路径连通性的方法及装置 | |
CN110830284A (zh) | 一种基于sdn网络的业务故障监测的方法和装置 | |
WO2016184222A1 (zh) | 一种故障检测方法及装置 | |
EP4099643A1 (en) | A method, a system and a computer program product for monitoring an industrial ethernet protocol type network | |
CN111343033B (zh) | 一种面向多层差异的网络管理系统 | |
US8665861B1 (en) | VoIP delay for predictive maintenance | |
CN112583650B (zh) | 一种spn中sr-be隧道链路检测方法及系统 | |
WO2017186004A1 (zh) | 故障上报方法、装置及存储介质 | |
JP5976934B2 (ja) | 電子機器 | |
WO2016082368A1 (zh) | 一种保持数据一致性的方法、装置及ptn传输设备 | |
KR101490316B1 (ko) | 네트워크 장비의 장애 검출 시스템 및 이를 이용한 장애 검출 방법 |