JP2007519993A - 周期的事象のためのクラスタリング技術 - Google Patents

周期的事象のためのクラスタリング技術 Download PDF

Info

Publication number
JP2007519993A
JP2007519993A JP2006546206A JP2006546206A JP2007519993A JP 2007519993 A JP2007519993 A JP 2007519993A JP 2006546206 A JP2006546206 A JP 2006546206A JP 2006546206 A JP2006546206 A JP 2006546206A JP 2007519993 A JP2007519993 A JP 2007519993A
Authority
JP
Japan
Prior art keywords
data
data array
period
scaled
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006546206A
Other languages
English (en)
Inventor
キモ ヘテョネン
ペッカ クンプライネン
ペッコ ヴェフヴィレイネン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JP2007519993A publication Critical patent/JP2007519993A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Optimization (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Molecular Biology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Algebra (AREA)
  • Medical Informatics (AREA)
  • Complex Calculations (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

データ処理システムは、物理的プロセスの数個のエンティティにおいて少なくとも一つの変量の周期的振舞いを集合的に記述するデータ配列を処理する。各周期は数個のタイムスロットを含む。入力ルーチン(2−4)は複数のデータ配列を受信し、各データ配列は複数のデータ項目を含み、そのそれぞれは一つのタイムスロットにおけるエンティティの変量を記述する。マグニチュード決定ルーチンは(2−6)、数個のエンティティのそれぞれのための平均、量、またはピークのような特定のマグニチュードパラメータを決定する。スケーリングルーチン(2−8)は、特定のマグニチュードパラメータが隠され、それらの形状だけが維持されるように、エンティティ間のデータ配列をスケーリングする。トレーニングルーチン(2−10)は、第1の複数のスケーリングされたデータ配列を用いて、クラスタ中心のセットを決定するために、クラスタリングシステムをトレーニングする。トレーニング後に、クラスタリングルーチン(2−12)は、第2の複数のスケーリングされたデータ配列を、トレーニングされたクラスタリングシステムへ適用する。
【選択図】図2

Description

本発明は周期的な事象に対するクラスタリング技術に関する。例えば、本発明は、物理的プロセスにおいて数個のエンティティにおける一つ以上の変量の周期的振舞いを集合的に記述するデータ配列を処理するために使用されうる。
k−平均法、階層的クラスタリング技術、自己組織化マップ、または同様のもののようなクラスタリング技術は、物理的プロセスにおける可変の振舞いを解析するために広く使用されている。具体的な、しかし制限的でない例を挙げると、物理的プロセスはセルラー通信ネットワークのオペレーションが考えられる。数個のエンティティそれぞれは、セルまたはネットワークの何らかのその他のリソースであり、一つ以上の変量はトラヒック量、リソースの使用法、切断された接続の数(または割合)、または同様のもののようなパフォーマンスインジケータであることが考えられる。
従来のクラスタリング技術においては、多量の有用な情報が無視されているという欠点を有していた。
本発明の目的は、上記不利益を軽減するための方法、および該方法を実行するための装置を提供することである。本発明の目的は、独立請求項において述べられる事項によって特徴付けられる方法及び装置によって達成される。本発明の好ましい実施形態は従属請求項において開示される。
本発明は、従来のクラスタリング技術が変量を絶対的な量として取り扱っていたという発見に基づくものである。通信ネットワークとの関連で、これを理解することできる。なぜなら、例えば、限界を超えてはならないトラヒックチャネル数のような物理的リソースによって、該ネットワークが制限されるためである。それに応じて、物理的なリソースが限界を超える場合、異常な状況を考慮することは自然である。しかし、それはまさに多量な有用な情報を無駄にする絶対的な量としての変量の観測である。したがって、絶対的な値が隠されている場合、小さなエンティティの周期的振舞いが、大きなエンティティのものと同様でありうるという発想に、本発明は部分的に基づいていている。これは、物理的プロセスにおいて、数個のエンティティで少なくとも一つの変量の周期的振舞いを集合的に記述するデータ配列を処理するための方法によって達成され得る。本発明は、以下のステップを含む。
1.周期的振舞いにおける第1の周期を決定し、該第1の周期を複数のタイムスロットに分割し、
2.複数のデータ配列を決定し、各データ配列は一つのタイムスロットにおけるエンティティの変量を記述するような複数のデータ項目を含み、
3.数個のエンティティそれぞれのために、特定のマグニチュード(magnitude)パラメータを決定し、
4.特定のマグニチュードパラメータが隠されるようにエンティティ間でデータ配列をスケーリング(scale)し、
5.クラスタ中心のセットを決定するために第1の複数のスケーリングされたデータ配列を用いてクラスタリングシステムをトレーニングし、
6.該トレーニングされたクラスタリングシステムを用いて、第2の複数のスケーリングされたデータ配列をクラスタリングする。
上記ステップをより理解できるようにするために、以下においても例としてセルラー通信ネットワークを使用する。しかし、これが非制限的な例に過ぎず、どのように本発明の様々な要素がそれぞれ互いに関係しうるかを明らかにするために提供されるものに過ぎないことに、読み手は注意されたい。
ステップ1は、物理的プロセスが通信ネットワークである場合、第1の周期は典型的には24時間の期間であって、タイムスロットは典型的には複数時間である。この24時間の期間は、ネットワークユーザの生活リズムによって決定されるが、一時間のタイムスロットは、人間が時を測定するのに時間を使用することになれているため、単なる便宜上の選択である。しかし、コンピュータにとっては、いかなるサイズのタイムスロットも同様に実現可能であり、タイムスロットは同じ長さである必要さえない。例えば、沈黙時間(典型的には夜)の間は、タイムスロットは高い活動期間の間より長くすることができる。この「第1の周期」という用語は、例えば、7つの一日のタイムスロットをそれぞれ持つ1週間周期のような、さらなる周期が存在することを暗示する。
「周期」という用語は、統計の現実世界の現象の関連において通常であるように、広い意味で理解されるべきである。パフォーマンスインジケータが周期的であるという事実は、パフォーマンスが任意の二つの周期の間で同一であることを意味する。むしろ、この用語は全体として、複数のサイクルの二つの大きなサンプルを与えられた、周期的に繰り返すパターンが存在することを意味する。これらの周期に渡るパフォーマンスは同じになる傾向がある。しかし、差異は発生し、そして、多くのクラスタリングシステムの目的が、該差異がシステム故障か、不正なユーザの振舞いか、またはその他の異常を表しているかを決定することである。
ステップ2においては、各データ項目は1タイムスロットにおけるエンティティの変量を記述する。例えば、各データ項目は、特定のタイムスロットの間のセルラー通信ネットワークにおけるセルのパフォーマンスインジケータを記述することが考えられる。一般的には、パフォーマンスインジケータは、該タイムスロットに渡って積算され、または平均化される。データ配列は周期に渡るデータ項目の収集物である。例えば、タイムスロットが1時間の期間である場合、データ配列がトータルで24時間の期間をカバーする24サンプル値の(配列のような)セットであることが考えられる。データ配列が曲線のように視覚化される場合、明確な形状でありマグニチュード(サイズ)を有する。
ステップ3においては、特定のマグニチュードパラメータが各エンティティのために決定される。ステップ4においては、特定のマグニチュードパラメータが隠されるように、データ配列がエンティティ間でスケーリングされる。マグニチュードパラメータは、形状のみを残すように絶対的な量を隠されるために使用することができる任意の数学的な量である。スケーリングオペレーションは、大きいおよび小さいエンティティを他のそれぞれと互換性を良くする。言い換えると、あるエンティティからクラスタリングデータによって得られた情報は、そのサイズに関わらず、もう一つのエンティティからデータをクラスタリングするために使用されうる。(この文脈において、「サイズ」とは、トラヒックの量のようなそのパフォーマンスインジケータのマグニチュードを意味し、その地理的な特徴ではない。)
ステップ5においては、クラスタリングシステムは、クラスタ中心のセットを決定するために第1の複数のスケーリングされたデータ配列を用いてトレーニングされる。ステップ3および4に関連して記述されるようにデータ配列がスケーリングされるという事実から離れて、このトレーニングステップは、完全に従来のものとすることができる。従来のクラスタリングシステムは、いくつかの好ましいクラスタリング技術が後に記述されるが、本発明が任意の特定のクラスタリングシステムを要求しない、または任意の特定のシステムに束縛されないことを意味する。
ステップ6においては、ステップ5においてトレーニングされたクラスタリングシステムは、第2の複数のスケーリングされたデータ配列をクラスタリングするために使用される。再び、純粋に数学的観点から見ると、しかし、後述するように、エンティティ間のマグニチュードを隠すためのスケーリングされたデータ配列を使用する創意は、新規な応用への道を開く。
本発明の利点は、パフォーマンスインジケータのような変数が、所与のサイズのエンティティに制限されないために、より有効な情報が物理的プロセスから得られることである。クラスタリングに先立ってスケーリングオペレーションを実行することで、該独創的な技術は従来のクラスタリング技術と互換性がある。
本発明は、数個の応用において使用されうる。例えば、独創的な方法の手段によってクラスタリングされ、スケーリングされたデータ配列が異常状態を検出するように使用されうる。もう一つの応用において、スケーリングされたデータ配列は価格戦略を決定するために使用する。さらにもう一つの応用においては、スケーリングされたデータ配列はネットワークリソースのために最適化されたオペレーティングパラメータを決定するために使用される。このパラメータは、もう一つのネットワークリソースへそれからコピーされる。そしてさらに、本発明の技術は、そのプロファイルがあるテンプレートの顧客に厳密に一致するが、そのサービスの使用がテンプレートの加入者のそれからは異なる加入者を検出するために使用される。この情報は、検出された顧客へのサービスの宣伝をターゲットにして使用することもできる。
本発明の好ましい実施形態にしたがうと、第1の周期を使用することでクラスタリングされたデータ配列は、該第1の周期の複合である第2の周期を使用することで再クラスタリングされる。例えば、第1の周期を伴うデータ配列が、ネットワーク要素またはリソースの日毎の振舞いを表し、一方で、第2の周期を用いて再クラスタリングされたデータ配列は日毎の振舞いの発展を1年間通して表現する。
本発明のもう一つの好ましい実施形態にしたがうと、クラスタリングシステムは、管理されていないクラスタリングシステムである。監視されていないクラスタリングシステムを使用することの利点は、クラスタリング中心をそれらの先行する知識なしに発見することができることである。しかし、通常「シードバリュー(seed value)」と呼ばれるクラスタ中心を考慮する推定的な情報がある場合、そういったシードバリューを用いて監視されないクラスタリングシステムを初期化することは有益である。
該独創的な処理によって得られる情報は、新規な方法において使用される。これらの応用分野を詳細に記述する前に、以下の説明をよりコンパクトにするいくつかの用語について説明する。クラスタリングシステムはデータ配列を処理し、クラスタ中心のセットを作り出す。「プロトタイプ」という用語を、クラスタ中心を記述するデータ配列のために使用すると便利である。それら各自のインジケータを用いたプロトタイプの収集物をコードブック(code book)と呼ぶことができる。コードブックの使用は数個の利点を与える。例えば、(例えば、日毎の24の独立したサンプルのような)一つの完全なデータスロットとしてのあるタイムスロットの間のエンティティの振舞いをアーカイブする代わりに、コードブックから最も一致するプロトタイプを選択し、最も一致するプロトタイプのインジケータを単に格納することができる。それは、明らかに多くのメモリー空間を節約する。したがって、本発明はアーカイビングデータにおいて有用である。
データ配列は、コードブックにおいてプロトタイプといつも正確に一致することはめったにない。これは、最も一致するプロトタイプからの大きな偏差が検出されるように信頼区間を定義することが有益だからである。データ配列が最も一致するプロトタイプから大きく逸脱するために、それが信頼区間の外になる場合、全体のデータ配列およびプロトタイプインジケータのみでなくアーカイブすることは有益である。さらによい代替手段は、最も一致するプロトタイプおよびパフォーマンスインジケータが信頼区間の外であるタイムスロットのインジケータ、およびそれらのタイムスロットにおける実際の(またはスケーリングされた)データ値をアーカイブすることである。
データアーカイバルにおける利点を与えることに加えて、コードブックコンセプトは、データ解析においてもまた有用である。例えば、特にエンティティ間のパフォーマンスインジケータのマグニチュードが異なる場合、任意の二つのエンティティが同様のまたはほとんど同様の態様で振舞うか否かを決定することは自明ではない。しかし、類似性の検出がコードブックにおけるプロトタイプインジケータの解析に基づいている場合、エンティティ間の同様の振舞いを検出することは比較的簡単なタスクである。
いくつかの実施形態においては、本発明はネットワークリソースにおける量のような可観測変量の履歴から失われた値を回復するために使用される。過去におけるその変量の日、週又は月の平均しか知らない場合、その変量の時間毎の振舞いの妥当な推定が、現在の時間毎の振舞いを推定することにより得ることができる。現在の時間毎の振舞いは、同じエンティティまたはその最も近く一致するプロトタイプから決定されうる。
本発明は、クラスタリングシステムに関連してよく知られているように、プログラムされたデータ処理として実行されることができる。先行技術との主要な逸脱、すなわち、観測されたエンティティ又は変量の特定のマグニチュードパラメータを隠すことが、計算ルーチンによって実行され得る。同様に、いくつかの実施形態において使用される信頼区間が計算ルーチンによって決定される。信頼区間基準が満たされた場合に、最も一致したプロトタイプインジケータのみがアーカイブされ、完全なデータは廃棄または第2の記憶装置へ移動される実施形態が、適切に構成されたデータベースシステムとして実行される。
以下に、添付図面を参照しながら好ましい実施形態を用いてより詳細に本発明を記述する。本発明は数個の応用において使用される。説明に役立つ例は異常状態を処理することである。図1は、異常を検出するためのニューラルネットワークのようなクラスタリングシステムの使用を示す。参照番号102は(ニューラルネットワークからは区別される)通信ネットワークのような物理的システムの要素を指す。物理的要素は数個の可観測変量を含むことが考えられる。例えば、物理的システム要素102が電気通信交換機である場合、その可観測変量はスループット、待機時間、不成功呼の数(または割合)、および同様のものを含む。各単位時間の間、インジケータコレクタ(indicator collector)106はインジケータタプル104を収集する。このタプルはインジケータデータベース110に格納される。参照番号112はニューラルネットワーク(または他の学習するメカニズム)114をトレーニングするために使用されるデータセットを指す。データセット112は物理的要素102の通常の振舞いを表示する。記憶装置118はトレーニングされたニューラルネットワークを含む。物理的要素102が観測される場合、対応するトレーニングされたニューラルネットワーク120は、記憶装置118から取り出され、異常検出メカニズム122へ入力されるものとして適用される。異常検出メカニズムのその他の入力は、異常な振舞いのためにテストされるべきであるインジケータセット124である。異常検出メカニズム122が、インジケータセット124によって記述された振舞いが異常であることを決定した場合、異常P−値および最偏位インジケータ126が異常履歴データベース128に格納される。同時に、アラーム130が、コンピュータスクリーンのような表示装置132に与えられる。
図2は本発明の原理を示すフローチャートである。ステップ2−2は周期(または多重に入れ子にされた周期)、(時間、日、週・・・のような)タイムスロット、(物理的ネットワークリソースのような)エンティティ、および(スループット、切断された呼の数、セル内のハンドオーバ数、ショートメッセージ数または同様のもののような)観測されるべき変量を決定するための準備段階である。ステップ2−4は、可観測変量のためのデータ配列を決定するためのもう一つの準備段階である。可観測変量の一つがセルにおけるハンドオーバ数であり、各タイムスロットが1時間で、周期が24時間であると仮定すると、各データ配列を24データ項目(数)の軌道とし、各データ項目がそれぞれの時間の間のハンドオーバ数を記述するとすると都合が良い。
ステップ2−6は各エンティティのための特定のマグニチュードパラメータを決定することを含む。特定のマグニチュードパラメータの好ましい形式は、1周期に渡る値の和(積分)または平均である。その平均値が特定のマグニチュードパラメータであると仮定すると、各エンティティのデータ配列(軌道)がそのエンティティの平均値によって割られる。それにより、その周期に渡って、各エンティティを記述するデータ項目の平均値が等しくなる。言い換えると、エンティティの特定のマグニチュードパラメータは隠されるであろう。これは、ステップ2−8において行なわれる。次に、ステップ2−10においては、クラスタリングシステムはスケーリングされたデータ配列の第1のセット(トレーニングセット)によってトレーニングされる。このステップがクラスタリングシステムの準備およびトレーニング段階を完了する。クラスタリングシステムの実際の使用がステップ2−12において行なわれる。これは、データ配列がエンティティの特定のマグニチュードパラメータを隠すことでスケーリングされる事実は別とすると、従来型である。
特定のマグニチュードパラメータとして平均値を使用することの典型的な利点は、図1に示され、任意のエンティティからの観測データとともにトレーニングされた異常検出システムが、相当に大きいまたは小さい容量を伴うその他のエンティティにおける異常を検出するために使用されうるということである。
図3は4つのクラスタ中心31−34であって、異なるサイズのエンティティのマグニチュードパラメータを隠すためにスケーリングされたものを示す。この例においては、クラスタ中心は24エレメント軌道のグラフで表したものであり、ここでは各軌道は物理的リソースのネットワークセルにおけるトラヒック量のような毎日の振舞いを表す。本発明がそのマグニチュードからエンティティの振舞いの形状を抽出することが図3から明らかである。各軌道の平均値は同じである。これは、軌道をグラフで表したものによってカバーされる範囲が等しいことをもまた意味している。言い換えると、各軌道のための周期長が同じであるから、軌道の範囲またはマグニチュードパラメータとしての積分を用いることは、その平均値を用いることと数学的に等しい。
図4Aは、物理的リソースのようなエンティティのための典型的なプロフィール40を示す。物理的リソースがネットワークセルであって、可観測変量がトラヒック量であると、もう一度仮定する。一番左の欄は、月曜日は「1」、日曜日は「7」のような週における日を示す。クラスタ番号1〜4は、図3において示される4つのクラスタ中心を参照する。この例においては、プロファイル40は、問題となっているセルのために、クラスタ4が、月曜日から木曜日及び日曜日のための最良振舞いインジケータである。最良振舞いインジケータであるその他のクラスタのための確率は無視しても良く、これは、この確率は正確には0ではないが、実用的な目的のためには無視され得ることを意味する。同様に、すべての土曜日は、プロファイル40の最後の行によって示されるようにクラスタ3によって最もよく表される。しかし、すべての金曜日は同様ではなく、それらの83パーセントはクラスタ1によって最もよく表されるが、それらの残り17パーセントはクラスタ4によって最もよく表される。
図4Bは、より詳細な週毎のプロファイル45を示す。確率欄のダッシュ記号は無視するのに十分小さい値を示す。この例は、実用的な目的のためには、すべての月曜日(日番号1)はクラスタ4によって最もよく表される一方で、クラスタ4は金曜日にとっては最もよい記述子となる30%だけの可能性を有している等を示している。
図5は4つの発見された週毎のクラスタのための確率分布50を示す。この例においては、(そのグラフによる表現が図3に示されるような)4つの択一的な週プロファイルおよび4つのクラスタ中心がある。確率分布表50をコンパクトに維持するために、この表は10パーセント単位でそれぞれその確率を示す。このように、例えば、4のデータ入力は40パーセントを意味する。この確率分布50は、週プロファイル1において、月曜日の最良表現となるために、クラスタ1および2が20または80パーセントの確率をそれぞれ有することを示す。このプロファイルにおいて、残りのクラスタ3および4のための確率は無視することができる。週プロファイル2において、月曜日の最良表現となるために、クラスタ1および4は70または30パーセントの確率をそれぞれ有し、残りのクラスタ2および3のための確率は無視することができるなど。
確率分布50の手法を用いると、毎時間の推定を1周期に渡る平均変量をその変量の推定されるプロファイルの形状と掛け合わせることで計算することができる。
週毎のプロファイル40、45および/または確率分布50は数個の応用において使用されうる。例えば、それらは、観測データをアーカイブするときに、メモリ消費を削減するために使用されうる。各24時間周期のための絶対的な値として観測データをアーカイブすることに代わって、絶対的な値を、(平均値のような)そのセルおよび周期の特定のマグニチュードパラメータによって、スケーリングする(割る)ことも考えられ、またスケーリングの後のエンティティの振舞いが所定のプロファイルの一つに対応することが考えられる。もしそれがすると、それは、その24時間のための、その特定のマグニチュードおよびプロファイル番号をアーカイブするのに十分である。それは、それ自身内でメモリ消費における相当な削減を起こす。
週毎のプロファイル40、45および/または確率分布50のためのもう一つの応用は、改善された予測である。エンティティ間でのマグニチュードの違いを隠し、プロファイル形状に専念することで、エンティティが同様のプロファイル形状を有することが提供される任意のマグニチュードのエンティティから得られる情報を使用することが可能である。
さらにもう一つの応用は「過去の予測」をすることである。これは、例えば、過去のある時間における変量の平均値を知ることのみができるかもしれないことを意味する。その現在のプロファイル形状を知ることで、時間の関数としてその変量の過去の振舞いを推定することができる。
図6および7は、観測をアーカイブする好ましい技術を示す。ここで使用されるように、「アーカイブ」は、ある関連するデータをある時間(通常は複数年)の間格納し、関連のないデータは、廃棄されるかまたは通常はオフラインの安い規則装置に移動される。言い換えれば、アーカイブは、メモリ消費量を削減するために、何を格納し、何を廃棄するかを決定することを含む。
図6は、アーカイブ方法のフローチャートである。ステップ6−2は準備段階であり、そこでは、観測されるエンティティのための特定のマグニチュードパラメータが決定され、格納される。このステップは、図2のステップ2−6と同じである。ステップ6−4は、24時間トラヒック値の軌道のような観測された変量のデータ配列を取得することを含む。ステップ6−6は、データ配列が観測されるエンティティのために特定のマグニチュードパラメータを用いてスケーリングされる。ステップ6−8では、スケーリングされたデータ配列がトレーニングされたクラスタリングシステムを用いてしょりされ、その最も一致するクラスタ中心を探す。ステップ6−10においては、スケーリングされたデータ配列が最も一致するクラスタ中心から所定の信頼区間内であるか否かを決定する。そうである場合、ステップ6−12が実行され、そこでは最も一致するクラスタ中心のインジケータのみが格納され(アーカイブされ)、現実のデータ配列が廃棄されるかまたは第2の記憶装置に移動される。一方で、スケーリングされたデータ配列が最も一致するクラスタ中心から所定の信頼区間内にない場合、ステップ6−14が実行され、そこでは、スケーリングされたまたはスケーリングされない形式で完全なデータ配列が格納(アーカイブ)される。さらにより効果的なアーカイバルメモリの使用は、最も一致するクラスタ中心、それらは所定の信頼区間の外であるようにサンプルが最も一致するクラスタ中心から逸脱しているタイムスロット、それらのタイムスロットにおける実際のサンプル値のインジケータをアーカイブすることにより達成される。
図7は異常な状況を示す。曲線71はネットワークリソースのような物理的エンティティの実際のスケーリングされた観測を示す。最も一致するプロトタイプ(クラスタ中心)は、カーブ72によって示される。実際の観測71は、15:00、16:00、および17:00の3つの観測を除いて24時間周期のほとんどの間、所定の信頼区間73内である。
図8は、観測を格納するための好ましいデータ構造80を示す。データ構造80は一つのエンティティと一つの変量のための観測履歴を含む。欄81は、24時間期間のような周期の通し番号である。実際の観測を含むデータ配列は、特定のマグニチュードパラメータ82を用いて割られることでスケーリングされる。それから、スケーリングされたデータ配列はトレーニングされたクラスタリングシステムを用いてクラスタリングされる。観測履歴80は連続する11日間のデータ入力を示す。一日のデータエントリ(または任意のその他の使用される周期)は、最も一致するクラスタ中心83およびスケーリングされたデータ配列が所定の信頼区間内であるか否か、すなわち、それがある信頼測定より少なく、最も一致するクラスタ中心から逸脱しているかどうかを示すフラッグ84とを含む。
ほとんどの日については、クラスタ中心2が最も近く一致した。7日および8日については、クラスタ中心3および1がそれぞれ最も一致した。しかし、10日においては、実際の観測は図7の曲線81に沿ったと仮定する。言い換えると、実際の観測は、15:00に開始する3つの連続する観測を除いて最も一致するプロトタイプ(クラスタ中心)番号2(曲線82として示される)の信頼区間内であった。それに応じて、欄83で10日のデータエントリはクラスタ中心2が最も一致することを示すが、欄84のフラッグはスケーリングされた観測が全体の周期の間、信頼区間内でないことを示す。10日については、実際の観測記録85が存在する。実際の観測記録85は10日の15:00に開始する3つの連続する時間の間の実際の観測は123、15、および192であった。
24時間期間のような一周期のすべてのスケーリングされた観測が信頼区間内であれば、3つの記述子、すなわち、マグニチュード(float number)、最も一致するクラスタ中心(integer)、およびフラッグ84だけが、アーカイブされなければならない。
[更なる応用]
本発明の応用は、異常状態を処理することに限定されない。本発明の一つの好ましい実施形態においては、顧客のデータ構造および彼らによって使用されるサービスが生成される。この発想は、顧客をほとんど同様のサービス分布を用いてクラスタリングすることである。この実施形態は、コードブック(codebook)コンセプトの使用を生かす。任意の顧客によって使用されるサービスのセットは、データ配列(軌道)を構成する。このデータ配列は、クラスタ中心を探すために、それからクラスタリングされる。この場合、それらはそのサービスの組合せが非常に人気があるプロトタイプの顧客である。最も一致するプロトタイプの顧客からの任意の顧客の偏差は、それらの顧客によって使用されるサービスのセットにおける違いを表す。この情報は、そういったサービスをまだ使用していない顧客へのサービスの申し出のために使用されうる。通信ネットワークにおいて、そういったサービスがネットワークそれ自体を経由して申し出される。
サービスを申し出るクラスタリングベースの技術は、いくつかのサービスをまだ使用していない顧客の単純なデータベーススキャンを含むしらみ潰しの技術を超えて、ネットワークリソースのようなリソースを節約する。クラスタリング技術のリソース節約の態様は、プロトタイプの顧客が、人気のあるサービスの組合せであるサービスA、B、CおよびDを使用し、その他の顧客がサービスA、BおよびCを使用する場合、その顧客は、サービスA、XおよびYを使用する顧客よりサービスDのためのより潜在的なターゲットであるという事実に起因する。一方で、しらみ潰しの技術は、ネットワークおよびその他のリソースを、その顧客がプロトタイプの顧客に近いが完全な一致ではないか否かについて考慮することなくサービスを「無分別に」申し出る。
本発明のもう一つの実施形態においては、顧客および彼らの時間毎のサービス使用プロフィールについてのデータ構造が生成される。この実施形態は、料率が変更された場合に、時間を最適化するために使用される。本発明は、異なるサイズの同等物から情報を作成するため、そういった料率変更最適化は任意のサイズのエンティティから情報を利用することができる。
料率が変更された場合に時間を最適化するために、本発明を使用する代わりに、またはそういった使用に加えて、本発明はその他の観測されたエンティティのオペレーティングパラメータを最適化するためにも使用され得る。例えば、エンティティのサイズに関わらず、ネットワークオペレータはパラメータセットを最適化されたエンティティから最適化されていないものへコピーすることができる。この実施形態は、アクティビティ形状コードブックを生成し、エンティティの日毎の振舞いをクラスタリングすることを含む。例えば、セルラーネットワークにおいて最適化されるべきパラメータは周波数再利用パターン、サービス間の帯域割り当て、またはそういったものを含む。
本発明の更なる実施形態は、同期サービスのための送信回数最適化のためのデータ構造を含む。セルラーネットワークはマルチメディアファイルの形式において、「インフォテインメント(infortainment」を配送するために、ますます使用されるであろうことが予測される。ネットワークオペレータは送信のための送信時間を最適化するために本発明を使用することができる。このネットワークは、低い予測される負荷と共に将来のタイムスロットへファイル配送をスケジューリングすることで負荷バランシングを採用することが考えられる。最適なスロットは負荷プロファイルの方法で特定することができる。ある顧客が大きな遅延を取り扱うことに用意があるように、クラスタリングによる顧客分類は選択に影響を与えることが考えられる。このネットワークは、顧客に遅延推定を示すことができる。
本発明はサービススケジューリングを最適化するためにもまた使用することができる。小さいまたは大きいサイズのエンティティからの情報は、大体は同等であるから、特定のマグニチュードを隠した後は、ネットワークまたはサービスオペレータはその他の点では可能なものより大きな情報量へのアクセスを有する。オペレータはこの情報を使用し、サービスオペレーションを最適にスケジューリングする。例えば、ネットワーク保守システムがネットワーク要素からデータログを取り出すための要求を受信することが考えられる。このシステムは推定されるトラヒックプロファイル形状を確認し、その要求されたログ検索(またはその他の保守オペレーション)をトラヒックピークの外にスケジューリングする。
[信頼区間]
以下に、信頼区間または信頼限界を決定するための好ましい技術について記載する。例えば、所定の信頼限界を超えてその最も一致するプロトタイプ(クラスタ中心)から逸脱する可変値を異常、または例外と呼ぶことができる。
信頼限界は通常k・σとして計算される。ここでσは、変量の標準偏差であり、kは要求される信頼水準を示す被覆率である。標準的に分散されたデータのために、k=1.96は95パーセントの信頼水準を意味する。基礎をなす分布に関わらず、被覆率2、および3がよく使用される。
本発明の好ましい実施形態に従うと、標準偏差σが各クラスタおよびタイムスロットのために別々に計算される。例として08:00におけるクラスタ番号1を使用する。クラスタ1に帰属する日プロファイルが組み合わされる。それから、08:00の値の標準偏差がこれらのプロファイルから計算される。
いま、この発想は信頼限界をスケーリングし、それにより高い平均可変値とともにエンティティから発生するプロファイルのために、より厳しい信頼限界を得ることである。これは、以下によって達成することができる。
Figure 2007519993
方程式1において、fは減少関数(単調またはステップ関数)であり、mean(var)は、例えば、24時間周期における一つセルにおけるトラヒックの平均値であるような、1周期における変量の平均値である。単調減少関数の好ましいバージョンは、以下のように(日のような)各周期の平均値の逆平方根である。
Figure 2007519993
したがって、異なる可変依存性被覆率が各周期のために得られる。この信頼限界は以下のように表現される。
Figure 2007519993
ここで、μは特定のタイムスロットのクラスタにおける平均値であり、このクラスタはk−平均法クラスタリングによって与えられるクラスタ中心でもあり、σは上述のクラスタにおけるデータの標準偏差である。
図9は方程式2によって決定される信頼限界の応用を示す。y軸は、変量(パフォーマンスインジケータ)のスケーリングされた値を示し、x軸は0から4のスケールにおける日毎の平均であり、平均値はこの例においては2である。黒円91は観測結果を表す。水辺の線92は、標準偏差の平均プラスマイナス2倍であるような固定された信頼限界を示す。
曲線93は概略的に(しかし、正確ではなく)方程式2によって決定される信頼限界を示す。信頼限界によって定義づけられる信頼区間は、増加するマグニチュードパラメータを用いて徐々に(この例においては漸近的に)狭くなる。例えば、観察結果94は、徐々に減少する信頼区間93内であるが、固定された信頼区間92の外である。一方、観察点95は、徐々に減少する信頼区間93外であるが、固定された信頼区間92内である。変量がセル内のトラヒック量を記述すると仮定すると、徐々に減少する信頼区間93は、トラヒックが静かである場合、よりアクティブなセルにおける方がより大きな比例的な偏差が取り扱われることを意味する。例えば、農村地帯の静かなセルは通常、時間当り10個の呼を持ち、発言するかも知れない。誰かが、故障した携帯電話を用いて3つの失敗した呼の試みを行なった場合、これは必ずしも異常ではないが、100の中の30の失敗の個の試みは深刻な異常である。
技術進歩によって、本発明の概念が様々な方法で実行され得ることが、当業者には明らかであろう。本発明およびその実施形態は、上述の例には制限されないが、請求項の範囲内で変更され得る。
図1は異常検出のためのクラスタリングシステムの使用を示すブロック図である。 図2は本発明の原理を示すフローチャートである。 図3は異なるサイズのエンティティのマグニチュードパラメータを隠すためにスケーリングされた4つのクラスタ中心を示す。 図4AおよびBは二つの典型的なプロファイル記述子を示す。 図5は4つの異なる週のクラスタのための確率分布を示す。 図6は観測を記憶する好ましい技術を示す。 図7は異常状態を示す。 図8は異常状態の手当てを伴うデータをアーカイブするためのデータ構造を示す。 図9は信頼区間を決定するための好ましい技術を示す。

Claims (16)

  1. 物理的プロセスの数個のエンティティ(102)における少なくとも一つの変量の周期的振舞いを集合的に記述するデータ配列を処理するための方法であって、
    前記方法が、
    周期的振舞いにおいて第1の周期を決定し(2−2)、第1の周期を複数のタイムスロットに分割し、
    複数のデータ配列を決定し(2−4)、各データ配列は一つのタイムスロットにおいてエンティティの変量を記述するように複数のデータ項目を含み、
    数個のエンティティのそれぞれのために、特定のマグニチュードパラメータ(82)を決定し(2−6)、
    前記特定のマグニチュードパラメータが隠されるようにエンティティ間のデータ配列をスケーリングし(2−8)、
    第1の複数のスケーリングされたデータ配列を伴うクラスタリングシステムを、クラスタ中心(31−34;72、83)のセットを決定するために、トレーニングし(2−10)、
    前記トレーニングされたクラスタリングシステムを、第2の複数のスケーリングされたデータ配列をクラスタリングするために使用する(2−12)ことを含む方法。
  2. 前記特定のマグニチュードパラメータが各第1の周期のために別々に決定される請求項1に記載の方法。
  3. 更に、前記第1の周期の複合である第2の周期を決定し、前記第2の周期に関連してクラスタリングされたデータ配列を再クラスタリングすることを含む請求項1に記載の方法。
  4. 更に、前記隠された特定のマグニチュードパラメータをクラスタリングシステムから切り離して処理することを含む請求項1に記載の方法。
  5. クラスタリングシステムは監視されていないクラスタリングシステムである請求項1に記載の方法。
  6. 更に、前記監視されていないクラスタリングシステムを、前記トレーニングに先立って推測的なシードバリューを用いて初期化することを含む請求項5に記載の方法。
  7. 更に、所定の信頼区間(73、93)を前記クラスタ中心に関連付け、
    前記第2の複数のクラスタリングされたデータ配列のそれぞれのために、最も一致するクラスタ中心を決定し(6−8)、前記クラスタリングされたデータ配列が前記最も一致するクラスタ中心の前記所定の信頼区間内であるか否かを確認し(6−10)、
    信頼区間内であるときは、前記最も一致するクラスタ中心(83)のインジケータをアーカイブし(6−12)、問題となっているデータ配列を廃棄し、
    信頼区間内でないときは、クラスタリングされたデータ配列が前記所定の信頼区間内にあるとされない、それらのタイムスロットのためのデータ配列のデータ項目(85)をアーカイブする(6−14)ことを含む請求項1に記載の方法。
  8. 前記信頼区間(93)は前記記述された変量の増加するマグニチュードパラメータを用いて徐々に狭くなる請求項7に記載の方法。
  9. 更に、前記第2の複数のスケーリングされたデータ配列を、異常状態を検出するために使用することを含む請求項1に記載の方法。
  10. 前記クラスタリングされた第2の複数のスケーリングされたデータ配列を、価格戦略を決定するために使用することを含む請求項1に記載の方法。
  11. 前記スケーリングされたデータ配列が様々な加入者によるサービスの使用をあらわし、前記方法が、前記クラスタリングされた第2の複数のスケーリングされたデータ配列を、サービス公告への志願加入者を選択するために使用することを含む請求項1に記載の方法。
  12. 前記数個のエンティティがネットワークリソース(102)であり、前記方法が更に、
    スケーリングされたデータ配列を、ネットワークリソースのための最適化されたオペレーティングパラメータのセットを決定するために使用し、
    前記最適化されたオペレーティングパラメータをもう一つのネットワークリソースへコピーすることを含む請求項1に記載の方法。
  13. 物理的プロセスの数個のエンティティにおいて少なくとも一つの変量の周期的振舞いを集合的に記述するデータ配列を処理するためのデータ処理システムであって、
    前記周期的振舞いが少なくとも繰り返す第1の周期を示し、各第1の周期が複数のタイムスロットを含み、
    前記データ処理システムが、
    複数のデータ配列を受信するための入力ルーチン(2−4)であって、各データ項目が一つのタイムスロットにおけるエンティティの変量を記述するように、各データ配列が複数のデータ項目を含む入力ルーチンと、
    数個のエンティティそれぞれのために特定のマグニチュードパラメータ(82)を決定するためのマグニチュード決定ルーチン(2−6)と、
    前記特定のマグニチュードパラメータが隠されるようにエンティティ間のデータ配列をスケーリングするためのスケーリングルーチン(2−8)と、
    クラスタ中心(31−34;83)のセットを決定するために、第1の複数のスケーリングされたデータ配列を用いてクラスタリングシステムをトレーニングするためのトレーニングルーチンと(114、2−10)と、
    前記トレーニングされたクラスタリングシステムを用いて、第2のスケーリングされたデータ配列をクラスタリングするためのクラスタリングルーチン(2−12)と、を備えるデータ処理システム。
  14. 前記マグニチュード決定ルーチンが前記特定のマグニチュードパラメータ(82)を別々に各第1の周期のために決定するために動作する請求項13に記載のデータ処理システム。
  15. さらに、前記隠された特定のマグニチュードパラメータをクラスタリングシステムから切り離して処理するためのルーチンを含む請求項13に記載のデータ処理システム。
  16. 更に、所定の信頼区間(73、93)を前記クラスタ中心に関連付け、
    前記第2の複数の各クラスタリングされたデータ配列のために、最も一致するクラスタ中心(72)を決定し(6−8)、および前記最も一致するクラスタ中心の前記クラスタリングされたデータ配列が前記所定の信頼区間内であるかを確認し(6−10)、
    前記所定の信頼区間内であるときは、最も一致するクラスタ中心のインジケータをアーカイブし(6−12)、問題となっている前記データ配列を廃棄し、
    前記所定の信頼区間内でないときは、クラスタリングされたデータ配列が前記所定の信頼区間内にあるとされない、それらのタイムスロットのためのデータ配列のデータ項目(85)をアーカイブする(6−14)、
    ために動作可能であるアーカイバルルーチン(6−2・・・6−14)を含む請求項13に記載のデータ処理システム。
JP2006546206A 2003-12-31 2004-11-26 周期的事象のためのクラスタリング技術 Pending JP2007519993A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/748,673 US7461037B2 (en) 2003-12-31 2003-12-31 Clustering technique for cyclic phenomena
PCT/FI2004/000721 WO2005064499A1 (en) 2003-12-31 2004-11-26 Clustering technique for cyclic phenomena

Publications (1)

Publication Number Publication Date
JP2007519993A true JP2007519993A (ja) 2007-07-19

Family

ID=34700938

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006546206A Pending JP2007519993A (ja) 2003-12-31 2004-11-26 周期的事象のためのクラスタリング技術

Country Status (7)

Country Link
US (1) US7461037B2 (ja)
EP (1) EP1704500B1 (ja)
JP (1) JP2007519993A (ja)
CN (1) CN100511241C (ja)
AT (1) ATE401612T1 (ja)
DE (1) DE602004015157D1 (ja)
WO (1) WO2005064499A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8028337B1 (en) 2005-08-30 2011-09-27 Sprint Communications Company L.P. Profile-aware filtering of network traffic
US8204974B1 (en) * 2005-08-30 2012-06-19 Sprint Communications Company L.P. Identifying significant behaviors within network traffic
WO2010004509A1 (en) * 2008-07-08 2010-01-14 Mobile Telephone Networks (Proprietary) Limited A method and system for clustering cells in a cellular or mobile telecommunications network
US20110090820A1 (en) 2009-10-16 2011-04-21 Osama Hussein Self-optimizing wireless network
US8849771B2 (en) 2010-09-02 2014-09-30 Anker Berg-Sonne Rules engine with database triggering
US8509762B2 (en) 2011-05-20 2013-08-13 ReVerb Networks, Inc. Methods and apparatus for underperforming cell detection and recovery in a wireless network
EP2754271B1 (en) 2011-09-09 2019-11-13 Reverb Networks Inc. Methods and apparatus for implementing a self optimizing-organizing network manager
US9258719B2 (en) 2011-11-08 2016-02-09 Viavi Solutions Inc. Methods and apparatus for partitioning wireless network cells into time-based clusters
US9008722B2 (en) 2012-02-17 2015-04-14 ReVerb Networks, Inc. Methods and apparatus for coordination in multi-mode networks
US9113353B1 (en) 2015-02-27 2015-08-18 ReVerb Networks, Inc. Methods and apparatus for improving coverage and capacity in a wireless network
US11620471B2 (en) * 2016-11-30 2023-04-04 Cylance Inc. Clustering analysis for deduplication of training set samples for machine learning based computer threat analysis

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07141384A (ja) * 1993-11-12 1995-06-02 Hitachi Ltd データ特徴抽出方法およびデータ分類装置
JPH07200300A (ja) * 1993-11-29 1995-08-04 Toshiba Corp パターン認識型推論方法及び装置
JPH10334155A (ja) * 1997-05-28 1998-12-18 Toshiba Corp 自動取引装置の資金運用支援装置
JPH1170445A (ja) * 1997-08-29 1999-03-16 Nec Kyushu Ltd 製造プロセス変更管理装置及び製造プロセス変更管理方法
JP2001188772A (ja) * 1999-12-28 2001-07-10 Ishikawajima Harima Heavy Ind Co Ltd プラントの需要予測方法及びその装置
JP2002024251A (ja) * 2000-07-07 2002-01-25 Nippon Telegr & Teleph Corp <Ntt> 時系列データの分類方法及び装置並びに時系列データの分類プログラムを記録した記録媒体

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4821264A (en) * 1988-02-04 1989-04-11 Bell Communications Research, Inc. Adaptive concentration communication network ISDN access
US5040133A (en) * 1990-01-12 1991-08-13 Hughes Aircraft Company Adaptive clusterer
US5148485A (en) * 1990-07-20 1992-09-15 Ericsson Ge Mobile Communications Holding, Inc. Encrypton system for digital cellular communications
US5263120A (en) * 1991-04-29 1993-11-16 Bickel Michael A Adaptive fast fuzzy clustering system
US6850252B1 (en) * 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US5717725A (en) * 1992-03-12 1998-02-10 Ntp Incorporated System for wireless transmission and receiving of information through a computer bus interface and method of operation
US5751773A (en) * 1992-03-12 1998-05-12 Ntp Incorporated System for wireless serial transmission of encoded information
US6272190B1 (en) * 1992-03-12 2001-08-07 Ntp Incorporated System for wireless transmission and receiving of information and method of operation thereof
US5694428A (en) * 1992-03-12 1997-12-02 Ntp Incorporated Transmitting circuitry for serial transmission of encoded information
US6198783B1 (en) * 1992-03-12 2001-03-06 Ntp Incorporated System for wireless serial transmission of encoded information
US5710798A (en) * 1992-03-12 1998-01-20 Ntp Incorporated System for wireless transmission and receiving of information and method of operation thereof
US5742644A (en) * 1992-03-12 1998-04-21 Ntp Incorporated Receiving circuitry for receiving serially transmitted encoded information
US5745532A (en) * 1992-03-12 1998-04-28 Ntp Incorporated System for wireless transmission and receiving of information and method of operation thereof
US5764241A (en) * 1995-11-30 1998-06-09 Microsoft Corporation Method and system for modeling and presenting integrated media with a declarative modeling language for representing reactive behavior
US6490571B1 (en) * 1996-05-02 2002-12-03 David L. Cooper Method and apparatus for neural networking using semantic attractor architecture
US6009418A (en) * 1996-05-02 1999-12-28 Cooper; David L. Method and apparatus for neural networking using semantic attractor architecture
US6556951B1 (en) * 1997-11-26 2003-04-29 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services System and method for intelligent quality control of a process
US6023544A (en) * 1997-12-24 2000-02-08 Lucent Technologies Inc. Monitoring with an optical wavelength router
US6608630B1 (en) * 1998-11-09 2003-08-19 Broadcom Corporation Graphics display system with line buffer control scheme
US7051309B1 (en) * 1999-02-16 2006-05-23 Crosetto Dario B Implementation of fast data processing with mixed-signal and purely digital 3D-flow processing boars
US6161213A (en) * 1999-02-17 2000-12-12 Icid, Llc System for providing an integrated circuit with a unique identification
US7219020B1 (en) * 1999-04-09 2007-05-15 Axontologic, Inc. Chemical structure similarity ranking system and computer-implemented method for same
US6542854B2 (en) * 1999-04-30 2003-04-01 Oracle Corporation Method and mechanism for profiling a system
US6473084B1 (en) * 1999-09-08 2002-10-29 C4Cast.Com, Inc. Prediction input
US6792399B1 (en) * 1999-09-08 2004-09-14 C4Cast.Com, Inc. Combination forecasting using clusterization
US7072863B1 (en) * 1999-09-08 2006-07-04 C4Cast.Com, Inc. Forecasting using interpolation modeling
US6606615B1 (en) * 1999-09-08 2003-08-12 C4Cast.Com, Inc. Forecasting contest
US6658467B1 (en) * 1999-09-08 2003-12-02 C4Cast.Com, Inc. Provision of informational resources over an electronic network
SE9904008D0 (sv) 1999-11-03 1999-11-03 Abb Ab Förfarande vid maskin
US6553332B2 (en) * 1999-12-22 2003-04-22 Texas Instruments Incorporated Method for evaluating process chambers used for semiconductor manufacturing
US6532456B1 (en) * 2000-06-02 2003-03-11 International Business Machines Corporation Methods for identifying partial periodic patterns of infrequent events in an event sequences
US6901244B1 (en) * 2000-10-23 2005-05-31 Oren Semiconductor Ltd. Training signal in a single carrier transmission
US6701389B2 (en) * 2001-06-07 2004-03-02 International Business Machines Corporation Bandwidth allocation in accordance with shared queue output limit
US6834266B2 (en) 2001-10-11 2004-12-21 Profitlogic, Inc. Methods for estimating the seasonality of groups of similar items of commerce data sets based on historical sales data values and associated error information
US20030101009A1 (en) 2001-10-30 2003-05-29 Johnson Controls Technology Company Apparatus and method for determining days of the week with similar utility consumption profiles
FR2833125B1 (fr) * 2001-12-03 2004-02-27 Cit Alcatel Procede de determination de tendance de service
US7327800B2 (en) * 2002-05-24 2008-02-05 Vecima Networks Inc. System and method for data detection in wireless communication systems
US7107188B2 (en) * 2003-01-08 2006-09-12 Schlumberger Technology Corporation Digital pressure derivative method and program storage device
US7327795B2 (en) * 2003-03-31 2008-02-05 Vecima Networks Inc. System and method for wireless communication systems
US7369491B1 (en) * 2003-05-14 2008-05-06 Nortel Networks Limited Regulating data-burst transfer
US7254646B2 (en) * 2003-06-23 2007-08-07 Hewlett-Packard Development Company, L.P. Analysis of causal relations between intercommunicating nodes
US7149387B2 (en) * 2004-03-24 2006-12-12 Enablence Inc. Double diffraction grating with flat passband output
US7311666B2 (en) * 2004-07-10 2007-12-25 Trigeminal Solutions, Inc. Apparatus for collecting information

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07141384A (ja) * 1993-11-12 1995-06-02 Hitachi Ltd データ特徴抽出方法およびデータ分類装置
JPH07200300A (ja) * 1993-11-29 1995-08-04 Toshiba Corp パターン認識型推論方法及び装置
JPH10334155A (ja) * 1997-05-28 1998-12-18 Toshiba Corp 自動取引装置の資金運用支援装置
JPH1170445A (ja) * 1997-08-29 1999-03-16 Nec Kyushu Ltd 製造プロセス変更管理装置及び製造プロセス変更管理方法
JP2001188772A (ja) * 1999-12-28 2001-07-10 Ishikawajima Harima Heavy Ind Co Ltd プラントの需要予測方法及びその装置
JP2002024251A (ja) * 2000-07-07 2002-01-25 Nippon Telegr & Teleph Corp <Ntt> 時系列データの分類方法及び装置並びに時系列データの分類プログラムを記録した記録媒体

Also Published As

Publication number Publication date
CN100511241C (zh) 2009-07-08
WO2005064499A1 (en) 2005-07-14
US20050144148A1 (en) 2005-06-30
CN1902631A (zh) 2007-01-24
EP1704500A1 (en) 2006-09-27
EP1704500B1 (en) 2008-07-16
US7461037B2 (en) 2008-12-02
ATE401612T1 (de) 2008-08-15
DE602004015157D1 (de) 2008-08-28

Similar Documents

Publication Publication Date Title
US9679243B2 (en) System and method for detecting platform anomalies through neural networks
US20160359719A1 (en) System and method for predicting changes in network quality
EP3093760A1 (en) Device and method
CN104951340A (zh) 一种信息处理方法及装置
JP2007519993A (ja) 周期的事象のためのクラスタリング技術
EP2652909B1 (en) Method and system for carrying out predictive analysis relating to nodes of a communication network
WO2018207878A1 (ja) 需要予測装置
CN109978575B (zh) 一种挖掘用户流量经营场景的方法及装置
Barnett et al. Feature-based classification of networks
CN114866462A (zh) 一种智慧校园的物联网通信路由方法及系统
CN110602207A (zh) 基于离网预测推送信息的方法、装置、服务器和存储介质
EP3084531A1 (en) Predicting an interface control action of a user with an in-vehicle user interface
Zhang et al. Adaptive sampling scheme for learning in severely imbalanced large scale data
Plutowski et al. Experience with selecting exemplars from clean data
CN101676912A (zh) 在存储器有限的系统中对数据进行分类的方法
JP4780668B2 (ja) トラヒック分析モデルの構築方法、装置および構築プログラムならびにその記憶媒体
CN107368355B (zh) 虚拟机的动态调度方法和装置
CN116047223A (zh) 一种基于实时用电信息及大数据分析的窃电判别方法
CN112883291B (zh) 目的地位置的推荐方法、装置和服务器
CN114579157A (zh) 一种应用更新方法、装置、计算机设备及存储介质
CN115473781B (zh) 一种分布式snmp数据中心设备监控方法
CN111339156B (zh) 业务数据的长期确定方法、装置和计算机可读存储介质
CN114118502A (zh) 客户来电预测方法、装置、计算机设备和存储介质
CN117473322A (zh) 一种异常设备识别模型训练方法、电子设备及存储介质
CN118093194A (zh) 一种gpu资源的分配方法及装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090518

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100112