JP4513878B2 - 統計処理方法及び装置並びに統計処理方法のプログラム - Google Patents

統計処理方法及び装置並びに統計処理方法のプログラム Download PDF

Info

Publication number
JP4513878B2
JP4513878B2 JP2008053195A JP2008053195A JP4513878B2 JP 4513878 B2 JP4513878 B2 JP 4513878B2 JP 2008053195 A JP2008053195 A JP 2008053195A JP 2008053195 A JP2008053195 A JP 2008053195A JP 4513878 B2 JP4513878 B2 JP 4513878B2
Authority
JP
Japan
Prior art keywords
data
section
appearance frequency
frequency
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008053195A
Other languages
English (en)
Other versions
JP2009212770A (ja
Inventor
佳孝 濱口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2008053195A priority Critical patent/JP4513878B2/ja
Priority to US12/320,046 priority patent/US20090183037A1/en
Priority to DE602009000921T priority patent/DE602009000921D1/de
Priority to EP09150720A priority patent/EP2081326B1/en
Publication of JP2009212770A publication Critical patent/JP2009212770A/ja
Application granted granted Critical
Publication of JP4513878B2 publication Critical patent/JP4513878B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、処理対象となるデータについて、データに係る値毎の出現頻度の計数等の処理を行う統計処理方法等に関するものである。特に、値が取り得る範囲が広いために、全ての値に係る計数値等の記憶(記録)を保持し続けることが困難で、かつ、例えば時系列のデータにおいて、時間と共に、出現する値の傾向が変化するような場合にも対応できるようにしたものである。
例えば継続的に得られる大規模な時系列のデータから、一定の出現頻度以上出現するデータに係る値(以下、データ値という)の出現頻度などの処理結果を抽出するための統計処理を行うことは、様々な場面で必要になる。例えば、通信網を伝送する信号に含まれるIPアドレスをデータ(データ値)とし、通信網中からパケットロス等のエラー発生を検出したIPアドレス毎にエラー検出数を計数処理し、一定割合(一定数)以上のエラー発生の要因となっているIPアドレス、通信経路等を特定するトラフィック観測を監視システムにおいて行う場合などがある。
通信網上におけるエラー検出数をIPアドレス毎に計数するための最も単純な処理方法としては、IPアドレス(データ値)毎にカウンタ(計数した値を記憶する記憶領域)を用意し、エラーを検出する毎に、エラー検出に係るIPアドレスのカウンタに増加させた数値(以下、カウント数という)を記憶させることが考えられる。しかし、IPアドレス空間は膨大であるため、例えば監視システムにより管理している端末分程度のカウンタを用意するとしても、多くのメモリ容量を要することになる。また、一定の出現頻度以上計数したカウンタ(IPアドレス)を探索し、そのデータ値などの結果を抽出するにはメモリ空間をスキャンする必要があるが、カウンタを多く用意するほどスキャンに時間を要する。以上のことから、全てのデータ値に対してカウンタを設けても実用的でないことが多い。
そこで、確率的に、もしくはある一定誤差範囲内に収まるように、出現頻度が低いと判断したデータ値に係るカウント数などのデータ(以下、データ値毎の計数処理などに関するデータを頻度情報(スケッチ)という)を、随時、記憶手段から削除することにより、少ないメモリ容量(記憶容量)で、一定以上のデータ値の出現頻度を効率よく計数し、データ値などの結果を抽出する統計処理などするための方法が論じられている(非特許文献1参照)。
この方法は、例えばコンピュータ等からなる統計処理装置において、次のような処理を行うことにより実現する。
(1)計数処理を行う単位(以下、サイクルという)となる所定数N個分のデータを、記憶手段の確保した記憶領域に記憶させる。ここで、N個分のデータについては、頻度の誤差範囲を決める値となる許容誤差率ε(%)の逆数個のデータ毎に分割するものとする(以下、この分割に係る単位を区間というものとする(1サイクルにおける区間数はεNとなる))。そして、各区間には例えば1から始まる区間番号を付すものとする。
(2)1番目のデータ(=区間番号1の最初のデータ)から順に処理を開始する。処理に係るデータが新たなデータ値を有しているものと判断すると、データ値及びデータが属する区間番号−1で表される誤差見積もり値Δとともに、カウント数fを1にした頻度情報を記憶手段に記憶する。一方、処理に係るデータが有するデータ値が既に記憶済みであると判断すると、そのデータ値に係るカウント数fを1増やして記憶手段に記憶する。
(3)区間の境界に到達する度(区間の最後のデータを処理する度)に、以下の基準に従い、カウント数fの少ないデータ値に係る頻度情報を記憶手段から削除するか残すかを判断して処理する。
(3.1)f+Δ≦処理に係る区間番号となるカウント数f、誤差見積もり値Δを有するデータ値に係る頻度情報は記憶手段から削除する。
(3.2)上記式を満たさないデータ値に係る頻度情報は記憶手段に残す。
上記(2)及び(3)の処理を、N番目のデータまで繰り返すと、一定数以上計数したデータ値に係る頻度情報は全て記憶手段に残されることが数学的に保証されており、かつカウント数fの少ないデータ値に係る頻度情報は削除されて残らない。したがって、カウント数fの多い、重要なデータ値の数を計数するために必要な分のメモリ容量を用意すればよくなり、より少ないメモリ容量で、必要なデータ値の出現頻度を計数することができる。
Gurmeet Singh Manku, Rajeev Motwani, 「Approximate Frequency Counts over Data Stream」, VLDB 2002 (28th VLDB), p 346-357, August 2002
ここで、例えば、信号が継続して終端なく伝送し、かつ、通信網に伝送する信号においてIPアドレスが頻繁に入れ替わるような場合には、エラー検出に係るIPアドレスも時間とともに変化することが多い。この場合のトラフィック観測では、エラー検出に係るIPアドレスの経時変化をできる限りリアルタイムで把握する観点から、できる限り短い間隔で、処理した結果を抽出できることが望ましい。
しかし、上記の方法では、N個分のデータを一区切として処理することになるため、基本的には、N個のデータの処理終了毎でなければ、処理した結果を抽出することができない。(N個のデータにおける)許容誤差率εに基づいて各区間におけるデータ数(1/ε)、区間数(εN)が決まることを考慮すると、処理単位のデータ数Nを少なくして間隔を短くしようとすることにも限界がある。
もし、上記の処理を行って、N個のデータの処理終了毎まで待つことなく、処理した結果を抽出しようとすると、処理を開始するデータを所望のデータ数wだけずらしていってそれぞれ計数処理を並行して行う必要がある。この場合には、w個のデータを処理する毎に結果の抽出を行うことができる。ただ、複数の並行処理を行うには、各処理について、処理に係る記憶容量とデータ処理能力が必要となるため、多大なリソースを消費してしまう。そして、上記のメモリ容量抑制の目的との間でずれが生じる可能性がある。
そこで、メモリ容量抑制をはかりつつ、より短い間隔で有効な処理の結果を抽出する統計処理を行うことができる統計処理方法等の実現が望まれていた。
本発明に係る統計処理方法は、所定数個のデータに対する誤差許容率の逆数個のデータの単位を区間とし、1区間分のデータに係るデータ値毎の出現頻度の計数処理を終了する毎に、出現頻度が低いデータ値の計数に係る頻度情報を記憶手段から削除しながら、データ値毎の出現頻度の計数を行って頻度情報を記憶手段に記憶する統計処理方法において、所定数個のデータに係る計数処理を終了した後及び1区間分のデータに係るデータ値の計数処理を終了する毎に、記憶手段に頻度情報が記憶された各データ値について、所定数個分のデータにおける先頭区間の次の区間の出現頻度の推定値を算出しなければならないかどうかを判断する工程と、次の区間の出現頻度の推定値を算出しなければならないものと判断すると、記憶手段に頻度情報として記憶された先頭区間における出現頻度となる先頭区間出現頻度、所定数個のデータにおける最終区間における出現頻度となる最終区間出現頻度及び計数処理に係る出現頻度に基づいて、計数処理に係る出現頻度から先頭区間出現頻度を減じ、1区間分ずらした所定数個−1区間分のデータにおける計数処理に係る出現頻度として記憶手段に記憶し、また、次の区間の出現頻度の推定値を算出し、1区間分ずらした次の所定数個分のデータにおける先頭区間出現頻度として記憶手段に記憶する工程と有するものである。
本発明によれば、1区間分ずらした所定数個−1区間分のデータにおける計数処理に係る出現頻度を算出すると共に、必要に応じて、先頭区間の次の区間の出現頻度の推定値を算出して記憶手段に記憶しておくようにしたので、さらに1区間分の処理を行うだけで、1区間分ずれた次の区間を先頭区間とする所定数個のデータに係るデータ値毎の出現頻度を得ることができるため、計数処理、統計処理に必要な記憶容量、処理能力を抑えつつ、所定数個のデータを処理する毎しか出現頻度が得られない場合に比べて、はるかに短い間隔で、結果の抽出を行うことができる。
実施の形態1.
図1は本発明の実施の形態1の統計処理装置1000の構成を示すブロック図である。統計処理装置1000は、処理対象のデータに基づく処理を行う各種処理部を有する演算手段2000、データ等を一時的、長期的に記憶する記憶手段3000及び外部装置から処理対象となるデータを含む信号を受信するためのインタフェース手段4000とを備えている。
本実施の形態の演算手段2000は、所定数N個のデータにおける出現率がs(%)以上のデータ値などの結果を抽出する統計処理を、1/ε個の新たなデータの計数処理を行う毎に行えるようにするものである。演算手段2000は、データ取得処理部2001、データ値計数処理部2002、区間内データ処理数判断部2003、データ処理数判断部2004、計数決定処理部2005、近似頻度演算処理部2006及び結果検索抽出処理部2007で構成する。
データ取得処理部2001は、インタフェース手段4000が受信した信号に含まれるデータに係るデータ値を判断するデータ取得処理を行う。データ値計数処理部2002は、データ取得処理部2001が判断したデータ値に基づいて、スケッチ記憶部3002に記憶する頻度情報を追加するデータ追加処理及び最終区間頻度yn の値を増加させる区間頻度加算処理による頻度情報の追加、更新等に係る計数処理を行う。
区間内データ処理数判断部2003は、各区間の先頭のデータからのデータ処理数を計数して、区間内処理データ数記憶部3003に記憶した区間処理データ数の値に基づいて、区間境界であるかどうかを判断する区間内データ数計数処理を行う。計数決定処理部2005は、各区間境界におけるデータ処理終了により、最終的なカウント数fの確定等を行う頻度加算処理及び出現頻度の低いデータ値に係る頻度情報のスケッチ記憶部3002からの削除等を行う低頻度データ削除処理による頻度情報の更新、削除等に係る計数処理を行う。
データ処理数判断部2004は、処理開始からのデータ処理数を計数して、処理データ数記憶部3004に記憶した処理データ数の値に基づいて、N個以上のデータを処理したかどうかを判断するデータ数計数処理を行う。
近似頻度演算処理部2006は、確定したN個分のデータによる頻度情報に基づいて先頭区間出現頻度演算処理を行う。特に本実施の形態では、後述するように、N個分のデータ(サイクル)における先頭区間の次の区間(次のサイクルの先頭の区間となる)におけるの出現頻度(近似値となる)を算出する頻度近似処理を、必要に応じて行う。
結果検索抽出処理部2007は、スケッチ記憶部3002に記憶されている頻度情報に基づいてデータ値毎のカウント数などの結果を抽出し、表示手段(図示せず)等に表示させる統計処理などを行う。本実施の形態では、N個のデータの中から出現率s(%)以上のデータ値に係る出現頻度を検索し、抽出するものとする。ここで、誤差許容率εが存在することから、実際にはs−ε(%)以上の出現率のデータ値に係る出現頻度が抽出される(f≧(s−ε)Nを満たすデータ値に係るカウンタ数fが出現頻度として抽出される)。例えば出現率s=1(%)、誤差許容率ε=0.1(%)の場合、出現率が1(%)以上のデータを抽出することが目的であるが、0.1(%)の誤差があるために、実際には0.9(%)以上の出現率であれば抽出する可能性がある。
ここで、演算手段2000の各処理部について、それぞれ異なる専用機器(ハードウェア)で構成することもできるが、一般的には、例えば、CPU(Central Processing Unit )を中心とする演算制御手段(コンピュータ)でハードウェアを構成し、各処理部が行う処理手順をあらかじめプログラム化し、ソフトウェア、ファームウェア等で構成しておく。そして、演算手段2000がそのプログラムを実行して、プログラムに基づく処理を行うことにより、上記の各処理部が行う処理を実現する。これらのプログラムに係るデータは例えば記憶手段3000に記憶しておくようにする。
本実施の形態の記憶手段3000は、頻度情報をはじめとして、演算手段2000の各処理部が行う処理に係るデータを一時的又は長期的に記憶するための手段である。例えばRAM(Random Access Memory)のような半導体素子を利用した記憶手段でもよいし、HDD(Hard disk drive )のような大きなメモリ容量を有する記憶手段でもよい。スケッチ記憶部3001、区間内処理データ数記憶部3002及び処理データ数記憶部3003で構成する。図1では各記憶部を記憶手段3000が有しているが、それぞれ異なる記憶手段に記憶させるようにしてもよい。
図2はスケッチ記憶部3001に記憶される頻度情報の例を表す図である。スケッチ記憶部3001は、出現したデータに係るデータ値、出現頻度(出現数)を表すカウント数f、出現頻度の誤差見積もり値Δ、先頭区間頻度y1 及び最終区間頻度yn の各事項を組とした頻度情報を、例えばテーブル形式のデータとして記憶する。この頻度情報は、データ値計数処理部2002等の処理により、追加、更新又は削除される。図2を参照した統計処理装置1000による統計処理の手順については後述する。
区間内処理データ数記憶部3002は、区間内データ処理数判断部2003の処理に基づいて、処理中の区間内において処理したデータ数を記憶する。また、処理データ数記憶部3003は、データ処理数判断部2004の処理に基づいて、統計処理開始から処理したデータ数と、処理を終えた区間境界(=区間)の数を記憶する。区間境界の数は、例えば、現在処理している区間番号が5の場合、その区間番号から1減算した4が記憶している区間境界の数となる。そして、現在処理中の区間番号内の全データの処理を終了したものと判断すると5が記憶される。
図3は統計処理に係るデータの概念図である。図3中の○は、各データを示しており、図3の左端のデータから順に時系列にデータの処理がなされるものとする。前述したようにN個のデータが仮想的に1/ε毎の区間に分けられる(各区間の境界を区間境界とする)ものとし、区間番号bを1から順に付けるものとする。例えばN=100000であるとすると、区間数εNは、(0.1/100)×100000=100となる。そのため、100000個のデータは、1000個ずつ100個の区間に分けられることになる。
本実施の形態の統計処理装置1000は、N個のデータに対する処理を行った後、それよりも少ない数のデータ数(1/ε)を単位とする区間における計数処理などが終了する毎に、一定の出現率以上出現するデータ値などを検索、抽出する統計処理を行えるようにしたものである。例えば、図3において、サイクルb1内のN個のデータにおいて一定出現率以上現れるデータ値などを抽出する処理を行った後、新たに1/ε個のデータを処理すると、今度はサイクルb2におけるN個のデータ中において一定出現率以上現れるデータを抽出する処理を行うもので、新たに1/ε個のデータが得られる度に継続して行うものである。
その際、1区間ずらしたN個のデータには、そのN個のデータに含まれなくなった区間における出現頻度(出現数)は含めないため、その区間における出現頻度を減算しなければならない。しかしながら、各区間の出現頻度を記憶することはメモリ容量の増大につながる(基本的にはεN区間分に係る各出現頻度を記憶できるだけの記憶容量をデータ値毎に用意する必要がある)ことになり、メモリ容量抑制の効果を著しく損なうことになる。そこで、実施の形態1の統計処理装置1000では、出現頻度の減算する必要がある(例えば出現頻度が高く、頻度情報の削除がなされていない等)と判断すると、N個分のデータにおける先頭区間(1区間目)の出現頻度(先頭区間頻度y1 )と最終区間(εN区間目)の出現頻度(最終区間頻度yn )とに基づいて、先頭区間の次の区間(2区間目。N個分のデータを1区間分ずらしたときの先頭区間となる)の出現頻度を近似推定するものとする。ここで、本実施の形態では二次曲線に係る式を用いた推定を行う。これにより、εN番目の区間以降の各区間における処理を終了する毎に、N個分のデータにおけるデータ値毎の出現頻度を推定し、その結果を抽出することができる。
図3のサイクルb1及びサイクルb2に基づいて説明する。例えば、サイクルb1の1〜εN区間(N個分のデータ)に係るカウント数fなどの結果が処理により得られている場合、その結果には、サイクルb2の1〜εN−1区間に係る結果も反映されている。そのため、次の区間に係るデータを処理すれば、サイクルb2の1〜εN区間に係る結果が得られることになる。ただ、このときイクルb1の1区間目における出現頻度が余分に含まれる場合がある。そこで、b1=1〜εNまでの処理した結果からサイクル1の先頭区間における出現頻度を減ずることでサイクルb2の1〜εN−1までを処理した結果として見なす。そして、このような処理を継続して続けていくため、本実施の形態では、あるサイクルの先頭区間における出現頻度を必要に応じて近似推定するための処理を行い、減算する。
図4は統計処理装置1000の演算手段2000における処理の流れ及び処理時に参照するデータの流れを組み合わせて表した図である。図4に基づいて、本実施の形態における統計処理装置1000の処理手順について説明する。また、図2の頻度情報の例に基づいて適宜説明する。
まず、データが含まれた信号をインタフェース手段4000が受信し、演算手段2000が処理できる形式のデータに変換する。データ取得処理部2001はデータを取得し、データ値を判断するデータ取得処理を行う(S1)。データ値計数処理部2002は、データ取得処理部2001が判断したデータ値に係る頻度情報がスケッチ記憶部3001に記憶されていないかどうかを判断する(S2)。例えば処理開始直後等、スケッチ記憶部3001に頻度情報が記憶されていないものと判断すると、そのデータに係る頻度情報を作成してスケッチ記憶部3001に記憶する、頻度情報追加処理を行う(S3)。このとき、頻度情報において、誤差見積もり値Δは区間番号bから1減じた値b−1とする(例えば処理開始直後の区間番号が1の場合は0となる)。また、区間内における計数値となる最終区間頻度yn は1とする。また、この時点ではカウント数fと先頭区間頻度y1 との値を確定しない。
一方、そのデータ値に係る設計事項がスケッチ記憶部3001に記憶されていると判断すると、最終区間頻度yn を1増やしてスケッチ記憶部3001に記憶する区間頻度加算処理を行う(S4)。
区間内データ処理数判断部2003は、区間内データ数計数処理を行って、区間内処理データ数記憶部3002に記憶した区間処理データ数の値を1増やす(S5)。さらに、区間処理データ数に基づいて区間境界かどうか(区間処理データ数が1/εであるかどうか)を判断する(S6)。区間境界でないと判断すると、S1に戻り、次のデータについてデータ取得処理などの処理を行う。
例えば、図2(a)は、D1というデータ値を有するデータが1番目の区間(区間番号1の区間)において、5回出現したことを表しているものとする。この時点では、確定していないカウント数fを0とし、先頭区間頻度y1 を空とする。
そして、区間内データ処理数判断部2003は、区間境界であると判断すると、区間処理データ数の値を0とする(S7)。次に、計数決定処理部2005は、カウント数fを確定するための頻度加算処理を行う(S8)。頻度加算処理については、区間におけるデータの処理が終了したときの最終区間頻度yn の値をカウント数fに加算する。また、頻度情報を追加した区間の場合のみ、最終区間頻度yn の値を先頭区間頻度y1 の値とする。
例えば、図2(b)のデータ値D1について、最終区間頻度yn の値である5をカウント数fに加算し、その値を0+5=5とする。また、先頭区間頻度y1 の値も5とする。
さらに、計数決定処理部2005は、処理開始から現在までの区間において許容誤差率ε(%)以下の出現率のデータ値に係る頻度情報をスケッチ記憶部3001から削除する低頻度データ削除処理を行う(S9)。ここで、上述したように、1区間に係るデータ数が1/ε個であることから、区間内で1回のみ出現したときの出現率がε(%)に相当する。よって、処理開始から(処理が終了している)現区間における出現頻度が、現区間番号b以下の値となる頻度情報をスケッチ記憶部3001から削除することになる。
ここで、低頻度データ削除処理は、区間境界における頻度加算処理が終了する度に行われる処理であるため、例えば以前の区間における低頻度データ削除処理で頻度情報が削除された可能性がある。そこで、低頻度データ削除処理では、以前の低頻度データ削除処理により削除された可能性のあるカウント数fも考慮して処理を行う必要がある。
誤差見積もり値Δは、前述したように頻度情報追加処理を行ったときの区間b−1の値が記憶される。この誤差見積もり値Δにより、区間b以降のデータに係る計数についてはカウント数fに反映されていることがわかる。例えば、スケッチ記憶部3001の頻度情報において、あるデータ値について、カウント数fが20、誤差見積もり値Δが10として記憶されている場合には、区間番号11の区間において頻度情報追加処理を行い、その区間からの出現頻度が20回であることがわかる。
一方で、区間b−1以前のデータに係る計数した数については、カウント数fに反映されていないことになる。ここで、上述したように、区間内における出現頻度が平均1回以下になると頻度情報は削除されることになる。そのため、区間番号b−1までの区間において最終区間頻度yn (出現頻度)が平均1回であったとすると、そのときのカウント数f(出現頻度)はb−1=Δとなる。実際には、最終区間頻度yn が平均1回以下の場合もあるため、誤差見積もり値Δは、削除された可能性のあるカウント数fの最大値を表すことになる。
以上のことから、低頻度データ削除処理では、f+Δ≦bを満たすカウント数f、誤差見積もり値Δを有する頻度情報をスケッチ記憶部3001から削除する処理を行い、区間境界になる度に行い、スケッチ記憶部3001内の頻度情報を整理する。
例えばスケッチ記憶部3001が図2(b)のような状態において、区間番号1の区間での処理が終了したときに、データ値D1については、2+0≦1であるため頻度情報は残されるが、データ値D2については1+0≦1となるために頻度情報は削除されることになる。
次に、データ処理数判断部2004は、N個以上のデータの処理を行っているか(εN番目の区間以上の区間の処理を行ったか)どうかを、処理データ数記憶部3003に記憶した処理データ数の値に基づいて判断する(S10)。N個以上のデータについて処理を行っていないと判断すると、データ数計数処理を行って、処理データ数記憶部3003に記憶した処理データ数の値を1/ε増やす。さらに、処理を行った区間の数を表す区間境界数の値を1増やす(S11)。そして、データ値計数処理部2002が、各データ値に係る頻度情報の最終区間頻度yn の値をそれぞれ0とする最終区間頻度初期化処理を行う(S13)。そして、S1に戻り、次のデータについてデータ取得処理を行う。一方、データ処理数判断部2004が、N個以上のデータの処理を行ったものと判断すると、近似頻度演算処理部2006により先頭区間出現頻度近似処理を行う(S12)。なお、N個以上のデータについて処理を終了した後は、常に先頭区間出現頻度近似処理を行うことになる。
図5は近似頻度演算処理部2006による先頭区間出現頻度演算処理のフローチャートを表す図である。次に図5に基づいて近似頻度演算処理部2006が行う処理について説明する。まず、スケッチ記憶部3001に記憶されたあるデータ値に係る頻度情報を取得し(S21)、誤差見積もり値Δが0であるかどうかを判断する(S22)。誤差見積もり値Δが0でなければ、先頭区間の出現頻度(先頭区間頻度y1 )がカウント数fに反映されていないことになるため、Δの値を1減らす減算処理(頻度情報追加処理が行われた区間を概念的に1ずらす)を行う(S24)。そして、全てのデータ値に係る頻度情報について処理を終了したかどうかを判断し(S25)、処理が終了していなければS21に戻って次のデータ値の頻度情報について処理を行う。
図6は2区間目の出現頻度の推定に係る概念を表す図である。一方、S22において、誤差見積もり値Δが0であると判断すると頻度近似処理を行う(S23)。頻度近似処理では、カウント数fから先頭区間頻度y1 を減じて、1区間ずらした際の、先頭区間(データ)からεN−1区間分のカウント数fの値を算出する。また、カウント数f≦εN−1であるかどうかを判断する。f≦εN−1であれば、区間内における出現頻度が平均1回以下となるため、そのデータ値に係る頻度情報をスケッチ記憶部3002から削除する。
そして、f≦εN−1でなければ、2区間目の出現頻度(1区間ずらしたときの先頭区間頻度)の近似値y2 を、現在の先頭区間頻度y1 、最終区間頻度yn 及びカウント数fから近似推定、算出する。算出に際し、まず、例えば図6に示すように区間の出現頻度のヒストグラムを仮想的に考える。1区間目が先頭区間頻度y1 、εN区間目が最終区間頻度yn となり、その間の区間における出現頻度のヒストグラムは、所定の2次曲線に沿っているものとする。
この2次曲線については、例えば2次元座標系において、(1,y1 )、(εN,yn )を通るものとする。また、x=1、x=εN及びy=0と2次曲線で囲まれる面積がf’となるようにする。ここで、面積f’は、f’=f−(y0 +yn )/2となるようにして、カウント数fにより表される面積から、先頭の区間の中心以前及び最終区間の中心以降の部分に係る面積を除く調整を行ったものである。この2次曲線を表す次式(1)から、2区間目における区間頻度(の近似値)y2 を算出する。ここで、算出した値が負の値であれば0とする。(1)式は、2次曲線の一般式から、(1,y1 )、(εN,yn )及びx=1〜εNにおける積分値がf’を満たすときの係数を求めて得たものである。
Figure 0004513878
先頭区間出現頻度演算処理が終了すると、図3に示すように、最終区間頻度初期化処理を行い(S13)、S1に戻り、次のデータについてデータ取得処理等を行う。そして、結果検索抽出処理部2007による検索抽出処理を行って、表示手段(図示せず)などへの結果の出力を行う(S14)。
例えば図2(c)においては、データ値D1に係る誤差見積もり値Δ=0であるので頻度近似処理を行う。まず、カウント数f=1500から先頭区間頻度y1 =5を減じて1495を算出する。これがサイクル2における区間番号1からεN−1までのεN−1区間(N−1/ε個のデータ)におけるカウント数fとなる。
次にデータ値D1に係る先頭区間頻度y1 =5、最終区間頻度yn =50、カウント数f=1500であり、εN=100であるため、これらを(1)式に代入して算出したy2 =3.95≒4を近似値として、新たな先頭区間頻度y1 (サイクルb2における先頭区間頻度y1 )として記憶する。一方、データ値D2に係る誤差見積もり値Δは0でないので、Δ減算処理により誤差見積もり値Δとして10−1=9を記憶する。
以上のように処理により、スケッチ記憶部3001に記憶された各データ値に係る頻度情報は、図2(d)のようになる。これは、サイクルb2における区間番号1からεN−1までの処理が終了した状態となる。サイクルb2における区間番号εNのデータに係る処理を行う。このように、先頭区間出現頻度演算処理を行うことで、あるサイクルにおける区間番号εN−1までの処理が終了したことになる。そのため、次の区間の処理を終了することにより、そのサイクルに係るN個分のデータの処理を終了したことになる。なお、次の区間における頻度情報追加処理では、誤差見積もり値Δとして記憶される値は常にεN−1となる。
N個以上のデータについて、先頭区間出現頻度演算処理を継続して行っていくことにより、1/ε個のデータの処理が終了する度に、結果検索抽出処理部2007が結果を抽出することができる。ここで、結果検索抽出処理部2007は、スケッチ記憶部3001に頻度情報が残された、カウント数fが(s−ε)N以上となるデータ値に係る頻度情報について抽出処理することができる。
以上のように、実施の形態1の統計処理装置1000によれば、演算手段2000の近似頻度演算処理部2006が行う先頭区間出現頻度演算処理により、次サイクルに係る頻度情報の処理を行い、スケッチ記憶部3001に記憶するようにしたので、スケッチ記憶部3002をサイクル毎に重複して有する必要がなく、また、同じ処理を並行して行うこともなく、1/ε個のデータを処理する毎に、N個分のデータを処理した結果を抽出することができる。その際、1区間ずらした際の、先頭区間(データ)からεN−1区間分のカウント数fの値を算出するとともに、必要に応じて、2区間目の出現頻度y2 (次の区間における先頭区間出現頻度となる)を、先頭区間頻度y1 、最終区間頻度yn 、カウント数fにより得られる二次曲線の式に基づいて算出して、カウント数fから減算することにより、次のサイクルに前のサイクルの先頭区間の出現頻度を含めないようにすることができるため、より精度の高い計数処理、統計処理を行って結果を抽出することができる。
また、上述したように、処理を開始するデータを所望のデータ数w(1/ε以下)だけずらしていってそれぞれ計数処理を並行して行う場合についても、処理とメモリ容量の重複は1/(εw)個で済むことになり、さらに短い間隔で結果の抽出を行うことができることになる。本実施の形態による処理を行わない場合に、この並行処理を行うために必要な記憶容量とデータ処理能力はN/w倍となるとなるが、これと比較しても、1/(εN)のメモリ容量及び処理時間の消費だけで済むことになる。そのため、εNが充分に大きくなるほど、大きな効果を発揮することができる。
実施の形態2.
図7は実施の形態2における統計処理装置1000Aの構成を示すブロック図である。図7の統計処理装置1000Aは、予兆出力処理部2008を有している点で図1の統計処理装置1000と異なる。予兆出力処理部2008は、変化率推定処理を行って、各データ値に係る出現頻度の変化の傾向を算出し、算出した傾向に基づいて、例えば表示手段、発音手段(図示せず)による警告教示を行う。
図8は統計処理装置1000の演算手段2000における処理の流れ及び処理時に参照するデータの流れを組み合わせて表した図である。図8において、図2と同じ番号を付しているものは、同様の動作、処理を行うものであるため、説明を省略する。図8に示すように、予兆出力処理部2008が行う変化率推定処理は、先頭区間出現頻度演算処理と同様に、N個以上のデータを処理した後に行う処理である(S15)。ただし、先頭区間出現頻度演算処理による頻度情報の変更が行われる前に処理を行う。
予兆出力処理部2008は、実施の形態1において説明した(1)式に係る2次曲線の微分に係る次式(2)に基づいて、εN区間(最終の区間)目における微分値y’n を変化率の推定値として算出する。ここで、実施の形態1と異なり、誤差見積もり値Δ>0の場合がある。Δ>0の場合は1区間目ではなくΔ+1区間目(b区間目)からの計数に係るカウント数fに基づく変化率の推定値が算出されることになる。また、Δ>εN−2の場合は、2次曲線への近似ができず、変化率の推定値を算出することができないため、変化率推定処理は行わないものとする。
Figure 0004513878
予兆出力処理部2008は、算出した変化率の推定値に基づき、予め定めたルールを満たしているかどうか判断する。ここで、例えば一定以上の出現頻度を観測する場合、算出した変化率に基づいて、今後、所定のデータ数以内に所定のカウント数fを越える可能性があるかどうかを判断する、変化率が所定の値以上と判断する等、その予兆を警告教示するためのルールを任意に定めることができる。
例えば図2(c)においては、データ値D1に係る先頭区間頻度y0 =5、最終区間頻度yn =50、カウント数f=1500であり、εN=100であるため、これらを(2)式に代入して算出した変化率の推定値は5.17となる。また、データ値D1に係る先頭区間頻度y0 =15、最終区間頻度yn =2、カウント数f=720であり、εN=100であるため、変化率の推定値は−0.18となる。
ここで、予兆出力処理部2008には、例えば今後20区間以内に、カウント数fが閾値となる1550を越える可能性があれば警告教示を行うルールが定められているものとする。データ値D1については、変化率の推定値が5.17であるため、20区間でカウント数fは5.17×20=103.4増加する可能性がある。このとき、1500+103.4=1603.4であり、閾値となる1550を越えることが見込まれるため、予兆出力処理部2008は警告教示を行う。
一方、データ値D2については、変化率の推定値が−0.18であり、減少傾向にある。また、閾値1550を越えると見込めないため、予兆出力処理部2008は警告教示を行わない。
以上のように、実施の形態2によれば、予兆出力処理部2008をさらに有し、スケッチ記憶部3002に頻度情報が記憶された各データ値に係る先頭区間頻度y0 、最終区間頻度yn 、カウント数fに基づいて、N個のデータにおける最終区間となるεN番目の区間における出現頻度の変化率を、上述した二次曲線の微分値に基づいて算出するするようにしたので、各データ値における出現頻度の増加(減少)傾向を推定することができる。そして、出現頻度の傾向に基づいて、例えば注目しなければならないほど出現頻度が増加しそうな場合など、所定のルールに基づいて事前にオペレータ等に警告を発するなどの処理を行うことができ、信頼性の向上をはかることができる。
実施の形態3.
上述の実施の形態において、先頭区間頻度y0 、最終区間頻度yn 及びカウント数fの関係を二次曲線で表し、2区間目の出現頻度(1区間ずらしたときの先頭区間頻度)の算出を行うようにしたが、二次曲線に限定するものではなく、他の曲線などで近似させるようにしてもかまわない。例えば、出現頻度の変化モデルに基づいている曲線にすることが望ましい。
実施の形態4.
上述の実施の形態においては、インターフェース手段4000を介して得られるデータを処理するようにしたが、例えば、記憶手段3000にN個分のデータを一時的に蓄えてから演算手段2000において各種処理を行うこともできる。
また、上述の実施の形態では、最終区間頻度yn を更新することにより、1区間分の出現頻度の計数した値を最終区間頻度yn に一時的に蓄え、1区間分の処理が終了するとカウント数fの値などに更新、反映させるようにしたが、この方法に限定するものではない。場合によっては同時に更新していってもよいし、また、通常はカウント数fを更新し、最終区間のみ最終区間頻度yn も更新するようにしてもよい。
上述した各実施の形態では、時系列データから一定以上の出現頻度で現われるデータを抽出するための統計処理方法、処理を行う装置などについて説明した。ここで、本発明に係る方法などを実際に利用する場面としては、オペレータがデータ値などに基づく目視検査する場合に高い出現頻度に係るデータから提示する可視化装置の一部として利用する場合が考えられる。また、処理コストが高い解析処理を行うにあたって、処理対象を高い出現頻度に係るデータに絞るための前処理として用いる場合などが考えられる。
実施の形態1の統計処理装置1000の構成を示すブロック図である。 スケッチ記憶部3001に記憶される頻度情報の例を表す図である。 統計処理に係るデータの概念図である。 実施の形態1における処理及びデータの流れを表した図である。 近似頻度演算処理部2006による処理のフローチャートを表す図である。 2区間目の出現頻度の推定に係る概念を表す図である。 実施の形態2の統計処理装置1000Aの構成を示すブロック図である。 実施の形態2における処理及びデータの流れを表した図である。
符号の説明
1000、1000A 統計処理装置
2000 演算手段
2001 データ取得処理部
2002 データ値計数処理部
2003 区間内データ処理数判断部
2004 データ処理数判断部
2005 計数決定処理部
2006 近似頻度演算処理部
2007 結果検索抽出処理部
2008 予兆出力処理部
3000 記憶手段
3001 スケッチ記憶部
3002 区間内処理データ数記憶部
3003 処理データ数記憶部
4000 インタフェース部

Claims (13)

  1. 所定数個のデータに対する誤差許容率の逆数個のデータの単位を区間とし、1区間分のデータに係るデータ値毎の出現頻度の計数処理を終了する毎に、出現頻度が低いデータ値の計数に係る頻度情報を記憶手段から削除しながら、データ値毎の出現頻度の計数を行って前記頻度情報を記憶手段に記憶する統計処理方法において、
    前記所定数個のデータに係る計数処理を終了した後及び1区間分のデータに係るデータ値の計数処理を終了する毎に、
    前記記憶手段に前記頻度情報が記憶された各データ値について、
    前記所定数個分のデータにおける先頭区間の次の区間の出現頻度の推定値を算出しなければならないかどうかを判断する工程と、
    前記次の区間の出現頻度の推定値を算出しなければならないものと判断すると、前記記憶手段に前記頻度情報として記憶された前記先頭区間における出現頻度となる先頭区間出現頻度、前記所定数個のデータにおける最終区間における出現頻度となる最終区間出現頻度及び前記計数処理に係る出現頻度に基づいて、前記計数処理に係る出現頻度から前記先頭区間出現頻度を減じ、1区間分ずらした、前記所定数個−1区間分のデータにおける計数処理に係る出現頻度として前記記憶手段に記憶し、また、前記次の区間の出現頻度の推定値を算出し、1区間分ずらした次の所定数個分のデータにおける先頭区間出現頻度として前記記憶手段に記憶する工程と
    を有することを特徴とする統計処理方法。
  2. 前記先頭区間出現頻度と前記最終区間出現頻度とを結び、前記計数処理に係る出現頻度がその区間の面積となる二次曲線に基づく式から、前記次の区間の出現頻度の推定値を算出することを特徴とする請求項1記載の統計処理方法。
  3. 前記先頭区間出現頻度、前記最終区間出現頻度及び前記計数処理に係る出現頻度に基づいて、前記データ値毎の出現頻度の変化率の推定値を算出する工程をさらに有することを特徴とする請求項1又は2記載の統計処理方法。
  4. 前記先頭区間出現頻度と前記最終区間出現頻度とを結び、前記計数処理に係る出現頻度がその区間の面積となる二次曲線を微分した式に基づいて算出した前記最終区間における微分値を、前記出現頻度の変化率の推定値とすることを特徴とする請求項3記載の統計処理方法。
  5. 前記所定数個のデータに係る計数処理を終了した後及び1区間分のデータに係るデータ値の計数処理を終了する毎に、所定の出現率に基づく値以上の出現頻度を計数したデータ値の頻度情報を前記記憶手段から検索して抽出する処理をさらに行うことを特徴とする請求項1〜4のいずれかに記載の統計処理方法。
  6. 請求項1乃至請求項5のいずれかに記載の統計処理方法をコンピュータに行わせることを特徴とする統計処理方法のプログラム。
  7. 所定数個のデータに対する誤差許容率の逆数個のデータの単位を区間としたときに、前記所定数個分のデータにおける先頭区間の各データ値に係る出現頻度となる先頭区間出現頻度、最終区間の各データ値に係る出現頻度となる最終区間出現頻度及び各データ値の所定数個分のデータに係る出現頻度を組とした頻度情報を記憶する記憶手段と、
    1区間分のデータに係るデータ値の出現頻度の計数処理を終了する毎に、出現頻度が低いデータ値の計数に係る頻度情報を記憶手段から削除しながら、データ値毎の出現頻度の計数を行って前記頻度情報を記憶手段に記憶する処理を行う演算手段を備え、
    前記演算手段は、さらに、前記所定数個のデータに係る計数処理を終了した後及び1区間分のデータに係るデータ値の計数処理を終了する毎に、前記記憶手段に前記頻度情報が記憶された各データ値について、
    前記所定数個分のデータにおける先頭区間の次の区間の出現頻度の推定値を算出しなければならないかどうかを判断し、前記次の区間の出現頻度の推定値を算出しなければならないものと判断すると、前記計数処理に係る出現頻度から前記先頭区間出現頻度を減じ、1区間分ずらした、前記所定数個−1区間分のデータにおける計数処理に係る出現頻度として前記記憶手段に記憶し、また、前記先頭区間出現頻度、前記最終区間出現頻度及び前記計数処理に係る出現頻度に基づいて、前記次の区間の出現頻度の推定値を算出し、1区間分ずらした次の所定数個分のデータにおける先頭区間出現頻度として前記記憶手段に記憶する処理を行うことを特徴とする統計処理装置。
  8. 所定数個分のデータを1サイクルとし、前記所定数個のデータに対する誤差許容率の逆数個のデータの単位を区間としたときに、前記所定数個分のデータにおける先頭区間の各データ値に係る出現頻度となる先頭区間出現頻度、最終区間の各データ値に係る出現頻度となる最終区間出現頻度、各データ値の計数に係る出現頻度及び各データ値において前記所定数個分のデータに係る出現頻度の計数を開始した区間を表す誤差見積もり値を組とした計数に係る頻度情報を記憶する記憶手段と、
    前記1サイクルの中から一定以上の出現率で出現するデータに係るデータ値を前記記憶手段を検索することで得られるように、前記記憶手段内の頻度情報の追加・削除・変更を行うとともに、最初の所定数個のデータに基づく前記記憶手段内の頻度情報の追加・削除・変更後は、新たに1区間数分のデータを処理する度に、前記1区間分ずらした所定数個分のデータを次の1サイクルとして一定以上の出現率で出現するデータに係るデータ値を前記記憶手段を検索して得られるように、前記記憶手段内の頻度情報の追加・削除・変更を行う演算手段とを備え、
    該演算手段は、
    順次入力されるデータのデータ値について、前記頻度情報が前記記憶手段に記憶されていない場合、前記記憶手段に前記データ値の頻度情報を新たに追加し、前記記憶手段に記憶されている場合、前記データ値の頻度情報の出現頻度に関する事項を加算更新する処理を行うデータ値計数処理部と、
    1区間分取得したデータに係る処理が終了すると、所定数個分のデータに係る各データ値の出現頻度と誤差見積もり値とに基づいて、処理した区間数分のデータに対して、出現頻度が低いデータ値に係る前記頻度情報を前記記憶手段から削除する処理を行う計数決定処理部と、
    最初のサイクルの所定数個のデータに対して、前記データ値計数処理部及び前記計数決定処理部の処理が終了した場合、前記記憶手段に記憶された各データ値の前記誤差見積もり値に基づいて前記計数処理に係る出現頻度を調整し、前記次の区間の出現頻度の推定値を算出しなければならないものと判断すると、前記計数処理に係る出現頻度から前記先頭区間出現頻度を減じ、1区間分ずらした前記所定数個−1区間分のデータにおける計数処理に係る出現頻度として前記記憶手段に記憶し、また、前記先頭区間出現頻度、前記最終区間出現頻度及び前記計数処理に係る出現頻度に基づいて、前記次の区間の出現頻度の推定値を算出し、1区間分ずらした次の所定数個分のデータにおける先頭区間出現頻度として前記記憶手段に記憶する処理を行う近似頻度演算処理部と
    を有し、
    その後入力されるデータが、前記次のサイクルの最後の区間の最初のデータから入力されているものとして、前記データ値計数処理部、計数決定処理部及び近似頻度演算処理部が処理を継続して行うことを特徴とする統計処理装置。
  9. 前記近似頻度演算処理部において、前記次の区間の出現頻度の推定値を算出しなくてもよいものと判断すると、前記誤差見積もり値の値を1減らすことを特徴とする請求項8記載の統計処理装置。
  10. 前記演算手段は、前記先頭区間出現頻度と前記最終区間出現頻度とを結び、前記計数処理に係る出現頻度がその区間の面積となる二次曲線に基づく式から、前記次の区間の出現頻度の推定値を算出することを特徴とする請求項7〜9のいずれかに記載の統計処理装置。
  11. 前記演算手段は、前記先頭区間出現頻度、前記最終区間出現頻度及び前記計数処理に係る出現頻度に基づいて、前記データ値毎の出現頻度の変化率の推定値を算出する処理をさらに行うことを特徴とする請求項7〜10のいずれかに記載の統計処理装置。
  12. 前記演算手段は、前記先頭区間出現頻度と前記最終区間出現頻度とを結び、前記計数処理に係る出現頻度がその区間の面積となる二次曲線を微分した式に基づいて算出した前記最終区間における微分値を、前記出現頻度の変化率の推定値として算出することを特徴とする請求項11記載の統計処理装置
  13. 前記演算手段は、前記所定数個のデータに係る計数処理を終了した後及び1区間分のデータに係るデータ値の計数処理を終了する毎に、所定の出現率に基づく値以上の出現頻度を計数したデータ値の頻度情報を前記記憶手段から検索して抽出する処理を行う結果抽出処理部をさらに有することを特徴とする請求項7〜12のいずれかに記載の統計処理装置。
JP2008053195A 2008-01-16 2008-03-04 統計処理方法及び装置並びに統計処理方法のプログラム Expired - Fee Related JP4513878B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2008053195A JP4513878B2 (ja) 2008-03-04 2008-03-04 統計処理方法及び装置並びに統計処理方法のプログラム
US12/320,046 US20090183037A1 (en) 2008-01-16 2009-01-15 Statistical processing apparatus capable of reducing storage space for storing statistical occurrence frequency data and a processing method therefor
DE602009000921T DE602009000921D1 (de) 2008-01-16 2009-01-16 Zur Reduzierung des Speicherplatzes beim Speichern von Daten der statistischen Häufigkeitsfrequenz fähige Vorrichtung zur statistischen Verarbeitung und Verarbeitungsverfahren dafür
EP09150720A EP2081326B1 (en) 2008-01-16 2009-01-16 Statistical processing apparatus capable of reducing storage space for storing statistical occurence frequency data and a processing method therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008053195A JP4513878B2 (ja) 2008-03-04 2008-03-04 統計処理方法及び装置並びに統計処理方法のプログラム

Publications (2)

Publication Number Publication Date
JP2009212770A JP2009212770A (ja) 2009-09-17
JP4513878B2 true JP4513878B2 (ja) 2010-07-28

Family

ID=41185502

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008053195A Expired - Fee Related JP4513878B2 (ja) 2008-01-16 2008-03-04 統計処理方法及び装置並びに統計処理方法のプログラム

Country Status (1)

Country Link
JP (1) JP4513878B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5818740B2 (ja) 2012-04-17 2015-11-18 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation テキストデータストリームに含まれるアイテムの中から出現頻度の高いアイテムを特定する方法、装置及びコンピュータプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006148686A (ja) * 2004-11-22 2006-06-08 Oki Electric Ind Co Ltd 通信監視システム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2987258B2 (ja) * 1992-07-13 1999-12-06 沖電気工業株式会社 非同期転送モード通信網におけるトラヒック監視方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006148686A (ja) * 2004-11-22 2006-06-08 Oki Electric Ind Co Ltd 通信監視システム

Also Published As

Publication number Publication date
JP2009212770A (ja) 2009-09-17

Similar Documents

Publication Publication Date Title
CN111064614A (zh) 一种故障根因定位方法、装置、设备及存储介质
US20090183037A1 (en) Statistical processing apparatus capable of reducing storage space for storing statistical occurrence frequency data and a processing method therefor
CN107480028B (zh) 磁盘可使用的剩余时长的获取方法及装置
JP2021533474A (ja) ノード分類方法、モデル訓練方法並びに、その装置、機器及びコンピュータプログラム
CN108345601A (zh) 搜索结果排序方法及装置
CN112882889A (zh) 异常监控方法、系统、电子设备和存储介质
CN108647587A (zh) 人数统计方法、装置、终端及存储介质
US20200090076A1 (en) Non-transitory computer-readable recording medium, prediction method, and learning device
CN104424361A (zh) 自动定义热存储和大工作负载
JP4513878B2 (ja) 統計処理方法及び装置並びに統計処理方法のプログラム
CN114168318A (zh) 存储释放模型的训练方法、存储释放方法及设备
JP7367622B2 (ja) データ管理システム、データ管理方法、および、データ管理プログラム
CN108073464A (zh) 一种基于速度和加速度的时序数据异常点检测方法及装置
JP2004078780A (ja) 予測方法、予測装置、予測プログラム、および予測プログラムを記録した記録媒体
CN110909062A (zh) 数据处理方法、装置、电子设备及可读存储介质
US11762562B2 (en) Performance analysis apparatus and performance analysis method
JP2011154487A (ja) コンテンツ有用性管理システム、方法、及びプログラム
JP6627258B2 (ja) システムモデル生成支援装置、システムモデル生成支援方法、及び、プログラム
CN108537654B (zh) 客户关系网络图的渲染方法、装置、终端设备及介质
JP7119484B2 (ja) 情報集約装置、情報集約方法、及び、プログラム
JP2010102462A (ja) 障害推定装置、方法及びプログラム
JP6508202B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
US20230161841A1 (en) Computer system and data analysis method
JP5957507B2 (ja) データパターン分析最適化処理装置、及びデータパターン分析最適化処理方法
JP3952043B2 (ja) 分析装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091208

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100420

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100503

R150 Certificate of patent or registration of utility model

Ref document number: 4513878

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140521

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees