JP4513878B2 - 統計処理方法及び装置並びに統計処理方法のプログラム - Google Patents
統計処理方法及び装置並びに統計処理方法のプログラム Download PDFInfo
- Publication number
- JP4513878B2 JP4513878B2 JP2008053195A JP2008053195A JP4513878B2 JP 4513878 B2 JP4513878 B2 JP 4513878B2 JP 2008053195 A JP2008053195 A JP 2008053195A JP 2008053195 A JP2008053195 A JP 2008053195A JP 4513878 B2 JP4513878 B2 JP 4513878B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- section
- appearance frequency
- frequency
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
(1)計数処理を行う単位(以下、サイクルという)となる所定数N個分のデータを、記憶手段の確保した記憶領域に記憶させる。ここで、N個分のデータについては、頻度の誤差範囲を決める値となる許容誤差率ε(%)の逆数個のデータ毎に分割するものとする(以下、この分割に係る単位を区間というものとする(1サイクルにおける区間数はεNとなる))。そして、各区間には例えば1から始まる区間番号を付すものとする。
(3.1)f+Δ≦処理に係る区間番号となるカウント数f、誤差見積もり値Δを有するデータ値に係る頻度情報は記憶手段から削除する。
(3.2)上記式を満たさないデータ値に係る頻度情報は記憶手段に残す。
Gurmeet Singh Manku, Rajeev Motwani, 「Approximate Frequency Counts over Data Stream」, VLDB 2002 (28th VLDB), p 346-357, August 2002
図1は本発明の実施の形態1の統計処理装置1000の構成を示すブロック図である。統計処理装置1000は、処理対象のデータに基づく処理を行う各種処理部を有する演算手段2000、データ等を一時的、長期的に記憶する記憶手段3000及び外部装置から処理対象となるデータを含む信号を受信するためのインタフェース手段4000とを備えている。
この2次曲線については、例えば2次元座標系において、(1,y1 )、(εN,yn )を通るものとする。また、x=1、x=εN及びy=0と2次曲線で囲まれる面積がf’となるようにする。ここで、面積f’は、f’=f−(y0 +yn )/2となるようにして、カウント数fにより表される面積から、先頭の区間の中心以前及び最終区間の中心以降の部分に係る面積を除く調整を行ったものである。この2次曲線を表す次式(1)から、2区間目における区間頻度(の近似値)y2 を算出する。ここで、算出した値が負の値であれば0とする。(1)式は、2次曲線の一般式から、(1,y1 )、(εN,yn )及びx=1〜εNにおける積分値がf’を満たすときの係数を求めて得たものである。
図7は実施の形態2における統計処理装置1000Aの構成を示すブロック図である。図7の統計処理装置1000Aは、予兆出力処理部2008を有している点で図1の統計処理装置1000と異なる。予兆出力処理部2008は、変化率推定処理を行って、各データ値に係る出現頻度の変化の傾向を算出し、算出した傾向に基づいて、例えば表示手段、発音手段(図示せず)による警告教示を行う。
上述の実施の形態において、先頭区間頻度y0 、最終区間頻度yn 及びカウント数fの関係を二次曲線で表し、2区間目の出現頻度(1区間ずらしたときの先頭区間頻度)の算出を行うようにしたが、二次曲線に限定するものではなく、他の曲線などで近似させるようにしてもかまわない。例えば、出現頻度の変化モデルに基づいている曲線にすることが望ましい。
上述の実施の形態においては、インターフェース手段4000を介して得られるデータを処理するようにしたが、例えば、記憶手段3000にN個分のデータを一時的に蓄えてから演算手段2000において各種処理を行うこともできる。
2000 演算手段
2001 データ取得処理部
2002 データ値計数処理部
2003 区間内データ処理数判断部
2004 データ処理数判断部
2005 計数決定処理部
2006 近似頻度演算処理部
2007 結果検索抽出処理部
2008 予兆出力処理部
3000 記憶手段
3001 スケッチ記憶部
3002 区間内処理データ数記憶部
3003 処理データ数記憶部
4000 インタフェース部
Claims (13)
- 所定数個のデータに対する誤差許容率の逆数個のデータの単位を区間とし、1区間分のデータに係るデータ値毎の出現頻度の計数処理を終了する毎に、出現頻度が低いデータ値の計数に係る頻度情報を記憶手段から削除しながら、データ値毎の出現頻度の計数を行って前記頻度情報を記憶手段に記憶する統計処理方法において、
前記所定数個のデータに係る計数処理を終了した後及び1区間分のデータに係るデータ値の計数処理を終了する毎に、
前記記憶手段に前記頻度情報が記憶された各データ値について、
前記所定数個分のデータにおける先頭区間の次の区間の出現頻度の推定値を算出しなければならないかどうかを判断する工程と、
前記次の区間の出現頻度の推定値を算出しなければならないものと判断すると、前記記憶手段に前記頻度情報として記憶された前記先頭区間における出現頻度となる先頭区間出現頻度、前記所定数個のデータにおける最終区間における出現頻度となる最終区間出現頻度及び前記計数処理に係る出現頻度に基づいて、前記計数処理に係る出現頻度から前記先頭区間出現頻度を減じ、1区間分ずらした、前記所定数個−1区間分のデータにおける計数処理に係る出現頻度として前記記憶手段に記憶し、また、前記次の区間の出現頻度の推定値を算出し、1区間分ずらした次の所定数個分のデータにおける先頭区間出現頻度として前記記憶手段に記憶する工程と
を有することを特徴とする統計処理方法。 - 前記先頭区間出現頻度と前記最終区間出現頻度とを結び、前記計数処理に係る出現頻度がその区間の面積となる二次曲線に基づく式から、前記次の区間の出現頻度の推定値を算出することを特徴とする請求項1記載の統計処理方法。
- 前記先頭区間出現頻度、前記最終区間出現頻度及び前記計数処理に係る出現頻度に基づいて、前記データ値毎の出現頻度の変化率の推定値を算出する工程をさらに有することを特徴とする請求項1又は2記載の統計処理方法。
- 前記先頭区間出現頻度と前記最終区間出現頻度とを結び、前記計数処理に係る出現頻度がその区間の面積となる二次曲線を微分した式に基づいて算出した前記最終区間における微分値を、前記出現頻度の変化率の推定値とすることを特徴とする請求項3記載の統計処理方法。
- 前記所定数個のデータに係る計数処理を終了した後及び1区間分のデータに係るデータ値の計数処理を終了する毎に、所定の出現率に基づく値以上の出現頻度を計数したデータ値の頻度情報を前記記憶手段から検索して抽出する処理をさらに行うことを特徴とする請求項1〜4のいずれかに記載の統計処理方法。
- 請求項1乃至請求項5のいずれかに記載の統計処理方法をコンピュータに行わせることを特徴とする統計処理方法のプログラム。
- 所定数個のデータに対する誤差許容率の逆数個のデータの単位を区間としたときに、前記所定数個分のデータにおける先頭区間の各データ値に係る出現頻度となる先頭区間出現頻度、最終区間の各データ値に係る出現頻度となる最終区間出現頻度及び各データ値の所定数個分のデータに係る出現頻度を組とした頻度情報を記憶する記憶手段と、
1区間分のデータに係るデータ値の出現頻度の計数処理を終了する毎に、出現頻度が低いデータ値の計数に係る頻度情報を記憶手段から削除しながら、データ値毎の出現頻度の計数を行って前記頻度情報を記憶手段に記憶する処理を行う演算手段を備え、
前記演算手段は、さらに、前記所定数個のデータに係る計数処理を終了した後及び1区間分のデータに係るデータ値の計数処理を終了する毎に、前記記憶手段に前記頻度情報が記憶された各データ値について、
前記所定数個分のデータにおける先頭区間の次の区間の出現頻度の推定値を算出しなければならないかどうかを判断し、前記次の区間の出現頻度の推定値を算出しなければならないものと判断すると、前記計数処理に係る出現頻度から前記先頭区間出現頻度を減じ、1区間分ずらした、前記所定数個−1区間分のデータにおける計数処理に係る出現頻度として前記記憶手段に記憶し、また、前記先頭区間出現頻度、前記最終区間出現頻度及び前記計数処理に係る出現頻度に基づいて、前記次の区間の出現頻度の推定値を算出し、1区間分ずらした次の所定数個分のデータにおける先頭区間出現頻度として前記記憶手段に記憶する処理を行うことを特徴とする統計処理装置。 - 所定数個分のデータを1サイクルとし、前記所定数個のデータに対する誤差許容率の逆数個のデータの単位を区間としたときに、前記所定数個分のデータにおける先頭区間の各データ値に係る出現頻度となる先頭区間出現頻度、最終区間の各データ値に係る出現頻度となる最終区間出現頻度、各データ値の計数に係る出現頻度及び各データ値において前記所定数個分のデータに係る出現頻度の計数を開始した区間を表す誤差見積もり値を組とした計数に係る頻度情報を記憶する記憶手段と、
前記1サイクルの中から一定以上の出現率で出現するデータに係るデータ値を前記記憶手段を検索することで得られるように、前記記憶手段内の頻度情報の追加・削除・変更を行うとともに、最初の所定数個のデータに基づく前記記憶手段内の頻度情報の追加・削除・変更後は、新たに1区間数分のデータを処理する度に、前記1区間分ずらした所定数個分のデータを次の1サイクルとして一定以上の出現率で出現するデータに係るデータ値を前記記憶手段を検索して得られるように、前記記憶手段内の頻度情報の追加・削除・変更を行う演算手段とを備え、
該演算手段は、
順次入力されるデータのデータ値について、前記頻度情報が前記記憶手段に記憶されていない場合、前記記憶手段に前記データ値の頻度情報を新たに追加し、前記記憶手段に記憶されている場合、前記データ値の頻度情報の出現頻度に関する事項を加算更新する処理を行うデータ値計数処理部と、
1区間分取得したデータに係る処理が終了すると、所定数個分のデータに係る各データ値の出現頻度と誤差見積もり値とに基づいて、処理した区間数分のデータに対して、出現頻度が低いデータ値に係る前記頻度情報を前記記憶手段から削除する処理を行う計数決定処理部と、
最初のサイクルの所定数個のデータに対して、前記データ値計数処理部及び前記計数決定処理部の処理が終了した場合、前記記憶手段に記憶された各データ値の前記誤差見積もり値に基づいて前記計数処理に係る出現頻度を調整し、前記次の区間の出現頻度の推定値を算出しなければならないものと判断すると、前記計数処理に係る出現頻度から前記先頭区間出現頻度を減じ、1区間分ずらした前記所定数個−1区間分のデータにおける計数処理に係る出現頻度として前記記憶手段に記憶し、また、前記先頭区間出現頻度、前記最終区間出現頻度及び前記計数処理に係る出現頻度に基づいて、前記次の区間の出現頻度の推定値を算出し、1区間分ずらした次の所定数個分のデータにおける先頭区間出現頻度として前記記憶手段に記憶する処理を行う近似頻度演算処理部と
を有し、
その後入力されるデータが、前記次のサイクルの最後の区間の最初のデータから入力されているものとして、前記データ値計数処理部、計数決定処理部及び近似頻度演算処理部が処理を継続して行うことを特徴とする統計処理装置。 - 前記近似頻度演算処理部において、前記次の区間の出現頻度の推定値を算出しなくてもよいものと判断すると、前記誤差見積もり値の値を1減らすことを特徴とする請求項8記載の統計処理装置。
- 前記演算手段は、前記先頭区間出現頻度と前記最終区間出現頻度とを結び、前記計数処理に係る出現頻度がその区間の面積となる二次曲線に基づく式から、前記次の区間の出現頻度の推定値を算出することを特徴とする請求項7〜9のいずれかに記載の統計処理装置。
- 前記演算手段は、前記先頭区間出現頻度、前記最終区間出現頻度及び前記計数処理に係る出現頻度に基づいて、前記データ値毎の出現頻度の変化率の推定値を算出する処理をさらに行うことを特徴とする請求項7〜10のいずれかに記載の統計処理装置。
- 前記演算手段は、前記先頭区間出現頻度と前記最終区間出現頻度とを結び、前記計数処理に係る出現頻度がその区間の面積となる二次曲線を微分した式に基づいて算出した前記最終区間における微分値を、前記出現頻度の変化率の推定値として算出することを特徴とする請求項11記載の統計処理装置。
- 前記演算手段は、前記所定数個のデータに係る計数処理を終了した後及び1区間分のデータに係るデータ値の計数処理を終了する毎に、所定の出現率に基づく値以上の出現頻度を計数したデータ値の頻度情報を前記記憶手段から検索して抽出する処理を行う結果抽出処理部をさらに有することを特徴とする請求項7〜12のいずれかに記載の統計処理装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008053195A JP4513878B2 (ja) | 2008-03-04 | 2008-03-04 | 統計処理方法及び装置並びに統計処理方法のプログラム |
US12/320,046 US20090183037A1 (en) | 2008-01-16 | 2009-01-15 | Statistical processing apparatus capable of reducing storage space for storing statistical occurrence frequency data and a processing method therefor |
DE602009000921T DE602009000921D1 (de) | 2008-01-16 | 2009-01-16 | Zur Reduzierung des Speicherplatzes beim Speichern von Daten der statistischen Häufigkeitsfrequenz fähige Vorrichtung zur statistischen Verarbeitung und Verarbeitungsverfahren dafür |
EP09150720A EP2081326B1 (en) | 2008-01-16 | 2009-01-16 | Statistical processing apparatus capable of reducing storage space for storing statistical occurence frequency data and a processing method therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008053195A JP4513878B2 (ja) | 2008-03-04 | 2008-03-04 | 統計処理方法及び装置並びに統計処理方法のプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009212770A JP2009212770A (ja) | 2009-09-17 |
JP4513878B2 true JP4513878B2 (ja) | 2010-07-28 |
Family
ID=41185502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008053195A Expired - Fee Related JP4513878B2 (ja) | 2008-01-16 | 2008-03-04 | 統計処理方法及び装置並びに統計処理方法のプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4513878B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5818740B2 (ja) | 2012-04-17 | 2015-11-18 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | テキストデータストリームに含まれるアイテムの中から出現頻度の高いアイテムを特定する方法、装置及びコンピュータプログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006148686A (ja) * | 2004-11-22 | 2006-06-08 | Oki Electric Ind Co Ltd | 通信監視システム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2987258B2 (ja) * | 1992-07-13 | 1999-12-06 | 沖電気工業株式会社 | 非同期転送モード通信網におけるトラヒック監視方式 |
-
2008
- 2008-03-04 JP JP2008053195A patent/JP4513878B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006148686A (ja) * | 2004-11-22 | 2006-06-08 | Oki Electric Ind Co Ltd | 通信監視システム |
Also Published As
Publication number | Publication date |
---|---|
JP2009212770A (ja) | 2009-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111064614A (zh) | 一种故障根因定位方法、装置、设备及存储介质 | |
US20090183037A1 (en) | Statistical processing apparatus capable of reducing storage space for storing statistical occurrence frequency data and a processing method therefor | |
CN107480028B (zh) | 磁盘可使用的剩余时长的获取方法及装置 | |
JP2021533474A (ja) | ノード分類方法、モデル訓練方法並びに、その装置、機器及びコンピュータプログラム | |
CN108345601A (zh) | 搜索结果排序方法及装置 | |
CN112882889A (zh) | 异常监控方法、系统、电子设备和存储介质 | |
CN108647587A (zh) | 人数统计方法、装置、终端及存储介质 | |
US20200090076A1 (en) | Non-transitory computer-readable recording medium, prediction method, and learning device | |
CN104424361A (zh) | 自动定义热存储和大工作负载 | |
JP4513878B2 (ja) | 統計処理方法及び装置並びに統計処理方法のプログラム | |
CN114168318A (zh) | 存储释放模型的训练方法、存储释放方法及设备 | |
JP7367622B2 (ja) | データ管理システム、データ管理方法、および、データ管理プログラム | |
CN108073464A (zh) | 一种基于速度和加速度的时序数据异常点检测方法及装置 | |
JP2004078780A (ja) | 予測方法、予測装置、予測プログラム、および予測プログラムを記録した記録媒体 | |
CN110909062A (zh) | 数据处理方法、装置、电子设备及可读存储介质 | |
US11762562B2 (en) | Performance analysis apparatus and performance analysis method | |
JP2011154487A (ja) | コンテンツ有用性管理システム、方法、及びプログラム | |
JP6627258B2 (ja) | システムモデル生成支援装置、システムモデル生成支援方法、及び、プログラム | |
CN108537654B (zh) | 客户关系网络图的渲染方法、装置、终端设备及介质 | |
JP7119484B2 (ja) | 情報集約装置、情報集約方法、及び、プログラム | |
JP2010102462A (ja) | 障害推定装置、方法及びプログラム | |
JP6508202B2 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
US20230161841A1 (en) | Computer system and data analysis method | |
JP5957507B2 (ja) | データパターン分析最適化処理装置、及びデータパターン分析最適化処理方法 | |
JP3952043B2 (ja) | 分析装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091208 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100420 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100503 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4513878 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130521 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130521 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130521 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140521 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |