JPH1125169A - 相関関係抽出方法 - Google Patents

相関関係抽出方法

Info

Publication number
JPH1125169A
JPH1125169A JP17450397A JP17450397A JPH1125169A JP H1125169 A JPH1125169 A JP H1125169A JP 17450397 A JP17450397 A JP 17450397A JP 17450397 A JP17450397 A JP 17450397A JP H1125169 A JPH1125169 A JP H1125169A
Authority
JP
Japan
Prior art keywords
event
events
time
correlation
combination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP17450397A
Other languages
English (en)
Other versions
JP3699807B2 (ja
Inventor
Akihiko Nakase
明彦 仲瀬
Shigeru Koyanagi
滋 小柳
Mitsuru Kakimoto
満 柿元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP17450397A priority Critical patent/JP3699807B2/ja
Priority to US09/106,091 priority patent/US6230064B1/en
Publication of JPH1125169A publication Critical patent/JPH1125169A/ja
Application granted granted Critical
Publication of JP3699807B2 publication Critical patent/JP3699807B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling

Abstract

(57)【要約】 【課題】 効率良く大規模な時系列データから相関関係
を抽出することが可能な相関関係抽出方法を提供するこ
と。 【解決手段】時系列データ内で特徴的に変化している時
系列部分をイベントとして抽出するとともに、該イベン
トの属性情報として少なくとも該時系列部分の開始時刻
を抽出し、前記イベントの属性情報に基づいてイベント
間の発生傾向の相関関係を抽出することにより、前記時
系列データ間の相関関係を抽出することを特徴とする。
前記イベント間の発生傾向の相関関係を抽出する際、前
記時系列データから抽出された前記イベントを所定の方
法によりグルーピングしてなる各グループ内にて所定の
方法によりイベントの組合せを作成し、複数の前記グル
ープから得た前記組合せを形成するイベント間の開始時
刻の時刻差に基づいて前記イベント間の発生傾向の相関
関係を抽出する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数の時系列デー
タから相関関係を抽出する相関関係抽出方法に係り、特
に販売実績の時系列データに基づいた売れ行きの動向に
相関関係を持つ商品の抽出等を行うことでマーケッティ
ング等の動向予測、傾向予測を行うための相関関係抽出
方法に関する。
【0002】
【従来の技術】近年、記憶装置の大容量化ならびに低価
格化により、データベース内に大規模なデータを格納す
ることが可能となってきた。このようなデータベースで
は、時刻、日、週、月等の時間単位で変化するデータ
を、かなり長い時間範囲で格納することも可能である。
このようなデータベースに販売実績等の情報を蓄積して
いき、これを分析して販売(消費者の購買)に関する何
らかの傾向を発見することは、マーケッティングや販売
戦略にとって非常に重要である。
【0003】図9に小売企業などで収集される商品の販
売データの一例を示す。この(a),(b),(c)の
データは、店A、店B、店Cの3店におけるそれぞれの
4月から10月までの商品Xと商品Yの売上動向を示し
ている。
【0004】図9のデータ量であればこれをグラフなど
で表して人手で分析することが比較的容易であり、この
場合、例えば、(1)店Aでは4月から6月にかけて商
品Xの売上が伸びており、6月から8月にかけて商品Y
の売上が伸びている点、(2)店Bでは5月から7月に
かけて商品Xの売上が伸びており、7月から9月にかけ
て商品Yの売上が伸びている点、(3)店Cでは4月か
ら6月にかけて商品Xの売上が伸びており、6月から8
月にかけて商品Yの売上が伸びている点が分析の結果と
して得られる。そして、以上の分析から推測できる命題
として、「商品Xの売上が伸びると2カ月後に商品Yの
売上も伸びる。」という規則が考えられる。
【0005】このように時系列を含んだ規則を発見する
ことは、商店の営業活動において、早期に変化の兆候を
察して行動をとる上で非常に重要である。従来、このよ
うな分析を行うには、各商品の売行きをグラフ等で表
し、視覚化して、専門化の判断により時系列間の相関関
係を判定していた。
【0006】しかしながら、各店舗で扱う商品数が多く
なり、長期間の売上データが分析対象となり、また扱う
店舗数が多くなるなどすると、たとえ専門化であっても
人手でデータを分析することは極めて困難になる問題点
があった。
【0007】また、時系列同士の形状の類似性、それら
の時間差などを分析する手法として、時系列同士の組合
せを作り、1つの時系列を時間軸方向にずらしながら回
帰分析等の統計分析を行い、相関関係を発見する手法も
考えられるが、計算量が、時系列の系列数の組合せの数
と、時間長の積に比例するので、大規模な項目と期間を
持つ時系列分析には適さないという問題点があった。
【0008】また、上記の例のように売上データを分析
した場合、その結果が実際には時系列間の相関を意味す
るのではなく時系列と特定の時刻との間の相関に起因し
て抽出されていた場合がある。例えば12月24日付近
にケーキの売上が急上昇し12月25日以降に餅の売上
が急上昇した場合、どの店舗でも同じような状況である
とすれば、「ケーキの売上が急上昇した1週間後に餅の
売上も上昇する。」等の規則が出てきてしまう場合があ
る。このように特定時刻に対する相関性が強いものに対
しては、「ケーキはクリスマス近くに良く売れ、餅は正
月近くに良く売れる。」等の特定時刻と時系列の依存性
を示すことが望ましい。
【0009】
【発明が解決しようとする課題】従来、大規模な時系列
データから相関関係を抽出する場合、専門化等が人手で
分析するのは極めて困難であった。また、統計分析等の
手法を用いることも考えられるが、処理時間が時系列デ
ータの組合せの種類数と時系列データのデータ量積に比
例するので、大規模な項目と期間を持つ時系列分析には
適さないという問題点があった。
【0010】本発明は、上記事情を考慮してなされたも
ので、効率良く大規模な時系列データから相関関係を抽
出することが可能な相関関係抽出方法を提供することを
目的とする。
【0011】
【課題を解決するための手段】本発明(請求項1)は、
複数の時系列データから相関関係を抽出する相関関係抽
出方法であって、時系列データ内で特徴的に変化してい
る時系列部分をイベントとして抽出するとともに、該イ
ベントの属性情報として少なくとも該時系列部分の開始
時刻を抽出し、前記イベントの属性情報に基づいてイベ
ント間の発生傾向の相関関係を抽出することにより、前
記時系列データ間の相関関係を抽出することを特徴とす
る。
【0012】好ましくは、前記イベント間の発生傾向の
相関関係を抽出する際、前記時系列データから抽出され
た前記イベントをりグルーピングしてなる各グループ内
にてイベントの組合せを作成し、複数の前記グループか
ら得た前記組合せを形成するイベント間の開始時刻の時
刻差に基づいて前記イベント間の発生傾向の相関関係を
抽出するようにしてもよい。
【0013】好ましくは、前記イベント間の発生傾向の
相関関係を抽出する際、前記時系列データから抽出され
た前記イベントをグルーピングしてなる各グループ内に
てイベントの組合せを作成し、複数の前記グループから
前記組合せを形成するイベント間の開始時刻の時刻差を
それぞれ求め、求められた複数の前記時刻差の度数分布
を求め、求められた前記度数分布において所定の分散条
件が満たされているならば、この組合せを形成するイベ
ント間の発生傾向には相関関係があると判断するように
してもよい。
【0014】好ましくは、前記イベントの属性情報とし
て前記開始時刻に加えて少なくとも前記時系列部分の継
続時間を抽出し、前記イベント間の発生傾向の相関関係
を抽出する際、前記時系列データから抽出された前記イ
ベントをグルーピングしてなる各グループ内にてイベン
トの組合せを作成し、複数の前記グループから前記組合
せを形成するイベントの継続時間をそれぞれ求め、求め
られた複数の前記継続時間の度数分布を求め、求められ
た前記度数分布において所定の分散条件が満たされてい
るならば、この組合せを形成するイベント間の発生傾向
には相関関係があると判断するようにしてもよい。
【0015】好ましくは、前記イベント間の発生傾向の
相関関係を抽出する際、前記時系列データから抽出され
た前記イベントをグルーピングしてなる各グループ内に
てイベントの組合せを作成し、複数の前記グループから
前記組合せを形成するイベントの開始時刻をそれぞれ求
め、求められた複数の前記開始時刻の度数分布を求め、
求められた前記度数分布において所定の分散条件が満た
されているならば、この組合せを形成するイベント間の
発生傾向には相関関係があると判断するようにしてもよ
い。
【0016】好ましくは、前記イベント間の発生傾向の
相関関係を抽出する際、前記時系列データから抽出され
た前記イベントをグルーピングしてなる各グループ内に
てイベントの組合せを作成し、複数の前記グループから
前記組合せを形成するイベントの開始時刻をそれぞれ求
め、求められた複数の前記開始時刻の度数分布を求め、
求められた前記度数分布において所定の分散条件が満た
されているならば、この組合せを形成するイベントと特
定時刻との間に相関関係があると判断するようにしても
よい。
【0017】また、本発明(請求項7)は、開始時刻の
情報を少なくとも含むイベントの集合からイベント間の
発生傾向の相関関係を抽出する相関関係抽出方法であっ
て、前記イベントをグルーピングしてなる各グループ内
にてイベントの組合せを作成し、数の前記グループから
前記組合せを形成するイベントの開始時刻をそれぞれ求
め、該開始時刻の度数分布を求め、該度数分布において
所定の分散条件が満たされているか否か判断し、前記所
定の分散条件が満たされていると判断された場合に、複
数の前記グループから前記組合せを形成するイベント間
の開始時刻の時刻差をそれぞれ求め、該時刻差の度数分
布を求め、該度数分布において所定の分散条件が満たさ
れているならば、この組合せを形成するイベント間の発
生傾向には相関関係があると判断することを特徴とす
る。
【0018】また、本発明(請求項8)は、開始時刻お
よび継続時間の情報を含むイベントの集合からイベント
間の発生傾向の相関関係を抽出する相関関係抽出方法で
あって、前記イベントをグルーピングしてなる各グルー
プ内にてイベントの組合せを作成し、複数の前記グルー
プから前記組合せを形成するイベントの継続時間をそれ
ぞれ求め、該継続時間の度数分布を求め、該度数分布に
おいて所定の分散条件が満たされているか否か判断し、
前記所定の分散条件が満たされていると判断された場合
に、複数の前記グループから前記組合せを形成するイベ
ントの開始時刻をそれぞれ求め、該開始時刻の度数分布
を求め、該度数分布において所定の分散条件が満たされ
ているか否か判断し、前記所定の分散条件が満たされて
いると判断された場合に、複数の前記グループから前記
組合せを形成するイベント間の開始時刻の時刻差をそれ
ぞれ求め、該時刻差の度数分布を求め、該度数分布にお
いて所定の分散条件が満たされているならば、この組合
せを形成するイベント間の発生傾向には相関関係がある
と判断することを特徴とする。
【0019】本発明によれば、時系列データから特徴的
な部分を抽出して、それらをイベントとして扱うことに
より、分析対象の時系列データのデータ量を削減し、よ
り大量のデータの分析を可能とする。また、抽出された
イベントに、イベント開始時刻のデータを持たせること
により、イベント発生間の相関関係を容易に抽出でき、
最終的に時系列間の相関関係も容易に抽出できる。
【0020】本発明での計算量は、時系列データから特
徴的な時系列部分を抽出してイベント列に変換する処理
では、時系列データの長さに比例する。しかし、その後
の処理での計算量は、変換されたイベント列を使うの
で、時系列の長さとは独立で、時系列の系列数の組合せ
数にのみ比例するので、従来の統計的に相関関係を分析
する手法に比べて、少ない計算量で時系列間の相関関係
を抽出できる。
【0021】なお、以上の各方法に係る発明は装置に係
る発明としても成立する。また、上記の発明は、相当す
る手順あるいは手段をコンピュータに実行させるための
プログラムを記録した機械読取り可能な媒体としても成
立する。
【0022】
【発明の実施の形態】以下、図面を参照しながら発明の
実施の形態を説明する。図1に本発明の第1の実施形態
に係るデータ処理システムの構成を示す。本データ処理
システムは、複数のクライアント装置(店舗システム)
と1つのサーバ装置(センタシステム)により構成され
る。
【0023】なお、以下では、具体例を用いて説明する
場合には、その具体例として複数の店舗にクライアント
装置を設置し、1つの情報処理センタにサーバ装置を設
置し、各店舗から情報処理センタに集めた各時系列デー
タをもとに商品の販売・購買の動向・傾向を分析・予測
するような場合を用いる。この場合、クライアント装置
を店舗システムと呼び、サーバ装置をセンタシステムと
呼ぶものとする。
【0024】各クライアント装置(図1中の#1〜#
n)は、それぞれ、時系列データベース11、時系列デ
ータ特徴的時系列部分抽出部12、イベント列記憶部1
3を有する。サーバ装置は、イベント組合せ抽出部1
4、イベント継続期間判定部15、イベント開始時刻判
定部16、イベント発生時刻正規化部17、イベント間
発生時刻差判定部18を有する。
【0025】各クライアント装置とサーバ装置との間の
データのやり取りは、各クライアント装置およびサーバ
装置にそれぞれ設けられた図示しない通信装置により通
信網を介して行われる。
【0026】クライアント装置とサーバ装置は、計算機
と上記各構成部分に相当するプログラムと必要なオペレ
ーティング・システム等を用いて構成されるものとす
る。なお、店舗システムは、例えば、店舗側POSシス
テムに上記の機能を付加することでも実現可能である。
【0027】以下の説明で用いる「開始時刻」「発生時
刻差」等の「時刻」は、時系列データの時間軸の区分の
仕方に応じて、時間帯(時間帯は1日をいくつかに分割
した単位)、日、週または月等を意味するものとする。
「継続時間」等の「時間」は、時系列データの時間軸の
区分の仕方に応じて、時間帯数、日数、週数、月数等を
意味するものとする。
【0028】まず、各クライアント装置の各構成部分に
ついて説明する。時系列データベース11は、複数の時
系列データを含むものであり、例えばリレーショナル・
データベースとして実現される。ここでの1つの時系列
データは、ある項目のある変数の値を時系列に並べたも
のである。
【0029】購買動向予測等を行う具体例の場合、時系
列データベース11は、例えば、POSデータをもとに
作成され、当該店舗において販売された商品の分類毎/
一定期間毎に、その販売数量を集計したものである。販
売数量の集計単位として用いる商品の分類としては個別
品目毎を基本とするのが好ましいが、その他に、あるカ
テゴリーに含まれる複数の個別品目の販売数量を集計し
たデータを用いてもよい。また、上記の一定期間は、例
えば、時間帯単位、日単位、週単位、月単位等であり、
販売数量の集計期間として1種類のみ使用してもよい
し、所望のいくつかでそれぞれ販売数量を集計した時系
列データを用いるようにしてもよい。
【0030】時系列データベース11の内容は、外部か
ら入力してもよいし、外部から入力した生データなどを
もとにクライアント装置内で作成してもよい。購買動向
予測等を行う具体例の場合に、店舗側POSシステムに
必要な機能を付加して本クライアント装置(店舗システ
ム)を実現するならば、時系列データベース11は、店
舗側POSシステムに蓄積されているPOSデータをも
とに容易に作成することができる。
【0031】なお、時間軸の区分の仕方が相違する時系
列データ(例えば、日単位の時系列データと月単位の時
系列データ)が存在する場合には、以降のクライアント
装置における処理は、時間軸の区分の仕方を同一とする
時系列データごとに、別々に行うものとする。
【0032】特徴的時系列部分抽出部12は、時系列デ
ータベース11から特徴的時系列部分を抽出し、これを
所定のイベントに置き換えることにより、時系列データ
をイベント列に変換する。この際、特徴的時系列部分の
分類、開始時刻、継続時間の情報を、それぞれ、イベン
トのイベント名、イベント開始時刻、イベント継続時間
とする。特徴的時系列部分の分類とその条件は、例え
ば、使用者による定義に基づいて設定される。
【0033】図2に特徴的時系列部分抽出部12の処理
手順の一例を示す。この処理は、時系列データベース1
1の各時系列データについてそれぞれ行われる。ステッ
プS12でデータが終了するで、次の処理を繰り返す。
【0034】すなわち、まず、時系列データベース11
から取り出された1つの時系列データを、横軸を時間
(日、週、月等)、縦軸を変数として折れ線グラフ化し
て表現した場合における極大点および極小点を抽出し
(ステップS11)、隣接する極大点と極小点とを結ぶ
ベクトルを作成する(ステップS13)。ベクトルの向
きは時間軸方向の成分が正になるようにする。ベクトル
の長さは、そのベクトルの持つ時間軸方向の成分の長さ
とする。ベクトルの傾きは、時間軸方向を0度(あるい
はラジアン)とし、変数(例えば販売数量)の軸方向の
成分が正の場合(例えば販売数量が増加する場合)を正
とする。
【0035】次に、ベクトルの傾きの絶対値が基準値以
上であり、かつ、ベクトルの長さが基準値以上である条
件を満たすか、または該条件を満たさないかを判断する
(ステップS14)。
【0036】いずれかが基準値以上でない場合には、ス
テップS11に戻り、次のベクトルを作成し、ステップ
S12の判断を行う。いずれも基準値以上である場合に
は、そのベクトルの始点と長さとイベント分類に必要な
情報(例えば傾き)とを特徴的時系列部分として抽出
し、これらをもとにイベントとして表現する(ステップ
S15)。
【0037】この手順の場合、ベクトルの始点がイベン
トの開始時刻になり、ベクトルの長さがイベントの継続
時間になる。また、特徴的時系列部分の分類は、例え
ば、ベクトルの特徴の分類(例えば、ベクトルの傾きの
正負、傾きの程度、長さによる分類)を示す記号により
表現される。そして、イベント名は、特徴的時系列部分
の分類の記号に、当該時系列データの主体あるいは項目
(例えば商品の個別品目)を示す記号が結合されたもの
となる。購買動向予測等を行う具体例の場合、すなわち
時系列データが小売店の販売時系列データの場合、商品
Xの売上げが急上昇したために上記基準を満たすベクト
ルが抽出されたならば(上記の手順ではベクトルの傾き
が基準以上で正のケース)、例えば、[商品X_急上
昇]等の記号に変換される。
【0038】そして、イベント名とイベント開始時刻と
イベント継続時間が結合されて、1つのイベントが得ら
れる。購買動向予測等を行う具体例の場合、例えば、
[商品X_急上昇、4月開始、2ケ月継続]等の記号に
より1つのイベントが表現される(より抽象的に記号化
すると[A、4、2]などとなる)。
【0039】図2の手順などにより特徴的時系列部分抽
出部12により得られた種々のイベントはイベント列記
憶部13に保存される。このようにして特徴的時系列部
分抽出部12により時系列数値データを縮小化すること
により後の処理が極めて効率化される。
【0040】なお、図2の手順では、1つのベクトル単
位で処理したが、各ステップS11,S13,S14お
よびS15をバッチ的に処理するようにしてもよい。次
に、サーバ装置の各構成部分について説明する。
【0041】なお、時間軸の区分の仕方が相違する時系
列データ(例えば、日単位の時系列データと月単位の時
系列データ)をもとに作成されたイベント列が存在する
場合には、サーバ装置の各処理は、時間軸の区分の仕方
を同一とする時系列データをもとに作成されたイベント
列ごとに、別々に行うものとする。
【0042】まず、イベント組合せ抽出部14について
説明する。イベント組合せ抽出部14は、各クライアン
ト装置から提供されるイベント列が揃うと、イベントの
組合せを抽出する。
【0043】購買動向予測等を行う具体例の場合、イベ
ント組合せ抽出部14は、各店舗システムから収集した
イベント列(その店舗で発生した全イベント)を用い
て、複数の店舗で発生しているイベントの組合せを抽出
する。
【0044】図3に、イベント組合せ抽出部14の処理
手順の一例を示す。イベント組合せ抽出部14は、ユー
ザにより指定されたまたはユーザ指定がない場合にはデ
フォルト設定された所定の方法(ステップS22,S2
3,S24等)により、2つ以上の異なる種類のイベン
トの組合せを1つ作成し、このイベントの組合せに該当
するものが、複数の時系列データベースからそれぞれ得
られたイベント列(例えば各店舗におけるイベント列)
の一定数以上(または全部)に含まれている場合には、
そのイベントの組合せを形成する各イベントのイベント
名、イベント開始時刻、イベント継続時間を、各イベン
ト列から抽出する。なお、この抽出された各イベントの
イベント名、イベント開始時刻、イベント継続時間から
なるデータを「イベント組データ」と呼ぶものとする。
一方、このイベントの組み合わせに相当するものを含む
イベント列がは一定数に満たない場合(または全部では
ない場合)には、この組み合わせは破棄する。以上の処
理をイベントの組み合わせを変えながら、繰り返し行っ
ていく。
【0045】なお、本実施形態では、イベント名の相違
するものを異なる種類のイベントとして扱う場合につい
て説明するが、イベント名が同一でもイベント開始時刻
が相違すれば異なる種類のイベントとするようにしても
構わない。
【0046】また、イベントの組み合わせの種類が膨大
になるのを防ぐため、抽出するイベントの組み合わせの
種類数の上限を設けるのが好ましい。この場合、イベン
トの組み合わせの種類数が上限値に達したら、上記の処
理は終了する。また、イベントの組み合わせの種類が膨
大になるのを防ぐため、1つの組み合わせを形成するイ
ベント数の上限(例えば2)を設けるのが好ましい。
【0047】上記のイベントの組合せを作成するための
所定の方法としては、以下のようなものを始めとして、
種々の方法が考えられる。 (1)全イベント列を参照しイベントの総当たりによる
全種類のイベントの組み合わせを作成する。 (2)ユーザ指定による重要度の高いイベント名から順
にイベントの組み合わせを作成する。または、ユーザ指
定による重要度の高い項目(例えば商品の個別品目)に
関するイベント名を持つイベントから順にイベントの組
み合わせを作成する。 (3)対応する時系列データの変数値がより大きな値を
持つイベントから順番にイベントの組み合わせを作成す
る(例えば売上の高い商品のイベントを含むイベントの
組み合わせを優先的に作成する)。なお、この場合、ク
ライアント装置側において、イベント列の各イベントの
データにその変数値(例えば販売数量)のデータを付加
しておく必要がある。 (4)より多くのイベント列に出現する項目(例えばよ
り多くの店舗で扱っている商品の個別品目)に関するイ
ベント名を持つイベントから順にイベントの組み合わせ
を作成する。
【0048】(5)より大きい変化(例えばベクトルの
傾き)を持つイベントから順にイベントの組み合わせを
作成する。次に図4にイベント継続期間判定部15の処
理手順の一例を示す。
【0049】イベント組合せ抽出部14により種々のイ
ベント組データが抽出されると、イベント継続期間判定
部15は、イベントの組み合わせごとに、該当するイベ
ント組データを用いて、該組み合わせを形成する各イベ
ントの継続時間の度数分布を調べ(ステップS31)、
各イベントについてそれぞれ所定の条件(例えば、イベ
ントの継続時間の分散もしくは標準偏差が、規定値未満
であること)を満たしていれば(ステップS32)、こ
のイベントの組み合わせを、相関関係を持つイベントの
組み合わせの候補とする(ステップS33)。
【0050】イベントの組み合わせを形成する全イベン
トのうちいずれか1つでも所定の分散度の条件を満たし
ていなければ、該イベント間には相関関係がないものと
して、該イベントの組み合わせはこの時点で破棄され
る。
【0051】次に図5にイベント開始時刻判定部16の
処理手順の一例を示す。イベント開始時刻判定部16
は、イベント継続期間判定部15により抽出された相関
関係候補となる各イベントの組み合わせについて、該当
するイベント組データを用いて、該組み合わせを形成す
るイベントごとにその開始時刻の度数分布を調べ(ステ
ップS41)、所定のイベント(例えば最初に発生する
イベント)について所定の条件(例えば、イベントの開
始時刻の分散もしくは標準偏差が、規定値以上であるこ
と)を満たしていれば(ステップS42)、相関関係を
持つイベントの組み合わせの候補として出力する(ステ
ップS43)。
【0052】上記の所定のイベントが所定の分散度の条
件を満たしていない場合、他のイベントについて順次上
記の判定を行い、1つでも所定の条件を満たしているも
のがあれば、その時点で相関関係を持つイベントの組み
合わせの候補として出力する。
【0053】一方、全てのイベントが所定の条件を満た
さないならば、イベントの開始時刻と特定の時刻(ある
いは日等)との間に相関関係があるものと判断して、組
み合わせの候補としないことを決定する。組み合わせの
候補としないことが決定された場合、該イベントの組み
合わせは破棄する。
【0054】なお、上記の所定のイベントが所定の分散
度の条件を満たしていない場合、他のイベントの判定を
せずにその時点で組み合わせの候補としないことを決定
するようにしてもよい。
【0055】なお、特定時刻との間に相関関係があると
判断されたイベントについては別途ユーザに提示するよ
うにしてもよい。次に図6にイベント発生時刻正規化部
17の処理手順の一例を示す。
【0056】イベント発生時刻正規化部17は、イベン
ト開始時刻判定部16により相関関係を持つイベントの
組み合わせの候補として出力された各イベントの組み合
わせに該当する各イベント組データについて、複数のイ
ベントのうちの発生順序をもとに予め定められた1つの
イベント(例えば最初に発生したイベント)の開始時刻
で、該イベントの開始時刻を正規化する(ステップS5
1)。すなわち、該1つのイベントの開始時刻を起点と
して、該他のイベントの開始時刻を、この起点からの経
過時間すなわち発生時刻差で表現する。
【0057】次に図7にイベントイベント間発生時刻差
判定部18の処理手順の一例を示す。イベント発生時刻
正規化部17により該当するイベント組データに対する
イベント経過時間の正規化が終了すると、イベント間発
生時刻差判定部18は、イベント開始時刻判定部16に
より相関関係を持つイベントの組み合わせの候補として
出力された各イベントの組み合わせについて、該当する
イベント組データを用いて、各発生時刻差の度数分布を
調べ、すべてについて所定の分散度の条件(例えば、イ
ベントの発生時刻差の分散もしくは標準偏差が、規定値
未満であること)を満たしていれば、このイベントの組
み合わせを、相関関係を持つイベントの組み合わせとし
て決定し、このイベントの組み合わせを形成する各イベ
ントのイベント名、各発生時刻差の該当するイベント組
データにおける平均値(もしくは平均値および標準偏差
等の統計値)を出力する。
【0058】相関関係を持つイベントの組み合わせとし
て決定されたものは、逐次、相関関係規則19として蓄
積していく。そして、得られた種々の相関関係規則19
のデータは、クライアント装置側に提供される。
【0059】このようにして、イベント間発生時刻差判
定部18により、イベントの組み合わせのうち、それを
形成する複数のイベントの発生間隔のずれの分布が小さ
いものが、時間的な相関関係のあるイベントの組み合わ
せとして発見される。例えば、イベントの組み合わせを
形成する2種類のイベントを“イベントA”、“イベン
トB”とし、発生時刻差をn時間とすると、「イベント
Aが発生したn時間後にイベントBが発生する。」とい
う時系列間の相関関係が発見される。
【0060】なお、イベントは、もともと時系列の特徴
的な部分が変換されたものなので、サーバ装置側あるい
はクライアント装置側において、発見された相関関係に
係るイベント名および発生時刻差を、再度、時系列デー
タにおける表現に戻すことができる。例えば、イベント
名[X_A]とイベント名[Y_B]と発生時刻差[2
(カ月)](Aは売上上昇、Bは売上下降とする)から
「商品Xの売上が上昇すると2カ月後に商品Yの売上が
下降する。」の表現を得るなどが可能である。
【0061】なお、必要に応じて、相関関係を持つと決
定されたイベントの組み合わせに含まれる所望のイベン
トの開始時刻や継続時間の平均および標準偏差等の統計
値をも出力するようにしてもよい。
【0062】次に図8(a),(b)に各クライアント
装置およびサーバ装置の処理手順の一例を示す。各クラ
イアント装置は、時系列データ作成(ステップS10
1)とイベント列生成(ステップS102)とを継続的
に行っている。
【0063】一方、サーバ装置は、所定の周期におよび
/または外部からの明示的な指示に応じて、一連の処理
を行う。所定の周期または外部からの指示で、一連の処
理を開始する際(ステップS201)、まず、各クライ
アント装置にイベント列転送のリクエストを送信する
(ステップS202)。リクエストには転送を要求する
イベント列の期間的な対象範囲等を書き込むものとす
る。
【0064】各クライアント装置は、サーバ装置からイ
ベント列転送のリクエストを受信すると(ステップS1
03)、要求に該当するイベント列をサーバ装置に送信
する。
【0065】サーバ装置は、各クライアント装置からイ
ベント列を受信し(ステップS203)、全クライアン
ト装置からのイベント列が揃うと、ステップS204〜
ステップS208の一連の処理を行う。なお、この一連
の処理の結果得られたイベント間の相関関係に関する知
識は、サーバ装置内に蓄積され、さらなる動向分析、傾
向分析等に供される。また、この一連の処理の結果得ら
れたイベント間の相関関係に関する知識および/または
さらなる動向分析、傾向分析等の結果は、上記の一連の
処理直後あるいはその後の適当なタイミングで各クライ
アント装置側にフィードバックされる。
【0066】なお、この手順は一例であり、各クライア
ント装置およびサーバ装置の処理手順には他にも種々の
形態が考えられる。以下では、図9の各店舗の商品名別
月別売上数量の時系列データを分析する場合を例に取っ
て本実施形態を説明する。
【0067】まず、特徴的時系列部分抽出部12におい
て、図9に示される時系列データから特徴的な時系列を
抽出する。ここでは、2カ月以上連続で売上が上昇し、
2カ月間の間に売上高が2倍以上となっているものを、
特徴的な時系列部分と定義する。以下、2カ月間の間に
売上高が2倍以上となっているものは、「売上高が急上
昇する」と示す。例えば、図9での各時系列で、隣接し
ている月の売上の増減を調べ、前月、前々月との売上比
を計算することにより、2カ月以上連続で売上が上昇
し、2カ月間の間に売上高が2倍以上となっている部分
を抽出することができる。
【0068】図9の場合、店舗Aでは、商品が4月より
2カ月の間に売上が急上昇しており、商品Bが6月より
2カ月の間に売上が急上昇しており、店舗Bでは、商品
Aが5月より2カ月の間に売上が急上昇しており、商品
Bが7月より2カ月の間に売上が急上昇しており、店舗
Cでは、商品Aが4月より2カ月の間に売上が急上昇し
ており、商品Bが6月より2カ月の間に売上が急上昇し
ていることから、例えば図10に示される形式で、各店
舗ごとに特徴的時系列部分が抽出される。
【0069】ここで、特徴的時系列部分抽出部12で
は、これらの抽出された特徴的時系列部分をイベント形
式に変換してイベント列13を作成する。ここでは、イ
ベントの形式は、[“イベント名”、“開始時刻”、
“継続時間”]の形式とする。例えば、「商品Xが4月
より2カ月の間に売上が急上昇している」部分は、[商
品X_急上昇、4月開始、2カ月継続]のような形のイ
ベントに変換される。
【0070】この結果、図10で示される特徴的時系列
部分からは、図11に示すようなイベント列が作成され
る。この操作によって、図9の時系列データで、3店舗
2商品7カ月分のデータ(42個の数値データ)が、3
店舗2イベントのイベント名を示す6個の記号データと
3店舗2イベントの開示時刻および継続時間を示す12
個の数値データの計18個のデータに削減される。
【0071】次に、イベント組合せ抽出部14におい
て、2つ以上の異なる種類のイベント名の組合せを作
る。本例では、イベントは“商品X_急上昇”と“商品
Y_急上昇”の2つのイベントしかないので、“商品X
_急上昇”と“商品Y_急上昇”の組を作るが、通常は
前述したように多くのイベント名が抽出されるので総当
たり等の所定の方法に従ってイベント名の組を作る。
【0072】このイベントの組合せが、複数の時系列デ
ータベースから得られた複数のイベント列の各イベント
列に含まれていれば、そのイベント名、イベント開始時
刻、イベント継続時間を各イベント列から抽出する。
【0073】本例では、“商品X_急上昇”と“商品Y
_急上昇”の組が店舗A、店舗B、店舗Cの全てのイベ
ント列から抽出され、図12で示されるイベント組とな
る。本例の場合は、イベントの組み合わせが1種類であ
るので、表は1つしか生成されないが、イベントの組み
合わせの候補が複数ある場合には、イベントの組み合わ
せ種類数分の表が作成される。
【0074】次に、イベント継続期間判定部15におい
て、イベント組内の各イベントの継続時間の分布を求
め、この分布がある一定の分散基準を満たしていれば、
相関関係の候補とする。本例の場合、店舗A、店舗B、
店舗Cにおける“商品X_急上昇”イベントの継続時間
は、それぞれ、2カ月、2カ月、2カ月である。また、
“商品Y_急上昇”イベントの継続時間は、それぞれ、
2カ月、2カ月、2カ月である。ここでは、両イベント
とも分散基準を満たしているとする。
【0075】次に、イベント開始時刻判定部16におい
て、イベント組内の各イベントの開始時刻の度数分布を
調べ、所定の分散基準の条件を満たしているか否かを調
べる。本例の場合、商品Xの急上昇のイベントの開始時
刻で判断すると、開始時刻は、[4月、5月、4月]と
なる。ここでは、商品Xの急上昇のイベントの開始時刻
は所定の分散基準の条件を満たしているとし、イベント
間の相関関係候補となる。
【0076】次に、イベント発生時刻正規化部17にお
いて、各イベント組内の1つのイベントの開始時刻で他
のイベントの開始時刻を正規化する。本例の場合は、
“商品X_急上昇”のイベントを基準として、“商品Y
_急上昇”のイベントの開始時刻を正規化する。“商品
X_急上昇”のイベントの開始時刻をNとして、“商品
Y_急上昇”のイベントの開始時刻のNに対するオフセ
ットを求めると、図13で示される表のような内容にな
る。
【0077】ここで、イベント間発生時刻差判定部18
において、正規化された上記の他のイベントの開始時刻
の度数分布を調べ、所定の分散基準の条件を満たしてい
るか否かを調べる。
【0078】本例の場合は、店舗A、店舗B、店舗Cに
おける“商品X_急上昇”のイベントの開始時刻を基準
として正規化された、“商品Y_急上昇”のイベントの
開始時刻は、それぞれ、+2カ月、+2カ月、+2カ月
である。ここでは、正規化された“商品Y_急上昇”の
イベントの開始時刻は所定の分散基準を示しているとす
る。
【0079】以上の操作により、図9の時系列データか
らは、「商品X_急上昇イベントが発生した後、一定期
間後に、商品Y_急上昇イベントが発生する。」という
規則が導かれる。
【0080】生成された規則でのイベントの継続時間、
イベントの発生時刻差は、それぞれ、イベント継続期間
判定部15で得られた各イベントの継続時間差の平均
等、所定の方法で算出可能である。
【0081】最終的に本例では、「商品X_急上昇イベ
ントが発生した後、2カ月後に商品Y_急上昇イベント
が発生する。各々のイベント継続時間は2カ月であ
る。」という規則が導かれる。
【0082】ここで、“商品X_急上昇”,“商品Y_
急上昇”をそれぞれ、「商品Xの売上が急上昇し始め
る」、「商品Yの売上が急上昇し始める」という表現に
置き換えると、「商品Xの売上が急上昇すると、2カ月
後には商品Yの売上も急上昇し始める。上昇期間は2カ
月である。」という時系列間の相関関係が導かれる。
【0083】本実施形態によれば、時系列データから特
徴的な部分を抽出して、それらをイベントで表すことに
より、分析対象の時系列データのデータ量を削減し、よ
り大量のデータの分析を可能とする。また、抽出された
イベントに、イベント開始時刻とイベント継続時間のデ
ータを持たせることにより、イベント発生間の相関関係
を容易に発見でき、最終的に時系列間の相関関係も容易
に発見できる。
【0084】本実施形態での計算量は、時系列データか
ら特徴的な時系列部分を抽出してイベント列に変換する
処理では、時系列データの長さに比例する。しかし、そ
の後の処理での計算量は、変換されたイベント列を使う
ので、時系列の長さとは独立で、時系列の系列数の組合
せ数にのみ比例するので、従来の統計的に相関関係を分
析する手法に比べて、少ない計算量で時系列間の相関関
係を発見できる。
【0085】また、本実施形態によれば、時系列データ
をイベントに変換して相関関係を発見するだけでなく、
イベント列からイベント間の相関関係を求める部分のみ
を用いて、開始時刻と継続期間が記されているイベント
列から、イベント発生の相関関係を発見する装置および
方法も提供することができる。
【0086】次に、本発明の第2の実施形態に係るデー
タ処理システムについて説明する。本実施形態のデータ
処理システムは、基本的には第1の実施形態と同様であ
り、以下では相違する部分のみ説明する。
【0087】まず、本実施形態では、クライアント装置
において、時系列データからイベントを抽出する代わり
に、実際に発生したイベントを用いるので、第1の実施
形態の時系列データベース11と時系列データ特徴的時
系列部分抽出部12が不要となり、イベント列記憶部1
3の代わりに、イベント列データベースに直接、イベン
ト列が記録されるものとなる。
【0088】また、本実施形態では、イベントにはその
開始時刻にのみ意味を持たせ継続時間は用いないので、
サーバ装置において、第1の実施形態のイベント継続期
間判定部15の処理を始めとするイベントの継続時間に
関する処理が削除される。
【0089】以下、具体例として店舗での各種行事や発
生した事象などをイベントとして表したイベント系列か
らイベント間の発生の傾向の相関関係を発見する例につ
いて説明する。
【0090】図14に、2つの店舗A,Bでのイベント
を示す。これは、第1の実施形態におけるイベント列に
相当する。図14に示すイベント列は、店舗Aで1月1
0日に大売出広告を行い、1月11日に店舗の大掃除を
行い、1月12日に客の入りが良く大入袋が出されてい
ることと、店舗Bでは、1月21日に棚卸しが行われ、
1月23日に大売出広告を出しており、1月25日に客
の入りが良く大入袋が出されていることを示している。
【0091】これらのイベントに対して、総辺りでイベ
ント組を生成すると、図15〜図19で示されるイベン
ト組が生成される。大売出広告と大入袋のイベントは、
店舗A、店舗Bともに発生しているので、図15に示さ
れるように、これらのイベント組は両店舗に発生する。
しかし、大掃除、棚卸しのイベントは、それぞれ店舗
A、店舗Bのみに発生するので、図16〜図19に示す
ように、これらのイベントを含むイベント組は、片方の
店にしか発生しない。
【0092】本例では、図15のイベント組から、イベ
ントの発生傾向を発見する動作を示す。まず、イベント
発生時刻正規化部17において、図15のイベント組に
対して、イベントの開始時刻を正規化する。大売出広告
のイベント発生時をNとしてイベントの開始時刻を正規
化すると、図20に示すイベント組が生成される。
【0093】次に、イベント間発生時刻差判定部18に
おいて、正規化された上記の他のイベントの開始時刻の
度数分布を調べ、所定の分散基準の条件を満たしている
か否かを調べる。本例の場合、正規化された大入袋が出
たイベントの開始時刻は所定の分散基準を満たしている
とする。
【0094】以上の操作により、図14のイベントデー
タから、「大売出広告を出した2日後には、大入袋が出
るほど客足が伸びる。」という、イベント間の相関関係
が発見される。
【0095】以下では、各実施形態の変形例について説
明する。 (変形例1)第1、第2の実施形態において、イベント
開始時刻判定部16を省き、イベント継続期間判定部1
5とイベント発生時刻正規化部17を結合するように構
成して、イベントの開始時刻と特定の時刻との間の相関
関係の判定は行わないようにしてもよい。この場合、イ
ベント開始時刻判定部16で破棄されたであろうイベン
トの組み合わせも一旦は規則として抽出されることがあ
り、その後の分析に供することができる。
【0096】また、第1、第2の実施形態において、イ
ベント継続期間判定部15を省き、イベント組合せ抽出
部14とイベント開始時刻判定部16を結合するように
構成してもよい。これは、各クライアント装置ごとにイ
ベントの継続時間がばらついても相関関係がないものと
して破棄しないこととしたものである。
【0097】また、第1、第2の実施形態において、イ
ベント継続期間判定部15およびイベント開始時刻判定
部16を省いた構成も可能である。また、第1、第2の
実施形態または上記の構成部分を一部省いた構成におい
て、イベント継続期間判定部15と、イベント開始時刻
判定部16と、イベント発生時刻正規化部17およびイ
ベント間発生時刻差判定部18とは、適宜順序を入れ替
えてもよい。
【0098】(変形例2)第1の実施形態(またはその
変形例1)において、第1の実施形態の時系列データ特
徴的時系列部分抽出部12で抽出された継続時間を持つ
イベントと第2の実施形態のような継続時間を持たない
イベントとの間の相関関係を抽出する機能をも付加する
ようにしてもよい。
【0099】すなわち、クライアント装置には、時系列
データ特徴的時系列部分抽出部12で抽出された継続時
間を持つイベント列のデータベースとクライアント装置
側で個別に発生した継続時間を持たないイベント列のデ
ータベースを設け、それぞれのイベント列をサーバ装置
に転送する。
【0100】サーバ装置側では、第1の実施形態(また
はその変形例1)のようにして継続時間を持つイベント
間の相関関係を検出するのに加えて、継続時間を持つイ
ベントと、継続時間を持たないイベント間の相関関係を
検出する。継続時間を持つイベントと、継続時間を持た
ないイベント間の相関関係を検出する際には、第1の実
施形態(またはその変形例1)において、イベント継続
期間判定部15の処理を継続時間を持つイベントについ
て行うかまたはイベント継続期間判定部15の処理を省
くようにする。
【0101】これにより、「継続時間を持たない個別イ
ベントXの発生→期間t1後に継続時間を持つイベント
Aが発生(継続時間=t2)」といったような知識を得
ることができる。
【0102】また、サーバ装置には、必要に応じて、各
クライアント装置側に共通するような継続時間を持たな
い特定のイベントのデータベースを設け、各クライアン
ト装置から収集したイベントのうち特定イベントと相関
関係を持つものを抽出するようにしてもよい。この場
合、イベント組合せ抽出部14では特定イベントと各ク
ライアント装置から収集したイベント列に含まれるイベ
ントでイベントの組み合わせを作成し、イベント継続期
間判定部15は省くかあるいは継続時間を持つイベント
について行い、イベント開始時刻判定部16は省くかあ
るいは各クライアント装置から収集したイベント列に含
まれるイベントについて行うようにする。
【0103】これにより、例えば、「あるスポーツであ
るチームが勝った次の日はスポーツ新聞の売上が上昇す
る。」などのように、「継続時間を持たない特定イベン
トXの発生→期間t1後に継続時間を持つイベントAが
発生(継続時間=t2)」といった知識を得ることがで
きる。
【0104】(変形例3)第2の実施形態の機能を、第
1の実施形態(あるいはその変形例1)や上記の変形例
2に付加してもよい。その他、以上で説明した各機能
は、種々組み合わせて実施することが可能である。
【0105】(変形例4)上記の各実施形態や各変形例
において、得られた規則間の関係を分析して、さらに規
則を追加等するようにしてもよい。
【0106】例えば、 知識1:品目Aの売上が上昇→期間t1後に品目Bの売
上が上昇 知識2:品目Bの売上が上昇→期間t2後に品目Cの売
上が上昇 知識3:品目Bの売上が上昇→期間t3後に品目Dの売
上が上昇 との規則が得られている場合に、これらを結合して、品
目Aの売上が上昇→期間t1後に品目Bの売上が上昇→
(期間t2後に品目Cの売上が上昇、期間t3後に品目
Dの売上が上昇)といった規則を生成するようにしても
よい。
【0107】(変形例5)第1の実施形態およびその変
形例のそれぞれにおいて、各クライアント装置には、時
系列データベース11のみ設け、時系列データ特徴的時
系列部分抽出部12とイベント列記憶部13は、クライ
アント装置に設けるようにしてもよい。
【0108】なお、以上の各機能は、ソフトウェアとし
ても実現可能である。また、上記した各手順あるいは手
段をコンピュータに実行させるためのプログラムを記録
した機械読取り可能な媒体として実施することもでき
る。本発明は、上述した実施の形態に限定されるもので
はなく、その技術的範囲において種々変形して実施する
ことができる。
【0109】
【発明の効果】本発明によれば、時系列データから特徴
的な部分を抽出して、それらをイベントとして扱うこと
により、分析対象の時系列データのデータ量を削減し、
より大量のデータの分析を可能とする。また、抽出され
たイベントに、イベント開始時刻のデータを持たせるこ
とにより、イベント発生間の相関関係を容易に抽出で
き、最終的に時系列間の相関関係も容易に抽出できる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係るデータ処理システム
の構成を示す図
【図2】特徴的時系列部分抽出部の処理手順の一例を示
すフローチャート
【図3】イベント組合せ抽出部の処理手順の一例を示す
フローチャート
【図4】イベント継続期間判定部の処理手順の一例を示
すフローチャート
【図5】イベント開始時刻判定部の処理手順の一例を示
すフローチャート
【図6】イベント発生時刻正規化部の処理手順の一例を
示すフローチャート
【図7】イベント間発生時刻差判定部の処理手順の一例
を示すフローチャート
【図8】店舗システムおよびセンタシステムの処理手順
の一例を示すフローチャート
【図9】分析対象となる時系列データの一例を示す図
【図10】抽出された特徴的時系列部分の一例を示す図
【図11】イベント列となった時系列データの一例を示
す図
【図12】イベント組となった時系列データの一例を示
す図
【図13】発生時刻を正規化されたイベント列となった
時系列データの一例を示す図
【図14】イベントの列の一例を示す図
【図15】イベント組となった時系列データの一例を示
す図
【図16】イベント組となった時系列データの一例を示
す図
【図17】イベント組となった時系列データの一例を示
す図
【図18】イベント組となった時系列データの一例を示
す図
【図19】イベント組となった時系列データの一例を示
す図
【図20】発生時刻を正規化されたイベント組の一例を
示す図
【符号の説明】
11…時系列データベース 12…特徴的時系列部分抽出部 13…イベント列記憶部 14…イベント組合せ抽出部 15…イベント継続期間判定部 16…イベント開始時刻判定部 17…イベント発生時刻正規化部 18…イベント間発生時刻差判定部 19…相関関係規則

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】複数の時系列データから相関関係を抽出す
    る相関関係抽出方法であって、 時系列データ内で特徴的に変化している時系列部分をイ
    ベントとして抽出するとともに、該イベントの属性情報
    として少なくとも該時系列部分の開始時刻を抽出し、 前記イベントの属性情報に基づいてイベント間の発生傾
    向の相関関係を抽出することにより、前記時系列データ
    間の相関関係を抽出することを特徴とする相関関係抽出
    方法。
  2. 【請求項2】前記イベント間の発生傾向の相関関係を抽
    出する際、 前記時系列データから抽出された前記イベントをグルー
    ピングしてなる各グループ内にてイベントの組合せを作
    成し、 複数の前記グループから得た前記組合せを形成するイベ
    ント間の開始時刻の時刻差に基づいて前記イベント間の
    発生傾向の相関関係を抽出することを特徴とする請求項
    1に記載の相関関係抽出方法。
  3. 【請求項3】前記イベント間の発生傾向の相関関係を抽
    出する際、 前記時系列データから抽出された前記イベントをグルー
    ピングしてなる各グループ内にてイベントの組合せを作
    成し、 複数の前記グループから前記組合せを形成するイベント
    間の開始時刻の時刻差をそれぞれ求め、 求められた複数の前記時刻差の度数分布について、所定
    の分散条件が満たされているならば、この組合せを形成
    するイベント間の発生傾向には相関関係があるとして抽
    出することを特徴とする請求項1に記載の相関関係抽出
    方法。
  4. 【請求項4】前記イベントの属性情報として前記開始時
    刻に加えて少なくとも前記時系列部分の継続時間を抽出
    し、 前記イベント間の発生傾向の相関関係を抽出する際、 前記時系列データから抽出された前記イベントをグルー
    ピングしてなる各グループ内にてイベントの組合せを作
    成し、 複数の前記グループから前記組合せを形成するイベント
    の継続時間をそれぞれ求め、 求められた複数の前記継続時間の度数分布について、所
    定の分散条件が満たされているならば、この組合せを形
    成するイベント間の発生傾向には相関関係があるとして
    抽出することを特徴とする請求項1に記載の相関関係抽
    出方法。
  5. 【請求項5】前記イベント間の発生傾向の相関関係を抽
    出する際、 前記時系列データから抽出された前記イベントをグルー
    ピングしてなる各グループ内にてイベントの組合せを作
    成し、 複数の前記グループから前記組合せを形成するイベント
    の開始時刻をそれぞれ求め、 求められた複数の前記開始時刻の度数分布について、所
    定の分散条件が満たされているならば、この組合せを形
    成するイベント間の発生傾向には相関関係があるとして
    抽出することを特徴とする請求項1に記載の相関関係抽
    出方法。
  6. 【請求項6】前記イベント間の発生傾向の相関関係を抽
    出する際、 前記時系列データから抽出された前記イベントをグルー
    ピングしてなる各グループ内にてイベントの組合せを作
    成し、 複数の前記グループから前記組合せを形成するイベント
    の開始時刻をそれぞれ求め、 求められた複数の前記開始時刻の度数分布について、所
    定の分散条件が満たされているならば、この組合せを形
    成するイベントと特定時刻との間に相関関係があるとし
    て抽出することを特徴とする請求項1に記載の相関関係
    抽出方法。
  7. 【請求項7】開始時刻の情報を少なくとも含むイベント
    の集合からイベント間の発生傾向の相関関係を抽出する
    相関関係抽出方法であって、 前記イベントをグルーピングしてなる各グループ内にて
    イベントの組合せを作成し、複数の前記グループから前
    記組合せを形成するイベントの開始時刻をそれぞれ求
    め、該開始時刻の度数分布を求め、該度数分布において
    所定の分散条件が満たされているか否か判断し、 前記所定の分散条件が満たされていると判断された場合
    に、複数の前記グループから前記組合せを形成するイベ
    ント間の開始時刻の時刻差をそれぞれ求め、該時刻差の
    度数分布を求め、該度数分布において所定の分散条件が
    満たされているならば、この組合せを形成するイベント
    間の発生傾向には相関関係があるとして抽出することを
    特徴とする相関関係抽出方法。
  8. 【請求項8】開始時刻および継続時間の情報を含むイベ
    ントの集合からイベント間の発生傾向の相関関係を抽出
    する相関関係抽出方法であって、 前記イベントをグルーピングしてなる各グループ内にて
    イベントの組合せを作成し、 複数の前記グループから前記組合せを形成するイベント
    の継続時間をそれぞれ求め、該継続時間の度数分布を求
    め、該度数分布において所定の分散条件が満たされてい
    るか否か判断し、 前記所定の分散条件が満たされていると判断された場合
    に、複数の前記グループから前記組合せを形成するイベ
    ントの開始時刻をそれぞれ求め、該開始時刻の度数分布
    を求め、該度数分布において所定の分散条件が満たされ
    ているか否か判断し、 前記所定の分散条件が満たされていると判断された場合
    に、複数の前記グループから前記組合せを形成するイベ
    ント間の開始時刻の時刻差をそれぞれ求め、該時刻差の
    度数分布を求め、該度数分布において所定の分散条件が
    満たされているならば、この組合せを形成するイベント
    間の発生傾向には相関関係があると判断することを特徴
    とする相関関係抽出方法。
JP17450397A 1997-06-30 1997-06-30 相関関係抽出装置 Expired - Fee Related JP3699807B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP17450397A JP3699807B2 (ja) 1997-06-30 1997-06-30 相関関係抽出装置
US09/106,091 US6230064B1 (en) 1997-06-30 1998-06-29 Apparatus and a method for analyzing time series data for a plurality of items

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17450397A JP3699807B2 (ja) 1997-06-30 1997-06-30 相関関係抽出装置

Publications (2)

Publication Number Publication Date
JPH1125169A true JPH1125169A (ja) 1999-01-29
JP3699807B2 JP3699807B2 (ja) 2005-09-28

Family

ID=15979648

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17450397A Expired - Fee Related JP3699807B2 (ja) 1997-06-30 1997-06-30 相関関係抽出装置

Country Status (2)

Country Link
US (1) US6230064B1 (ja)
JP (1) JP3699807B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002183431A (ja) * 2000-12-13 2002-06-28 Sumitomo Life Insurance Co 保険制度の運営適正化提案装置及びその方法
JP2002207755A (ja) * 2001-01-09 2002-07-26 Fujitsu Ltd イベントデータに関する情報管理装置
JP2005038116A (ja) * 2003-07-18 2005-02-10 Hitachi Ltd 不正侵入分析装置
JP2005257416A (ja) * 2004-03-10 2005-09-22 Internatl Business Mach Corp <Ibm> 診断装置、検出装置、制御方法、検出方法、プログラム、及び記録媒体
US7516368B2 (en) 2004-06-21 2009-04-07 Fujitsu Limited Apparatus, method, and computer product for pattern detection
JP2009116869A (ja) * 2007-10-31 2009-05-28 Nec (China) Co Ltd エンティティ関係マイニング装置および方法
WO2010035455A1 (ja) * 2008-09-24 2010-04-01 日本電気株式会社 情報分析装置、情報分析方法、及びプログラム
WO2013190627A1 (ja) * 2012-06-18 2013-12-27 株式会社日立製作所 相関分析装置及びその方法
WO2014068758A1 (ja) * 2012-11-01 2014-05-08 株式会社日立製作所 情報提示装置および情報提示方法
WO2015033869A1 (ja) * 2013-09-06 2015-03-12 インターナショナル・ビジネス・マシーンズ・コーポレーション 検出装置、検出方法、およびプログラム
JP2018128855A (ja) * 2017-02-08 2018-08-16 横河電機株式会社 イベント解析装置、イベント解析システム、イベント解析方法、イベント解析プログラム、および記録媒体

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000048047A (ja) * 1998-01-19 2000-02-18 Asahi Glass Co Ltd 時系列デ―タの保存方法及び時系列デ―タベ―スシステム、時系列デ―タの処理方法及び時系列デ―タ処理システム、時系列デ―タ表示システム、並びに記録媒体
US7299194B1 (en) * 2000-02-22 2007-11-20 International Business Machines Corporation Method and system for researching sales effects of advertising using association analysis
US7146374B1 (en) * 2001-02-21 2006-12-05 Oracle Corporation Automated multi-line labeling of a time axis
US6920453B2 (en) * 2001-12-31 2005-07-19 Nokia Corporation Method and system for finding a query-subset of events within a master-set of events
US7778711B2 (en) * 2001-08-31 2010-08-17 Bio Control Medical (B.C.M.) Ltd. Reduction of heart rate variability by parasympathetic stimulation
US20030200134A1 (en) * 2002-03-29 2003-10-23 Leonard Michael James System and method for large-scale automatic forecasting
AU2003231176A1 (en) * 2002-04-29 2003-11-17 Laboratory For Computational Analytics And Semiotics, Llc Sequence miner
JP4398777B2 (ja) * 2004-04-28 2010-01-13 株式会社東芝 時系列データ分析装置および方法
US20050283337A1 (en) * 2004-06-22 2005-12-22 Mehmet Sayal System and method for correlation of time-series data
US8005707B1 (en) 2005-05-09 2011-08-23 Sas Institute Inc. Computer-implemented systems and methods for defining events
US7310652B1 (en) * 2005-08-08 2007-12-18 At&T Corp. Method and apparatus for managing hierarchical collections of data
US10528705B2 (en) * 2006-05-09 2020-01-07 Apple Inc. Determining validity of subscription to use digital content
US8112302B1 (en) * 2006-11-03 2012-02-07 Sas Institute Inc. Computer-implemented systems and methods for forecast reconciliation
US20090106293A1 (en) * 2007-10-19 2009-04-23 Oracle International Corporation Multidimensional forecasting
US20090216611A1 (en) * 2008-02-25 2009-08-27 Leonard Michael J Computer-Implemented Systems And Methods Of Product Forecasting For New Products
US8769675B2 (en) * 2008-05-13 2014-07-01 Apple Inc. Clock roll forward detection
EP2443573A4 (en) * 2009-06-19 2016-09-07 Optuminsight Inc SYSTEM AND METHOD FOR GENERATING ATTRIBUTE-CONTROLLED TEMPORAL CLUSTERING
US8631040B2 (en) 2010-02-23 2014-01-14 Sas Institute Inc. Computer-implemented systems and methods for flexible definition of time intervals
US9047559B2 (en) 2011-07-22 2015-06-02 Sas Institute Inc. Computer-implemented systems and methods for testing large scale automatic forecast combinations
US9087306B2 (en) 2012-07-13 2015-07-21 Sas Institute Inc. Computer-implemented systems and methods for time series exploration
US9244887B2 (en) 2012-07-13 2016-01-26 Sas Institute Inc. Computer-implemented systems and methods for efficient structuring of time series data
US9147218B2 (en) 2013-03-06 2015-09-29 Sas Institute Inc. Devices for forecasting ratios in hierarchies
US9934259B2 (en) 2013-08-15 2018-04-03 Sas Institute Inc. In-memory time series database and processing in a distributed environment
US10169720B2 (en) 2014-04-17 2019-01-01 Sas Institute Inc. Systems and methods for machine learning using classifying, clustering, and grouping time series data
US9892370B2 (en) 2014-06-12 2018-02-13 Sas Institute Inc. Systems and methods for resolving over multiple hierarchies
US9208209B1 (en) 2014-10-02 2015-12-08 Sas Institute Inc. Techniques for monitoring transformation techniques using control charts
US9418339B1 (en) 2015-01-26 2016-08-16 Sas Institute, Inc. Systems and methods for time series analysis techniques utilizing count data sets
US10983682B2 (en) 2015-08-27 2021-04-20 Sas Institute Inc. Interactive graphical user-interface for analyzing and manipulating time-series projections
US10331490B2 (en) 2017-11-16 2019-06-25 Sas Institute Inc. Scalable cloud-based time series analysis
US10338994B1 (en) 2018-02-22 2019-07-02 Sas Institute Inc. Predicting and adjusting computer functionality to avoid failures
US10255085B1 (en) 2018-03-13 2019-04-09 Sas Institute Inc. Interactive graphical user interface with override guidance
US10560313B2 (en) 2018-06-26 2020-02-11 Sas Institute Inc. Pipeline system for time-series data forecasting
US10685283B2 (en) 2018-06-26 2020-06-16 Sas Institute Inc. Demand classification based pipeline system for time-series data forecasting
JP7476713B2 (ja) * 2020-08-04 2024-05-01 横河電機株式会社 データ管理システム、データ管理方法、および、データ管理プログラム
JP2022127818A (ja) * 2021-02-22 2022-09-01 三菱電機株式会社 データ分析装置、データ分析システムおよびプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6020898A (en) * 1992-07-27 2000-02-01 Olympus Optical Co., Ltd. Information display system for displaying time-series numerical values and graph simultaneously
JP3244798B2 (ja) * 1992-09-08 2002-01-07 株式会社東芝 動画像処理装置
US5748907A (en) * 1993-10-25 1998-05-05 Crane; Harold E. Medical facility and business: automatic interactive dynamic real-time management
US5819261A (en) * 1995-03-28 1998-10-06 Canon Kabushiki Kaisha Method and apparatus for extracting a keyword from scheduling data using the keyword for searching the schedule data file
JPH09106336A (ja) * 1995-10-11 1997-04-22 Sharp Corp 複数の表示画像を情報処理装置の表示窓内に表示する方法
US5933821A (en) * 1996-08-30 1999-08-03 Kokusai Denshin Denwa Co., Ltd Method and apparatus for detecting causality
US6034683A (en) * 1997-03-26 2000-03-07 Netscape Communications Corporation Time line for desktop metaphor
US6073110A (en) * 1997-07-22 2000-06-06 Siemens Building Technologies, Inc. Activity based equipment scheduling method and system

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002183431A (ja) * 2000-12-13 2002-06-28 Sumitomo Life Insurance Co 保険制度の運営適正化提案装置及びその方法
JP2002207755A (ja) * 2001-01-09 2002-07-26 Fujitsu Ltd イベントデータに関する情報管理装置
JP2005038116A (ja) * 2003-07-18 2005-02-10 Hitachi Ltd 不正侵入分析装置
US7720640B2 (en) 2004-03-10 2010-05-18 International Business Machines Corporation Diagnostic data detection and control
JP2005257416A (ja) * 2004-03-10 2005-09-22 Internatl Business Mach Corp <Ibm> 診断装置、検出装置、制御方法、検出方法、プログラム、及び記録媒体
US7516368B2 (en) 2004-06-21 2009-04-07 Fujitsu Limited Apparatus, method, and computer product for pattern detection
JP2009116869A (ja) * 2007-10-31 2009-05-28 Nec (China) Co Ltd エンティティ関係マイニング装置および方法
JPWO2010035455A1 (ja) * 2008-09-24 2012-02-16 日本電気株式会社 情報分析装置、情報分析方法、及びプログラム
WO2010035455A1 (ja) * 2008-09-24 2010-04-01 日本電気株式会社 情報分析装置、情報分析方法、及びプログラム
JP5387578B2 (ja) * 2008-09-24 2014-01-15 日本電気株式会社 情報分析装置、情報分析方法、及びプログラム
WO2013190627A1 (ja) * 2012-06-18 2013-12-27 株式会社日立製作所 相関分析装置及びその方法
WO2014068758A1 (ja) * 2012-11-01 2014-05-08 株式会社日立製作所 情報提示装置および情報提示方法
WO2015033869A1 (ja) * 2013-09-06 2015-03-12 インターナショナル・ビジネス・マシーンズ・コーポレーション 検出装置、検出方法、およびプログラム
JPWO2015033869A1 (ja) * 2013-09-06 2017-03-02 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 検出装置、検出方法、およびプログラム
US10584986B2 (en) 2013-09-06 2020-03-10 International Business Machines Corporation Detecting device, detecting method, and program
JP2018128855A (ja) * 2017-02-08 2018-08-16 横河電機株式会社 イベント解析装置、イベント解析システム、イベント解析方法、イベント解析プログラム、および記録媒体
US11275357B2 (en) 2017-02-08 2022-03-15 Yokogawa Electric Corporation Event analyzing device, event analyzing system, event analyzing method, and non-transitory computer readable storage medium

Also Published As

Publication number Publication date
US6230064B1 (en) 2001-05-08
JP3699807B2 (ja) 2005-09-28

Similar Documents

Publication Publication Date Title
JPH1125169A (ja) 相関関係抽出方法
US5920855A (en) On-line mining of association rules
CN107545381B (zh) 管理仓库库存的方法和仓库管理系统
US6308168B1 (en) Metadata-driven data presentation module for database system
Hossain et al. Market basket analysis using apriori and FP growth algorithm
US7433879B1 (en) Attribute based association rule mining
US20020065797A1 (en) System, method and computer program for automated collaborative filtering of user data
JPH1115842A (ja) データマイニング装置
JP2002279279A (ja) 商品推薦装置、商品推薦方法、及び商品推薦プログラム
US11182364B2 (en) Data analysis support apparatus and data analysis support method
US20160086200A1 (en) Product code analysis system and product code analysis program
Güllüoğlu Segmenting customers with data mining techniques
CN107239495A (zh) 基于关系链权重的商品以及搜索排序展示方法
EP2720154A1 (en) Pattern extraction device and method
US20040034562A1 (en) Time service management apparatus, method, medium, and program
Suharjo et al. Customer relationship management in retail using double association rule
JP4719761B2 (ja) お勧め商品管理システム及びプログラム
US20050125433A1 (en) Data summation system and method based on classification definition covering plural records
Pradana et al. Market Basket Analysis Using FP-Growth Algorithm On Retail Sales Data
JPH08278959A (ja) 時系列販売推移カーブを用いた商品販売予測
RU2480828C1 (ru) Способ прогноза целевого показателя событий по неограниченному количеству характеристик
US20020078064A1 (en) Data model for analysis of retail transactions using gaussian mixture models in a data mining system
JPH09305571A (ja) 時系列データ処理方法
CN114971794A (zh) 基于时间周期的高效用序列模式在团购中分析方法及系统
Karim et al. A Data Mining Approach for Prediction Modeling Using Association rule

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050415

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050711

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090715

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees