JPH10240716A - 時系列データ解析装置及びプログラムを記録した機械読み取り可能な記録媒体 - Google Patents

時系列データ解析装置及びプログラムを記録した機械読み取り可能な記録媒体

Info

Publication number
JPH10240716A
JPH10240716A JP5401897A JP5401897A JPH10240716A JP H10240716 A JPH10240716 A JP H10240716A JP 5401897 A JP5401897 A JP 5401897A JP 5401897 A JP5401897 A JP 5401897A JP H10240716 A JPH10240716 A JP H10240716A
Authority
JP
Japan
Prior art keywords
data
unit
similar
similarity
series data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5401897A
Other languages
English (en)
Other versions
JP3204154B2 (ja
Inventor
Nobukatsu Kitajima
伸克 北島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP5401897A priority Critical patent/JP3204154B2/ja
Publication of JPH10240716A publication Critical patent/JPH10240716A/ja
Application granted granted Critical
Publication of JP3204154B2 publication Critical patent/JP3204154B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Abstract

(57)【要約】 【課題】 時系列データの中から解析対象データと類似
する類似データを探し出す時系列データ解析装置に於い
て、膨大な量の時系列データから現実的な時間で、今後
の変化を予測する上で有効になる類似データを探し出せ
るようにする。 【解決手段】 記憶部1には、時系列データである複数
年分の気温データ2が格納されている。クラスタリング
部5は、気温データ2を構成する単位気温データ(1年
分の気温データ)を、類似度に基づいて複数のクラスタ
にクラスタリングする。比較対象クラスタ出力部6で
は、各単位気温データを、それがどのクラスタに属する
ものかが分かる形式で表示する。ユーザは、この表示を
見て、解析対象データを含む単位気温データとデータパ
ターンが似ている単位気温データを含むクラスタを選択
する。類似データ検索部7は、ユーザによって選択され
たクラスタに属する単位気温データのみを検索対象にし
て類似データを検索する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、気温データ,地震
波データ,株価データ等の時系列データを解析する技術
に関し、特に、ユーザによって指定されたデータとデー
タパターンが類似する類似データを時系列データの中か
ら探し出す技術に関する。
【0002】
【従来の技術】気温データ,株価データ等の時系列デー
タを解析し、今後の気温,株価等の変化を予測する場
合、ユーザによって指定された最近のデータとデータパ
ターンが類似する類似データを過去の時系列データの中
から探し出し、探し出した類似データの近傍に存在する
データのパターンを参考にして今後の変化を予測すると
いうことが従来から行われている。
【0003】ところで、ユーザによって指定されたデー
タと類似する類似データを探し出す場合、従来は、例え
ば、図12のブロック図に示すような時系列データ解析
装置が用いられている。
【0004】図12に示した従来の時系列データ解析装
置は、気温データ,株価データ等の時系列データ100
が格納された記憶部101と、キーボード等の入力部1
02と、解析対象データ選択部103と、類似データ検
索部104と、CRT等の表示部108とから構成され
ている。類似データ検索部104は、比較対象データ選
択部105,データ間類似度計算部106及び類似デー
タソート部107から構成されている。
【0005】ユーザは、類似データの検索を行う場合、
入力部102から解析対象データ選択部103に対して
解析対象データを指示する解析対象データ指示を入力す
ると共に、比較対象データ選択部105に対して検索対
象期間を指示する検索対象期間指示を入力する。ここ
で、解析対象データ指示は、例えば、時系列データ10
0中の解析対象データとする部分の開始時点を示す情報
と終了時点を示す情報とを含むものである。
【0006】解析対象データ選択部103は、解析対象
データ指示が入力されると、それによって示される解析
対象データを時系列データ100の中から選択し、選択
した解析対象データを比較対象データ選択部105,デ
ータ間類似度計算部106に渡す。
【0007】比較対象データ選択部105は、検索対象
期間指示が入力されると、先ず、時系列データ100の
中から上記指示によって指示された期間の時系列データ
を取り出す。その後、取り出した時系列データの中か
ら、解析対象データとの類似度を計算する比較対象デー
タを1つ選択し、選択した比較対象データをデータ間類
似度計算部106に渡す。以下、類似データソート部1
07から選択指示が加えられる毎に、時系列データの中
から次の比較対象データを1つ選択し、選択した比較対
象データをデータ間類似度計算部106に渡すという処
理を、比較対象データが選択できなくなるまで、繰り返
し行う。
【0008】データ間類似度計算部106は、比較対象
データ選択部105から比較対象データが1つ渡される
毎に、その比較対象データと解析対象データ選択部10
3から渡されている解析対象データとの間の類似度を計
算し、計算した類似度と上記比較対象データの組を類似
データソート部107に渡す。
【0009】類似データソート部107は、データ間類
似度計算部106から類似度と比較対象データの組が渡
されると、先ず、類似度が予め定められているユーザに
よって設定されている類似度e以上であるか否かを判断
する。そして、類似度が予め定められている類似度e未
満の場合は、今回渡された類似度と比較対象データとの
組を破棄する。一方、類似度が予め定められている類似
度e以上の場合は、今回渡された類似度と比較対象デー
タとの組を保存する。その際、既に保存されている類似
度と比較対象データの組と、今回渡された類似度と比較
データの組とを類似度によってソートして保存する。ま
た、保存する組の数が予めユーザによって設定されてい
る組数Lを超えるような場合には、類似度が最も小さな
組を破棄する。
【0010】類似データソート部107は、現在処理対
象としている組に対して上述した処理を行うと、比較対
象データ選択部105に対して選択指示を加える。
【0011】これにより、比較対象データ選択部105
は、次の比較対象データを選択し、データ間類似度計算
部106に渡す。以下、前述したと同様の動作が繰り返
し行われる。そして、比較対象データ選択部105が比
較対象データを選択できなくなると、類似データソート
部107は、保持している類似度順にソートした比較対
象データを類似データとして表示部108に出力する。
【0012】
【発明が解決しようとする課題】過去の時系列データを
用いて今後の変化を予測する場合、一般的には、大量の
時系列データが必要となる。従って、過去の時系列デー
タの全てを検索対象にして類似データを探し出している
従来の技術では、いかに高速な検索方式を用いたとして
も、類似データの検索処理に時間がかかりすぎるため、
今後の変化を予測する上で有効になる類似データを現実
的な時間内で得ることが難しかった。このような問題点
を解決するためには、ユーザが勘にたよって検索対象と
する時系列データを絞り込むという方法をとらざるを得
ないが、このようにな方法をとった場合には、今後の変
化を予測する上で有効になる類似データを得ることがで
きなくなる可能性が高くなってしまう。
【0013】そこで、本発明の目的は、膨大なデータ量
の時系列データの中から、今後の変化を予測する上で有
効になる類似データを探し出す場合であっても、現実的
な時間内で有効な類似データを探し出せる可能性を高く
することにある。
【0014】
【課題を解決するための手段】本発明の時系列データ解
析装置は、上記目的を達成するため、時系列データの中
からユーザの指示に従って解析対象データを選択する解
析対象データ選択部と、前記時系列データを単位期間で
区切ることにより構成される複数の単位時系列データ
を、類似度に基づいて複数のクラスタにクラスタリング
するクラスタリング部と、該クラスタリング部でクラス
タリングされた前記複数の単位時系列データを、それが
前記複数のクラスタの内のどのクラスタに属するものな
のかが分かる形式で表示すると共に、ユーザによって選
択されたクラスタに属する単位時系列データのみを出力
する比較対象クラスタ出力部と、該比較対象クラスタ出
力部から出力された単位時系列データの中から、前記解
析対象データ選択部で選択された解析対象データと類似
する類似データを検索して出力する類似データ検索部と
を備えている。
【0015】この構成に於いては、解析対象データ選択
部が、ユーザの指示に従って時系列データの中から解析
対象データを選択し、クラスタリング部が、時系列デー
タを単位区間で区切ることにより構成される複数の単位
時系列データを類似度に基づいて複数のクラスタにクラ
スタリングする。
【0016】比較対象クラスタ出力部では、クラスタ部
でクラスタリングされた複数の単位時系列データを、そ
れがどのクラスタに属するものかが分かる形式で表示す
る。ユーザは、この表示を見て、解析対象データを含む
単位時系列データとデータパターンが似ている単位時系
列データを含むクラスタを選択する。ユーザによってク
ラスタが選択されると、比較対象クラスタ出力部は、選
択されたクラスタに属する単位時系列データのみを出力
する。類似データ検索部は、比較対象クラスタ出力部か
ら単位時系列データが出力されると、その中から解析対
象データと類似する類似データを検索し出力する。
【0017】また、本発明の時系列データ解析装置は、
探し出された類似データの数が非常に多い場合でも、類
似度が高い方からユーザによって設定された上限数分の
類似データのみを出力できるようにし、更に、出力され
た類似データの中にユーザが望むような類似データが存
在しなかった場合、検索対象にする単位時系列データを
更に絞り込んで再検索を行えるようにするため、前記類
似データ検索部から出力された類似データを表示すると
共に、ユーザによって再検索が指示された場合、前記類
似データ検索部から出力された類似データを含む単位時
系列データを示す情報を前記クラスタリング部に渡す検
索結果判定部を備え、且つ、前記類似データ検索部は、
前記比較対象クラスタ出力部から出力された単位時系列
データを検索することにより得た類似データの数がユー
ザによって設定された上限数を超える場合には前記検索
することにより得た類似データの内の、前記解析対象デ
ータとの類似度が高い方から前記上限数分の類似データ
を出力する構成を備え、前記クラスタリング部は、前記
検索結果判定部から単位時系列データを示す情報が渡さ
れた場合、その情報によって示される複数の単位時系列
データを類似度に基づいて複数のクラスタにクラスタリ
ングする構成を備えている。
【0018】この構成に於いては、類似データ検索部
は、比較対象クラスタ出力部から出力された単位時系列
データを検索することにより得た類似データの数が、ユ
ーザによって設定された上限数を超える場合には、その
内の、解析対象データとの類似度が高い方から上記上限
数分の類似データを出力する。
【0019】検索結果判定部は、類似データ検索部から
出力された類似データを表示し、ユーザは、この表示を
見て希望する類似データが存在しなかった場合には、検
索結果判定部に対して再検索指示を入力する。
【0020】これにより、検索結果判定部は、類似デー
タ検索部から出力された類似データを含む単位時系列デ
ータを示す情報をクラスタリング部に渡し、クラスタリ
ング部は、上記情報によって示される単位時系列データ
を対象にして再度クラスタリングを行う。
【0021】
【発明の実施の形態】次に本発明の実施の形態について
図面を参照して詳細に説明する。
【0022】図1は本発明の実施例のブロック図であ
り、記憶部1と、キーボード等の入力部3と、解析対象
データ選択部4と、クラスタリング部5と、比較対象ク
ラスタ出力部6と、類似データ検索部7と、検索結果判
定部11と、CRT等の表示部12とから構成されてい
る。
【0023】記憶部1には、今後の変化を予測するため
に使用する過去の時系列データが格納されている。尚、
本実施例に於いては、1950年〜1996年の東京の
気温データ2が時系列データとして格納されているとす
る。
【0024】解析対象データ選択部4は、ユーザが入力
部3から入力する解析対象データ指示に従って、今後の
変化を予測する上で基準となるデータ(解析対象デー
タ)を気温データ2の中から取り出す機能を有する。
尚、本実施例に於いては、解析対象データ指示は、解析
対象データの開始時点を示す情報と終了時点を示す情報
とを含むものとする。
【0025】クラスタリング部5は、ユーザが入力部3
から入力した検索対象期間指示によって示される期間の
データを気温データ2の中から取り出す機能,取り出し
たデータを単位期間(本実施例では1年とする)で区切
ることにより構成される単位時系列データ(本実施例で
は1年分の気温データであり、以下単位気温データと称
す)を、類似度に基づいて複数のレベルでクラスタリン
グする機能,各レベルに於けるクラスタリング結果を表
示部12に表示する機能,表示部12に表示された各レ
ベルのクラスタリング結果を見たユーザによって使用す
るクラスタリング結果のレベルが指示されることによ
り、そのレベルのクラスタリング結果を比較対象クラス
タ出力部6に渡す機能,検索結果判定部11から渡され
た情報によって示される単位気温データを対象にして再
度クラスタリングを行う機能を有する。
【0026】比較対象クラスタ出力部6は、クラスタリ
ング部5でクラスタリングされた複数の単位気温データ
を、それがどのクラスタに属するのかが分かる形式で表
示部12に表示する機能,ユーザによって選択されたク
ラスタに属する単位気温データのみを出力する機能を有
する。
【0027】類似データ検索部7は、比較対象クラスタ
出力部6から出力された単位気温データの中から、解析
対象データ選択部4で選択された解析対象データと類似
する類似データを検索する機能,検索することにより得
た類似データの数がユーザにより設定されている上限数
Lを超える場合には、類似データの内の、類似度が高い
方から上記上限数L分の類似データを類似度順にソート
して出力し、上記規定数Lを超えない場合には、検索し
て得た類似データを全て類似度順にソートして出力する
機能を有する。
【0028】このような機能を有する類似データ検索部
7は、比較対象データ選択部8,データ間類似度計算部
9及び類似データソート部10から構成される。
【0029】比較対象データ選択部8は、比較対象クラ
スタ出力部6から出力された単位気温データの中から、
解析対象データとの類似度を計算する比較対象データを
順次選択する。
【0030】データ間類似度計算部9は、解析対象デー
タ選択部4で選択された解析対象データと比較対象デー
タ選択部8で選択された各比較対象データとの類似度を
計算する。
【0031】類似データソート部10は、データ間類似
度計算部9で類似度が計算された各比較対象データの内
の、類似度がユーザによって設定された類似度e以上の
ものを類似データとして取り扱うものであり、類似デー
タの数がユーザによって設定された上限数Lを超えない
場合には、全ての類似データを類似度順にソートして出
力し、上限数Lを超える場合には、その内の、解析対象
データとの類似度が高い方から上記上限数L分の類似対
象データを類似度順にソートして出力する。
【0032】検索結果判定部11は、類似データソート
部10から出力された類似データを表示部12に表示す
ると共に、ユーザによって再検索が指示された場合、類
似データソート部10から出力された類似データを含ん
でいる単位気温データを示す情報をクラスタリング部5
に渡す機能を有する。
【0033】図2は解析対象データ選択部4の処理例を
示す流れ図、図3はクラスタリング部5の処理例を示す
流れ図、図4は比較対象クラスタ出力部6の処理例を示
す流れ図、図5は比較対象データ選択部8の処理例を示
す流れ図、図6はデータ間類似度計算部9の処理例を示
す流れ図、図7は類似データソート部10の処理例を示
す流れ図、図8は検索結果判定部11の処理例を示す流
れ図であり、以下各図を参照して本実施例の動作を説明
する。
【0034】解析対象データと類似するデータを気温デ
ータ2の中から探し出す場合、ユーザは、先ず、入力部
3を用いて類似データソート部10に類似度e及び上限
数Lを設定する。ここで、類似度eは、類似データソー
ト部10に於いて類似データとして取り扱う比較対象デ
ータの類似度の下限値を示すものであり、上限値Lは、
類似データソート部10に於いて保存しておく類似デー
タの数の上限値を示すものである。
【0035】その後、ユーザは、入力部3を用いて、解
析対象データ選択部4に対して解析対象データ指示を入
力すると共に、クラスタリング部5に対して検索対象期
間指示を入力する。
【0036】解析対象データ選択部4は、解析対象デー
タ指示が入力されると、図2の流れ図に示すように、解
析対象データ指示に従って気温データ2の中から解析対
象データを選択し、選択した解析対象データを比較対象
データ選択部8,データ間類似度計算部9に渡す(S
1,S2)。今、例えば、解析対象データ指示に、解析
対象データの開始時点,終了時点を示す情報として、1
996年11月22日,1996年11月29日が含ま
れていたとすると、解析対象データ選択部4は、気温デ
ータ2中の1996年11月22日から1996年11
月29日までのデータを解析対象データとして選択する
ことになる。
【0037】また、クラスタリング部5は、検索対象期
間指示が入力されると、図3の流れ図に示すように、気
温データ2の中から上記検索対象期間指示によって指示
された期間のデータを取り出す(S11)。今、例え
ば、検索対象期間指示が、気温データ2の全期間を指示
するものであったとすると、クラスタリング部5は、記
憶部1に格納されている1950年〜1996年の東京
の気温データ2を全て取り出すことになる。
【0038】その後、クラスタリング部5は、取り出し
た気温データ2に対して第1レベルのクラスタリング処
理を行う(S12,S13)。
【0039】ここで、第1レベルのクラスタリング処理
について詳細に説明する。
【0040】先ず、1950年から1996年までの、
47年分の気温データ2を1年分ずつの計47個の単位
気温データに分割する。図9は単位気温データの一例を
示した図である。
【0041】その後、47個の単位気温データ間の類似
度を全て求める。類似度としては、例えば、単位気温デ
ータ間の相関係数を利用することができる。2つの単位
気温データ間の相関係数rは、それぞれの振幅値x,y
の平均をxa,a 、標準偏差をsx,y 、単位気温デー
タ中の全データ数をMとすると、次式により求めること
ができる。
【0042】
【数1】
【0043】ここで、常に−1≦r≦1であり、r>0
の場合は、一方の変量が増加すると他方の変量も増加
し、正の相関関係があるという。これに対して、r<0
の場合は、一方の変量が増加すると他方の変量が減少
し、負の相関関係があるという。また、|r|が1に近
いほど相関関係が強く、0に近いほど相関関係が弱い。
類似度として相関係数を利用する場合は、正の相関関係
だけを用い、相関係数rが1に近いほど類似度が高く、
相関係数rが0に近いほど類似度が低いとする。
【0044】また、この他にも、DPマッチング法で計
算した2つの単位気温データ間の距離をdとした時の1
/(1−d)〔0≦1/(1−d)≦1〕を用いること
もできる。この場合、1/(1−d)が1に近いほど類
似度が高く、0に近いほど類似度が低いとする。尚、D
Pマッチング法については、例えば、「動的計画法を利
用した音声の時間正規化に基づく連続単語認識,音響学
会誌,27,9,pp483〜490,1971」に詳
しく記載されている。
【0045】上記したような方法で、47個の単位気温
データ間の類似度を全て求めると、最も類似度が高い2
つの単位気温データを1つのクラスタに属するように
し、残りの45個の単位気温データをそれぞれ異なるク
ラスタに属するようにする。例えば、1990年の単位
気温データと1960年の単位気温データとの類似度が
最も高かった場合には、両単位気温データを1つのクラ
スタに属するようにし、残りの単位気温データをそれぞ
れ異なるクラスタに属するようにする。以上で、第1レ
ベルのクラスタリング処理が完了する。尚、どの単位気
温データがどのクラスタに属するかという、第1レベル
のクラスタリング処理の処理結果を、クラスタリング部
5は、保存しておく。
【0046】第1レベルのクラスタリング処理が完了す
ると、クラスタリング部5は、クラスタ数が1個になっ
たか否かを判断する(S14)。この例の場合、46個
のクラスタが存在するので、S14の判断結果はNOと
なる。
【0047】S14の判断結果がNOとなると、クラス
タリング部5は、第2レベルのクラスタリング処理を行
う(S15,S13)。
【0048】第2レベルのクラスタリング処理では、以
下に述べるような処理を行う。
【0049】第1レベルのクラスタリング処理で融合が
行われたクラスタ(この例の場合は、1990年と19
60年の2年分の単位気温データが属するクラスタ)と
残りの45個のクラスタとの間の類似度を求め、次い
で、今回求めた類似度と既に求めてある残りの45個の
クラスタ相互間の類似度とに基づいて最も類似度が高い
2つのクラスタを求め、その2つのクラスタを融合する
ことにより1つのクラスタを生成する。その後、どの単
位気温データがどのクラスタに属することになったかを
示す第2レベルのクラスタ処理結果を保存する。以上に
より、第2レベルのクラスタリング処理が完了する。
【0050】以上の処理をクラスタが1個になるまで行
うと(S14がYES)、クラスタリング部5は、各レ
ベルのクラスタリング結果を表示部12に表示する(S
16)。図10は或る1レベルのクラスタリング結果を
示した図である。
【0051】ユーザは、表示部12に表示された各レベ
ルのクラスタリング結果を見て、どのレベルのクラスタ
リング結果を使用するのかを決定し、決定したレベルを
示す情報を、入力部3を用いてクラスタリング部5に入
力する。尚、使用するレベルを決定する際、ユーザは、
必要ならば、クラスタに属する単位気温データを表示さ
せ、その表示を参考にして使用するレベルを決定する。
【0052】これにより、クラスタリング部5は、ユー
ザによって指示されたレベルのクラスタリング結果と、
クラスタリング処理の対象にした1950年から199
6年までの計47個の単位気温データとを比較対象クラ
スタ出力部6に渡す(S17)。
【0053】比較対象クラスタ出力部6は、クラスタリ
ング部5からクラスタリング結果及び47個の単位気温
データが渡されると、図4の流れ図に示すように、各ク
ラスタにどのような単位気温データが含まれるのかが分
かる形式で、単位気温データを表示部12に表示する
(S21)。例えば、単位気温データを、それが属する
クラスタ毎にひとかたまりにして表示する。
【0054】ユーザは、表示部12の表示を見て、検索
対象にしたい1個以上のクラスタを選び、選んだクラス
タを示す情報を入力部3から比較対象クラスタ出力部6
へ入力する。ここで、検索対象にするクラスタの選択基
準は、例えば、1年間の気温の変化の傾向が、解析対象
データを含む単位気温データに似ていること等が挙げら
れる。
【0055】これにより、比較対象クラスタ出力部6
は、ユーザが選択したクラスタに属する単位気温データ
のみを比較対象データ選択部8に渡す(S22)。
【0056】比較対象データ選択部8は、比較対象クラ
スタ出力部6から、ユーザによって選択されたクラスタ
に属する単位気温データが渡されると、図5の流れ図に
示すように、渡された単位気温データの中から、解析対
象データとの類似度を計算する比較対象データを1つ選
択し、選択した比較対象データをデータ間類似度計算部
9に渡す(S31)。その後、比較対象データ選択部8
は、類似データソート部10から選択指示が加えられる
毎に(S33がYESとなる毎に)、比較対象データを
1つ選択し、選択した比較対象データをデータ間類似度
計算部9に渡すという処理(S31)を、比較対象デー
タを選択できなくなるまで(S32がNOとなるま
で)、繰り返し行う。
【0057】比較対象データの選択方法としては、例え
ば、単位温度データの中から解析対象データと時間軸方
向に同じ長さのデータを、始点をずらしながら可能な限
り選択するという方法がある。尚、比較対象データの時
間軸方向の長さが解析対象データの長さと等しいという
ことは、データ間類似度計算部9に於ける類似度の計算
方法によっては必須条件とはならない。このような場合
には、比較対象データの時間軸方向の長さを解析対象デ
ータの時間軸方向の長さに対してどのような割合にする
のかを指示しておき、単位気温データの中から、解析デ
ータの時間軸方向の長さが上記指示された割合によって
決まる長さのデータを、始点をずらしながら可能な限り
選択するという方法をとることができる。
【0058】データ間類似度計算部9は、比較対象デー
タ選択部8から、比較対象データが渡されると、図6の
流れ図に示すように、上記比較対象データと解析対象デ
ータ選択部4から渡されている解析対象データとの間の
類似度を計算し(S41)、計算した類似度と上記比較
対象データとを組にして類似データソート部10に渡す
(S42)。ここで、類似度としては、前述したような
相関係数,DPマッチング法に於ける1/(1−d)を
利用することができる。
【0059】類似データソート部10は、類似度と比較
対象データとの組が渡されると、図7の流れ図に示すよ
うに、上記比較対象データの類似度が、ユーザによって
設定されている類似度e以上であるか否かを判断するこ
とにより、上記比較対象データを類似データとして取り
扱うか否かを決定する(S51)。
【0060】そして、比較対象データを類似データとし
て取り扱うと決定した場合(S51がYES)は、上記
類似データとその類似度の組と、既に保存してある類似
データとその類似度の組とを、類似度の高い順にソート
し、そのソート結果をそれまでのソート結果に代えて保
存する(S52)。その後、保存してある類似データと
類似度の組が、ユーザによって指定されている上限値L
を超えているか否かを判断する(S53)。そして、超
えている場合には保存してある類似データと類似度の組
の内、最も類似度が小さいものを破棄した後(S5
9)、比較対象データ選択部8に対して選択指示を出力
し(S55)、超えていない場合には、直ちに、比較対
象データ選択部8に対して選択指示を出力する(S5
5)。
【0061】また、S51に於いて、比較対象データを
類似データとして取り扱わないと決定した場合(S51
がNO)は、比較対象データ選択部8に対して選択指示
を出力する(S55)。
【0062】S55に於いて選択指示を出力した後、所
定時間が経過しても、データ間類似度計算部9から比較
対象データと類似度の組が渡されなかった場合は、比較
対象データ選択部8に於いて既に選択可能な比較対象デ
ータが全て選択されていると判断し(S56がYE
S)、保存してあるソート結果を検索結果判定部11に
出力する(S57)。また、選択指示を出力してから所
定時間が経過する前にデータ間類似度計算部9から比較
対象データと類似度の組が渡された場合(S56がYE
S)は、その組に対して前述したと同様の処理を行う
(S51〜S54)。
【0063】検索結果判定部11は、類似データソート
部10からソート結果が渡されると、図8の流れ図に示
すように、表示部12にソート結果を表示する(S6
1)。ユーザは、その表示を見て、希望するような類似
データが含まれていないと判断した場合は、入力部3を
用いて、検索結果判定部11に対して再検索指示を入力
する。
【0064】検索結果判定部11は、ユーザによって再
検索指示が入力されると(S62がYES)、表示部1
2に表示した類似データを含む単位気温データを示す情
報を、クラスタリング部5に渡す(S63)。
【0065】これにより、クラスタリング部5は、検索
結果判定部11から渡された情報によって示される単位
気温データを対象にして、前述したと同様の処理を行う
(図3,S12〜S17)。また、比較対象クラスタ出
力部6,比較対象データ選択部8,データ間類似度計算
部9,類似データソート部10,検索結果判定部11
も、クラスタリング部5からクラスタリング結果が出力
されることにより、前述したと同様の処理を行う。つま
り、類似データの検索対象とする単位気温データを更に
絞り込んだ形で再検索を行うので、前回の検索時に、上
限値Lによる制限によってユーザが希望するような類似
データが表示部12に表示されなかった場合にも、ユー
ザが希望するような類似データが表示部12に表示され
る可能性が高くなる。
【0066】図11は、本発明の時系列データ解析装置
を実現するハードウェア構成を示したブロック図であ
り、コンピュータによって構成されるデータ処理装置2
1と、時系列データ解析プログラムを記録した記録媒体
22と、時系列データ24を格納した記憶装置23と、
キーボード等の入力装置25と、CRT等の表示装置2
6とから構成されている。記録媒体22は、磁気ディス
ク,半導体メモリその他の記録媒体であっても良い。
【0067】記録媒体22に記録された時系列データ解
析プログラムは、データ処理装置21によって読み込ま
れ、データ処理装置21の動作を制御することで、デー
タ処理装置21上に、図1に示した、解析対象データ選
択部4,クラスタリング部5,比較対象クラスタ出力部
6,比較対象データ選択部8,データ間類似度計算部
9,類似データソート部10,検索結果判定部11を実
現する。
【0068】
【発明の効果】以上説明したように、本発明は、時系列
データを構成する複数の単位時系列データを類似度に基
づいて複数のクラスタにクラスタリングし、複数のクラ
スタの中から類似データの検索に使用するクラスタをユ
ーザに選択させるようにしているので、ユーザの勘によ
って検索対象を絞り込む場合に比較して、客観的に検索
対象を絞り込むことができる。この結果、時系列データ
のデータ量が膨大な場合であっても、現実的な時間で、
今後の変化を予測するために有効になる類似データを探
し出すことができる可能性を高くすることができる。
【0069】また、本発明は、比較対象クラスタ出力部
から出力された単位時間系列データを検索することによ
り得た類似データの数がユーザによって設定された設定
数を超える場合には、その内の解析対象データとの類似
度が高い方から上記設定数分の類似データを出力するよ
うにしたものであるので、無制限に類似データを出力す
る場合に比較して、出力された類似データの中から、今
後の変化を予測する上で有効になる類似データを探し出
す際のユーザの負担を軽減することができる効果がある
と共に、類似データを保存しておくための記憶領域の容
量を少なくすることができる効果がある。
【0070】更に、本発明は、ユーザによって再検索が
指示された場合、類似データ検索部から出力された類似
データを含む単位時系列データを示す情報を前記クラス
タリング部に渡し、その情報によって示される単位時系
列データを対象にして再度クラスタリングを行わせる検
索結果判定部を備えているので、検索対象とする単位時
系列データを更に絞り込んだ形で類似データの検索を行
うことができる。この結果、出力する類似データの数を
制限することにより、ユーザの負担等を軽減するように
した場合であっても、ユーザが望むような類似データを
出力できる可能性が高くなる。
【図面の簡単な説明】
【図1】本発明の時系列データ解析装置の実施例のブロ
ック図である。
【図2】解析対象データ選択部4の処理例を示す流れ図
である。
【図3】クラスタリング部5の処理例を示す流れ図であ
る。
【図4】比較対象クラスタ出力部6の処理例を示す流れ
図である。
【図5】比較対象データ選択部8の処理例を示す流れ図
である。
【図6】データ間類似度計算部9の処理例を示す流れ図
である。
【図7】類似データソート部10の処理例を示す流れ図
である。
【図8】検索結果判定部11の処理例を示す流れ図であ
る。
【図9】1年分の気温データ(単位気温データ)の一例
を示す図である。
【図10】或るレベルのクラスタリング結果を示す図で
ある。
【図11】時系列データ解析装置を実現するハードウェ
ア構成の一例を示すブロック図である。
【図12】従来の時系列データ解析装置の一例を示すブ
ロック図である。
【符号の説明】
1…記憶部 2…気温データ 3…入力部 4…解析対象データ選択部 5…クラスタリング部 6…比較対象クラスタ出力部 7…類似データ検索部 8…比較対象データ選択部 9…データ間類似度計算部 10…類似データソート部 11…検索結果判定部 12…表示部 21…データ処理装置 22…記録媒体 23…記憶装置 24…時系列データ 25…入力装置 26…表示装置 100…時系列データ 101…記憶部 102…入力部 103…解析対象データ選択部 104…類似データ検索部 105…比較対象データ選択部 106…データ間類似度計算部 107…類似データソート部 108…表示部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 時系列データの中からユーザの指示に従
    って解析対象データを選択する解析対象データ選択部
    と、 前記時系列データを単位期間で区切ることにより構成さ
    れる複数の単位時系列データを、類似度に基づいて複数
    のクラスタにクラスタリングするクラスタリング部と、 該クラスタリング部でクラスタリングされた前記複数の
    単位時系列データを、それが前記複数のクラスタの内の
    どのクラスタに属するものなのかが分かる形式で表示す
    ると共に、ユーザによって選択されたクラスタに属する
    単位時系列データのみを出力する比較対象クラスタ出力
    部と、 該比較対象クラスタ出力部から出力された単位時系列デ
    ータの中から、前記解析対象データ選択部で選択された
    解析対象データと類似する類似データを検索して出力す
    る類似データ検索部とを備えたことを特徴とする時系列
    データ解析装置。
  2. 【請求項2】 前記類似データ検索部から出力された類
    似データを表示すると共に、ユーザによって再検索が指
    示された場合、前記類似データ検索部から出力された類
    似データを含む単位時系列データを示す情報を前記クラ
    スタリング部に渡す検索結果判定部を備え、且つ、 前記類似データ検索部は、前記比較対象クラスタ出力部
    から出力された単位時系列データを検索することにより
    得た類似データの数がユーザによって設定された上限数
    を超える場合には前記検索することにより得た類似デー
    タの内の、前記解析対象データとの類似度が高い方から
    前記上限数分の類似データを出力する構成を備え、 前記クラスタリング部は、前記検索結果判定部から単位
    時系列データを示す情報が渡された場合、その情報によ
    って示される複数の単位時系列データを類似度に基づい
    て複数のクラスタにクラスタリングする構成を備えたこ
    とを特徴とする請求項1記載の時系列データ解析装置。
  3. 【請求項3】 前記類似データ検索部は、 前記比較対象クラスタ出力部から出力された単位時系列
    データの中から、解析対象データとの類似度を計算する
    比較対象データを選択する比較対象データ選択部と、 該比較対象データ選択部で選択された比較対象データと
    前記解析対象データ選択部で選択された解析対象データ
    との類似度を計算するデータ間類似度計算部と、 該データ間類似度計算部で類似度が計算された複数の比
    較対象データの中に存在する、前記解析対象データとの
    類似度がユーザによって設定された類似度以上の、類似
    データとして取り扱う比較対象データの数が、ユーザに
    よって設定された上限数を超える場合には、その内の、
    解析対象データとの類似度が高い方から前記上限数分の
    比較対象データを類似度順にソートして出力し、前記上
    限数を超えない場合には、それらを類似度順にソートし
    て出力する類似データソート部とを備えたことを特徴と
    する請求項2記載の時系列データ解析装置。
  4. 【請求項4】 コンピュータを、 時系列データの中からユーザの指示に従って解析対象デ
    ータを選択する解析対象データ選択部、 前記時系列データを単位期間で区切ることにより構成さ
    れる複数の単位時系列データを、類似度に基づいて複数
    のクラスタにクラスタリングするクラスタリング部、 該クラスタリング部でクラスタリングされた前記複数の
    単位時系列データを、それが前記複数のクラスタの内の
    どのクラスタに属するものなのかが分かる形式で表示す
    ると共に、ユーザによって選択されたクラスタに属する
    単位時系列データのみを出力する比較対象クラスタ出力
    部、 該比較対象クラスタ出力部から出力された単位時系列デ
    ータの中から、前記解析対象データ選択部で選択された
    解析対象データと類似する類似データを検索して出力す
    る類似データ検索部、として機能させるプログラムを記
    録した機械読み取り可能な記録媒体。
  5. 【請求項5】 コンピュータを、 時系列データの中からユーザの指示に従って解析対象デ
    ータを選択する解析対象データ選択部、 前記時系列データを単位期間で区切ることにより構成さ
    れる複数の単位時系列データを、類似度に基づいて複数
    のクラスタにクラスタリングすると共に、単位時系列デ
    ータを示す情報が渡された場合、その情報によって示さ
    れる単位時系列データを類似度に基づいて複数のクラス
    タにクラスタリングするクラスタリング部、 該クラスタリング部でクラスタリングされた前記複数の
    単位時系列データを、それが前記複数のクラスタの内の
    どのクラスタに属するものなのかが分かる形式で表示す
    ると共に、ユーザによって選択されたクラスタに属する
    単位時系列データのみを出力する比較対象クラスタ出力
    部、 前記比較対象クラスタ出力部から出力された単位時系列
    データの中から前記解析対象データ選択部で選択された
    解析対象データと類似する類似データを検索し、検索す
    ることにより得た類似データの数がユーザによって設定
    された上限数を超える場合には前記類似データの内の、
    前記解析対象データとの類似度が高い方から前記上限数
    分の類似データを出力し、前記上限数を超えない場合に
    は検索して得た類似データを全て出力する類似データ検
    索部、 前記類似データ検索部から出力された類似データを表示
    すると共に、ユーザによって再検索が指示された場合、
    前記類似データ検索部から出力された類似データを含む
    単位時系列データを示す情報を前記クラスタリング部に
    渡す検索結果判定部、として機能させるプログラムを記
    録した機械読み取り可能な記録媒体。
JP5401897A 1997-02-21 1997-02-21 時系列データ解析装置 Expired - Lifetime JP3204154B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5401897A JP3204154B2 (ja) 1997-02-21 1997-02-21 時系列データ解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5401897A JP3204154B2 (ja) 1997-02-21 1997-02-21 時系列データ解析装置

Publications (2)

Publication Number Publication Date
JPH10240716A true JPH10240716A (ja) 1998-09-11
JP3204154B2 JP3204154B2 (ja) 2001-09-04

Family

ID=12958855

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5401897A Expired - Lifetime JP3204154B2 (ja) 1997-02-21 1997-02-21 時系列データ解析装置

Country Status (1)

Country Link
JP (1) JP3204154B2 (ja)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999036861A1 (fr) * 1998-01-19 1999-07-22 Asahi Glass Company Ltd. Procede de stockage de donnees de series chronologiques et systeme de base de donnees de series chronologiques, procede et systeme de traitement de donnees de series chronologiques, systeme d'affichage de donnees de series chronologiques et support d'enregistrement
WO2001003010A1 (en) * 1999-07-01 2001-01-11 Honeywell Inc. Content-based retrieval of series data
JP2001297062A (ja) * 2000-04-13 2001-10-26 Mitsubishi Electric Corp 時刻情報提供システム及び時刻情報提供方法及び時刻情報提供方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読みとり可能な記録媒体
JP2002024251A (ja) * 2000-07-07 2002-01-25 Nippon Telegr & Teleph Corp <Ntt> 時系列データの分類方法及び装置並びに時系列データの分類プログラムを記録した記録媒体
JP2002207855A (ja) * 2001-01-10 2002-07-26 Synergy System:Kk 経営情報の分析方法、そのプログラム及び該プログラムを記録したコンピュータ読み取り可能な記録媒体、並びに経営情報の分析装置
WO2003036539A1 (fr) * 2001-10-23 2003-05-01 Citizen Watch Co., Ltd. Systeme de gestion de sante et programme de gestion de sante
US6609085B1 (en) 1998-01-19 2003-08-19 Asahi Glass Company, Ltd. Method for storing time series data and time series database system, method and system for processing time series data, time series data display system, and recording medium
WO2007088700A1 (ja) * 2006-02-01 2007-08-09 Kenichi Sasaki 経済データ処理システム
WO2007111061A1 (ja) * 2006-03-24 2007-10-04 Konami Digital Entertainment Co., Ltd. 株式銘柄検索装置、株式銘柄検索方法及び情報記憶媒体
JP2008003825A (ja) * 2006-06-22 2008-01-10 Konami Digital Entertainment:Kk 線形状処理装置、線形状処理方法、ならびに、プログラム
JP2010277204A (ja) * 2009-05-26 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> 情報分類処理装置、方法、およびプログラム
JP2012117987A (ja) * 2010-12-03 2012-06-21 Hitachi Ltd データ処理方法、データ処理システム、及びデータ処理装置
JP2013164811A (ja) * 2012-02-13 2013-08-22 Nippon Telegr & Teleph Corp <Ntt> データ検索装置、データ検索方法、及びデータ検索プログラム
JP2013196665A (ja) * 2012-03-23 2013-09-30 Nippon Telegr & Teleph Corp <Ntt> データ検索装置、データ検索方法、及びデータ検索プログラム
JP2017010523A (ja) * 2015-06-19 2017-01-12 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited 論理パターンを検索する方法とシステム
WO2019239964A1 (ja) * 2018-06-15 2019-12-19 キヤノン株式会社 情報処理装置、その制御方法、プログラム、記憶媒体、及びシステム
CN115950557A (zh) * 2023-03-08 2023-04-11 深圳市特安电子有限公司 一种基于压力变送器的温度智能补偿方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101770971B1 (ko) 2016-06-24 2017-08-25 주식회사 제이앤티씨 전자기기 커넥터 플러그용 쉘 가공방법
KR101896054B1 (ko) * 2016-08-03 2018-09-06 주식회사 신화콘텍 마이크로 유에스비 커넥터 플러그
KR102519453B1 (ko) * 2021-01-13 2023-04-06 곽창용 방열 기능을 갖는 멀티탭의 단자 구조

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999036861A1 (fr) * 1998-01-19 1999-07-22 Asahi Glass Company Ltd. Procede de stockage de donnees de series chronologiques et systeme de base de donnees de series chronologiques, procede et systeme de traitement de donnees de series chronologiques, systeme d'affichage de donnees de series chronologiques et support d'enregistrement
US6609085B1 (en) 1998-01-19 2003-08-19 Asahi Glass Company, Ltd. Method for storing time series data and time series database system, method and system for processing time series data, time series data display system, and recording medium
WO2001003010A1 (en) * 1999-07-01 2001-01-11 Honeywell Inc. Content-based retrieval of series data
US6754388B1 (en) 1999-07-01 2004-06-22 Honeywell Inc. Content-based retrieval of series data
JP2001297062A (ja) * 2000-04-13 2001-10-26 Mitsubishi Electric Corp 時刻情報提供システム及び時刻情報提供方法及び時刻情報提供方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読みとり可能な記録媒体
JP2002024251A (ja) * 2000-07-07 2002-01-25 Nippon Telegr & Teleph Corp <Ntt> 時系列データの分類方法及び装置並びに時系列データの分類プログラムを記録した記録媒体
JP2002207855A (ja) * 2001-01-10 2002-07-26 Synergy System:Kk 経営情報の分析方法、そのプログラム及び該プログラムを記録したコンピュータ読み取り可能な記録媒体、並びに経営情報の分析装置
WO2003036539A1 (fr) * 2001-10-23 2003-05-01 Citizen Watch Co., Ltd. Systeme de gestion de sante et programme de gestion de sante
CN1315080C (zh) * 2001-10-23 2007-05-09 西铁城时计株式会社 健康管理装置
WO2007088700A1 (ja) * 2006-02-01 2007-08-09 Kenichi Sasaki 経済データ処理システム
WO2007111061A1 (ja) * 2006-03-24 2007-10-04 Konami Digital Entertainment Co., Ltd. 株式銘柄検索装置、株式銘柄検索方法及び情報記憶媒体
US8352345B2 (en) 2006-03-24 2013-01-08 Konami Digital Entertainment Co., Ltd. Stock name search device, stock name search method, and information storage medium
JP2008003825A (ja) * 2006-06-22 2008-01-10 Konami Digital Entertainment:Kk 線形状処理装置、線形状処理方法、ならびに、プログラム
US8244073B2 (en) 2006-06-22 2012-08-14 Konami Digital Entertainment Co. Ltd. Line shape processing device, line shape processing method, information recording medium, and program
JP2010277204A (ja) * 2009-05-26 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> 情報分類処理装置、方法、およびプログラム
JP2012117987A (ja) * 2010-12-03 2012-06-21 Hitachi Ltd データ処理方法、データ処理システム、及びデータ処理装置
JP2013164811A (ja) * 2012-02-13 2013-08-22 Nippon Telegr & Teleph Corp <Ntt> データ検索装置、データ検索方法、及びデータ検索プログラム
JP2013196665A (ja) * 2012-03-23 2013-09-30 Nippon Telegr & Teleph Corp <Ntt> データ検索装置、データ検索方法、及びデータ検索プログラム
JP2017010523A (ja) * 2015-06-19 2017-01-12 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited 論理パターンを検索する方法とシステム
WO2019239964A1 (ja) * 2018-06-15 2019-12-19 キヤノン株式会社 情報処理装置、その制御方法、プログラム、記憶媒体、及びシステム
JP2019219758A (ja) * 2018-06-15 2019-12-26 キヤノン株式会社 情報処理装置、その制御方法、プログラム、記憶媒体、及びシステム
CN115950557A (zh) * 2023-03-08 2023-04-11 深圳市特安电子有限公司 一种基于压力变送器的温度智能补偿方法

Also Published As

Publication number Publication date
JP3204154B2 (ja) 2001-09-04

Similar Documents

Publication Publication Date Title
JP3204154B2 (ja) 時系列データ解析装置
US6654744B2 (en) Method and apparatus for categorizing information, and a computer product
US7225200B2 (en) Automatic data perspective generation for a target variable
US7426509B2 (en) Method and apparatus for document filtering using ensemble filters
US6772170B2 (en) System and method for interpreting document contents
US20110225196A1 (en) Moving image search device and moving image search program
JP2003030224A (ja) 文書クラスタ作成装置、文書検索システムおよびfaq作成システム
JP2004334594A (ja) 画像検索装置、画像検索方法、画像検索プログラム及びそのプログラムを記録した記録媒体
KR100309666B1 (ko) 데이터간결합룰도출방법및장치와,직교볼록영역분리추출방법및장치
KR20070009338A (ko) 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치
US7836059B2 (en) System and method for minimally predictive feature identification
CN100458788C (zh) 一种互联网音频文件的聚类方法、搜索方法及系统
JP2002007433A (ja) 情報分類装置、情報分類方法および情報分類プログラムを記録したコンピュータ読み取り可能な記録媒体、並びに情報分類プログラム
JPH05101107A (ja) 適合率を用いた絞り込みデータ検索装置及び方法
JPH069054B2 (ja) 文書自動分類装置
JP2007249600A (ja) 目的データをカテゴリに分類する方法
JP2006251975A (ja) テキスト分類方法ならびにその方法によるプログラム、およびテキスト分類装置
JPH08287086A (ja) 適合度順画像強調表示方法及び装置
JP4234841B2 (ja) データ分析装置
JP2003316819A (ja) オブジェクト分類検索装置及びそれを実行するためのプログラム
JP2002024251A (ja) 時系列データの分類方法及び装置並びに時系列データの分類プログラムを記録した記録媒体
JP2001155020A (ja) 類似文書検索装置、類似文書検索方法及び記録媒体
JP2001318947A (ja) 情報統合システムおよび情報統合方法、ならびにそのプログラムを記録した記録媒体
JP3483113B2 (ja) 時系列画像検索方法、装置、および時系列画像検索プログラムを記録した記録媒体
RU2409849C2 (ru) Способ поиска информации в политематических массивах неструктурированных текстов

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080629

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090629

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100629

Year of fee payment: 9