JP3204154B2 - 時系列データ解析装置 - Google Patents

時系列データ解析装置

Info

Publication number
JP3204154B2
JP3204154B2 JP5401897A JP5401897A JP3204154B2 JP 3204154 B2 JP3204154 B2 JP 3204154B2 JP 5401897 A JP5401897 A JP 5401897A JP 5401897 A JP5401897 A JP 5401897A JP 3204154 B2 JP3204154 B2 JP 3204154B2
Authority
JP
Japan
Prior art keywords
data
unit
similarity
similar
comparison target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5401897A
Other languages
English (en)
Other versions
JPH10240716A (ja
Inventor
伸克 北島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP5401897A priority Critical patent/JP3204154B2/ja
Publication of JPH10240716A publication Critical patent/JPH10240716A/ja
Application granted granted Critical
Publication of JP3204154B2 publication Critical patent/JP3204154B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、気温データ,地震
波データ,株価データ等の時系列データを解析する技術
に関し、特に、ユーザによって指定されたデータとデー
タパターンが類似する類似データを時系列データの中か
ら探し出す技術に関する。
【0002】
【従来の技術】気温データ,株価データ等の時系列デー
タを解析し、今後の気温,株価等の変化を予測する場
合、ユーザによって指定された最近のデータとデータパ
ターンが類似する類似データを過去の時系列データの中
から探し出し、探し出した類似データの近傍に存在する
データのパターンを参考にして今後の変化を予測すると
いうことが従来から行われている。
【0003】ところで、ユーザによって指定されたデー
タと類似する類似データを探し出す場合、従来は、例え
ば、図12のブロック図に示すような時系列データ解析
装置が用いられている。
【0004】図12に示した従来の時系列データ解析装
置は、気温データ,株価データ等の時系列データ100
が格納された記憶部101と、キーボード等の入力部1
02と、解析対象データ選択部103と、類似データ検
索部104と、CRT等の表示部108とから構成され
ている。類似データ検索部104は、比較対象データ選
択部105,データ間類似度計算部106及び類似デー
タソート部107から構成されている。
【0005】ユーザは、類似データの検索を行う場合、
入力部102から解析対象データ選択部103に対して
解析対象データを指示する解析対象データ指示を入力す
ると共に、比較対象データ選択部105に対して検索対
象期間を指示する検索対象期間指示を入力する。ここ
で、解析対象データ指示は、例えば、時系列データ10
0中の解析対象データとする部分の開始時点を示す情報
と終了時点を示す情報とを含むものである。
【0006】解析対象データ選択部103は、解析対象
データ指示が入力されると、それによって示される解析
対象データを時系列データ100の中から選択し、選択
した解析対象データを比較対象データ選択部105,デ
ータ間類似度計算部106に渡す。
【0007】比較対象データ選択部105は、検索対象
期間指示が入力されると、先ず、時系列データ100の
中から上記指示によって指示された期間の時系列データ
を取り出す。その後、取り出した時系列データの中か
ら、解析対象データとの類似度を計算する比較対象デー
タを1つ選択し、選択した比較対象データをデータ間類
似度計算部106に渡す。以下、類似データソート部1
07から選択指示が加えられる毎に、時系列データの中
から次の比較対象データを1つ選択し、選択した比較対
象データをデータ間類似度計算部106に渡すという処
理を、比較対象データが選択できなくなるまで、繰り返
し行う。
【0008】データ間類似度計算部106は、比較対象
データ選択部105から比較対象データが1つ渡される
毎に、その比較対象データと解析対象データ選択部10
3から渡されている解析対象データとの間の類似度を計
算し、計算した類似度と上記比較対象データの組を類似
データソート部107に渡す。
【0009】類似データソート部107は、データ間類
似度計算部106から類似度と比較対象データの組が渡
されると、先ず、類似度が予め定められているユーザに
よって設定されている類似度e以上であるか否かを判断
する。そして、類似度が予め定められている類似度e未
満の場合は、今回渡された類似度と比較対象データとの
組を破棄する。一方、類似度が予め定められている類似
度e以上の場合は、今回渡された類似度と比較対象デー
タとの組を保存する。その際、既に保存されている類似
度と比較対象データの組と、今回渡された類似度と比較
データの組とを類似度によってソートして保存する。ま
た、保存する組の数が予めユーザによって設定されてい
る組数Lを超えるような場合には、類似度が最も小さな
組を破棄する。
【0010】類似データソート部107は、現在処理対
象としている組に対して上述した処理を行うと、比較対
象データ選択部105に対して選択指示を加える。
【0011】これにより、比較対象データ選択部105
は、次の比較対象データを選択し、データ間類似度計算
部106に渡す。以下、前述と同様の動作が繰り返し行
われる。そして、比較対象データ選択部105が比較対
象データを選択できなくなると、類似データソート部1
07は、保持している類似度順にソートした比較対象デ
ータを類似データとして表示部108に出力する。
【0012】
【発明が解決しようとする課題】過去の時系列データを
用いて今後の変化を予測する場合、一般的には、大量の
時系列データが必要となる。従って、過去の時系列デー
タの全てを検索対象にして類似データを探し出している
従来の技術では、いかに高速な検索方式を用いたとして
も、類似データの検索処理に時間がかかりすぎるため、
今後の変化を予測する上で有効になる類似データを現実
的な時間内で得ることが難しかった。このような問題点
を解決するためには、ユーザが勘にたよって検索対象と
する時系列データを絞り込むという方法をとらざるを得
ないが、このような方法をとった場合には、今後の変化
を予測する上で有効になる類似データを得ることができ
なくなる可能性が高くなってしまう。
【0013】そこで、本発明の目的は、膨大なデータ量
の時系列データの中から、今後の変化を予測する上で有
効になる類似データを探し出す場合であっても、現実的
な時間内で有効な類似データを探し出せる可能性を高く
することにある。
【0014】
【課題を解決するための手段】本発明の時系列データ解
析装置は、上記目的を達成すると共に、出力された類似
データの中にユーザが望むような類似データが存在しな
かった場合、検索対象にする単位時系列データを更に絞
り込んで再検索を行えるようにするため、時系列データ
の中からユーザの指示に従って解析対象データを選択す
る解析対象データ選択部と、前記時系列データを単位期
間で区切ることにより構成される複数の単位時系列デー
タを、類似度に基づいて複数のクラスタにクラスタリン
グする構成を備えると共に、検索結果判定部から単位時
系列データを示す情報が渡された場合、その情報によっ
て示される複数の単位時系列データを類似度に基づいて
複数のクラスタにクラスタリングする構成を備えたクラ
スタリング部と、該クラスタリング部でクラスタリング
された前記複数の単位時系列データを、それが前記複数
のクラスタの内のどのクラスタに属するものなのかが分
かる形式で表示すると共に、ユーザによって選択された
クラスタに属する単位時系列データのみを出力する比較
対象クラスタ出力部と、該比較対象クラスタ出力部から
出力された単位時系列データの中から、前記解析対象デ
ータ選択部で選択された解析対象データと類似する類似
データを検索して出力する類似データ検索部と 該類似
データ検索部から出力された類似データを表示すると共
に、ユーザによって再検索が指示された場合、前記類似
データ検索部から出力された類似データを含む単位時系
列データを示す情報を前記クラスタリング部に渡す検索
結果判定部とを備えている。
【0015】この構成に於いては、解析対象データ選択
部が、ユーザの指示に従って時系列データの中から解析
対象データを選択し、クラスタリング部が、時系列デー
タを単位区間で区切ることにより構成される複数の単位
時系列データを類似度に基づいて複数のクラスタにクラ
スタリングする。
【0016】比較対象クラスタ出力部では、クラスタ
ング部でクラスタリングされた複数の単位時系列データ
を、それがどのクラスタに属するものかが分かる形式で
表示する。ユーザは、この表示を見て、解析対象データ
を含む単位時系列データとデータパターンが似ている単
位時系列データを含むクラスタを選択する。ユーザによ
ってクラスタが選択されると、比較対象クラスタ出力部
は、選択されたクラスタに属する単位時系列データのみ
を出力する。類似データ検索部は、比較対象クラスタ出
力部から単位時系列データが出力されると、その中から
解析対象データと類似する類似データを検索し出力す
る。検索結果判定部は、類似データ検索部から出力され
た類似データを表示し、ユーザは、この表示を見て希望
する類似データが存在しなかった場合には、検索結果判
定部に対して再検索指示を入力する。これにより、検索
結果判定部は、類似データ検索部から出力された類似デ
ータを含む単位時系列データを示す情報をクラスタリン
グ部に渡し、クラスタリング部は、上記情報によって示
される単位時系列データを対象にして再度クラスタリン
グを行う。
【0017】また、本発明の時系列データ解析装置は、
探し出された類似データの数が非常に多い場合でも、類
似度が高い方からユーザによって設定された上限数分の
類似データのみを出力できるようにするため、記類似
データ検索部は、前記比較対象クラスタ出力部から出力
された単位時系列データを検索することにより得た類似
データの数がユーザによって設定された上限数を超える
場合には前記検索することにより得た類似データの内
の、前記解析対象データとの類似度が高い方から前記上
限数分の類似データを出力する構成を備えている。
【0018】この構成に於いては、類似データ検索部
は、比較対象クラスタ出力部から出力された単位時系列
データを検索することにより得た類似データの数が、ユ
ーザによって設定された上限数を超える場合には、その
内の、解析対象データとの類似度が高い方から上記上限
数分の類似データを出力する。
【0019】
【0020】
【0021】
【発明の実施の形態】次に本発明の実施の形態について
図面を参照して詳細に説明する。
【0022】図1は本発明の実施例のブロック図であ
り、記憶部1と、キーボード等の入力部3と、解析対象
データ選択部4と、クラスタリング部5と、比較対象ク
ラスタ出力部6と、類似データ検索部7と、検索結果判
定部11と、CRT等の表示部12とから構成されてい
る。
【0023】記憶部1には、今後の変化を予測するため
に使用する過去の時系列データが格納されている。尚、
本実施例に於いては、1950年〜1996年の東京の
気温データ2が時系列データとして格納されているとす
る。
【0024】解析対象データ選択部4は、ユーザが入力
部3から入力する解析対象データ指示に従って、今後の
変化を予測する上で基準となるデータ(解析対象デー
タ)を気温データ2の中から取り出す機能を有する。
尚、本実施例に於いては、解析対象データ指示は、解析
対象データの開始時点を示す情報と終了時点を示す情報
とを含むものとする。
【0025】クラスタリング部5は、ユーザが入力部3
から入力した検索対象期間指示によって示される期間の
データを気温データ2の中から取り出す機能,取り出し
たデータを単位期間(本実施例では1年とする)で区切
ることにより構成される単位時系列データ(本実施例で
は1年分の気温データであり、以下単位気温データと称
す)を、類似度に基づいて複数のレベルでクラスタリン
グする機能,各レベルに於けるクラスタリング結果を表
示部12に表示する機能,表示部12に表示された各レ
ベルのクラスタリング結果を見たユーザによって使用す
るクラスタリング結果のレベルが指示されることによ
り、そのレベルのクラスタリング結果を比較対象クラス
タ出力部6に渡す機能,検索結果判定部11から渡され
た情報によって示される単位気温データを対象にして再
度クラスタリングを行う機能を有する。
【0026】比較対象クラスタ出力部6は、クラスタリ
ング部5でクラスタリングされた複数の単位気温データ
を、それがどのクラスタに属するのかが分かる形式で表
示部12に表示する機能,ユーザによって選択されたク
ラスタに属する単位気温データのみを出力する機能を有
する。
【0027】類似データ検索部7は、比較対象クラスタ
出力部6から出力された単位気温データの中から、解析
対象データ選択部4で選択された解析対象データと類似
する類似データを検索する機能,検索することにより得
た類似データの数がユーザにより設定されている上限数
Lを超える場合には、類似データの内の、類似度が高い
方から上記上限数L分の類似データを類似度順にソート
して出力し、上記規定数Lを超えない場合には、検索し
て得た類似データを全て類似度順にソートして出力する
機能を有する。
【0028】このような機能を有する類似データ検索部
7は、比較対象データ選択部8,データ間類似度計算部
9及び類似データソート部10から構成される。
【0029】比較対象データ選択部8は、比較対象クラ
スタ出力部6から出力された単位気温データの中から、
解析対象データとの類似度を計算する比較対象データを
順次選択する。
【0030】データ間類似度計算部9は、解析対象デー
タ選択部4で選択された解析対象データと比較対象デー
タ選択部8で選択された各比較対象データとの類似度を
計算する。
【0031】類似データソート部10は、データ間類似
度計算部9で類似度が計算された各比較対象データの内
の、類似度がユーザによって設定された類似度e以上の
ものを類似データとして取り扱うものであり、類似デー
タの数がユーザによって設定された上限数Lを超えない
場合には、全ての類似データを類似度順にソートして出
力し、上限数Lを超える場合には、その内の、解析対象
データとの類似度が高い方から上記上限数L分の類似対
象データを類似度順にソートして出力する。
【0032】検索結果判定部11は、類似データソート
部10から出力された類似データを表示部12に表示す
ると共に、ユーザによって再検索が指示された場合、類
似データソート部10から出力された類似データを含ん
でいる単位気温データを示す情報をクラスタリング部5
に渡す機能を有する。
【0033】図2は解析対象データ選択部4の処理例を
示す流れ図、図3はクラスタリング部5の処理例を示す
流れ図、図4は比較対象クラスタ出力部6の処理例を示
す流れ図、図5は比較対象データ選択部8の処理例を示
す流れ図、図6はデータ間類似度計算部9の処理例を示
す流れ図、図7は類似データソート部10の処理例を示
す流れ図、図8は検索結果判定部11の処理例を示す流
れ図であり、以下各図を参照して本実施例の動作を説明
する。
【0034】解析対象データと類似するデータを気温デ
ータ2の中から探し出す場合、ユーザは、先ず、入力部
3を用いて類似データソート部10に類似度e及び上限
数Lを設定する。ここで、類似度eは、類似データソー
ト部10に於いて類似データとして取り扱う比較対象デ
ータの類似度の下限値を示すものであり、上限値Lは、
類似データソート部10に於いて保存しておく類似デー
タの数の上限値を示すものである。
【0035】その後、ユーザは、入力部3を用いて、解
析対象データ選択部4に対して解析対象データ指示を入
力すると共に、クラスタリング部5に対して検索対象期
間指示を入力する。
【0036】解析対象データ選択部4は、解析対象デー
タ指示が入力されると、図2の流れ図に示すように、解
析対象データ指示に従って気温データ2の中から解析対
象データを選択し、選択した解析対象データを比較対象
データ選択部8,データ間類似度計算部9に渡す(S
1,S2)。今、例えば、解析対象データ指示に、解析
対象データの開始時点,終了時点を示す情報として、1
996年11月22日,1996年11月29日が含ま
れていたとすると、解析対象データ選択部4は、気温デ
ータ2中の1996年11月22日から1996年11
月29日までのデータを解析対象データとして選択する
ことになる。
【0037】また、クラスタリング部5は、検索対象期
間指示が入力されると、図3の流れ図に示すように、気
温データ2の中から上記検索対象期間指示によって指示
された期間のデータを取り出す(S11)。今、例え
ば、検索対象期間指示が、気温データ2の全期間を指示
するものであったとすると、クラスタリング部5は、記
憶部1に格納されている1950年〜1996年の東京
の気温データ2を全て取り出すことになる。
【0038】その後、クラスタリング部5は、取り出し
た気温データ2に対して第1レベルのクラスタリング処
理を行う(S12,S13)。
【0039】ここで、第1レベルのクラスタリング処理
について詳細に説明する。
【0040】先ず、1950年から1996年までの、
47年分の気温データ2を1年分ずつの計47個の単位
気温データに分割する。図9は単位気温データの一例を
示した図である。
【0041】その後、47個の単位気温データ間の類似
度を全て求める。類似度としては、例えば、単位気温デ
ータ間の相関係数を利用することができる。2つの単位
気温データ間の相関係数rは、それぞれの振幅値x,y
の平均をxa,a 、標準偏差をsx,y 、単位気温デー
タ中の全データ数をMとすると、次式により求めること
ができる。
【0042】
【数1】
【0043】ここで、常に−1≦r≦1であり、r>0
の場合は、一方の変量が増加すると他方の変量も増加
し、正の相関関係があるという。これに対して、r<0
の場合は、一方の変量が増加すると他方の変量が減少
し、負の相関関係があるという。また、|r|が1に近
いほど相関関係が強く、0に近いほど相関関係が弱い。
類似度として相関係数を利用する場合は、正の相関関係
だけを用い、相関係数rが1に近いほど類似度が高く、
相関係数rが0に近いほど類似度が低いとする。
【0044】また、この他にも、DPマッチング法で計
算した2つの単位気温データ間の距離をdとした時の1
/(1−d)〔0≦1/(1−d)≦1〕を用いること
もできる。この場合、1/(1−d)が1に近いほど類
似度が高く、0に近いほど類似度が低いとする。尚、D
Pマッチング法については、例えば、「動的計画法を利
用した音声の時間正規化に基づく連続単語認識,音響学
会誌,27,9,pp483〜490,1971」に詳
しく記載されている。
【0045】上記したような方法で、47個の単位気温
データ間の類似度を全て求めると、最も類似度が高い2
つの単位気温データを1つのクラスタに属するように
し、残りの45個の単位気温データをそれぞれ異なるク
ラスタに属するようにする。例えば、1990年の単位
気温データと1960年の単位気温データとの類似度が
最も高かった場合には、両単位気温データを1つのクラ
スタに属するようにし、残りの単位気温データをそれぞ
れ異なるクラスタに属するようにする。以上で、第1レ
ベルのクラスタリング処理が完了する。尚、どの単位気
温データがどのクラスタに属するかという、第1レベル
のクラスタリング処理の処理結果を、クラスタリング部
5は、保存しておく。
【0046】第1レベルのクラスタリング処理が完了す
ると、クラスタリング部5は、クラスタ数が1個になっ
たか否かを判断する(S14)。この例の場合、46個
のクラスタが存在するので、S14の判断結果はNOと
なる。
【0047】S14の判断結果がNOとなると、クラス
タリング部5は、第2レベルのクラスタリング処理を行
う(S15,S13)。
【0048】第2レベルのクラスタリング処理では、以
下に述べるような処理を行う。
【0049】第1レベルのクラスタリング処理で融合が
行われたクラスタ(この例の場合は、1990年と19
60年の2年分の単位気温データが属するクラスタ)と
残りの45個のクラスタとの間の類似度を求め、次い
で、今回求めた類似度と既に求めてある残りの45個の
クラスタ相互間の類似度とに基づいて最も類似度が高い
2つのクラスタを求め、その2つのクラスタを融合する
ことにより1つのクラスタを生成する。その後、どの単
位気温データがどのクラスタに属することになったかを
示す第2レベルのクラスタ処理結果を保存する。以上に
より、第2レベルのクラスタリング処理が完了する。
【0050】以上の処理をクラスタが1個になるまで行
うと(S14がYES)、クラスタリング部5は、各レ
ベルのクラスタリング結果を表示部12に表示する(S
16)。図10は或る1レベルのクラスタリング結果を
示した図である。
【0051】ユーザは、表示部12に表示された各レベ
ルのクラスタリング結果を見て、どのレベルのクラスタ
リング結果を使用するのかを決定し、決定したレベルを
示す情報を、入力部3を用いてクラスタリング部5に入
力する。尚、使用するレベルを決定する際、ユーザは、
必要ならば、クラスタに属する単位気温データを表示さ
せ、その表示を参考にして使用するレベルを決定する。
【0052】これにより、クラスタリング部5は、ユー
ザによって指示されたレベルのクラスタリング結果と、
クラスタリング処理の対象にした1950年から199
6年までの計47個の単位気温データとを比較対象クラ
スタ出力部6に渡す(S17)。
【0053】比較対象クラスタ出力部6は、クラスタリ
ング部5からクラスタリング結果及び47個の単位気温
データが渡されると、図4の流れ図に示すように、各ク
ラスタにどのような単位気温データが含まれるのかが分
かる形式で、単位気温データを表示部12に表示する
(S21)。例えば、単位気温データを、それが属する
クラスタ毎にひとかたまりにして表示する。
【0054】ユーザは、表示部12の表示を見て、検索
対象にしたい1個以上のクラスタを選び、選んだクラス
タを示す情報を入力部3から比較対象クラスタ出力部6
へ入力する。ここで、検索対象にするクラスタの選択基
準は、例えば、1年間の気温の変化の傾向が、解析対象
データを含む単位気温データに似ていること等が挙げら
れる。
【0055】これにより、比較対象クラスタ出力部6
は、ユーザが選択したクラスタに属する単位気温データ
のみを比較対象データ選択部8に渡す(S22)。
【0056】比較対象データ選択部8は、比較対象クラ
スタ出力部6から、ユーザによって選択されたクラスタ
に属する単位気温データが渡されると、図5の流れ図に
示すように、渡された単位気温データの中から、解析対
象データとの類似度を計算する比較対象データを1つ選
択し、選択した比較対象データをデータ間類似度計算部
9に渡す(S31)。その後、比較対象データ選択部8
は、類似データソート部10から選択指示が加えられる
毎に(S33がYESとなる毎に)、比較対象データを
1つ選択し、選択した比較対象データをデータ間類似度
計算部9に渡すという処理(S31)を、比較対象デー
タを選択できなくなるまで(S32がNOとなるま
で)、繰り返し行う。
【0057】比較対象データの選択方法としては、例え
ば、単位温度データの中から解析対象データと時間軸方
向に同じ長さのデータを、始点をずらしながら可能な限
り選択するという方法がある。尚、比較対象データの時
間軸方向の長さが解析対象データの長さと等しいという
ことは、データ間類似度計算部9に於ける類似度の計算
方法によっては必須条件とはならない。このような場合
には、比較対象データの時間軸方向の長さを解析対象デ
ータの時間軸方向の長さに対してどのような割合にする
のかを指示しておき、単位気温データの中から、解析デ
ータの時間軸方向の長さが上記指示された割合によって
決まる長さのデータを、始点をずらしながら可能な限り
選択するという方法をとることができる。
【0058】データ間類似度計算部9は、比較対象デー
タ選択部8から、比較対象データが渡されると、図6の
流れ図に示すように、上記比較対象データと解析対象デ
ータ選択部4から渡されている解析対象データとの間の
類似度を計算し(S41)、計算した類似度と上記比較
対象データとを組にして類似データソート部10に渡す
(S42)。ここで、類似度としては、前述したような
相関係数,DPマッチング法に於ける1/(1−d)を
利用することができる。
【0059】類似データソート部10は、類似度と比較
対象データとの組が渡されると、図7の流れ図に示すよ
うに、上記比較対象データの類似度が、ユーザによって
設定されている類似度e以上であるか否かを判断するこ
とにより、上記比較対象データを類似データとして取り
扱うか否かを決定する(S51)。
【0060】そして、比較対象データを類似データとし
て取り扱うと決定した場合(S51がYES)は、上記
類似データとその類似度の組と、既に保存してある類似
データとその類似度の組とを、類似度の高い順にソート
し、そのソート結果をそれまでのソート結果に代えて保
存する(S52)。その後、保存してある類似データと
類似度の組が、ユーザによって指定されている上限値L
を超えているか否かを判断する(S53)。そして、超
えている場合には保存してある類似データと類似度の組
の内、最も類似度が小さいものを破棄した後(S5
9)、比較対象データ選択部8に対して選択指示を出力
し(S55)、超えていない場合には、直ちに、比較対
象データ選択部8に対して選択指示を出力する(S5
5)。
【0061】また、S51に於いて、比較対象データを
類似データとして取り扱わないと決定した場合(S51
がNO)は、比較対象データ選択部8に対して選択指示
を出力する(S55)。
【0062】S55に於いて選択指示を出力した後、所
定時間が経過しても、データ間類似度計算部9から比較
対象データと類似度の組が渡されなかった場合は、比較
対象データ選択部8に於いて既に選択可能な比較対象デ
ータが全て選択されていると判断し(S56がYE
S)、保存してあるソート結果を検索結果判定部11に
出力する(S57)。また、選択指示を出力してから所
定時間が経過する前にデータ間類似度計算部9から比較
対象データと類似度の組が渡された場合(S56がYE
S)は、その組に対して前述したと同様の処理を行う
(S51〜S54)。
【0063】検索結果判定部11は、類似データソート
部10からソート結果が渡されると、図8の流れ図に示
すように、表示部12にソート結果を表示する(S6
1)。ユーザは、その表示を見て、希望するような類似
データが含まれていないと判断した場合は、入力部3を
用いて、検索結果判定部11に対して再検索指示を入力
する。
【0064】検索結果判定部11は、ユーザによって再
検索指示が入力されると(S62がYES)、表示部1
2に表示した類似データを含む単位気温データを示す情
報を、クラスタリング部5に渡す(S63)。
【0065】これにより、クラスタリング部5は、検索
結果判定部11から渡された情報によって示される単位
気温データを対象にして、前述と同様の処理を行う(図
3,S12〜S17)。また、比較対象クラスタ出力部
6,比較対象データ選択部8,データ間類似度計算部
9,類似データソート部10,検索結果判定部11も、
クラスタリング部5からクラスタリング結果が出力され
ることにより、前述と同様の処理を行う。つまり、類似
データの検索対象とする単位気温データを更に絞り込ん
だ形で再検索を行うので、前回の検索時に、上限値Lに
よる制限によってユーザが希望するような類似データが
表示部12に表示されなかった場合にも、ユーザが希望
するような類似データが表示部12に表示される可能性
が高くなる。
【0066】図11は、本発明の時系列データ解析装置
を実現するハードウェア構成を示したブロック図であ
り、コンピュータによって構成されるデータ処理装置2
1と、時系列データ解析プログラムを記録した記録媒体
22と、時系列データ24を格納した記憶装置23と、
キーボード等の入力装置25と、CRT等の表示装置2
6とから構成されている。記録媒体22は、磁気ディス
ク,半導体メモリその他の記録媒体であっても良い。
【0067】記録媒体22に記録された時系列データ解
析プログラムは、データ処理装置21によって読み込ま
れ、データ処理装置21の動作を制御することで、デー
タ処理装置21上に、図1に示した、解析対象データ選
択部4,クラスタリング部5,比較対象クラスタ出力部
6,比較対象データ選択部8,データ間類似度計算部
9,類似データソート部10,検索結果判定部11を実
現する。
【0068】
【発明の効果】以上説明したように、本発明は、時系列
データを構成する複数の単位時系列データを類似度に基
づいて複数のクラスタにクラスタリングし、複数のクラ
スタの中から類似データの検索に使用するクラスタをユ
ーザに選択させるようにしているので、ユーザの勘によ
って検索対象を絞り込む場合に比較して、客観的に検索
対象を絞り込むことができる。この結果、時系列データ
のデータ量が膨大な場合であっても、現実的な時間で、
今後の変化を予測するために有効になる類似データを探
し出すことができる可能性を高くすることができる。
【0069】また、本発明は、比較対象クラスタ出力部
から出力された単位時間系列データを検索することによ
り得た類似データの数がユーザによって設定された設定
数を超える場合には、その内の解析対象データとの類似
度が高い方から上記設定数分の類似データを出力するよ
うにしたものであるので、無制限に類似データを出力す
る場合に比較して、出力された類似データの中から、今
後の変化を予測する上で有効になる類似データを探し出
す際のユーザの負担を軽減することができる効果がある
と共に、類似データを保存しておくための記憶領域の容
量を少なくすることができる効果がある。
【0070】更に、本発明は、ユーザによって再検索が
指示された場合、類似データ検索部から出力された類似
データを含む単位時系列データを示す情報を前記クラス
タリング部に渡し、その情報によって示される単位時系
列データを対象にして再度クラスタリングを行わせる検
索結果判定部を備えているので、検索対象とする単位時
系列データを更に絞り込んだ形で類似データの検索を行
うことができる。この結果、出力する類似データの数を
制限することにより、ユーザの負担等を軽減するように
した場合であっても、ユーザが望むような類似データを
出力できる可能性が高くなる。
【図面の簡単な説明】
【図1】本発明の時系列データ解析装置の実施例のブロ
ック図である。
【図2】解析対象データ選択部4の処理例を示す流れ図
である。
【図3】クラスタリング部5の処理例を示す流れ図であ
る。
【図4】比較対象クラスタ出力部6の処理例を示す流れ
図である。
【図5】比較対象データ選択部8の処理例を示す流れ図
である。
【図6】データ間類似度計算部9の処理例を示す流れ図
である。
【図7】類似データソート部10の処理例を示す流れ図
である。
【図8】検索結果判定部11の処理例を示す流れ図であ
る。
【図9】1年分の気温データ(単位気温データ)の一例
を示す図である。
【図10】或るレベルのクラスタリング結果を示す図で
ある。
【図11】時系列データ解析装置を実現するハードウェ
ア構成の一例を示すブロック図である。
【図12】従来の時系列データ解析装置の一例を示すブ
ロック図である。
【符号の説明】
1…記憶部 2…気温データ 3…入力部 4…解析対象データ選択部 5…クラスタリング部 6…比較対象クラスタ出力部 7…類似データ検索部 8…比較対象データ選択部 9…データ間類似度計算部 10…類似データソート部 11…検索結果判定部 12…表示部 21…データ処理装置 22…記録媒体 23…記憶装置 24…時系列データ 25…入力装置 26…表示装置 100…時系列データ 101…記憶部 102…入力部 103…解析対象データ選択部 104…類似データ検索部 105…比較対象データ選択部 106…データ間類似度計算部 107…類似データソート部 108…表示部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平6−314302(JP,A) 特開 平5−204991(JP,A) 特開 平7−230446(JP,A) 特開 平8−137974(JP,A) 特開 平7−234861(JP,A) 特開 平7−200300(JP,A) 特開 平6−332881(JP,A) 特開 平7−262164(JP,A) 特開 平6−52281(JP,A) 特開 平9−34719(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/60 G06F 17/30 G06F 19/00 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 時系列データの中からユーザの指示に従
    って解析対象データを選択する解析対象データ選択部
    と、 前記時系列データを単位期間で区切ることにより構成さ
    れる複数の単位時系列データを、類似度に基づいて複数
    のクラスタにクラスタリングする構成を備えると共に、
    検索結果判定部から単位時系列データを示す情報が渡さ
    れた場合、その情報によって示される複数の単位時系列
    データを類似度に基づいて複数のクラスタにクラスタリ
    ングする構成を備えたクラスタリング部と、 該クラスタリング部でクラスタリングされた前記複数の
    単位時系列データを、それが前記複数のクラスタの内の
    どのクラスタに属するものなのかが分かる形式で表示す
    ると共に、ユーザによって選択されたクラスタに属する
    単位時系列データのみを出力する比較対象クラスタ出力
    部と、 該比較対象クラスタ出力部から出力された単位時系列デ
    ータの中から、前記解析対象データ選択部で選択された
    解析対象データと類似する類似データを検索して出力す
    る類似データ検索部と 該類似データ検索部から出力された類似データを表示す
    ると共に、ユーザによって再検索が指示された場合、前
    記類似データ検索部から出力された類似データを含む単
    位時系列データを示す情報を前記クラスタリング部に渡
    す検索結果判定部 とを備えたことを特徴とする時系列デ
    ータ解析装置。
  2. 【請求項2】 記類似データ検索部は、前記比較対象
    クラスタ出力部から出力された単位時系列データを検索
    することにより得た類似データの数がユーザによって設
    定された上限数を超える場合には前記検索することによ
    り得た類似データの内の、前記解析対象データとの類似
    度が高い方から前記上限数分の類似データを出力する構
    成を備えたことを特徴とする請求項1記載の時系列デー
    タ解析装置。
  3. 【請求項3】 前記類似データ検索部は、 前記比較対象クラスタ出力部から出力された単位時系列
    データの中から、解析対象データとの類似度を計算する
    比較対象データを選択する比較対象データ選択部と、 該比較対象データ選択部で選択された比較対象データと
    前記解析対象データ選択部で選択された解析対象データ
    との類似度を計算するデータ間類似度計算部と、 該データ間類似度計算部で類似度が計算された複数の比
    較対象データの中に存在する、前記解析対象データとの
    類似度がユーザによって設定された類似度以上の、類似
    データとして取り扱う比較対象データの数が、ユーザに
    よって設定された上限数を超える場合には、その内の、
    解析対象データとの類似度が高い方から前記上限数分の
    比較対象データを類似度順にソートして出力し、前記上
    限数を超えない場合には、それらを類似度順にソートし
    て出力する類似データソート部とを備えたことを特徴と
    する請求項2記載の時系列データ解析装置。
JP5401897A 1997-02-21 1997-02-21 時系列データ解析装置 Expired - Lifetime JP3204154B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5401897A JP3204154B2 (ja) 1997-02-21 1997-02-21 時系列データ解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5401897A JP3204154B2 (ja) 1997-02-21 1997-02-21 時系列データ解析装置

Publications (2)

Publication Number Publication Date
JPH10240716A JPH10240716A (ja) 1998-09-11
JP3204154B2 true JP3204154B2 (ja) 2001-09-04

Family

ID=12958855

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5401897A Expired - Lifetime JP3204154B2 (ja) 1997-02-21 1997-02-21 時系列データ解析装置

Country Status (1)

Country Link
JP (1) JP3204154B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101770971B1 (ko) 2016-06-24 2017-08-25 주식회사 제이앤티씨 전자기기 커넥터 플러그용 쉘 가공방법
KR101896054B1 (ko) * 2016-08-03 2018-09-06 주식회사 신화콘텍 마이크로 유에스비 커넥터 플러그
KR102519453B1 (ko) * 2021-01-13 2023-04-06 곽창용 방열 기능을 갖는 멀티탭의 단자 구조

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1564647A3 (en) * 1998-01-19 2009-03-04 Asahi Glass Company Ltd. Time series data base system, method for processing time series data and system for displaying time series data
JP2000048047A (ja) 1998-01-19 2000-02-18 Asahi Glass Co Ltd 時系列デ―タの保存方法及び時系列デ―タベ―スシステム、時系列デ―タの処理方法及び時系列デ―タ処理システム、時系列デ―タ表示システム、並びに記録媒体
US6754388B1 (en) 1999-07-01 2004-06-22 Honeywell Inc. Content-based retrieval of series data
JP3475145B2 (ja) * 2000-04-13 2003-12-08 三菱電機株式会社 時刻情報提供システム及び時刻情報提供方法及び時刻情報提供方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読みとり可能な記録媒体
JP3650572B2 (ja) * 2000-07-07 2005-05-18 日本電信電話株式会社 時系列データの分類装置
JP2002207855A (ja) * 2001-01-10 2002-07-26 Synergy System:Kk 経営情報の分析方法、そのプログラム及び該プログラムを記録したコンピュータ読み取り可能な記録媒体、並びに経営情報の分析装置
JP4191604B2 (ja) * 2001-10-23 2008-12-03 シチズンホールディングス株式会社 健康管理装置及び健康管理プログラム
JP2007233988A (ja) * 2006-02-01 2007-09-13 Gonichi Sasaki 経済データ処理システム
JP3875257B1 (ja) 2006-03-24 2007-01-31 株式会社コナミデジタルエンタテインメント 株式銘柄検索装置、株式銘柄検索方法及びプログラム
JP3938928B1 (ja) * 2006-06-22 2007-06-27 株式会社コナミデジタルエンタテインメント 線形状処理装置、線形状処理方法、ならびに、プログラム
JP2010277204A (ja) * 2009-05-26 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> 情報分類処理装置、方法、およびプログラム
JP5678620B2 (ja) * 2010-12-03 2015-03-04 株式会社日立製作所 データ処理方法、データ処理システム、及びデータ処理装置
JP5632862B2 (ja) * 2012-02-13 2014-11-26 日本電信電話株式会社 データ検索装置、データ検索方法、及びデータ検索プログラム
JP5711171B2 (ja) * 2012-03-23 2015-04-30 日本電信電話株式会社 データ検索装置、データ検索方法、及びデータ検索プログラム
MX364165B (es) * 2015-06-19 2019-04-15 Tata Consultancy Services Ltd Métodos y sistemas para la busqueda de patrones lógicos.
JP7129235B2 (ja) * 2018-06-15 2022-09-01 キヤノン株式会社 情報処理装置、その制御方法、プログラム、記憶媒体、及びシステム
CN115950557B (zh) * 2023-03-08 2023-05-09 深圳市特安电子有限公司 一种基于压力变送器的温度智能补偿方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101770971B1 (ko) 2016-06-24 2017-08-25 주식회사 제이앤티씨 전자기기 커넥터 플러그용 쉘 가공방법
KR101896054B1 (ko) * 2016-08-03 2018-09-06 주식회사 신화콘텍 마이크로 유에스비 커넥터 플러그
KR102519453B1 (ko) * 2021-01-13 2023-04-06 곽창용 방열 기능을 갖는 멀티탭의 단자 구조

Also Published As

Publication number Publication date
JPH10240716A (ja) 1998-09-11

Similar Documents

Publication Publication Date Title
JP3204154B2 (ja) 時系列データ解析装置
US6654744B2 (en) Method and apparatus for categorizing information, and a computer product
US5625767A (en) Method and system for two-dimensional visualization of an information taxonomy and of text documents based on topical content of the documents
US6212526B1 (en) Method for apparatus for efficient mining of classification models from databases
EP1587008A2 (en) Automatic data view generation for a target variable
US20110225196A1 (en) Moving image search device and moving image search program
US7603370B2 (en) Method for duplicate detection and suppression
JP2003345810A (ja) 文書検索方法、文書検索システム及び文書検索結果示方システム
EP1909201A2 (en) Information processing apparatus and method, program and recording medium
JP2001515623A (ja) コンピュータによるテキストサマリ自動生成方法
US20080205795A1 (en) System and methods of image retrieval
CN112000776B (zh) 基于语音语义的话题匹配方法、装置、设备及存储介质
US7836059B2 (en) System and method for minimally predictive feature identification
CN100458788C (zh) 一种互联网音频文件的聚类方法、搜索方法及系统
WO2004072866A1 (ja) データ解析装置
US20030126138A1 (en) Computer-implemented column mapping system and method
JPH05101107A (ja) 適合率を用いた絞り込みデータ検索装置及び方法
JP2007249600A (ja) 目的データをカテゴリに分類する方法
JPH08287086A (ja) 適合度順画像強調表示方法及び装置
JP2003316819A (ja) オブジェクト分類検索装置及びそれを実行するためのプログラム
JP2002024251A (ja) 時系列データの分類方法及び装置並びに時系列データの分類プログラムを記録した記録媒体
JP4234841B2 (ja) データ分析装置
JP2001155020A (ja) 類似文書検索装置、類似文書検索方法及び記録媒体
RU2409849C2 (ru) Способ поиска информации в политематических массивах неструктурированных текстов
JP2980067B2 (ja) 文書分類装置及びプログラムを記録した機械読み取り可能な記録媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080629

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090629

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100629

Year of fee payment: 9