JP2009282926A

JP2009282926A - 時系列データ分析装置、方法及びプログラム

Info

Publication number: JP2009282926A
Application number: JP2008137120A
Authority: JP
Inventors: Ken Ueno; 研植野; Ryohei Orihara; 良平折原
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2008-05-26
Filing date: 2008-05-26
Publication date: 2009-12-03
Also published as: US20090292662A1

Abstract

【課題】予測対象について発生する事象の時系列的な変化の度合いと、その変化に至る所要時間とを推定することが可能な分類モデルを生成する時系列データ分析装置、方法及びプログラムを提供する。
【解決手段】分析対象毎にグループ化した履歴データと時不変データとからなる統合データの組を、当該統合データの組に含まれる浮動項目の変化量と、イベントシーケンスが表す数値範囲との包含関係に基づいて分類するとともに、共通する時不変項目に基づいて分類し、分類後の統合データの各組に含まれる事象項目の変化量と、当該変化量に至る所要時間とを表した予測対象イベントシーケンスを、前記分類に係る分類条件とともに前記イベントシーケンスに関連付けた予測モデルを生成する。
【選択図】図９

Description

本発明は、時系列データを分析する時系列データ分析装置、方法及びプログラムに関する。

従来、時間経過に伴って変化するデータを時系列的に分析する技術が種々存在している。例えば、特許文献１には、プロセスを構成する各プロセスステップが実行されている期間中に時系列に取得される時系列に取得されるプロセスの状態に関連するプロセス状態情報と、そのプロセスで処理された対象品についての検査結果情報とを入力し、プロセス特徴量と検査結果との関係を表すモデルを作成する技術が開示されている。

特開２００７−２５８７３１号公報

上記した従来技術のように、時系列データを分析する装置は種々存在するが、予測対象について発生する事象の時系列的な変化の度合いと、その変化に至る所要時間とを機械的に推定する十分に効果的な装置はいまだ提供されているとは言えない。例えば、装置等の保守分野では、部品の経年劣化を記録した検査データが各種データベースに蓄積されているが、部品の修復履歴や使用頻度、用途の違いなどが複雑に絡み合った複合的な要因を考慮しなければ、部品の経年劣化を予測することは困難である。上記した従来技術での時系列分析では、複合的な要因が明らかでなくとも、定量的な解析により予測値を推定することが可能であるが、予測モデルを人間が解釈することは困難であり、それが納得のいく根拠や理由で推定されているとは言い難い。

また、医療や介護分野で用いられる定期的な健康診断データにおいても、各人によって身体状態は異なり、また、アルコール摂取頻度や運動習慣、食習慣なども異なるため、これらの複合的な要因を考慮したうえで、医療関係者は生活習慣改善策を提示すれば効果的な健康指導が可能となると考えられる。例えば、中性脂肪の値を改善するような場合には、上記した複数の要因についての効果的な改善策を、理にかなった組み合わせで判断した上で、アルコールは少ししか控えることができないが、運動頻度を１．５倍にすることで２年後に中性脂肪を正常範囲にまで戻すことができるといった、データ分析による検証に基づいて改善策を出すことが考えられる。介護分野では、心身状態や介護サービスの変化がどのように要介護度の変化と関係しているか、また、心身状態変化がどのように要介護度の変化に対応しているかといった分析結果に基づき、介護サービスを提供すべきである。しかしながら、上記従来技術でこのような推定を行うことは困難であった。

本発明は上記に鑑みてなされたものであって、予測対象について発生する事象の時系列的な変化の度合いと、その変化に至る所要時間とを推定することが可能な分類モデルを生成する時系列データ分析装置、方法及びプログラムを提供することを目的とする。

上述した課題を解決し、目的を達成するために、本発明は、複数の分析対象各々について時間経過に伴い発生した所定の事象を定量的に示した事象項目を、当該事象の発生に関係する要素の数値を示した浮動項目と、当該事象の発生日時とともに記録した履歴データと、前記分析対象に関する時不変の設定を示した１又は複数の時不変項目からなる時不変データとを、共通する分析対象について関連付けた統合データを記憶する第１記憶手段と、前記分析対象毎にグループ化した前記統合データの組のうち、特定の分析対象についての統合データの組に含まれる前記浮動項目の数値範囲を拡大し、他の分析対象の各々についてグループ化した統合データの組に含まれる前記浮動項目の変化量を包含する前記数値範囲を表したイベントシーケンスを生成する第１生成手段と、前記グループ化した統合データの各組を、当該統合データの組に含まれる前記浮動項目の変化量と、前記イベントシーケンスが表す数値範囲との包含関係に基づいて分類するとともに、共通する前記時不変項目に基づいて分類し、分類後の統合データの各組に含まれる前記事象項目の変化量と、当該変化量に至る所要時間とを表した予測対象イベントシーケンスを、前記分類に係る分類条件とともに前記イベントシーケンスに関連付けた予測モデルを生成する第２生成手段と、前記予測モデルを記憶する第２記憶手段と、を備える。

また、本発明は、時系列データ分析装置の時系列データ分析方法であって、前記時系列データ分析装置は、複数の分析対象各々について時間経過に伴い発生した所定の事象を定量的に示した事象項目を、当該事象の発生に関係する要素の数値を示した浮動項目と、当該事象の発生日時とともに記録した履歴データと、前記分析対象に関する時不変の設定を示した１又は複数の時不変項目からなる時不変データとを、共通する分析対象について関連付けた統合データを記憶する第１記憶手段を備え、第１生成手段が、前記分析対象毎にグループ化した前記統合データの組のうち、特定の分析対象についての統合データの組に含まれる前記浮動項目の数値範囲を拡大し、他の分析対象の各々についてグループ化した統合データの組に含まれる前記浮動項目の変化量を包含する前記数値範囲を表したイベントシーケンスを生成する第１生成工程と、第２生成手段が、前記グループ化した統合データの組を、当該統合データの組に含まれる前記浮動項目の変化量と、前記イベントシーケンスが表す数値範囲との包含関係に基づいて分類するとともに、共通する前記時不変項目に基づいて分類し、分類後の統合データの各組に含まれる前記事象項目の変化量と、当該変化量に至る所要時間とを表した予測対象イベントシーケンスを、前記分類に係る分類条件とともに前記イベントシーケンスに関連付けた予測モデルを生成する第２生成工程と、記憶制御手段が、前記予測モデルを第２記憶手段に記憶する記憶制御工程と、を含む。

また、本発明は、複数の分析対象各々について時間経過に伴い発生した所定の事象を定量的に示した事象項目を、当該事象の発生に関係する要素の数値を示した浮動項目と、当該事象の発生日時とともに記録した履歴データと、前記分析対象に関する時不変の設定を示した１又は複数の時不変項目からなる時不変データとを、共通する分析対象について関連付けた統合データを記憶する第１記憶手段を備えたコンピュータに、前記分析対象毎にグループ化した前記統合データの組のうち、特定の分析対象についての統合データの組に含まれる前記浮動項目の数値範囲を拡大し、他の分析対象の各々についてグループ化した統合データの組に含まれる前記浮動項目の変化量を包含する前記数値範囲を表したイベントシーケンスを生成する第１生成手段と、前記グループ化した統合データの組を、当該統合データの組に含まれる前記浮動項目の変化量と、前記イベントシーケンスが表す数値範囲との包含関係に基づいて分類するとともに、共通する前記時不変項目に基づいて分類し、分類後の統合データの各組に含まれる前記事象項目の変化量と、当該変化量に至る所要時間とを表した予測対象イベントシーケンスを、前記分類に係る分類条件とともに前記イベントシーケンスに関連付けた予測モデルを生成する第２生成手段と、前記予測モデルを第２記憶手段に記憶する記憶制御手段と、して機能させる。

本発明によれば、分析対象の各々ついてグループ化した統合データの各組を、イベントシーケンスが表す数値範囲との包含関係に基づいて分類するとともに、共通する時不変項目に基づいて分類し、分類後の統合データの各組に含まれる事象項目の変化量と、当該変化量に至る所要時間とを表した予測対象イベントシーケンスを、分類条件とともに前記イベントシーケンスに関連付けて予測モデルを生成するため、当該予測モデルを用いることで、予測対象となる予測対象について発生する事象の時系列的な変化の度合いと、その変化に至る所要時間とを推定することができる。

以下に添付図面を参照して、時系列データ分析装置、方法及びプログラムの最良な実施形態を詳細に説明する。なお、以下では、所定の装置を構成する部品の経年的な金属疲労についての時系列データの分析に、本願発明にかかる時系列データ分析装置、方法及びプログラムを適用した例について説明するが、分析対象となる時系列データはこの例に限らないものとする。

図１は、本実施形態にかかる時系列データ分析装置１００の機能構成を示したブロック図である。同図に示したように、時系列データ分析装置１００は、履歴データ記憶部１１と、時不変データ記憶部１２と、データ統合部１３、統合データ記憶部１４、パラメータ入力部１５と、イベントシーケンス生成部１６と、予測モデル生成部１７と、予測モデル記憶部１８と、対象データ記憶部１９と、時系列予測部２０と、結果表示部２１とを備えている。

履歴データ記憶部１１は、後述する記憶部３４に設けられたデータベース等であって、部品名（保守分野の場合）や心身状態（医療・介護分野の場合）等の分析対象について時間経過に伴い発生した事象を定量的に示した事象項目を、当該事象の発生に関係する定量的な数値を示した浮動項目と、当該事象の発生日時とともに記録した履歴データを記憶する。具体的には、分析対象となる各部品について、金属疲労の度合い（Ｌｅｖｅｌ１〜３）と、当該金属疲労発生の要素となる月当りの使用頻度と、その修復日とを履歴データとして関連付けて記憶している。

図２は、履歴データ記憶部１１に格納された履歴データの一例を示した図である。同図に示したように、履歴データは、分析対象となる各部品について、時間経過に伴い発生した金属疲労（事象）を定量的に示したＬｅｖｅｌ１〜３と、当該金属疲労発生の要素となる月当りの使用頻度（浮動項目）と、この事象の発生日時に対応する修復日とから構成されている。なお、履歴データは、図２の例に限定されないものとする、例えば、事象の発生に関係する浮動項目が複数種類存在するような場合には、これら複数種類の浮動項目を含むこととしてもよい。

時不変データ記憶部１２は、後述する記憶部３４に設けられたデータベース等であって、履歴データ記憶部１１に記憶された各分析対象に関する時不変のデータ項目（時不変項目）を格納している。図３は、時不変データ記憶部１２に格納されたデータ（時不変データ）の一例を示した図である。同図に示したように、時不変データは、図２に示した各部品（Ａ１、Ａ２、Ａ３…）に関する時不変項目として、設置場所や材質等を関連付けて記憶している。なお、時不変データは、図３の例に限定されないものとする。

データ統合部１３は、履歴データ記憶部１１及び時不変データ記憶部１２に格納されたデータを、共通する分析対象（部品名）について結合することで、一つの統合データを生成し、統合データ記憶部１４に記憶する。

図４は、図２に示した履歴データ記憶部１１の各データと、図３に示した時不変データ記憶部１２の各データとから生成された統合データの一例を示した図である。図４に示したように、統合データは、履歴データ記憶部１１に記憶された履歴データと、時不変データ記憶部１２に記憶された時不変データとが、共通する部品名について統合されており、部品毎にその使用頻度（回／月）と、接地場所と、材質と、修復日と、金属疲労とが関連付けられている。

統合データ記憶部１４は、後述する記憶部３４に設けられたデータベース等であって、データ統合部１３により生成された統合データを格納する。

パラメータ入力部１５は、イベントシーケンス生成部１６、予測モデル生成部１７での処理に用いるパラメータとして、変化粒度と、予測対象項目と、最小事例数とをイベントシーケンス生成部１６及び予測モデル生成部１７に入力する。

ここで「変化粒度」とは、後述する緩和範囲の拡大量を指定するパラメータである。また、「予測対象項目」は、統合データに含まれた各項目（使用頻度、設置場所、材質、修復日、金属疲労）のうち、後述する予測モデルにおいて予測の対象とする項目を指定するためのパラメータである。また、「最小事例数」とは、後述する決定木分類モデルで分類した葉ノードの最小値を指定するためのパラメータである。

なお、変化粒度、予測対象項目及び最小事例数の各パラメータが後述する記憶部３４等に予め記憶されている場合、パラメータ入力部１５は記憶部３４から各パラメータを読み出し、イベントシーケンス生成部１６及び予測モデル生成部１７に入力する。また、これら各パラメータが後述する操作部３６や通信部３７を介して入力される場合、パラメータ入力部１５は入力された各パラメータをイベントシーケンス生成部１６及び予測モデル生成部１７に夫々入力する。

イベントシーケンス生成部１６は、パラメータとして変化粒度と予測対象項目とを入力とし、同一の部品名（分析対象）についての統合データを少なくとも２つ選択することでこれらをグループ化する。また、イベントシーケンス生成部１６は、グループ化した統合データを、当該統合データに含まれた履歴データの修復日に基づいて時系列順に並び替える。また、イベントシーケンス生成部１６は、グループ化した統合データの組（以下、チャンクという）のうち、特定の部品のチャンクについて、このチャンクに含まれる浮動項目の数値範囲を順次拡大することで、この数値範囲を表した候補イベントシーケンスを生成する。

以下、図４に示した統合データに基づいて、候補イベントシーケンスの生成について説明する。なお、パラメータ入力部１５からは、変化粒度として“粒度＝５０”が、予測対象項目として“金属疲労”と“修復日”とが指定されたとする。

まず、イベントシーケンス生成部１６は、統合データ記憶部１４に格納された統合データの１つの部品に着目すると、この部品についてのエントリに含まれた数値を含む項目（浮動項目）を左から順に選択する。次に、イベントシーケンス生成部１６は、選択した項目の値が時間軸上で変化するよう統合データを時間経過順に並べる。

図４の統合データの場合、部品Ａ１に着目すると、２００７／０６の時点では使用頻度が３００回／月であったのに対し、２００８／０１の時点では使用頻度が６００回／月に変化している。そのため、イベントシーケンス生成部１６は、これらデータの組を時間経過順に並べ直す。なお、図４の統合データでは、同一の部品について時間経過順に並べ直した後の状態を示している。

続いて、イベントシーケンス生成部１６は、時間経過順に並べ直した同一部品についてのデータの組（以下、チャンクという）を、パラメータ入力部１５から入力された変化粒度を用いることで使用頻度の範囲を拡大し、候補イベントシーケンスを生成する。具体的には、下記式（１）を用いて使用頻度の範囲を拡大する。ここで、ｘはデータチャンクに含まれた各使用頻度が代入される変数を意味し、λは変化粒度を意味し、Φは後述する範囲拡大処理においてインクリメントされる変数（初期値は０）を意味する。以下、下記式（１）により算出された使用頻度の範囲を「緩和範囲」Ｒという。
Ｒ＝[ｘ−λ×Φ, ｘ＋λ×Φ] （１）

部品Ａ１についてのチャンクでは、使用頻度は“３００”と“６００”であるため、変化粒度＝５０、Φ＝０の条件で上記式（１）を算出すると、ｘ＝３００についての使用頻度（緩和範囲）は３００（回／月）となり、ｘ＝６００についての使用頻度（緩和範囲）は６００（回／月）となる。つまり、初回すなわちΦ＝０の場合は範囲による緩和はなく、使用頻度そのものでまずは他のデータがこの条件に当てはまっているかどうかを判定することになる。

図５は、緩和範囲３００（回／月）、６００（回／月）の候補イベントシーケンスを模式的に表した図である。同図において、Ｅは候補イベントシーケンスを表しており、使用頻度（緩和範囲）３００（回／月）についてのノードと、使用頻度（緩和範囲）６００（回／月）についてのノードから構成されている。また、図中矢印は、各ノードの時間的な前後関係を示しており、時間経過に伴い、矢印元のノードから矢印先のノードに状態が変化したことを意味している。以下、矢印元のノードを「開始ノード」と呼び、矢印先のノードを「終了ノード」と呼ぶ。また、各ノードにおける緩和範囲を、単に、開始ノードの範囲、終了ノードの範囲という。

１つの部品について候補イベントシーケンスを生成すると、イベントシーケンス生成部１６は、この候補イベントシーケンスの緩和範囲（開始ノードの範囲、終了ノードの範囲）に該当する記録データを持つチャンク（部品）が、当該候補イベントシーケンスの生成元となったチャンク以外に、統合データ中に１つ以上あるか否かを判定する。なお、図５の候補イベントシーケンスの場合、イベントシーケンス生成部１６は、部品Ａ１以外に使用頻度が３００回／月から６００回／月に変化する部品は存在しないと判定する。

候補イベントシーケンスの生成元となった部品以外に、当該候補イベントシーケンスに該当する部品が存在しないと判定した場合、イベントシーケンス生成部１６は、Φの値を１インクリメントすることで緩和範囲を段階的に拡大し、この候補イベントシーケンスの緩和範囲の条件と、各チャンクに含まれた使用頻度との比較を再度行う。

なお、Φ＝１とした場合、ｘ＝３００については使用頻度２５０〜３５０（回／月）の緩和範囲となり、ｘ＝６００については使用頻度５５０〜６５０（回／月）の緩和範囲となる。図６は、この場合の候補イベントシーケンスを模式的に表した図である。図６の候補イベントシーケンスＥの場合においても、部品Ａ１以外に緩和範囲が２５０〜３５０回／月から５５０〜６５０回／月に変化するチャンクは存在しないため、イベントシーケンス生成部１６は、Φ＝２とし、緩和範囲をさらに拡大する。なお、候補イベントシーケンスの生成元となったチャンク以外に、当該候補イベントシーケンスに該当するチャンクが１以上存在すると判定した場合、イベントシーケンス生成部１６は、この候補イベントシーケンスをイベントシーケンスとして採用（生成）する。以下、図７のフローチャートを参照して、上記したイベントシーケンスの生成にかかるイベントシーケンス生成部１６の動作について説明する。

図７は、イベントシーケンス生成処理の手順を示したフローチャートである。なお、本処理の前提として、統合データに含まれる各部品についてグループ化が行われているものとする。

まず、イベントシーケンス生成部１６は、統合データ中の各項目を選択する際の指標となるインデックスｉを０に初期化する（ステップＳ１１）。続いて、イベントシーケンス生成部１６は、統合データ記憶部１４に格納された統合データのうち、１つの部品（チャンク）を処理対象とすると、この部品についてのエントリのうち数値を含んだ項目ａ_iを選択する（ステップＳ１２）。ここで、ａ_iはエントリ内での数値を含んだ項目のうち、ｉ番目の項目を意味する。なお、ステップＳ１２で項目を選択する際には、エントリの左側から順次選択することとしてもよいし、右側から順次選択することとしてもよい。

次に、イベントシーケンス生成部１６は、ステップＳ１２で選択した項目ａ_iについての変化粒度λ_iをパラメータ入力部１５から受け付けると（ステップＳ１３）、上記式（１）を計算するためΦ＝０を設定する（ステップＳ１４）。

続いて、イベントシーケンス生成部１６は、上記式（１）に基づいて処理対象のチャンクに含まれる項目ａ_iについての緩和範囲を、Ｆｒｏｍ_j＝ｘ_j−（Φ×λ_i）、Ｔｏ_j＝ｘ_j＋（Φ×λ_i）として算出する（ステップＳ１５）。ここで、添字のｊは時系列的に前後する項目ａ_iについての緩和範囲を識別するためのインデックスである。例えば、部品Ａ１についてのチャンクの場合、修復日２００７／０６のデータに含まれる項目ａ_iについての緩和範囲、即ち開始ノードの範囲はＦｒｏｍ₁＝ｘ₁−（Φ×λ_i）〜Ｔｏ₁＝ｘ₁＋（Φ×λ_i）で表される。また、修復日２００８／０１のデータに含まれる項目ａ_iについての緩和範囲、即ち終了ノードの範囲はＦｒｏｍ₂＝ｘ₂−（Φ×λ_i）〜Ｔｏ₂＝ｘ₂＋（Φ×λ_i）で表される。

イベントシーケンス生成部１６は、ステップＳ１５での算出結果から得られた、開始ノードのＴｏ₁と、終了ノードのＦｒｏｍ₂とを比較し、Ｔｏ₁＜Ｆｒｏｍ₂であるか否かを判定することで、時系列的な前後関係に矛盾が生じているか否かを判断する（ステップＳ１６）。ここで、Ｔｏ₁≧Ｆｒｏｍ₂と判定した場合、つまり時系列的な前後関係に矛盾が生じていると判断した場合には（ステップＳ１６；Ｎｏ）、ステップＳ２１の処理に移行する。

ステップＳ１６において、Ｔｏ₁＜Ｆｒｏｍ₂と判定した場合、つまり時系列的な前後関係に矛盾が生じないと判断すると（ステップＳ１６；Ｙｅｓ）、イベントシーケンス生成部１６は、ステップＳ１５の算出結果を仮のイベントシーケンスの条件とし、この条件を満たすチャンク（部品）の数（頻度ｆ）がいくつあるかをカウントする（ステップＳ１７）。続いて、イベントシーケンス生成部１６は、ステップＳ１７でカウントしたｆの値が１より大きいかどうかを判定する（ステップＳ１８）。

なお、部品Ａ１のチャンクついての項目ａ_iが使用頻度の場合、Φ＝０の時点では、Ｆｒｏｍ₁＝３００、Ｔｏ₁＝３００、Ｆｒｏｍ₂＝６００、Ｔｏ₂＝６００となるため、ステップＳ１６において矛盾が生じないと判定される。この場合、部品Ａ１以外の部品では、上記の条件を満たすものはないことから、イベントシーケンス生成部１６はステップＳ１７においてｆ＝１とカウントする。またこのとき、ｆ＞１を満たさないため、イベントシーケンス生成部１６は続くステップＳ１８の条件を満たせず（ステップＳ１８；Ｎｏ）、ステップＳ１９の処理に移行する。

ステップＳ１９では、イベントシーケンス生成部１６が、Ｆｒｏｍ_jの値をｐＦｒｏｍ_jに代入するとともに、Ｔｏ_jの値をｐＴｏ_jに代入する（ステップＳ１９）。続いて、イベントシーケンス生成部１６は、Φの値を１インクリメントし（ステップＳ２０）、ステップＳ１５の処理に再び戻る。

部品Ａのチャンクついての項目ａ_iが使用頻度の場合、Φ＝０＋１とし、Φ＝１の時点での緩和範囲の計算を行うと、Ｆｒｏｍ₁＝２５０、Ｔｏ₁＝３５０、Ｆｒｏｍ₂＝５５０、Ｔｏ₂＝６５０となる。この場合、Ｔｏ₁＝３５０＜Ｆｒｏｍ₂＝５５０であるため、ステップＳ１６において時系列的な前後関係に矛盾は生じないと判定される。イベントシーケンス生成部１６は、この緩和範囲を候補イベントシーケンスの条件とすると、ステップＳ１７で、この候補イベントシーケンスの条件を満たすチャンクがいくつあるかを数え上げる。この場合もｘ₁＝３００、ｘ₂＝６００である部品Ａ１のみが該当し、頻度はｆ＝１であるため、ステップＳ１８；Ｎｏ→Ｓ２０の処理を行った後、ステップＳ１５に再び戻る。

ステップＳ２０において、Φ＝１＋１とした場合、ステップＳ１５での算出結果は、Ｆｒｏｍ₁＝２００、Ｔｏ₁＝４００、Ｆｒｏｍ₂＝５００、Ｔｏ₂＝７００となるため、ステップＳ１６では矛盾が生じないと判定される。また、今回は緩和範囲を広げたため、部品Ａ１だけでなく部品Ａ３のチャンクもこの候補イベントシーケンスの条件に当てはまるので、ステップＳ１７でカウントされる頻度ｆは２となる。なお、この場合にはｆ＞１であるため（ステップＳ１８；Ｙｅｓ）、ステップＳ２１に移行する。

イベントシーケンス生成部１６は、ステップＳ２１において、ｐＦｒｏｍ_jの値をＦｒｏｍ_jに、ｐＴｏ_jの値をＴｏ_jに夫々代入し、項目ａ_iについてのイベントシーケンスを生成する（ステップＳ２１）。続いて、イベントシーケンス生成部１６は、処理対象とした部品についてのエントリのうち、数値を含んだ全ての項目を選択したか否かを判定し、未選択の項目が存在すると判定した場合には（ステップＳ２２；Ｎｏ）、ｉの値を１インクリメントし（ステップＳ２３）、ステップＳ１２で次の項目を選択する。

一方、ステップＳ２２において、数値を含んだ全ての項目を選択したと判定した場合には（ステップＳ２２；Ｙｅｓ）、本処理を終了する。上記の処理を行うことで、処理対象とした部品に対し、数値を含んだ全ての項目についてのイベントシーケンスが生成される。

なお、イベントシーケンスの生成対象となるチャンクは、予め定められていることとしてもよいし、ランダムに選択する態様としてもよい。また、各チャンクについて夫々イベントシーケンスを生成する態様としてもよい。

図１に戻り、予測モデル生成部１７は、イベントシーケンス生成部１６で生成されたイベントシーケンスと、統合データ記憶部１４の統合データに含まれた時不変の項目とを構成要素とし、予測対象の将来の状態を予測するための予測モデルを生成する。以下、決定木により分類モデルを用いた予測モデルの生成例について説明する。

まず、予測モデル生成部１７は、統合データ中のすべてのデータに対して、イベントシーケンス生成部１６で生成されたイベントシーケンスの条件を満たしているか否かをテストする。ここで、予測モデル生成部１７は、条件に該当すると判定した場合にはこのイベントシーケンスのノードの左下、該当しないと判定した場合にはイベントシーケンスのノードの右下に部品集合を分けていく。

図８は、上述した、部品Ａ１の使用頻度についてのイベントシーケンスを模式的に表した図である。ここで、イベントシーケンスＥ１の開始ノードは使用頻度２００〜４００回／月の緩和範囲を有し、終了ノードは使用頻度５００〜７００回／月の緩和範囲を有している。この場合、予測モデル生成部１７は、開始ノードの範囲及び終了ノードの範囲に該当するチャンクとして部品Ａ１、Ａ３を特定し、該当しないチャンクとして部品Ａ２を特定する。

パラメータ入力部１５から予測対象の項目として金属疲労と、修復日とが指定されているため、予測モデル生成部１７は、このイベントシーケンスのノードの左下に部品Ａ１、Ａ３の金属疲労に関するノードＥ２を、右下に部品Ａ２の金属疲労に関するノードＥ３を夫々配置する。以下、予測対象項目についてのノードを予測対象イベントシーケンスという。

また、予測モデル生成部１７は、各予測対象イベントシーケンスにおいて、金属疲労の状態が変化するのに要した時間情報を夫々算出し、対応する予測対象イベントシーケンスに付与する。ここで、「変化に要した時間情報」とは、各分岐先の予測対象の各部品が要した時間の平均値や中央値、最頻値などの統計値を算出し、更にこれらの値の統計値を算出したものを境界値とした所要時間のことを意味する。

なお、図８では、具体例として平均値を統計値とした場合の例を示している。この場合、予測対象イベントシーケンスＥ２での金属疲労の変化の所要時間は、図４に示した統合データにおける部品Ａ１、部品Ａ３夫々についての修復日間隔７ヶ月と５ヶ月を平均した６ヶ月である。また、予測対象イベントシーケンスＥ３での金属疲労の変化の所要時間は、図４に示した統合データにおける部品Ａ２についての修復日間隔１５ヶ月である。そのため、予測対象イベントシーケンスＥ２とＥ３との間の境界値は、６ヶ月と１５ヶ月との平均値１０．５ヶ月となる。そのため、予測モデル生成部１７は、これらの境界値を時間情報とし、予測対象イベントシーケンスＥ２に「１０．５ヶ月未満」を、予測対象イベントシーケンスＥ３に「１０．５ヶ月以上」を夫々付与する。なお、ここではＥ２とＥ３は、ともに、金属疲労レベル１から金属疲労レベル３の変化を表すイベントシーケンスとなっているが、ここは、データによっては、Ｅ２は金属疲労レベル１から金属疲労レベル３でＥ３は金属疲労レベル２から金属疲労レベル３となる可能性もある。その場合は、それぞれのレベルの変化に応じて当てはまるデータを使って各平均を計算し、それぞれＥ２とＥ３の時間情報として付与する。

次に、予測モデル生成部１７は、パラメータ入力部１５から入力された最小事例数に基づいて、分岐させたイベントシーケンスを更に分岐させることが可能か否かを判定する。ここで、図８に示した、予測対象イベントシーケンスＥ２の部品Ａ１、部品Ａ３についての他の項目を参照すると、これらの部品は材質がスチールで同一であるが、設置場所が異なっていることが分かる（図４参照）。また、このとき、パラメータ入力部１５から入力された最小事例数が“１”だとすると、予測モデル生成部１７は、左下のノードには、部品Ａ１と部品Ａ３の２つの部品が分類されているため、これらの設置場所についてさらに分割することが可能であると判断する。

ここで、設置場所の項目自体は、時不変の項目であるが、本実施形態の特徴として、履歴データだけでなく時不変項目をも予測モデルに含めることが可能となっている。ただし、より汎用的な決定木モデルを生成する目的で、最終的な分岐先に辿り着いたときの部品集合の最小事例数を２に制限するような場合には、これ以上の項目追加を行わないものとしてもよい。設置場所の項目について更に予測モデルを詳細化する場合、図９に示したように、該当する予測対象イベントシーケンス上部、つまりこの場合はイベントシーケンスＥ１の左下に設置場所についてのノードＥ２１を配置し、このノードＥ２１から部品Ａ３の金属疲労についての予測対象イベントシーケンスＥ２２と、部品Ａ１の金属疲労についての予測対象イベントシーケンスＥ２３とを分岐する。

また、予測モデル生成部１７は、先と同様に、分岐させたイベントシーケンス間の境界値を算出し、時間情報として各検索対象イベントシーケンスに付与する。なお、図９の構成の場合、左下に分岐された予測対象イベントシーケンスＥ２２での金属疲労の変化の所要時間は、図４に示した統合データにおける部品Ａ３についての修復日間隔５ヶ月である。また、中央下に分岐された予測対象イベントシーケンスＥ２３での金属疲労の変化の所要時間は、図４に示した統合データにおける部品Ａ１についての修復日間隔７ヶ月である。そのため、予測対象イベントシーケンスＥ２２とＥ２３との間の境界値は、５ヶ月と７ヶ月との平均値６ヶ月となる。また、右下に分岐されている予測対象イベントシーケンスＥ３での金属疲労の変化の所要時間は、図４に示した統合データにおける部品Ａ２についての修復日間隔１５ヶ月であるため、予測対象イベントシーケンスＥ２３とＥ３との間の境界値は、７ヵ月と１５ヵ月の平均値１１ヵ月となる。

このように生成された決定木（予測モデル）を用いて新たなデータの将来値を予測するには、この決定木の最上位のノードＥ１から予測対象となる部品データを入力し、各分岐項目で指定された条件に基づいてノードを辿っていくことで、最終的に辿り着く予測対象イベントシーケンスから、予測対象の項目についての将来の状態（図９の場合、金属疲労とその状態に至るまでのおおよその所要時間）を推定することができる。なお、本実施形態の場合での予測モデルの生成にかかる予測モデル生成部１７の動作は、図１０のようになる。以下、図１０を参照して、予測モデル生成部１７の動作について説明する。

図１０は、予測モデル生成部１７により実行される予測モデル生成処理の手順を示したフローチャートである。まず、予測モデル生成部１７は、現在位置をルートに設定する（ステップＳ３１）。ここで、「ルート」とは予測モデルを構成する決定木のルートノードを意味し、具体的には、イベントシーケンス生成部１６により生成されたイベントシーケンスのノードである。続いて、予測モデル生成部１７は、統合データに含まれたイベントシーケンスまたは時不変項目の候補集合、即ち、各部品についてのチャンクから項目ｂ_iを選択すると（ステップＳ３２）、これら項目ｂ_iについてのデータ集合Ｄと、項目ｂ_iについてのイベントシーケンス（ルートノード）から分割情報量を算出する（ステップＳ３３）。ここで、分割情報量（利得比、Ｇａｉｎ＿Ｒａｔｉｏ）は例えば下記式（２）で算出することができる。

上記式（２）において、Ｂは項目を表し、ＸはＢについてのデータ集合を表している。また、ｖは任意の項目の値を表し、Ｖａｌ（Ｂ）はＢがとりうる全ての値の集合を表す。このＶａｌ（Ｂ）の値が数値の場合、上述した境界値を用い、候補集合をイベントシーケンスとして幾つかのグループに分けることで現在位置から分岐し、分岐したグループが示す値の範囲を１つの項目とみなす。ＸｖはＡ＝ｖで分割された分岐先にあるイベントシーケンスのデータ集合を示している。また、｜Ｘｖ｜はデータ集合Ｘｖに含まれるデータ数を表す。Ｃは最終ノードにくる予測対象項目を示し、ｊはこの予測対象項目のとる値の種類数を表す。

なお、上記式（２）において、Ｇａｉｎ（Ｂ，Ｘ）はＢの利得、つまり分岐項目Ｂを配置する前と後とでどれくらい情報量（不確実性）が減ったかを示す指標であって、下記式（３）〜（５）により導出される。金属疲労の例の場合には、イベントシーケンス生成部１６で生成された図８のＥ２、Ｅ３、図９のＥ２１、Ｅ２２、Ｅ２３が、下記式（５）のＣ_ｊに相当する。

予測モデル生成部１７は、イベントシーケンス生成部１６により生成されたイベントシーケンスの項目も含め、全項目は上記式（２）により得られる分割情報量Ｇａｉｎ＿Ｒａｔｉｏ（Ｂ，Ｘ）で評価する。

続いて、予測モデル生成部１７は、統合データに含まれた全ての項目についてステップＳ３３の処理を実行したか否を判定する（ステップＳ３４）。ここで、未処理の項目が存在すると判定した場合（ステップＳ３４；Ｎｏ）、予測モデル生成部１７は、ｉの値を１インクリメントした後（ステップＳ３５）、ステップＳ３２に再び戻ることで、次の項目を処理の対象とする。

一方、ステップＳ３４において、全ての項目についてステップＳ３３の処理を実行したと判定した場合（ステップＳ３４；Ｙｅｓ）、予測モデル生成部１７は、ステップＳ３３で算出した分割情報量のうち、分割情報量が最も大きい項目を分岐項目として採用し、この分岐項目のノードを現在位置に配置する（ステップＳ３６）。

次いで、予測モデル生成部１７は、何れかの予測対象イベントシーケンスにおいて、条件を満たすデータ集合数、即ち、条件を満たすチャンク数が最小事例数未満でないと判定した場合（ステップＳ３７；Ｎｏ）、その分岐項目の全ての分岐先について新たにデータ集合ならびに現在位置を更新し、ステップＳ３６で採用した分岐項目を候補集合から取り除く（ステップＳ３８）。そして、予測モデル生成部１７は、項目ｂ_iの下位の分岐先について当該項目ｂ_iの条件に該当するデータ集合をＤとし、現在位置を分岐先ノードに更新した後（ステップＳ３９）、ステップＳ３２の処理に再び戻る。

予測モデル生成部１７は、このような処理を再帰的に繰り返し、全ての項目を分岐項目として試し終わるか、分岐先のデータ集合に含まれるデータ数が最小事例数未満となるまで、ステップＳ３２〜Ｓ３９の処理を繰り返す。また、予測モデル生成部１７は、ステップＳ３７において、全ての項目を分岐項目として試し終わるか、又は、分岐先のデータ集合に含まれるデータ数が最小事例数未満と判定した場合（ステップＳ３７；Ｙｅｓ）、現在までに配置された分岐項目とその位置を予測モデルとして出力し（ステップＳ４０）、本処理を終了する。

なお、分割情報量が等しい分岐項目があった場合には複数の可能性を残しておき、複数の予測モデルを出力することとする。そうでない場合には、１つのモデルが生成される。予測モデル生成部１７は、各項目ｂ_iについての予測モデルを生成後、全てのデータ集合をどれだけ正確に分類予測できたかどうかを、例えば下記式（６）を用いることで各予測モデルの評価を行う。
精度＝予測を誤ったデータ数／全データ数（６）

評価尺度は、精度や再現率、適合率等が考えられるが、式（６）では最も単純な精度の場合を取り上げている。予測モデル生成部１７により生成された予測モデルと、その評価結果の値とは予測モデル記憶部１８に格納される。なお、予測モデル生成部１７により複数の予測モデルが生成された場合、結果表示部２１において、例えば予測モデルの精度が高い順に予測モデルを表示してもよい。

予測モデル記憶部１８は、後述する記憶部３４が備えるデータベース等であって、予測モデル生成部１７により生成された予測モデルと、その評価結果の値とを関連付けて記憶する。

対象データ記憶部１９は、予測の対象となる所定の予測対象についてのデータを格納する。この対象データ記憶部１９には、例えば、予測対象となる部品と、その部品についての履歴データ（使用頻度（回／月）、修復日、金属疲労等）や、時不変データ（設定場所、材質等）が格納される。

時系列予測部２０は、対象データ記憶部１９に格納された予測対象についてのデータを入力とし、予測モデル記憶部１８に記憶された予測モデルを用いることで、この予測対象について予測の対象となった所定の項目についての将来の状態を予測する。例えば、予測対象として、新たに部品Ａ５が入力された場合に、回帰式などの方法で過去の傾向から使用頻度が５００から７００回／月に変わりそうだと予測されると、この部品Ａ５の設置場所が内陸部で、材質がアルミ合金、修復日が２００７／０４／０１であれば、金属疲労が６ヵ月以上、１１ヵ月未満、つまり、２００７年１０月から２００８年３月に起こることを指示した情報を予測結果として導出する。なお、これは図９における中央下の分岐先ノード（予測対象イベントシーケンスＥ２３）に辿り着くことを示しており、部品Ａ１と同様の結果が予測されることを意味している。

結果表示部２１は、時系列予測部２０により予測モデルから導出された予測結果を、後述する表示部３５に表示する。また、結果表示部２１は、後述する操作部３６を介したユーザからの操作に応じて、予測モデル記憶部１８に記憶された予測モデルを、表示部３５に表示する。なお、予測モデル記憶部１８に複数の予測モデルが記憶されている場合には、例えば、予測モデルの精度が高い順に表示することとしてもよい。

また、結果表示部２１は、後述する操作部３６を介した操作に応じて、予測モデルに含まれた予測対象イベントシーケンスに対応するデータ集合（チャンク）を、統合データ記憶部１４から読み出し、表示部３５に表示する。

ここで、図１１は、時系列予測部２０と結果表示部２１とにより実行される、予測結果の出力にかかる処理（予測結果出力処理）の手順を示したフローチャートである。まず、時系列予測部２０は、対象データ記憶部１９から予測対象のデータを取得すると（ステップＳ５１）。続いて、時系列予測部２０は、予測モデル記憶部１８に記憶された予測モデルを参照し（ステップＳ５２）、この予測モデルの最上位のノードから予測対象のデータに該当するノードを、各分岐項目で指定された条件に基づいて辿っていくことで、最終的に辿り着いたイベントシーケンスの項目を予測結果として導出する（ステップＳ５３）。

なお、予測モデル記憶部１８に複数の予測モデルが記憶されているような場合には、その評価結果の値がより高いものを用いる態様としてもよいし、他の予測モデル又は全ての予測モデルを用いることとしてもよい。また、上述したように、結果表示部２１により表示された予測モデルに基づいて、ユーザから特定の予測モデルが選択されたような場合には、この選択された予測モデルを用いて予測結果を導出する態様としてもよい。

続いて、結果表示部２１は、ステップＳ５３で導出された予測結果を後述する表示部３５に表示し（ステップＳ５４）、本処理を終了する。

以上のように、本実施形態によれば、分析対象の各々ついてグループ化した統合データの各組を、イベントシーケンスが表す数値範囲との包含関係に基づいて分類するとともに、共通する時不変項目に基づいて分類し、分類後の統合データの各組に含まれる事象項目の変化量と、当該変化量に至る所要時間とを表した予測対象イベントシーケンスを、分類条件とともに前記イベントシーケンスに関連付けて予測モデルを生成するため、当該予測モデルを用いることで、予測対象となる予測対象について発生する事象の時系列的な変化の度合いと、その変化に至る所要時間とを推定することができる。

そのため、品質管理や保守部門における様々な事象の時系列記録から、将来の時間軸上での予測対象の変化を知ることができ、様々な記録から変化の度合いと変化過程を推定することが可能になるため、業務効率や安全性の向上を図ることができる。

なお、上記実施形態では、履歴データ記憶部１１と時不変データ記憶部１２とを、独立的に保持する態様としたが、これに限らないものとする。例えば、履歴データ記憶部１１と時不変データ記憶部１２とのデータ内容を統合したデータ（分析対象データ）のみを保持する態様としてもよい。

図１２は、本実施形態の他の態様として、分析対象データのみを保持する構成を示した図である。同図において、分析対象データ記憶部２２は、分析対象データを記憶する。ここで、分析対象データは、実質統合データと同様の項目内容となるため、図１で示したデータ統合部１３及び統合データ記憶部１４は不要となり、イベントシーケンス生成部１６、予測モデル生成部１７、結果表示部２１は、分析対象データ記憶部２２を参照することになる。

また、上記実施形態では、対象データ記憶部１９に予測対象のデータを保持する態様としたが、これに限らず、実際の部品（例えば、センサなど）から予測対象のデータが直接入力される態様としてもよい。

図１３は、本実施形態の他の態様として、予測対象のデータが直接入力される構成を示した図である。同図において、センサ部２３は予測対象となる部品であって、このセンサ部２３から出力されるデータがネットワークＮを介し、予測対象のデータとして時系列予測部２０に入力されるようになっている。なお、この場合、センサ部２３からの予測対象のデータは、常時入力される態様としてもよいし、所定の期間毎に入力される態様としてもよい。また、図１４に示したように、図１２、図１３で説明した２つの他の態様に係る構成を組み合わせることとしてもよい。

図１５は、時系列データ分析装置１００のハードウェア構成を示した図である。同図に示したように、時系列データ分析装置１００は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）３１と、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）３２と、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）３３と、記憶部３４と、表示部３５と、操作部３６と、通信部３７とを備え、各部はバス３８を介して接続されている。

ＣＰＵ３１は、ＲＡＭ３３を作業領域として、ＲＯＭ３２又は記憶部３４に記憶されたプログラムとの協働により、各種処理を実行し時系列データ分析装置１００の動作を統括的に制御する。また、ＣＰＵ３１は、ＲＯＭ３２又は記憶部３４に記憶されたプログラムとの協働により、上述した各機能部（データ統合部１３、パラメータ入力部１５、イベントシーケンス生成部１６、予測モデル生成部１７、時系列予測部２０、結果表示部２１）を実現させる。

ＲＯＭ３２は、時系列データ分析装置１００の制御にかかるプログラムや各種設定情報などを書き換え不可能に記憶する。ＲＡＭ３３は、ＳＤＲＡＭやＤＤＲメモリなどの揮発性メモリであって、ＣＰＵ３１の作業エリアとして機能する。

記憶部３４は、磁気的又は光学的に記録可能な記憶媒体を有し、時系列データ分析装置１００の制御にかかるプログラムや各種情報を書き換え可能に記憶する。また、記憶部３４は、当該記憶部３４が備えるデータベース等の記憶・管理機構により、上述した履歴データ記憶部１１、時不変データ記憶部１２、統合データ記憶部１４、予測モデル記憶部１８、対象データ記憶部１９、分析対象データ記憶部２２として機能する。なお、記憶部３４は単一の記憶媒体に限らず、用途に応じて設けられた複数の記憶媒体としてもよいし、ネットワーク等を介して接続される外部記憶装置としてもよい。

表示部３５は、ＬＣＤ（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ）などの表示デバイスから構成され、ＣＰＵ３１の制御の下、文字や画像などを表示する。

操作部３６は、マウスやキーボードなどの入力デバイスであって、ユーザから操作入力された情報を指示信号として受け付け、ＣＰＵ３１に出力する。

通信部３７は、外部装置との間で通信を行うインターフェイスであって、外部装置から受信した各種データをＣＰＵ３１に出力する。また、通信部３７は、ＣＰＵ３１の制御の下、各種情報を外部装置に送信する。

以上、本発明にかかる実施形態について説明したが、本発明はこれに限定されるものではなく、本発明の主旨を逸脱しない範囲での種々の変更、置換、追加などが可能である。

例えば、上記実施形態の時系列データ分析装置１００で実行されるプログラムは、ＲＯＭ３２や記憶部３４などに予め組み込まれて提供されるものとするが、これに限らず、インストール可能な形式又は実行可能な形式のファイルでＣＤ−ＲＯＭ、フレキシブルディスク（ＦＤ）、ＣＤ−Ｒ、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ）などのコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。

また、このプログラムを、インターネットなどのネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよく、インターネットなどのネットワーク経由で提供又は配布するように構成してもよい。

また、上記実施形態では、時系列データ分析装置１００を、所定の装置（部品）の品質管理や保守部門に用いる態様を説明したが、これに限らず、医療・健康・介護分野での健康診断データの時系列的な分析に用いることとしてもよいし、他の分野に係る時系列データの分析に用いることとしてもよい。

時系列データ分析装置１００の機能構成を示したブロック図である。履歴データ記憶部に格納されたデータの一例を示した図である。時不変データ記憶部に格納されたデータの一例を示した図である。図２に示した各データと、図３に示した各データとから生成された統合データの一例を示した図である。候補イベントシーケンスを模式的に表した図である。候補イベントシーケンスを模式的に表した図である。イベントシーケンス生成処理の手順を示したフローチャートである。部品Ａ１の使用頻度についてのイベントシーケンスを模式的に表した図である。イベントシーケンスの分岐を説明するための図である。予測モデル生成処理の手順を示したフローチャートである。予測結果出力処理の手順を示したフローチャートである。本実施形態の他の態様を説明するためのブロック図である。本実施形態の他の態様を説明するためのブロック図である。本実施形態の他の態様を説明するためのブロック図である。時系列データ分析装置のハードウェア構成を示したブロック図である。

符号の説明

１００時系列データ分析装置
１１履歴データ記憶部
１２時不変データ記憶部
１３データ統合部
１４統合データ記憶部
１５パラメータ入力部
１６イベントシーケンス生成部
１７予測モデル生成部
１８予測モデル記憶部
１９対象データ記憶部
２０時系列予測部
２１結果表示部
２２分析対象データ記憶部
２３センサ部
３１ＣＰＵ
３２ＲＯＭ
３３ＲＡＭ
３４記憶部
３５表示部
３６操作部
３７通信部
３８バス

Claims

複数の分析対象各々について時間経過に伴い発生した所定の事象を定量的に示した事象項目を、当該事象の発生に関係する要素の数値を示した浮動項目と、当該事象の発生日時とともに記録した履歴データと、前記分析対象に関する時不変の設定を示した１又は複数の時不変項目からなる時不変データとを、共通する分析対象について関連付けた統合データを記憶する第１記憶手段と、
前記分析対象毎にグループ化した前記統合データの組のうち、特定の分析対象についての統合データの組に含まれる前記浮動項目の数値範囲を拡大し、他の分析対象の各々についてグループ化した統合データの組に含まれる前記浮動項目の変化量を包含する前記数値範囲を表したイベントシーケンスを生成する第１生成手段と、
前記グループ化した統合データの各組を、当該統合データの組に含まれる前記浮動項目の変化量と、前記イベントシーケンスが表す数値範囲との包含関係に基づいて分類するとともに、共通する前記時不変項目に基づいて分類し、分類後の統合データの各組に含まれる前記事象項目の変化量と、当該変化量に至る所要時間とを表した予測対象イベントシーケンスを、前記分類に係る分類条件とともに前記イベントシーケンスに関連付けた予測モデルを生成する第２生成手段と、
前記予測モデルを記憶する第２記憶手段と、
を備えたことを特徴とする時系列データ分析装置。
前記第１生成手段は、前記第１記憶手段から、共通する分析対象毎に当該分析対象についての前記統合データを複数選択し、当該統合データを前記発生日時の順に並び替えてグループ化することを特徴とする請求項１に記載の時系列データ分析装置。
前記第１生成手段は、前記数値範囲の条件を満たす前記グループ化された分析対象の個数が、予め定められた個数以上となるまで前記数値範囲を段階的に拡大することを特徴とする請求項１又は２に記載の時系列データ分析装置。
前記第２生成手段は、前記イベントシーケンスをルートとする決定木分類モデルを用いて、前記予測対象イベントシーケンスを分類することを特徴とする請求項１〜３の何れか一項に記載の時系列データ分析装置。
前記第２生成手段は、葉ノードとなる前記予測対象イベントシーケンスが、予め定められた個数となるまで当該予測対象イベントシーケンスの分類を繰り返すことを特徴とする請求項４に記載の時系列データ分析装置。
前記第２生成手段は、前記分類した統合データの組毎に、当該統合データの組に含まれる前記事象項目間の発生日時の差を所要時間として算出し、前記統合データの各組における前記所要時間の統計値を前記所要時間とすることを特徴とする請求項１〜５の何れか一項に記載の時系列データ分析装置。
前記履歴データは、互いに異なる複数の要素についての前記浮動項目を含み、
前記第１生成手段は、前記浮動項目の要素毎に、前記イベントシーケンスを生成し、
前記第２生成手段は、前記イベントシーケンス毎に前記予測モデルを生成することを特徴とする請求項１〜６の何れか一項に記載の時系列データ分析装置。
前記第２記憶手段に記憶された予測モデルを表示する表示手段を更に備えたことを特徴とする請求項１〜７の何れか一項に記載の時系列データ分析装置。
予測対象についての前記履歴データ及び時不変データと、前記予測モデルでの前記分類条件とを比較し、最終的に到達する前記予測対象イベントシーケンスが表す事象項目の変化量と所要時間とを予測結果として導出する予測手段を更に備え、
前記表示手段は、前記導出された予測結果を表示することを特徴とする請求項１〜８の何れか一項に記載の時系列データ分析装置。
前記履歴データを記憶する第３記憶手段と、
前記時不変データを記憶する第４記憶手段と、
前記第３記憶手段に記憶された履歴データと、前記第４記憶手段に記憶された時不変データとを、当該履歴データ及び時不変データに含まれた共通する分析対象について統合する統合手段と、
を更に備え、
前記第１記憶手段は、前記統合手段により統合されたデータを記憶することを特徴とする請求項１〜９の何れか一項に記載の時系列データ分析装置。
時系列データ分析装置の時系列データ分析方法であって、
前記時系列データ分析装置は、複数の分析対象各々について時間経過に伴い発生した所定の事象を定量的に示した事象項目を、当該事象の発生に関係する要素の数値を示した浮動項目と、当該事象の発生日時とともに記録した履歴データと、前記分析対象に関する時不変の設定を示した１又は複数の時不変項目からなる時不変データとを、共通する分析対象について関連付けた統合データを記憶する第１記憶手段を備え、
第１生成手段が、前記分析対象毎にグループ化した前記統合データの組のうち、特定の分析対象についての統合データの組に含まれる前記浮動項目の数値範囲を拡大し、他の分析対象の各々についてグループ化した統合データの組に含まれる前記浮動項目の変化量を包含する前記数値範囲を表したイベントシーケンスを生成する第１生成工程と、
第２生成手段が、前記グループ化した統合データの組を、当該統合データの組に含まれる前記浮動項目の変化量と、前記イベントシーケンスが表す数値範囲との包含関係に基づいて分類するとともに、共通する前記時不変項目に基づいて分類し、分類後の統合データの各組に含まれる前記事象項目の変化量と、当該変化量に至る所要時間とを表した予測対象イベントシーケンスを、前記分類に係る分類条件とともに前記イベントシーケンスに関連付けた予測モデルを生成する第２生成工程と、
記憶制御手段が、前記予測モデルを第２記憶手段に記憶する記憶制御工程と、
を含むことを特徴とする時系列データ分析方法。
複数の分析対象各々について時間経過に伴い発生した所定の事象を定量的に示した事象項目を、当該事象の発生に関係する要素の数値を示した浮動項目と、当該事象の発生日時とともに記録した履歴データと、前記分析対象に関する時不変の設定を示した１又は複数の時不変項目からなる時不変データとを、共通する分析対象について関連付けた統合データを記憶する第１記憶手段を備えたコンピュータに、
前記分析対象毎にグループ化した前記統合データの組のうち、特定の分析対象についての統合データの組に含まれる前記浮動項目の数値範囲を拡大し、他の分析対象の各々についてグループ化した統合データの組に含まれる前記浮動項目の変化量を包含する前記数値範囲を表したイベントシーケンスを生成する第１生成手段と、
前記グループ化した統合データの組を、当該統合データの組に含まれる前記浮動項目の変化量と、前記イベントシーケンスが表す数値範囲との包含関係に基づいて分類するとともに、共通する前記時不変項目に基づいて分類し、分類後の統合データの各組に含まれる前記事象項目の変化量と、当該変化量に至る所要時間とを表した予測対象イベントシーケンスを、前記分類に係る分類条件とともに前記イベントシーケンスに関連付けた予測モデルを生成する第２生成手段と、
前記予測モデルを第２記憶手段に記憶する記憶制御手段と、
して機能させることを特徴とする時系列データ分析プログラム。