JP2009282926A - 時系列データ分析装置、方法及びプログラム - Google Patents

時系列データ分析装置、方法及びプログラム Download PDF

Info

Publication number
JP2009282926A
JP2009282926A JP2008137120A JP2008137120A JP2009282926A JP 2009282926 A JP2009282926 A JP 2009282926A JP 2008137120 A JP2008137120 A JP 2008137120A JP 2008137120 A JP2008137120 A JP 2008137120A JP 2009282926 A JP2009282926 A JP 2009282926A
Authority
JP
Japan
Prior art keywords
time
data
event
analysis
event sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008137120A
Other languages
English (en)
Inventor
Ken Ueno
研 植野
Ryohei Orihara
良平 折原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008137120A priority Critical patent/JP2009282926A/ja
Priority to US12/470,950 priority patent/US20090292662A1/en
Publication of JP2009282926A publication Critical patent/JP2009282926A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Computational Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Marketing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Development Economics (AREA)
  • Algebra (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】予測対象について発生する事象の時系列的な変化の度合いと、その変化に至る所要時間とを推定することが可能な分類モデルを生成する時系列データ分析装置、方法及びプログラムを提供する。
【解決手段】分析対象毎にグループ化した履歴データと時不変データとからなる統合データの組を、当該統合データの組に含まれる浮動項目の変化量と、イベントシーケンスが表す数値範囲との包含関係に基づいて分類するとともに、共通する時不変項目に基づいて分類し、分類後の統合データの各組に含まれる事象項目の変化量と、当該変化量に至る所要時間とを表した予測対象イベントシーケンスを、前記分類に係る分類条件とともに前記イベントシーケンスに関連付けた予測モデルを生成する。
【選択図】 図9

Description

本発明は、時系列データを分析する時系列データ分析装置、方法及びプログラムに関する。
従来、時間経過に伴って変化するデータを時系列的に分析する技術が種々存在している。例えば、特許文献1には、プロセスを構成する各プロセスステップが実行されている期間中に時系列に取得される時系列に取得されるプロセスの状態に関連するプロセス状態情報と、そのプロセスで処理された対象品についての検査結果情報とを入力し、プロセス特徴量と検査結果との関係を表すモデルを作成する技術が開示されている。
特開2007−258731号公報
上記した従来技術のように、時系列データを分析する装置は種々存在するが、予測対象について発生する事象の時系列的な変化の度合いと、その変化に至る所要時間とを機械的に推定する十分に効果的な装置はいまだ提供されているとは言えない。例えば、装置等の保守分野では、部品の経年劣化を記録した検査データが各種データベースに蓄積されているが、部品の修復履歴や使用頻度、用途の違いなどが複雑に絡み合った複合的な要因を考慮しなければ、部品の経年劣化を予測することは困難である。上記した従来技術での時系列分析では、複合的な要因が明らかでなくとも、定量的な解析により予測値を推定することが可能であるが、予測モデルを人間が解釈することは困難であり、それが納得のいく根拠や理由で推定されているとは言い難い。
また、医療や介護分野で用いられる定期的な健康診断データにおいても、各人によって身体状態は異なり、また、アルコール摂取頻度や運動習慣、食習慣なども異なるため、これらの複合的な要因を考慮したうえで、医療関係者は生活習慣改善策を提示すれば効果的な健康指導が可能となると考えられる。例えば、中性脂肪の値を改善するような場合には、上記した複数の要因についての効果的な改善策を、理にかなった組み合わせで判断した上で、アルコールは少ししか控えることができないが、運動頻度を1.5倍にすることで2年後に中性脂肪を正常範囲にまで戻すことができるといった、データ分析による検証に基づいて改善策を出すことが考えられる。介護分野では、心身状態や介護サービスの変化がどのように要介護度の変化と関係しているか、また、心身状態変化がどのように要介護度の変化に対応しているかといった分析結果に基づき、介護サービスを提供すべきである。しかしながら、上記従来技術でこのような推定を行うことは困難であった。
本発明は上記に鑑みてなされたものであって、予測対象について発生する事象の時系列的な変化の度合いと、その変化に至る所要時間とを推定することが可能な分類モデルを生成する時系列データ分析装置、方法及びプログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、複数の分析対象各々について時間経過に伴い発生した所定の事象を定量的に示した事象項目を、当該事象の発生に関係する要素の数値を示した浮動項目と、当該事象の発生日時とともに記録した履歴データと、前記分析対象に関する時不変の設定を示した1又は複数の時不変項目からなる時不変データとを、共通する分析対象について関連付けた統合データを記憶する第1記憶手段と、前記分析対象毎にグループ化した前記統合データの組のうち、特定の分析対象についての統合データの組に含まれる前記浮動項目の数値範囲を拡大し、他の分析対象の各々についてグループ化した統合データの組に含まれる前記浮動項目の変化量を包含する前記数値範囲を表したイベントシーケンスを生成する第1生成手段と、前記グループ化した統合データの各組を、当該統合データの組に含まれる前記浮動項目の変化量と、前記イベントシーケンスが表す数値範囲との包含関係に基づいて分類するとともに、共通する前記時不変項目に基づいて分類し、分類後の統合データの各組に含まれる前記事象項目の変化量と、当該変化量に至る所要時間とを表した予測対象イベントシーケンスを、前記分類に係る分類条件とともに前記イベントシーケンスに関連付けた予測モデルを生成する第2生成手段と、前記予測モデルを記憶する第2記憶手段と、を備える。
また、本発明は、時系列データ分析装置の時系列データ分析方法であって、前記時系列データ分析装置は、複数の分析対象各々について時間経過に伴い発生した所定の事象を定量的に示した事象項目を、当該事象の発生に関係する要素の数値を示した浮動項目と、当該事象の発生日時とともに記録した履歴データと、前記分析対象に関する時不変の設定を示した1又は複数の時不変項目からなる時不変データとを、共通する分析対象について関連付けた統合データを記憶する第1記憶手段を備え、第1生成手段が、前記分析対象毎にグループ化した前記統合データの組のうち、特定の分析対象についての統合データの組に含まれる前記浮動項目の数値範囲を拡大し、他の分析対象の各々についてグループ化した統合データの組に含まれる前記浮動項目の変化量を包含する前記数値範囲を表したイベントシーケンスを生成する第1生成工程と、第2生成手段が、前記グループ化した統合データの組を、当該統合データの組に含まれる前記浮動項目の変化量と、前記イベントシーケンスが表す数値範囲との包含関係に基づいて分類するとともに、共通する前記時不変項目に基づいて分類し、分類後の統合データの各組に含まれる前記事象項目の変化量と、当該変化量に至る所要時間とを表した予測対象イベントシーケンスを、前記分類に係る分類条件とともに前記イベントシーケンスに関連付けた予測モデルを生成する第2生成工程と、記憶制御手段が、前記予測モデルを第2記憶手段に記憶する記憶制御工程と、を含む。
また、本発明は、複数の分析対象各々について時間経過に伴い発生した所定の事象を定量的に示した事象項目を、当該事象の発生に関係する要素の数値を示した浮動項目と、当該事象の発生日時とともに記録した履歴データと、前記分析対象に関する時不変の設定を示した1又は複数の時不変項目からなる時不変データとを、共通する分析対象について関連付けた統合データを記憶する第1記憶手段を備えたコンピュータに、前記分析対象毎にグループ化した前記統合データの組のうち、特定の分析対象についての統合データの組に含まれる前記浮動項目の数値範囲を拡大し、他の分析対象の各々についてグループ化した統合データの組に含まれる前記浮動項目の変化量を包含する前記数値範囲を表したイベントシーケンスを生成する第1生成手段と、前記グループ化した統合データの組を、当該統合データの組に含まれる前記浮動項目の変化量と、前記イベントシーケンスが表す数値範囲との包含関係に基づいて分類するとともに、共通する前記時不変項目に基づいて分類し、分類後の統合データの各組に含まれる前記事象項目の変化量と、当該変化量に至る所要時間とを表した予測対象イベントシーケンスを、前記分類に係る分類条件とともに前記イベントシーケンスに関連付けた予測モデルを生成する第2生成手段と、前記予測モデルを第2記憶手段に記憶する記憶制御手段と、して機能させる。
本発明によれば、分析対象の各々ついてグループ化した統合データの各組を、イベントシーケンスが表す数値範囲との包含関係に基づいて分類するとともに、共通する時不変項目に基づいて分類し、分類後の統合データの各組に含まれる事象項目の変化量と、当該変化量に至る所要時間とを表した予測対象イベントシーケンスを、分類条件とともに前記イベントシーケンスに関連付けて予測モデルを生成するため、当該予測モデルを用いることで、予測対象となる予測対象について発生する事象の時系列的な変化の度合いと、その変化に至る所要時間とを推定することができる。
以下に添付図面を参照して、時系列データ分析装置、方法及びプログラムの最良な実施形態を詳細に説明する。なお、以下では、所定の装置を構成する部品の経年的な金属疲労についての時系列データの分析に、本願発明にかかる時系列データ分析装置、方法及びプログラムを適用した例について説明するが、分析対象となる時系列データはこの例に限らないものとする。
図1は、本実施形態にかかる時系列データ分析装置100の機能構成を示したブロック図である。同図に示したように、時系列データ分析装置100は、履歴データ記憶部11と、時不変データ記憶部12と、データ統合部13、統合データ記憶部14、パラメータ入力部15と、イベントシーケンス生成部16と、予測モデル生成部17と、予測モデル記憶部18と、対象データ記憶部19と、時系列予測部20と、結果表示部21とを備えている。
履歴データ記憶部11は、後述する記憶部34に設けられたデータベース等であって、部品名(保守分野の場合)や心身状態(医療・介護分野の場合)等の分析対象について時間経過に伴い発生した事象を定量的に示した事象項目を、当該事象の発生に関係する定量的な数値を示した浮動項目と、当該事象の発生日時とともに記録した履歴データを記憶する。具体的には、分析対象となる各部品について、金属疲労の度合い(Level1〜3)と、当該金属疲労発生の要素となる月当りの使用頻度と、その修復日とを履歴データとして関連付けて記憶している。
図2は、履歴データ記憶部11に格納された履歴データの一例を示した図である。同図に示したように、履歴データは、分析対象となる各部品について、時間経過に伴い発生した金属疲労(事象)を定量的に示したLevel1〜3と、当該金属疲労発生の要素となる月当りの使用頻度(浮動項目)と、この事象の発生日時に対応する修復日とから構成されている。なお、履歴データは、図2の例に限定されないものとする、例えば、事象の発生に関係する浮動項目が複数種類存在するような場合には、これら複数種類の浮動項目を含むこととしてもよい。
時不変データ記憶部12は、後述する記憶部34に設けられたデータベース等であって、履歴データ記憶部11に記憶された各分析対象に関する時不変のデータ項目(時不変項目)を格納している。図3は、時不変データ記憶部12に格納されたデータ(時不変データ)の一例を示した図である。同図に示したように、時不変データは、図2に示した各部品(A1、A2、A3…)に関する時不変項目として、設置場所や材質等を関連付けて記憶している。なお、時不変データは、図3の例に限定されないものとする。
データ統合部13は、履歴データ記憶部11及び時不変データ記憶部12に格納されたデータを、共通する分析対象(部品名)について結合することで、一つの統合データを生成し、統合データ記憶部14に記憶する。
図4は、図2に示した履歴データ記憶部11の各データと、図3に示した時不変データ記憶部12の各データとから生成された統合データの一例を示した図である。図4に示したように、統合データは、履歴データ記憶部11に記憶された履歴データと、時不変データ記憶部12に記憶された時不変データとが、共通する部品名について統合されており、部品毎にその使用頻度(回/月)と、接地場所と、材質と、修復日と、金属疲労とが関連付けられている。
統合データ記憶部14は、後述する記憶部34に設けられたデータベース等であって、データ統合部13により生成された統合データを格納する。
パラメータ入力部15は、イベントシーケンス生成部16、予測モデル生成部17での処理に用いるパラメータとして、変化粒度と、予測対象項目と、最小事例数とをイベントシーケンス生成部16及び予測モデル生成部17に入力する。
ここで「変化粒度」とは、後述する緩和範囲の拡大量を指定するパラメータである。また、「予測対象項目」は、統合データに含まれた各項目(使用頻度、設置場所、材質、修復日、金属疲労)のうち、後述する予測モデルにおいて予測の対象とする項目を指定するためのパラメータである。また、「最小事例数」とは、後述する決定木分類モデルで分類した葉ノードの最小値を指定するためのパラメータである。
なお、変化粒度、予測対象項目及び最小事例数の各パラメータが後述する記憶部34等に予め記憶されている場合、パラメータ入力部15は記憶部34から各パラメータを読み出し、イベントシーケンス生成部16及び予測モデル生成部17に入力する。また、これら各パラメータが後述する操作部36や通信部37を介して入力される場合、パラメータ入力部15は入力された各パラメータをイベントシーケンス生成部16及び予測モデル生成部17に夫々入力する。
イベントシーケンス生成部16は、パラメータとして変化粒度と予測対象項目とを入力とし、同一の部品名(分析対象)についての統合データを少なくとも2つ選択することでこれらをグループ化する。また、イベントシーケンス生成部16は、グループ化した統合データを、当該統合データに含まれた履歴データの修復日に基づいて時系列順に並び替える。また、イベントシーケンス生成部16は、グループ化した統合データの組(以下、チャンクという)のうち、特定の部品のチャンクについて、このチャンクに含まれる浮動項目の数値範囲を順次拡大することで、この数値範囲を表した候補イベントシーケンスを生成する。
以下、図4に示した統合データに基づいて、候補イベントシーケンスの生成について説明する。なお、パラメータ入力部15からは、変化粒度として“粒度=50”が、予測対象項目として“金属疲労”と“修復日”とが指定されたとする。
まず、イベントシーケンス生成部16は、統合データ記憶部14に格納された統合データの1つの部品に着目すると、この部品についてのエントリに含まれた数値を含む項目(浮動項目)を左から順に選択する。次に、イベントシーケンス生成部16は、選択した項目の値が時間軸上で変化するよう統合データを時間経過順に並べる。
図4の統合データの場合、部品A1に着目すると、2007/06の時点では使用頻度が300回/月であったのに対し、2008/01の時点では使用頻度が600回/月に変化している。そのため、イベントシーケンス生成部16は、これらデータの組を時間経過順に並べ直す。なお、図4の統合データでは、同一の部品について時間経過順に並べ直した後の状態を示している。
続いて、イベントシーケンス生成部16は、時間経過順に並べ直した同一部品についてのデータの組(以下、チャンクという)を、パラメータ入力部15から入力された変化粒度を用いることで使用頻度の範囲を拡大し、候補イベントシーケンスを生成する。具体的には、下記式(1)を用いて使用頻度の範囲を拡大する。ここで、xはデータチャンクに含まれた各使用頻度が代入される変数を意味し、λは変化粒度を意味し、Φは後述する範囲拡大処理においてインクリメントされる変数(初期値は0)を意味する。以下、下記式(1)により算出された使用頻度の範囲を「緩和範囲」Rという。
R=[x−λ×Φ, x+λ×Φ] (1)
部品A1についてのチャンクでは、使用頻度は“300”と“600”であるため、変化粒度=50、Φ=0の条件で上記式(1)を算出すると、x=300についての使用頻度(緩和範囲)は300(回/月)となり、x=600についての使用頻度(緩和範囲)は600(回/月)となる。つまり、初回すなわちΦ=0の場合は範囲による緩和はなく、使用頻度そのものでまずは他のデータがこの条件に当てはまっているかどうかを判定することになる。
図5は、緩和範囲300(回/月)、600(回/月)の候補イベントシーケンスを模式的に表した図である。同図において、Eは候補イベントシーケンスを表しており、使用頻度(緩和範囲)300(回/月)についてのノードと、使用頻度(緩和範囲)600(回/月)についてのノードから構成されている。また、図中矢印は、各ノードの時間的な前後関係を示しており、時間経過に伴い、矢印元のノードから矢印先のノードに状態が変化したことを意味している。以下、矢印元のノードを「開始ノード」と呼び、矢印先のノードを「終了ノード」と呼ぶ。また、各ノードにおける緩和範囲を、単に、開始ノードの範囲、終了ノードの範囲という。
1つの部品について候補イベントシーケンスを生成すると、イベントシーケンス生成部16は、この候補イベントシーケンスの緩和範囲(開始ノードの範囲、終了ノードの範囲)に該当する記録データを持つチャンク(部品)が、当該候補イベントシーケンスの生成元となったチャンク以外に、統合データ中に1つ以上あるか否かを判定する。なお、図5の候補イベントシーケンスの場合、イベントシーケンス生成部16は、部品A1以外に使用頻度が300回/月から600回/月に変化する部品は存在しないと判定する。
候補イベントシーケンスの生成元となった部品以外に、当該候補イベントシーケンスに該当する部品が存在しないと判定した場合、イベントシーケンス生成部16は、Φの値を1インクリメントすることで緩和範囲を段階的に拡大し、この候補イベントシーケンスの緩和範囲の条件と、各チャンクに含まれた使用頻度との比較を再度行う。
なお、Φ=1とした場合、x=300については使用頻度250〜350(回/月)の緩和範囲となり、x=600については使用頻度550〜650(回/月)の緩和範囲となる。図6は、この場合の候補イベントシーケンスを模式的に表した図である。図6の候補イベントシーケンスEの場合においても、部品A1以外に緩和範囲が250〜350回/月から550〜650回/月に変化するチャンクは存在しないため、イベントシーケンス生成部16は、Φ=2とし、緩和範囲をさらに拡大する。なお、候補イベントシーケンスの生成元となったチャンク以外に、当該候補イベントシーケンスに該当するチャンクが1以上存在すると判定した場合、イベントシーケンス生成部16は、この候補イベントシーケンスをイベントシーケンスとして採用(生成)する。以下、図7のフローチャートを参照して、上記したイベントシーケンスの生成にかかるイベントシーケンス生成部16の動作について説明する。
図7は、イベントシーケンス生成処理の手順を示したフローチャートである。なお、本処理の前提として、統合データに含まれる各部品についてグループ化が行われているものとする。
まず、イベントシーケンス生成部16は、統合データ中の各項目を選択する際の指標となるインデックスiを0に初期化する(ステップS11)。続いて、イベントシーケンス生成部16は、統合データ記憶部14に格納された統合データのうち、1つの部品(チャンク)を処理対象とすると、この部品についてのエントリのうち数値を含んだ項目aiを選択する(ステップS12)。ここで、aiはエントリ内での数値を含んだ項目のうち、i番目の項目を意味する。なお、ステップS12で項目を選択する際には、エントリの左側から順次選択することとしてもよいし、右側から順次選択することとしてもよい。
次に、イベントシーケンス生成部16は、ステップS12で選択した項目aiについての変化粒度λiをパラメータ入力部15から受け付けると(ステップS13)、上記式(1)を計算するためΦ=0を設定する(ステップS14)。
続いて、イベントシーケンス生成部16は、上記式(1)に基づいて処理対象のチャンクに含まれる項目aiについての緩和範囲を、Fromj=xj−(Φ×λi)、Toj=xj+(Φ×λi)として算出する(ステップS15)。ここで、添字のjは時系列的に前後する項目aiについての緩和範囲を識別するためのインデックスである。例えば、部品A1についてのチャンクの場合、修復日2007/06のデータに含まれる項目aiについての緩和範囲、即ち開始ノードの範囲はFrom1=x1−(Φ×λi)〜To1=x1+(Φ×λi)で表される。また、修復日2008/01のデータに含まれる項目aiについての緩和範囲、即ち終了ノードの範囲はFrom2=x2−(Φ×λi)〜To2=x2+(Φ×λi)で表される。
イベントシーケンス生成部16は、ステップS15での算出結果から得られた、開始ノードのTo1と、終了ノードのFrom2とを比較し、To1<From2であるか否かを判定することで、時系列的な前後関係に矛盾が生じているか否かを判断する(ステップS16)。ここで、To1≧From2と判定した場合、つまり時系列的な前後関係に矛盾が生じていると判断した場合には(ステップS16;No)、ステップS21の処理に移行する。
ステップS16において、To1<From2と判定した場合、つまり時系列的な前後関係に矛盾が生じないと判断すると(ステップS16;Yes)、イベントシーケンス生成部16は、ステップS15の算出結果を仮のイベントシーケンスの条件とし、この条件を満たすチャンク(部品)の数(頻度f)がいくつあるかをカウントする(ステップS17)。続いて、イベントシーケンス生成部16は、ステップS17でカウントしたfの値が1より大きいかどうかを判定する(ステップS18)。
なお、部品A1のチャンクついての項目aiが使用頻度の場合、Φ=0の時点では、From1=300、To1=300、From2=600、To2=600となるため、ステップS16において矛盾が生じないと判定される。この場合、部品A1以外の部品では、上記の条件を満たすものはないことから、イベントシーケンス生成部16はステップS17においてf=1とカウントする。またこのとき、f>1を満たさないため、イベントシーケンス生成部16は続くステップS18の条件を満たせず(ステップS18;No)、ステップS19の処理に移行する。
ステップS19では、イベントシーケンス生成部16が、Fromjの値をpFromjに代入するとともに、Tojの値をpTojに代入する(ステップS19)。続いて、イベントシーケンス生成部16は、Φの値を1インクリメントし(ステップS20)、ステップS15の処理に再び戻る。
部品Aのチャンクついての項目aiが使用頻度の場合、Φ=0+1とし、Φ=1の時点での緩和範囲の計算を行うと、From1=250、To1=350、From2=550、To2=650となる。この場合、To1=350<From2=550であるため、ステップS16において時系列的な前後関係に矛盾は生じないと判定される。イベントシーケンス生成部16は、この緩和範囲を候補イベントシーケンスの条件とすると、ステップS17で、この候補イベントシーケンスの条件を満たすチャンクがいくつあるかを数え上げる。この場合もx1=300、x2=600である部品A1のみが該当し、頻度はf=1であるため、ステップS18;No→S20の処理を行った後、ステップS15に再び戻る。
ステップS20において、Φ=1+1とした場合、ステップS15での算出結果は、From1=200、To1=400、From2=500、To2=700となるため、ステップS16では矛盾が生じないと判定される。また、今回は緩和範囲を広げたため、部品A1だけでなく部品A3のチャンクもこの候補イベントシーケンスの条件に当てはまるので、ステップS17でカウントされる頻度fは2となる。なお、この場合にはf>1であるため(ステップS18;Yes)、ステップS21に移行する。
イベントシーケンス生成部16は、ステップS21において、pFromjの値をFromjに、pTojの値をTojに夫々代入し、項目aiについてのイベントシーケンスを生成する(ステップS21)。続いて、イベントシーケンス生成部16は、処理対象とした部品についてのエントリのうち、数値を含んだ全ての項目を選択したか否かを判定し、未選択の項目が存在すると判定した場合には(ステップS22;No)、iの値を1インクリメントし(ステップS23)、ステップS12で次の項目を選択する。
一方、ステップS22において、数値を含んだ全ての項目を選択したと判定した場合には(ステップS22;Yes)、本処理を終了する。上記の処理を行うことで、処理対象とした部品に対し、数値を含んだ全ての項目についてのイベントシーケンスが生成される。
なお、イベントシーケンスの生成対象となるチャンクは、予め定められていることとしてもよいし、ランダムに選択する態様としてもよい。また、各チャンクについて夫々イベントシーケンスを生成する態様としてもよい。
図1に戻り、予測モデル生成部17は、イベントシーケンス生成部16で生成されたイベントシーケンスと、統合データ記憶部14の統合データに含まれた時不変の項目とを構成要素とし、予測対象の将来の状態を予測するための予測モデルを生成する。以下、決定木により分類モデルを用いた予測モデルの生成例について説明する。
まず、予測モデル生成部17は、統合データ中のすべてのデータに対して、イベントシーケンス生成部16で生成されたイベントシーケンスの条件を満たしているか否かをテストする。ここで、予測モデル生成部17は、条件に該当すると判定した場合にはこのイベントシーケンスのノードの左下、該当しないと判定した場合にはイベントシーケンスのノードの右下に部品集合を分けていく。
図8は、上述した、部品A1の使用頻度についてのイベントシーケンスを模式的に表した図である。ここで、イベントシーケンスE1の開始ノードは使用頻度200〜400回/月の緩和範囲を有し、終了ノードは使用頻度500〜700回/月の緩和範囲を有している。この場合、予測モデル生成部17は、開始ノードの範囲及び終了ノードの範囲に該当するチャンクとして部品A1、A3を特定し、該当しないチャンクとして部品A2を特定する。
パラメータ入力部15から予測対象の項目として金属疲労と、修復日とが指定されているため、予測モデル生成部17は、このイベントシーケンスのノードの左下に部品A1、A3の金属疲労に関するノードE2を、右下に部品A2の金属疲労に関するノードE3を夫々配置する。以下、予測対象項目についてのノードを予測対象イベントシーケンスという。
また、予測モデル生成部17は、各予測対象イベントシーケンスにおいて、金属疲労の状態が変化するのに要した時間情報を夫々算出し、対応する予測対象イベントシーケンスに付与する。ここで、「変化に要した時間情報」とは、各分岐先の予測対象の各部品が要した時間の平均値や中央値、最頻値などの統計値を算出し、更にこれらの値の統計値を算出したものを境界値とした所要時間のことを意味する。
なお、図8では、具体例として平均値を統計値とした場合の例を示している。この場合、予測対象イベントシーケンスE2での金属疲労の変化の所要時間は、図4に示した統合データにおける部品A1、部品A3夫々についての修復日間隔7ヶ月と5ヶ月を平均した6ヶ月である。また、予測対象イベントシーケンスE3での金属疲労の変化の所要時間は、図4に示した統合データにおける部品A2についての修復日間隔15ヶ月である。そのため、予測対象イベントシーケンスE2とE3との間の境界値は、6ヶ月と15ヶ月との平均値10.5ヶ月となる。そのため、予測モデル生成部17は、これらの境界値を時間情報とし、予測対象イベントシーケンスE2に「10.5ヶ月未満」を、予測対象イベントシーケンスE3に「10.5ヶ月以上」を夫々付与する。なお、ここではE2とE3は、ともに、金属疲労レベル1から金属疲労レベル3の変化を表すイベントシーケンスとなっているが、ここは、データによっては、E2は金属疲労レベル1から金属疲労レベル3でE3は金属疲労レベル2から金属疲労レベル3となる可能性もある。その場合は、それぞれのレベルの変化に応じて当てはまるデータを使って各平均を計算し、それぞれE2とE3の時間情報として付与する。
次に、予測モデル生成部17は、パラメータ入力部15から入力された最小事例数に基づいて、分岐させたイベントシーケンスを更に分岐させることが可能か否かを判定する。ここで、図8に示した、予測対象イベントシーケンスE2の部品A1、部品A3についての他の項目を参照すると、これらの部品は材質がスチールで同一であるが、設置場所が異なっていることが分かる(図4参照)。また、このとき、パラメータ入力部15から入力された最小事例数が“1”だとすると、予測モデル生成部17は、左下のノードには、部品A1と部品A3の2つの部品が分類されているため、これらの設置場所についてさらに分割することが可能であると判断する。
ここで、設置場所の項目自体は、時不変の項目であるが、本実施形態の特徴として、履歴データだけでなく時不変項目をも予測モデルに含めることが可能となっている。ただし、より汎用的な決定木モデルを生成する目的で、最終的な分岐先に辿り着いたときの部品集合の最小事例数を2に制限するような場合には、これ以上の項目追加を行わないものとしてもよい。設置場所の項目について更に予測モデルを詳細化する場合、図9に示したように、該当する予測対象イベントシーケンス上部、つまりこの場合はイベントシーケンスE1の左下に設置場所についてのノードE21を配置し、このノードE21から部品A3の金属疲労についての予測対象イベントシーケンスE22と、部品A1の金属疲労についての予測対象イベントシーケンスE23とを分岐する。
また、予測モデル生成部17は、先と同様に、分岐させたイベントシーケンス間の境界値を算出し、時間情報として各検索対象イベントシーケンスに付与する。なお、図9の構成の場合、左下に分岐された予測対象イベントシーケンスE22での金属疲労の変化の所要時間は、図4に示した統合データにおける部品A3についての修復日間隔5ヶ月である。また、中央下に分岐された予測対象イベントシーケンスE23での金属疲労の変化の所要時間は、図4に示した統合データにおける部品A1についての修復日間隔7ヶ月である。そのため、予測対象イベントシーケンスE22とE23との間の境界値は、5ヶ月と7ヶ月との平均値6ヶ月となる。また、右下に分岐されている予測対象イベントシーケンスE3での金属疲労の変化の所要時間は、図4に示した統合データにおける部品A2についての修復日間隔15ヶ月であるため、予測対象イベントシーケンスE23とE3との間の境界値は、7ヵ月と15ヵ月の平均値11ヵ月となる。
このように生成された決定木(予測モデル)を用いて新たなデータの将来値を予測するには、この決定木の最上位のノードE1から予測対象となる部品データを入力し、各分岐項目で指定された条件に基づいてノードを辿っていくことで、最終的に辿り着く予測対象イベントシーケンスから、予測対象の項目についての将来の状態(図9の場合、金属疲労とその状態に至るまでのおおよその所要時間)を推定することができる。なお、本実施形態の場合での予測モデルの生成にかかる予測モデル生成部17の動作は、図10のようになる。以下、図10を参照して、予測モデル生成部17の動作について説明する。
図10は、予測モデル生成部17により実行される予測モデル生成処理の手順を示したフローチャートである。まず、予測モデル生成部17は、現在位置をルートに設定する(ステップS31)。ここで、「ルート」とは予測モデルを構成する決定木のルートノードを意味し、具体的には、イベントシーケンス生成部16により生成されたイベントシーケンスのノードである。続いて、予測モデル生成部17は、統合データに含まれたイベントシーケンスまたは時不変項目の候補集合、即ち、各部品についてのチャンクから項目biを選択すると(ステップS32)、これら項目biについてのデータ集合Dと、項目biについてのイベントシーケンス(ルートノード)から分割情報量を算出する(ステップS33)。ここで、分割情報量(利得比、Gain_Ratio)は例えば下記式(2)で算出することができる。
Figure 2009282926
上記式(2)において、Bは項目を表し、XはBについてのデータ集合を表している。また、vは任意の項目の値を表し、Val(B)はBがとりうる全ての値の集合を表す。このVal(B)の値が数値の場合、上述した境界値を用い、候補集合をイベントシーケンスとして幾つかのグループに分けることで現在位置から分岐し、分岐したグループが示す値の範囲を1つの項目とみなす。XvはA=vで分割された分岐先にあるイベントシーケンスのデータ集合を示している。また、|Xv|はデータ集合Xvに含まれるデータ数を表す。Cは最終ノードにくる予測対象項目を示し、jはこの予測対象項目のとる値の種類数を表す。
なお、上記式(2)において、Gain(B,X)はBの利得、つまり分岐項目Bを配置する前と後とでどれくらい情報量(不確実性)が減ったかを示す指標であって、下記式(3)〜(5)により導出される。金属疲労の例の場合には、イベントシーケンス生成部16で生成された図8のE2、E3、図9のE21、E22、E23が、下記式(5)のCに相当する。
Figure 2009282926
予測モデル生成部17は、イベントシーケンス生成部16により生成されたイベントシーケンスの項目も含め、全項目は上記式(2)により得られる分割情報量Gain_Ratio(B,X)で評価する。
続いて、予測モデル生成部17は、統合データに含まれた全ての項目についてステップS33の処理を実行したか否を判定する(ステップS34)。ここで、未処理の項目が存在すると判定した場合(ステップS34;No)、予測モデル生成部17は、iの値を1インクリメントした後(ステップS35)、ステップS32に再び戻ることで、次の項目を処理の対象とする。
一方、ステップS34において、全ての項目についてステップS33の処理を実行したと判定した場合(ステップS34;Yes)、予測モデル生成部17は、ステップS33で算出した分割情報量のうち、分割情報量が最も大きい項目を分岐項目として採用し、この分岐項目のノードを現在位置に配置する(ステップS36)。
次いで、予測モデル生成部17は、何れかの予測対象イベントシーケンスにおいて、条件を満たすデータ集合数、即ち、条件を満たすチャンク数が最小事例数未満でないと判定した場合(ステップS37;No)、その分岐項目の全ての分岐先について新たにデータ集合ならびに現在位置を更新し、ステップS36で採用した分岐項目を候補集合から取り除く(ステップS38)。そして、予測モデル生成部17は、項目biの下位の分岐先について当該項目biの条件に該当するデータ集合をDとし、現在位置を分岐先ノードに更新した後(ステップS39)、ステップS32の処理に再び戻る。
予測モデル生成部17は、このような処理を再帰的に繰り返し、全ての項目を分岐項目として試し終わるか、分岐先のデータ集合に含まれるデータ数が最小事例数未満となるまで、ステップS32〜S39の処理を繰り返す。また、予測モデル生成部17は、ステップS37において、全ての項目を分岐項目として試し終わるか、又は、分岐先のデータ集合に含まれるデータ数が最小事例数未満と判定した場合(ステップS37;Yes)、現在までに配置された分岐項目とその位置を予測モデルとして出力し(ステップS40)、本処理を終了する。
なお、分割情報量が等しい分岐項目があった場合には複数の可能性を残しておき、複数の予測モデルを出力することとする。そうでない場合には、1つのモデルが生成される。予測モデル生成部17は、各項目biについての予測モデルを生成後、全てのデータ集合をどれだけ正確に分類予測できたかどうかを、例えば下記式(6)を用いることで各予測モデルの評価を行う。
精度=予測を誤ったデータ数/全データ数 (6)
評価尺度は、精度や再現率、適合率等が考えられるが、式(6)では最も単純な精度の場合を取り上げている。予測モデル生成部17により生成された予測モデルと、その評価結果の値とは予測モデル記憶部18に格納される。なお、予測モデル生成部17により複数の予測モデルが生成された場合、結果表示部21において、例えば予測モデルの精度が高い順に予測モデルを表示してもよい。
予測モデル記憶部18は、後述する記憶部34が備えるデータベース等であって、予測モデル生成部17により生成された予測モデルと、その評価結果の値とを関連付けて記憶する。
対象データ記憶部19は、予測の対象となる所定の予測対象についてのデータを格納する。この対象データ記憶部19には、例えば、予測対象となる部品と、その部品についての履歴データ(使用頻度(回/月)、修復日、金属疲労等)や、時不変データ(設定場所、材質等)が格納される。
時系列予測部20は、対象データ記憶部19に格納された予測対象についてのデータを入力とし、予測モデル記憶部18に記憶された予測モデルを用いることで、この予測対象について予測の対象となった所定の項目についての将来の状態を予測する。例えば、予測対象として、新たに部品A5が入力された場合に、回帰式などの方法で過去の傾向から使用頻度が500から700回/月に変わりそうだと予測されると、この部品A5の設置場所が内陸部で、材質がアルミ合金、修復日が2007/04/01であれば、金属疲労が6ヵ月以上、11ヵ月未満、つまり、2007年10月から2008年3月に起こることを指示した情報を予測結果として導出する。なお、これは図9における中央下の分岐先ノード(予測対象イベントシーケンスE23)に辿り着くことを示しており、部品A1と同様の結果が予測されることを意味している。
結果表示部21は、時系列予測部20により予測モデルから導出された予測結果を、後述する表示部35に表示する。また、結果表示部21は、後述する操作部36を介したユーザからの操作に応じて、予測モデル記憶部18に記憶された予測モデルを、表示部35に表示する。なお、予測モデル記憶部18に複数の予測モデルが記憶されている場合には、例えば、予測モデルの精度が高い順に表示することとしてもよい。
また、結果表示部21は、後述する操作部36を介した操作に応じて、予測モデルに含まれた予測対象イベントシーケンスに対応するデータ集合(チャンク)を、統合データ記憶部14から読み出し、表示部35に表示する。
ここで、図11は、時系列予測部20と結果表示部21とにより実行される、予測結果の出力にかかる処理(予測結果出力処理)の手順を示したフローチャートである。まず、時系列予測部20は、対象データ記憶部19から予測対象のデータを取得すると(ステップS51)。続いて、時系列予測部20は、予測モデル記憶部18に記憶された予測モデルを参照し(ステップS52)、この予測モデルの最上位のノードから予測対象のデータに該当するノードを、各分岐項目で指定された条件に基づいて辿っていくことで、最終的に辿り着いたイベントシーケンスの項目を予測結果として導出する(ステップS53)。
なお、予測モデル記憶部18に複数の予測モデルが記憶されているような場合には、その評価結果の値がより高いものを用いる態様としてもよいし、他の予測モデル又は全ての予測モデルを用いることとしてもよい。また、上述したように、結果表示部21により表示された予測モデルに基づいて、ユーザから特定の予測モデルが選択されたような場合には、この選択された予測モデルを用いて予測結果を導出する態様としてもよい。
続いて、結果表示部21は、ステップS53で導出された予測結果を後述する表示部35に表示し(ステップS54)、本処理を終了する。
以上のように、本実施形態によれば、分析対象の各々ついてグループ化した統合データの各組を、イベントシーケンスが表す数値範囲との包含関係に基づいて分類するとともに、共通する時不変項目に基づいて分類し、分類後の統合データの各組に含まれる事象項目の変化量と、当該変化量に至る所要時間とを表した予測対象イベントシーケンスを、分類条件とともに前記イベントシーケンスに関連付けて予測モデルを生成するため、当該予測モデルを用いることで、予測対象となる予測対象について発生する事象の時系列的な変化の度合いと、その変化に至る所要時間とを推定することができる。
そのため、品質管理や保守部門における様々な事象の時系列記録から、将来の時間軸上での予測対象の変化を知ることができ、様々な記録から変化の度合いと変化過程を推定することが可能になるため、業務効率や安全性の向上を図ることができる。
なお、上記実施形態では、履歴データ記憶部11と時不変データ記憶部12とを、独立的に保持する態様としたが、これに限らないものとする。例えば、履歴データ記憶部11と時不変データ記憶部12とのデータ内容を統合したデータ(分析対象データ)のみを保持する態様としてもよい。
図12は、本実施形態の他の態様として、分析対象データのみを保持する構成を示した図である。同図において、分析対象データ記憶部22は、分析対象データを記憶する。ここで、分析対象データは、実質統合データと同様の項目内容となるため、図1で示したデータ統合部13及び統合データ記憶部14は不要となり、イベントシーケンス生成部16、予測モデル生成部17、結果表示部21は、分析対象データ記憶部22を参照することになる。
また、上記実施形態では、対象データ記憶部19に予測対象のデータを保持する態様としたが、これに限らず、実際の部品(例えば、センサなど)から予測対象のデータが直接入力される態様としてもよい。
図13は、本実施形態の他の態様として、予測対象のデータが直接入力される構成を示した図である。同図において、センサ部23は予測対象となる部品であって、このセンサ部23から出力されるデータがネットワークNを介し、予測対象のデータとして時系列予測部20に入力されるようになっている。なお、この場合、センサ部23からの予測対象のデータは、常時入力される態様としてもよいし、所定の期間毎に入力される態様としてもよい。また、図14に示したように、図12、図13で説明した2つの他の態様に係る構成を組み合わせることとしてもよい。
図15は、時系列データ分析装置100のハードウェア構成を示した図である。同図に示したように、時系列データ分析装置100は、CPU(Central Processing Unit)31と、ROM(Read Only Memory)32と、RAM(Random Access Memory)33と、記憶部34と、表示部35と、操作部36と、通信部37とを備え、各部はバス38を介して接続されている。
CPU31は、RAM33を作業領域として、ROM32又は記憶部34に記憶されたプログラムとの協働により、各種処理を実行し時系列データ分析装置100の動作を統括的に制御する。また、CPU31は、ROM32又は記憶部34に記憶されたプログラムとの協働により、上述した各機能部(データ統合部13、パラメータ入力部15、イベントシーケンス生成部16、予測モデル生成部17、時系列予測部20、結果表示部21)を実現させる。
ROM32は、時系列データ分析装置100の制御にかかるプログラムや各種設定情報などを書き換え不可能に記憶する。RAM33は、SDRAMやDDRメモリなどの揮発性メモリであって、CPU31の作業エリアとして機能する。
記憶部34は、磁気的又は光学的に記録可能な記憶媒体を有し、時系列データ分析装置100の制御にかかるプログラムや各種情報を書き換え可能に記憶する。また、記憶部34は、当該記憶部34が備えるデータベース等の記憶・管理機構により、上述した履歴データ記憶部11、時不変データ記憶部12、統合データ記憶部14、予測モデル記憶部18、対象データ記憶部19、分析対象データ記憶部22として機能する。なお、記憶部34は単一の記憶媒体に限らず、用途に応じて設けられた複数の記憶媒体としてもよいし、ネットワーク等を介して接続される外部記憶装置としてもよい。
表示部35は、LCD(Liquid Crystal Display)などの表示デバイスから構成され、CPU31の制御の下、文字や画像などを表示する。
操作部36は、マウスやキーボードなどの入力デバイスであって、ユーザから操作入力された情報を指示信号として受け付け、CPU31に出力する。
通信部37は、外部装置との間で通信を行うインターフェイスであって、外部装置から受信した各種データをCPU31に出力する。また、通信部37は、CPU31の制御の下、各種情報を外部装置に送信する。
以上、本発明にかかる実施形態について説明したが、本発明はこれに限定されるものではなく、本発明の主旨を逸脱しない範囲での種々の変更、置換、追加などが可能である。
例えば、上記実施形態の時系列データ分析装置100で実行されるプログラムは、ROM32や記憶部34などに予め組み込まれて提供されるものとするが、これに限らず、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)などのコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
また、このプログラムを、インターネットなどのネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよく、インターネットなどのネットワーク経由で提供又は配布するように構成してもよい。
また、上記実施形態では、時系列データ分析装置100を、所定の装置(部品)の品質管理や保守部門に用いる態様を説明したが、これに限らず、医療・健康・介護分野での健康診断データの時系列的な分析に用いることとしてもよいし、他の分野に係る時系列データの分析に用いることとしてもよい。
時系列データ分析装置100の機能構成を示したブロック図である。 履歴データ記憶部に格納されたデータの一例を示した図である。 時不変データ記憶部に格納されたデータの一例を示した図である。 図2に示した各データと、図3に示した各データとから生成された統合データの一例を示した図である。 候補イベントシーケンスを模式的に表した図である。 候補イベントシーケンスを模式的に表した図である。 イベントシーケンス生成処理の手順を示したフローチャートである。 部品A1の使用頻度についてのイベントシーケンスを模式的に表した図である。 イベントシーケンスの分岐を説明するための図である。 予測モデル生成処理の手順を示したフローチャートである。 予測結果出力処理の手順を示したフローチャートである。 本実施形態の他の態様を説明するためのブロック図である。 本実施形態の他の態様を説明するためのブロック図である。 本実施形態の他の態様を説明するためのブロック図である。 時系列データ分析装置のハードウェア構成を示したブロック図である。
符号の説明
100 時系列データ分析装置
11 履歴データ記憶部
12 時不変データ記憶部
13 データ統合部
14 統合データ記憶部
15 パラメータ入力部
16 イベントシーケンス生成部
17 予測モデル生成部
18 予測モデル記憶部
19 対象データ記憶部
20 時系列予測部
21 結果表示部
22 分析対象データ記憶部
23 センサ部
31 CPU
32 ROM
33 RAM
34 記憶部
35 表示部
36 操作部
37 通信部
38 バス

Claims (12)

  1. 複数の分析対象各々について時間経過に伴い発生した所定の事象を定量的に示した事象項目を、当該事象の発生に関係する要素の数値を示した浮動項目と、当該事象の発生日時とともに記録した履歴データと、前記分析対象に関する時不変の設定を示した1又は複数の時不変項目からなる時不変データとを、共通する分析対象について関連付けた統合データを記憶する第1記憶手段と、
    前記分析対象毎にグループ化した前記統合データの組のうち、特定の分析対象についての統合データの組に含まれる前記浮動項目の数値範囲を拡大し、他の分析対象の各々についてグループ化した統合データの組に含まれる前記浮動項目の変化量を包含する前記数値範囲を表したイベントシーケンスを生成する第1生成手段と、
    前記グループ化した統合データの各組を、当該統合データの組に含まれる前記浮動項目の変化量と、前記イベントシーケンスが表す数値範囲との包含関係に基づいて分類するとともに、共通する前記時不変項目に基づいて分類し、分類後の統合データの各組に含まれる前記事象項目の変化量と、当該変化量に至る所要時間とを表した予測対象イベントシーケンスを、前記分類に係る分類条件とともに前記イベントシーケンスに関連付けた予測モデルを生成する第2生成手段と、
    前記予測モデルを記憶する第2記憶手段と、
    を備えたことを特徴とする時系列データ分析装置。
  2. 前記第1生成手段は、前記第1記憶手段から、共通する分析対象毎に当該分析対象についての前記統合データを複数選択し、当該統合データを前記発生日時の順に並び替えてグループ化することを特徴とする請求項1に記載の時系列データ分析装置。
  3. 前記第1生成手段は、前記数値範囲の条件を満たす前記グループ化された分析対象の個数が、予め定められた個数以上となるまで前記数値範囲を段階的に拡大することを特徴とする請求項1又は2に記載の時系列データ分析装置。
  4. 前記第2生成手段は、前記イベントシーケンスをルートとする決定木分類モデルを用いて、前記予測対象イベントシーケンスを分類することを特徴とする請求項1〜3の何れか一項に記載の時系列データ分析装置。
  5. 前記第2生成手段は、葉ノードとなる前記予測対象イベントシーケンスが、予め定められた個数となるまで当該予測対象イベントシーケンスの分類を繰り返すことを特徴とする請求項4に記載の時系列データ分析装置。
  6. 前記第2生成手段は、前記分類した統合データの組毎に、当該統合データの組に含まれる前記事象項目間の発生日時の差を所要時間として算出し、前記統合データの各組における前記所要時間の統計値を前記所要時間とすることを特徴とする請求項1〜5の何れか一項に記載の時系列データ分析装置。
  7. 前記履歴データは、互いに異なる複数の要素についての前記浮動項目を含み、
    前記第1生成手段は、前記浮動項目の要素毎に、前記イベントシーケンスを生成し、
    前記第2生成手段は、前記イベントシーケンス毎に前記予測モデルを生成することを特徴とする請求項1〜6の何れか一項に記載の時系列データ分析装置。
  8. 前記第2記憶手段に記憶された予測モデルを表示する表示手段を更に備えたことを特徴とする請求項1〜7の何れか一項に記載の時系列データ分析装置。
  9. 予測対象についての前記履歴データ及び時不変データと、前記予測モデルでの前記分類条件とを比較し、最終的に到達する前記予測対象イベントシーケンスが表す事象項目の変化量と所要時間とを予測結果として導出する予測手段を更に備え、
    前記表示手段は、前記導出された予測結果を表示することを特徴とする請求項1〜8の何れか一項に記載の時系列データ分析装置。
  10. 前記履歴データを記憶する第3記憶手段と、
    前記時不変データを記憶する第4記憶手段と、
    前記第3記憶手段に記憶された履歴データと、前記第4記憶手段に記憶された時不変データとを、当該履歴データ及び時不変データに含まれた共通する分析対象について統合する統合手段と、
    を更に備え、
    前記第1記憶手段は、前記統合手段により統合されたデータを記憶することを特徴とする請求項1〜9の何れか一項に記載の時系列データ分析装置。
  11. 時系列データ分析装置の時系列データ分析方法であって、
    前記時系列データ分析装置は、複数の分析対象各々について時間経過に伴い発生した所定の事象を定量的に示した事象項目を、当該事象の発生に関係する要素の数値を示した浮動項目と、当該事象の発生日時とともに記録した履歴データと、前記分析対象に関する時不変の設定を示した1又は複数の時不変項目からなる時不変データとを、共通する分析対象について関連付けた統合データを記憶する第1記憶手段を備え、
    第1生成手段が、前記分析対象毎にグループ化した前記統合データの組のうち、特定の分析対象についての統合データの組に含まれる前記浮動項目の数値範囲を拡大し、他の分析対象の各々についてグループ化した統合データの組に含まれる前記浮動項目の変化量を包含する前記数値範囲を表したイベントシーケンスを生成する第1生成工程と、
    第2生成手段が、前記グループ化した統合データの組を、当該統合データの組に含まれる前記浮動項目の変化量と、前記イベントシーケンスが表す数値範囲との包含関係に基づいて分類するとともに、共通する前記時不変項目に基づいて分類し、分類後の統合データの各組に含まれる前記事象項目の変化量と、当該変化量に至る所要時間とを表した予測対象イベントシーケンスを、前記分類に係る分類条件とともに前記イベントシーケンスに関連付けた予測モデルを生成する第2生成工程と、
    記憶制御手段が、前記予測モデルを第2記憶手段に記憶する記憶制御工程と、
    を含むことを特徴とする時系列データ分析方法。
  12. 複数の分析対象各々について時間経過に伴い発生した所定の事象を定量的に示した事象項目を、当該事象の発生に関係する要素の数値を示した浮動項目と、当該事象の発生日時とともに記録した履歴データと、前記分析対象に関する時不変の設定を示した1又は複数の時不変項目からなる時不変データとを、共通する分析対象について関連付けた統合データを記憶する第1記憶手段を備えたコンピュータに、
    前記分析対象毎にグループ化した前記統合データの組のうち、特定の分析対象についての統合データの組に含まれる前記浮動項目の数値範囲を拡大し、他の分析対象の各々についてグループ化した統合データの組に含まれる前記浮動項目の変化量を包含する前記数値範囲を表したイベントシーケンスを生成する第1生成手段と、
    前記グループ化した統合データの組を、当該統合データの組に含まれる前記浮動項目の変化量と、前記イベントシーケンスが表す数値範囲との包含関係に基づいて分類するとともに、共通する前記時不変項目に基づいて分類し、分類後の統合データの各組に含まれる前記事象項目の変化量と、当該変化量に至る所要時間とを表した予測対象イベントシーケンスを、前記分類に係る分類条件とともに前記イベントシーケンスに関連付けた予測モデルを生成する第2生成手段と、
    前記予測モデルを第2記憶手段に記憶する記憶制御手段と、
    して機能させることを特徴とする時系列データ分析プログラム。
JP2008137120A 2008-05-26 2008-05-26 時系列データ分析装置、方法及びプログラム Pending JP2009282926A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008137120A JP2009282926A (ja) 2008-05-26 2008-05-26 時系列データ分析装置、方法及びプログラム
US12/470,950 US20090292662A1 (en) 2008-05-26 2009-05-22 Time-series data analyzing apparatus, time-series data analyzing method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008137120A JP2009282926A (ja) 2008-05-26 2008-05-26 時系列データ分析装置、方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2009282926A true JP2009282926A (ja) 2009-12-03

Family

ID=41342801

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008137120A Pending JP2009282926A (ja) 2008-05-26 2008-05-26 時系列データ分析装置、方法及びプログラム

Country Status (2)

Country Link
US (1) US20090292662A1 (ja)
JP (1) JP2009282926A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011064876A1 (ja) * 2009-11-27 2011-06-03 株式会社東芝 予測モデル生成装置
JP2012225811A (ja) * 2011-04-20 2012-11-15 Fukushima Univ 塗膜劣化予測方法、塗膜劣化予測装置及びコンピュータプログラム
US9674058B2 (en) 2011-11-07 2017-06-06 Hitachi, Ltd. Time series data processing device, time series data processing method, and computer-readable recording medium storing time series data processing program
JP2018529996A (ja) * 2015-09-24 2018-10-11 エーエスエムエル ネザーランズ ビー.ブイ. リソグラフィプロセスにおけるレチクル加熱及び/又は冷却の影響を低減する方法
US10451977B2 (en) 2014-12-02 2019-10-22 Asml Netherlands B.V. Lithographic method and apparatus

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102010028152B4 (de) * 2010-04-23 2019-09-19 Endress + Hauser Process Solutions Ag Aufzeichnung von History-Informationen in einem Feldgerät
US20120066166A1 (en) * 2010-09-10 2012-03-15 International Business Machines Corporation Predictive Analytics for Semi-Structured Case Oriented Processes
US11587172B1 (en) 2011-11-14 2023-02-21 Economic Alchemy Inc. Methods and systems to quantify and index sentiment risk in financial markets and risk management contracts thereon
US9292798B2 (en) * 2012-12-21 2016-03-22 International Business Machines Corporation Iterative active feature extraction
US10133996B2 (en) * 2014-04-22 2018-11-20 International Business Machines Corporation Object lifecycle analysis tool
CN106156257A (zh) * 2015-04-28 2016-11-23 北大方正集团有限公司 一种微博舆情事件的态势预测方法
US11443015B2 (en) * 2015-10-21 2022-09-13 Adobe Inc. Generating prediction models in accordance with any specific data sets
CN106153824B (zh) * 2016-06-22 2018-07-31 北京工业大学 一种基于裂纹闭合效应的疲劳寿命预测方法
US10540095B1 (en) * 2016-08-12 2020-01-21 Pure Storage, Inc. Efficient garbage collection for stable data
WO2019012654A1 (ja) * 2017-07-13 2019-01-17 日本電気株式会社 分析システム、分析方法及び記憶媒体
CN109993339A (zh) * 2017-12-29 2019-07-09 上海诺悦智能科技有限公司 一种出国金融业务潜在用户的预测方法
JP6760348B2 (ja) * 2018-10-11 2020-09-23 株式会社富士通ゼネラル 空気調和機、データ送信方法及び空気調和システム
CN113837783A (zh) * 2020-06-24 2021-12-24 上海顺如丰来技术有限公司 时间序列模型参数优化方法、装置、计算机设备
CN114626896A (zh) * 2022-04-02 2022-06-14 北京京东振世信息技术有限公司 物品数量预测方法及装置、电子设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006085645A (ja) * 2004-09-17 2006-03-30 Canon System Solutions Inc データ予測装置及びデータ予測方法並びにプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7322250B1 (en) * 2002-04-09 2008-01-29 Rockwell Automation Technologies, Inc. System and method for sensing torque on a rotating shaft
US8510083B2 (en) * 2003-07-31 2013-08-13 The Boeing Company Method, apparatus and computer program product for constructing a diagnostic network model
US20070094219A1 (en) * 2005-07-14 2007-04-26 The Boeing Company System, method, and computer program to predict the likelihood, the extent, and the time of an event or change occurrence using a combination of cognitive causal models with reasoning and text processing for knowledge driven decision support
US8165968B2 (en) * 2004-10-25 2012-04-24 The Boeing Company Method and system for evaluating costs of various design and maintenance approaches
JP2006155404A (ja) * 2004-11-30 2006-06-15 Toshiba Corp 時間情報抽出装置、時間情報抽出方法、及び時間情報抽出プログラム
AU2006260795A1 (en) * 2005-06-20 2006-12-28 Future Route Limited Analytical system for discovery and generation of rules to predict and detect anomalies in data and financial fraud
JP4381361B2 (ja) * 2005-08-31 2009-12-09 株式会社東芝 時系列データ分析装置、時系列データ分析方法、及び時系列データ分析プログラム
US20070068605A1 (en) * 2005-09-23 2007-03-29 U.I.T., Llc Method of metal performance improvement and protection against degradation and suppression thereof by ultrasonic impact
US20090192731A1 (en) * 2008-01-24 2009-07-30 Halliburton Energy Services, Inc. System and Method for Monitoring a Health State of Hydrocarbon Production Equipment
US7623973B1 (en) * 2008-05-05 2009-11-24 Gm Global Technology Operations, Inc. Methods and systems to predict fatigue life in aluminum castings

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006085645A (ja) * 2004-09-17 2006-03-30 Canon System Solutions Inc データ予測装置及びデータ予測方法並びにプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNH200700151009; 勝山 恒男: '研究開発最前線' FUJITSU VOL.58 NO.3 第58巻, 20070510, 第234-239ページ, 富士通株式会社 *
JPN6012052429; 勝山 恒男: '研究開発最前線' FUJITSU VOL.58 NO.3 第58巻, 20070510, 第234-239ページ, 富士通株式会社 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011064876A1 (ja) * 2009-11-27 2011-06-03 株式会社東芝 予測モデル生成装置
JP2012225811A (ja) * 2011-04-20 2012-11-15 Fukushima Univ 塗膜劣化予測方法、塗膜劣化予測装置及びコンピュータプログラム
US9674058B2 (en) 2011-11-07 2017-06-06 Hitachi, Ltd. Time series data processing device, time series data processing method, and computer-readable recording medium storing time series data processing program
US10451977B2 (en) 2014-12-02 2019-10-22 Asml Netherlands B.V. Lithographic method and apparatus
JP2018529996A (ja) * 2015-09-24 2018-10-11 エーエスエムエル ネザーランズ ビー.ブイ. リソグラフィプロセスにおけるレチクル加熱及び/又は冷却の影響を低減する方法
US10429749B2 (en) 2015-09-24 2019-10-01 Asml Netherlands B.V. Method of reducing effects of reticle heating and/or cooling in a lithographic process
US10564555B2 (en) 2015-09-24 2020-02-18 Asml Netherlands B.V. Method of reducing effects of reticle heating and/or cooling in a lithographic process

Also Published As

Publication number Publication date
US20090292662A1 (en) 2009-11-26

Similar Documents

Publication Publication Date Title
JP2009282926A (ja) 時系列データ分析装置、方法及びプログラム
US9047559B2 (en) Computer-implemented systems and methods for testing large scale automatic forecast combinations
Brooks et al. Retrospective forecasting—evaluating performance of stock projections for New England groundfish stocks
US20190251458A1 (en) System and method for particle swarm optimization and quantile regression based rule mining for regression techniques
US20030033263A1 (en) Automated learning system
Saghafian et al. The newsvendor under demand ambiguity: Combining data with moment and tail information
US7657408B2 (en) Structural analysis apparatus, structural analysis method, and structural analysis program
JP7069029B2 (ja) 自動予測システム、自動予測方法および自動予測プログラム
US20140188442A1 (en) System and Method for Selecting Predictors for a Student Risk Model
US20180082185A1 (en) Predictive model updating system, predictive model updating method, and predictive model updating program
JP2008146621A (ja) 製品の品質改善条件解析装置、解析方法、コンピュータプログラム、及びコンピュータ読み取り可能な記録媒体
CN107016571A (zh) 数据预测方法及其系统
KR102075743B1 (ko) 신체 성장 예측 모델링 장치 및 방법
JP6944736B1 (ja) 疲労寿命予測方法、疲労寿命予測装置、疲労寿命予測プログラムおよび記憶媒体
KR101435096B1 (ko) 소셜 네트워크 서비스 데이터에 기반한 상품 수요 예측 장치 및 방법
Sawarkar et al. Predicting bug estimation time for newly reported bug using machine learning algorithms
Mohril et al. XGBoost based residual life prediction in the presence of human error in maintenance
JP2012190275A (ja) 緊急時対策業務支援装置及び緊急時対策業務支援方法
CN117522132A (zh) 供应商风险评估系统及应用方法
Sidabutar et al. Comparison of linear regression, neural net, and arima methods for sales prediction of instrumentation and control products in PT. Sarana instrument
Ardimento et al. A text-based regression approach to predict bug-fix time
US20240045923A1 (en) Information processing device, information processing method, and computer program product
JP6625183B1 (ja) リモデル支援装置、および、リモデル支援方法
JP5075962B2 (ja) 注目対象予測装置
JP2015187773A (ja) データ解析装置、データ解析プログラム及びデータ解析方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110414

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121009

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130528