JPWO2016203928A1

JPWO2016203928A1 - データ予測装置、データ予測方法、及びプログラム

Info

Publication number: JPWO2016203928A1
Application number: JP2017524777A
Authority: JP
Inventors: 一道佐藤; 山本　浩司; 浩司山本; 太一河野; 恵竹下
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2015-06-18
Filing date: 2016-05-27
Publication date: 2018-03-15
Also published as: WO2016203928A1; US20180189654A1

Abstract

データ予測装置は、それぞれが適用条件及び優先順位を有する複数のデータ予測方式のうち、過去の観測データの集合によって満たされる適用条件を有するデータ予測方式の中で優先順位が最も高い第１のデータ予測方式を利用して、前記観測データの集合に基づいて、次の観測データの予測値を算出する予測部と、次の観測データの入力に応じ、前記予測値と当該観測データとを比較して、前記第１のデータ予測方式の精度を算出する精度算出部と、前記精度算出部によって算出された精度に基づいて、前記第１のデータ予測方式の優先順位を変更する変更部と、を有することで、複数のデータ予測方式の中から予測精度が高くなるような方式を選択可能とする。

Description

本発明は、データ予測装置、データ予測方法、及びプログラムに関する。

過去に観測されたデータから次に観測されるデータを予測するデータ予測方式として、様々な技術が提案されている。例えば、多変量解析の一つである重回帰分析は、複数のパラメータ変数が与えられたとき、ある変数をその他の変数を用いて説明するためのモデルであり、データ予測方式として利用されている。

ここで、例として、あるユーザが、あるインターネットサービスを利用するときのスループット（単位時間あたりのデータ転送量）を予測することを考える。簡単のため、スループットは以下の３つのパラメータから推定（説明）可能であるとする。また、以下のパラメータはそれぞれ５つの要素を持つものとする。
１．利用時間帯：Ｔ＝｛ｔ１，ｔ２，ｔ３，ｔ４，ｔ５｝
２．利用場所：Ｌ＝｛ｌ１，ｌ２，ｌ３，ｌ４，ｌ５｝
３．利用サービス：Ｓ＝｛ｓ１，ｓ２，ｓ３，ｓ４，ｓ５｝
これらの情報を、ユーザがインターネットサービスを利用するごとに図１に示すよう記憶しておき、スループットを上記Ｔ、Ｌ、Ｓの組ごとの平均値を用いて予測するものとする。例えば、図１のように観測されたデータにおいて、時間帯ｔ１、場所ｌ１、サービスｓ１のスループットの予測値は（１０００＋１１００）÷２＝１０５０となる。

IPレピュテーションの統合方法，森達哉，佐藤一道，高橋洋介，木村達明，石橋圭介，インターネットアーキテクチャ研究会，2011 KY法の展開(二クラス分類および重回帰)，日本計算機統計学会シンポジウム論文集 (26)，9-12，2012-11-01，日本計算機統計学会

しかしながら、時間帯、場所、サービスの情報の全ての組み合わせは膨大であり、全ケースを網羅することは困難である。すなわち、データ予測のための過去の観測データのサンプル数が不足するという課題が存在する。例えば、図１に示されるように観測されたデータにおいては、時間帯ｔ１、場所ｌ３、サービスｓ１のデータは存在せず、このケースについて、スループットを予測するのは困難である。

この課題を解決するためには、直感的には、利用パラメータの粒度を変えた複数の予測方式を用いることが考えられる。例えば、上記の３つのパラメータの場合、｛Ｔ，Ｌ，Ｓ｝全てを用いた予測方式、異なる２つの組｛Ｔ，Ｌ｝、｛Ｔ，Ｓ｝、｛Ｌ，Ｓ｝を用いた予測方式、１つのみのパラメータ｛Ｔ｝、｛Ｌ｝のみを用いた予測方式が考えられる。このように用いるパラメータの粒度を変えることにより、予測に利用可能なサンプルデータ数が増え、予測が可能となる。しかしながら、利用パラメータ数を減らしてしまうと、予測精度が低くなってしまうという課題がある。例えば、図１において場所Ｌのみを考慮した予測方式を考えたとき、場所ｌ５で観測されたスループットは、５０００又は５００とばらつきが大きく、予測値が大きく外れてしまうことが考えられる。

なお、非特許文献１には、電子メールのスパム判定のためのＩＰレピュテーション技術に関し、複数のＩＰレピュテーションデータベースの分類精度を同時に考慮することでスパム判定精度を向上させる技術が記載されている。しかし、本願発明は、複数の方式の適用優先順序を決定することを目的とした技術であり、非特許文献１のようにそれぞれの方式の精度を同時に考慮するものとは異なる技術である。

また、非特許文献２には、複数の入力パラメータが与えられたとき、回帰式への入力パラメータの組み合わせを、最も予測精度が高くなるよう求める技術が記載されている。しかし、本願発明は、過去の予測精度をもとに、データに適用する回帰式の適用順を求めるものであり、非特許文献２に記載された技術とは異なるものである。

本発明は、上記の点に鑑みてなされたものであって、複数のデータ予測方式の中から予測精度が高くなるような方式を選択可能とすることする。

そこで上記課題を解決するため、データ予測装置は、それぞれが適用条件及び優先順位を有する複数のデータ予測方式のうち、過去の観測データの集合によって満たされる適用条件を有するデータ予測方式の中で優先順位が最も高い第１のデータ予測方式を利用して、前記観測データの集合に基づいて、次の観測データの予測値を算出する予測部と、次の観測データの入力に応じ、前記予測値と当該観測データとを比較して、前記第１のデータ予測方式の精度を算出する精度算出部と、前記精度算出部によって算出された精度に基づいて、前記第１のデータ予測方式の優先順位を変更する変更部と、を有する。

複数のデータ予測方式の中から予測精度が高くなるような方式を選択可能とすることができる。

過去に観測されたデータの一例を示す図である。本発明の実施の形態におけるデータ予測装置のハードウェア構成例を示す図である。本発明の実施の形態におけるデータ予測装置の機能構成例を示す図である。予測関数情報生成部が実行する処理手順の一例を説明するためのフローチャートである。データ予測部が実行する処理手順の一例を説明するためのフローチャートである。予測精度更新部が実行する処理手順の一例を説明するためのフローチャートである。予測関数情報列再構築部が実行する処理手順の一例を説明するためのフローチャートである。

以下、図面に基づいて本発明の実施の形態を説明する。図２は、本発明の実施の形態におけるデータ予測装置のハードウェア構成例を示す図である。図２のデータ予測装置１０は、それぞれバスＢで相互に接続されているドライブ装置１００、補助記憶装置１０２、メモリ装置１０３、ＣＰＵ１０４、及びインタフェース装置１０５等を有する。

データ予測装置１０での処理を実現するプログラムは、ＣＤ−ＲＯＭ等の記録媒体１０１によって提供される。プログラムを記憶した記録媒体１０１がドライブ装置１００にセットされると、プログラムが記録媒体１０１からドライブ装置１００を介して補助記憶装置１０２にインストールされる。但し、プログラムのインストールは必ずしも記録媒体１０１より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置１０２は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。

メモリ装置１０３は、プログラムの起動指示があった場合に、補助記憶装置１０２からプログラムを読み出して格納する。ＣＰＵ１０４は、メモリ装置１０３に格納されたプログラムに従ってデータ予測装置１０に係る機能を実行する。インタフェース装置１０５は、ネットワークに接続するためのインタフェースとして用いられる。

図３は、本発明の実施の形態におけるデータ予測装置の機能構成例を示す図である。図３において、データ予測装置１０は、データ収集部１１、予測関数情報列生成部１２、データ予測部１３、予測精度更新部１４、及び予測関数情報列再構築部１５等を有する。これら各部は、データ予測装置１０にインストールされた１以上のプログラムが、ＣＰＵ１０４に実行させる処理により実現される。データ予測装置１０は、また、観測データ記憶部１２１、予測結果記憶部１２２、予測誤差列記憶部１２３、及び予測精度情報記憶部１２４を利用する。観測データ記憶部１２１、予測結果記憶部１２２、予測誤差列記憶部１２３、及び予測精度情報記憶部１２４は、例えば、図２の補助記憶装置１０２、又はデータ予測装置１０にネットワークを介して接続可能な記憶装置等を用いて実現可能である。

データ収集部１１は、データ予測に必要な観測データを収集し、収集された観測データを観測データ記憶部１２１に記憶する。観測データ記憶部１２１には、例えば、図１に示されるような観測データの集合が記憶される。なお、観測データは、観測条件と観測値とを含むデータである。観測条件とは、観測対象が観測された条件又は状況等をいう。図１においては、時間帯、場所、及びサービス等が、観測条件に該当する。観測値は、観測対象に関して観測された値をいう。図１においては、スループットが観測値に該当する。

予測関数情報列生成部１２は、予測関数の集合（以下、「予測関数集合」という。）、各予測関数の適用条件、各予測関数の適用優先順位、及び各予測関数の初期予測精度を入力とし、予測関数情報の配列である予測関数情報列を生成する。予測関数情報列生成部１２は、生成された予測関数情報列をデータ予測部１３へ出力する。なお、１つの予測関数情報は、１つの予測関数に関する適用条件、適用優先順位、及び予測精度を含む情報である。

データ予測部１３は、予測関数情報列生成部１２から出力された予測関数情報列と、観測データ記憶部１２１に記憶された観測データの集合とを入力とし、予測関数集合のうちのいずれかの予測関数を用いてデータ予測を実施し、予測結果を予測結果記憶部１２２に記憶する。

予測精度更新部１４は、予測結果記憶部１２２に記憶された予測結果と、実際に観測された、予測結果に対応する観測データとを比較して、データ予測に利用された予測関数の予測精度を算出する。予測精度更新部１４は、算出された予測精度を、データ予測に利用された予測関数に関連付けて予測精度情報記憶部１２４に記憶する。予測精度更新部１４は、また、予測関数情報列再構築部１５へ予測関数情報列を出力する。

予測関数情報列再構築部１５は、予測精度更新部１４から出力された予測関数情報列と、予測精度情報記憶部１２４に記憶された予測精度とを入力とし、予測関数情報列を並び替え、再構築する。

なお、図２に示される各部は、１つのコンピュータにおいて実現されてもよいし、複数のコンピュータに分散されて実現されてもよい。

以下、データ予測装置１０が実行する処理手順をステップ１からステップ４に分けて説明する。

まず、ステップ１の詳細について説明する。ステップ１は、予測関数情報列生成部１２によって実行される。図４は、予測関数情報列生成部が実行する処理手順の一例を説明するためのフローチャートである。

ステップＳ１０１において、予測関数情報列生成部１２は、予測関数集合Ｆ、各予測関数の適用条件の集合である適用条件集合Ｃ、各予測関数の既定の適用優先順位の集合である適用優先順位集合Ｐ、及び各予測関数の初期予測精度の集合である初期予測精度集合Ａを入力情報として受け付ける。予測関数集合Ｆには、適用対象の観測データの粒度又は範囲（以下、「粒度」で統一する。）が相互に異なる複数の予測関数が含まれる。ここで、観測データの粒度とは、適用対象の観測データに対して予測関数が要求する、観測条件に関する共通性の粒度をいう。観測条件に対して予測関数が要求する、観測条件に関する共通性とは、図１の例において、時間帯が共通すること、場所が共通すること、時間帯及び場所が共通すること、時間帯及びサービスが共通すること、場所及びサービスが共通すること、又は時間帯、場所、及びサービスが共通すること等である。すなわち、時間帯が共通する観測データの集合に基づいてデータ予測を行う予測関数に関しては、時間帯が共通することが、当該予測関数が要求する共通性に該当する。また、時間帯、場所、及びサービスが共通する観測データの集合に基づいてデータ予測を行う予測関数に関しては、時間帯、場所、及びサービスが共通することが、当該予測関数が要求する共通性に該当する。このように、粒度は、観測条件を構成する項目のうち、共通性が要求される項目に対する値の組み合わせによって規定される。相対的に粒度が小さい共通性を満たす観測データの集合（例えば、時間帯、場所、及びサービスが共通する観測データの集合）は、相対的に粒度が大きい共通性を満たす観測データの集合（例えば、時間帯が共通する観測データの集合）の部分集合となる。

また、適用条件とは、例えば、観測データの集合のうち、予測関数が適用対象の観測データに対して要求する、観測条件に関する共通性を満たす観測データの数の下限値等を示す情報である。当該共通性が、時間が共通することである予測関数についての適用条件は、例えば、時間が共通する観測データの数の下限値である。

また、適用優先順位は、予測に利用される優先度（優先順位）を示す数値であり、本実施の形態では、数値が小さいほど優先度が高いこととする。但し、数値が大きいほど優先度が高いこととされてもよい。各予測関数の初期予測精度には、任意の数値が設定されてもよい。

続いて、予測関数情報列生成部１２は、予測関数集合Ｆ、適用条件集合Ｃ、適用優先順位集合Ｐ、初期予測精度集合Ａから、予測関数ごとに、以下のような予測関数情報ｘを生成する（ステップＳ１０２）。ここで、それぞれの集合のサイズはＮとする。
ｘ_ｉ＝（ｆ_ｉ，ｃ_ｉ，ｐ_ｉ，ａ_ｉ）
但し、（ｆ_ｉ∈Ｆ，ｃ_ｉ∈Ｃ，ｐ_ｉ∈Ｐ，ａ_ｉ∈Ａ，１≦ｉ≦Ｎ）
続いて、予測関数情報列生成部１２は、各予測関数情報ｘを、適用優先順位ｃの高い順に並び替えて、予測情報関数列Ｌを生成する（ステップＳ１０３）。添字が小さいものほど優先度が高いものとすると、予測関数情報列Ｌは、以下のようになる。
Ｌ＝［ｘ_１，ｘ_２，・・・，ｘ_Ｎ］
次に、ステップ２の詳細について説明する。ステップ２は、データの予測要求の入力に応じてデータ予測部１３によって実行され、観測データ記憶部１２１に記憶されている、過去の観測データの集合であるデータＤから次の観測データの観測値に関する予測値を算出する処理である。次の観測データとは、次に観測されることが予測される観測データをいう。

図５は、データ予測部が実行する処理手順の一例を説明するためのフローチャートである。

ステップＳ２０１において、データ予測部１３は、データの予測要求の入力を受け付ける。予測要求では、予測条件が入力される。予測条件とは、観測条件を構成する各項目に対する値の集合である。例えば、図１の例によれば、時間帯＝ｔ１、場所＝ｌ１、サービス＝ｓ１が、予測条件として入力される。この場合、時間帯がｔ１であり、場所がｌ１であり、サービスがｓ１である観測データの観測値（スループット）の予測が要求されたことになる。

続いて、データ予測部１３は、変数ｉに１を代入する（ステップＳ２０２）。変数ｉは、予測関数情報列Ｌに含まれている予測関数情報ｘのうち、処理対象の予測関数情報ｘを識別するための変数である。

続いて、データ予測部１３は、予測関数情報列Ｌから、ｉ番目の予測関数情報ｘである予測関数情報ｘ_ｉ＝（ｆ_ｉ，ｃ_ｉ，ｐ_ｉ，ａ_ｉ）を取り出す（ステップＳ２０３）。

続いて、データ予測部１３は、適用条件ｃ_ｉに対してデータＤを当てはめて、データＤが、適用条件ｃ_ｉを満たすか否かを判定する（ステップＳ２０４）。例えば、適用条件ｃ_ｉが、「時間帯及び場所が共通する観測データの数が１００以上であること」であり、予約条件が、「時間帯＝ｔ１、場所＝ｌ１、サービス＝ｓ１」であれば、時間帯がｔ１であり、かつ、場所がｌ１である観測データが、データＤから抽出され、抽出された観測データ数が、１００以上であるか否かが判定される。

データＤが適用条件ｃ_ｉを満たす場合（ステップＳ２０４でＹｅｓ）、データ予測部１３は、データＤから予測関数ｆ_ｉの適用対象の観測データの集合であるデータＸを抽出する（ステップＳ２０５）。例えば、適用条件ｃ_ｉが、「時間帯及び場所が共通する観測データの数が１００以上であること」であり、予約条件が、「時間帯＝ｔ１、場所＝ｌ１、サービス＝ｓ１」であれば、時間帯がｔ１であり、かつ、場所がｌ１である観測データの集合が、データＸとして抽出される。

続いて、データ予測部１３は、予測関数ｆ_ｉにデータＸを入力して、予測値ｆ_ｉ（Ｘ）を算出する（ステップＳ２０６）。例えば、予測関数ｆ_ｉは、データＸのスループットの平均値を算出するような関数であってもよい。データ予測部１３は、予測値ｆ_ｉ（Ｘ）を、予測関数ｆ_ｉと予測条件とに関連付けて予測結果記憶部１２２に記憶する。

一方、データＤが適用条件ｃ_ｉを満たさない場合（ステップＳ２０４でＮｏ）、データ予測部１３は、変数ｉの値がＮ以上であるか否かを判定する（ステップＳ２０７）。変数ｉの値がＮ未満である場合（ステップＳ２０７でＮｏ）、データ予測部１３は、変数ｉに１を加算して（ステップＳ２０８）、ステップＳ２０３以降を繰り返す。変数ｉの値がＮ以上である場合（ステップＳ２０７でＹｅｓ）、データ予測部１３は、処理を終了する。

図５の処理によれば、例えば、３つの項目の値で予測を行う予測関数に対して十分なデータが蓄積されていない場合には、２つ又は１つの項目の値で予測を行う予測関数が利用されてデータ予測が実行される。

次に、ステップ３の詳細について説明する。ステップ３は、予測精度更新部１４によって実行され、データ予測に利用された予測関数の予測精度を算出及び更新する処理である。図６は、予測精度更新部が実行する処理手順の一例を説明するためのフローチャートである。

ステップＳ３０１において、予測精度更新部１４は、実際に観測されたデータｄの入力を受け付ける。データｄの入力は、ユーザによって行われてもよいし、自動的に観測されてもよい。図１の例によれば、データｄは、時間帯、場所、サービス、及びスループットのそれぞれの値を含む。

続いて、予測精度更新部１４は、データｄに合致する予測条件に関連付けられている予測関数ｆ及び予測値ｆ（Ｘ）を、予測結果記憶部１２２から取得する（ステップＳ３０２）。

該当する予測関数ｆ及び予測値ｆが取得できなかった場合（ステップＳ３０３でＮｏ）、図６の処理は終了する。該当する予測関数ｆ及び予測値ｆ（Ｘ）が取得できた場合（ステップＳ３０３でＹｅｓ）、予測精度更新部１４は、予測関数ｆの予測誤差ｅｒｒｏｒ_ｆを以下のように算出する。
ｅｒｒｏｒ_ｆ＝｜ｆ（Ｘ）−ｄ｜
すなわち、予測誤差ｅｒｒｏｒ_ｆは、予測値ｆ（Ｘ）と、観測データｄとの差分である。図１の例によれば、予測誤差ｅｒｒｏｒ_ｆは、予測されたスループットと、観測されたスループットとの差分である。

続いて、予測精度更新部１４は、算出された予測誤差ｅｒｒｏｒ_ｆを、予測関数ｆに関連付けて予測誤差列記憶部１２３に記憶する（ステップＳ３０５）。したがって、予測誤差列記憶部１２３には、データ予測に利用された予測関数ごとに、予測誤差の配列（予測誤差の履歴）である予測誤差列ＬＤが記憶される。なお、予測関数ｆの予測誤差列ＬＤ_ｆは、以下のようになる。
ＬＤ_ｆ＝｜ｅｒｒｏｒ１_ｆ，ｅｒｒｏｒ２_ｆ，・・・，ｅｒｒｏｒＭ_ｆ｜
続いて、予測精度更新部１４は、予測関数ｆに関して予測誤差列記憶部１２３に記憶されている予測誤差列ＬＤ_ｆに基づいて、予測関数ｆの予測精度を算出する（ステップＳ３０６）。予測関数ｆの予測精度をａとしたとき、例えば、ａは以下のように算出される。
ａ＝（ΣＬＤ_ｆ）／｜ＬＤ_ｆ｜
ここで、｜ＬＤ_ｆ｜は、予測誤差列ＬＤ_ｆに含まれる予測誤差の数を示す。

続いて、予測精度更新部１４は、予測精度情報記憶部１２４において予測関数ｆに関連付けられて記憶されている予測精度を、ステップＳ３０６において算出された予測精度ａによって更新する。

このように、予測精度はデータ予測が実行されるごとに更新される。なお、予測精度には、上記以外の指標（相乗平均など）が用いられてもよい。

次に、ステップ４の詳細について説明する。ステップ４は、予測関数情報列再構築部１５によって実行され、各予測関数の予測精度及び既定の適用優先順位に基づいて、予測関数情報列の並び替えを行い、予測関数の適用優先順位の再構築を行う処理である。なお、ステップ４は、定期的に実行されてもよいし、ステップ３において、いずれかの予測関数の予測精度が更新されるたびに実行されてもよい。

図７は、予測関数情報列再構築部が実行する処理手順の一例を説明するためのフローチャートである。図７では、予測関数情報列Ｌに含まれる、相互に異なる２つの要素ｘ_ｉ及びｘ_ｊの並び替えについて説明する。

ステップＳ４０１において、予測関数情報列再構築部１５は、予測関数情報列Ｌから、相互に異なる２つの予測関数情報ｘ_ｉ＝（ｆ_ｉ，ｃ_ｉ，ｐ_ｉ，ａ_ｉ）及び予測関数情報ｘ_ｊ＝（ｆ_ｊ，ｃ_ｊ，ｐ_ｊ，ａ_ｊ）を抽出する。なお、予測精度ａ_ｉ、予測精度ａ_ｊは、それぞれ、予測関数ｆ_ｉ、予測関数ｆ_ｊに関して予測精度情報記憶部１２４に記憶されている値が用いられる。

続いて、予測関数情報列再構築部１５は、予測関数ｆ_ｉに対応する予測誤差列ＬＤ_ｉと、予測関数ｆ_ｊに対応する予測誤差列ＬＤ_ｊとを、予測誤差列記憶部１２３から取得する（ステップＳ４０２）。

続いて、予測関数情報列再構築部１５は、予測誤差列ＬＤ_ｉと予測誤差列ＬＤ_ｊとの差が統計的に有意かを判定するために、ｔ検定を実施する（ステップＳ４０３）。すなわち、予測実施回数が小さい場合、後述されるステップＳ４０５において算出される、予測精度の差ａ_ｉ−ａ_ｊが、統計的に有意ではない可能性がある。そこで、ステップＳ４０３では、ｔ検定が実行される。但し、検定方法はｔ検定に限らず、ノンパラメトリック検定などといったものが利用されてもよい。

ｔ検定の結果、有意差が認められた場合（ステップＳ４０４でＹｅｓ）、予測関数情報列再構築部１５は、予測精度ａ_ｉ及びａ_ｊを比較し、予測関数情報ｘ_ｉ及びｘ_ｊの優先度を判定する（ステップＳ４０５）。具体的には、ａ_ｉ−ａ_ｊが算出され、算出結果が負であれば、予測関数情報ｘ_ｉは予測関数情報ｘ_ｊよりも優先度が高いと判定される。一方、算出結果が正であれば、ｘ_ｊはｘ_ｉよりも優先度が高いと判定される。また、算出結果が０である場合（ａ_ｉ＝ａ_ｊである場合）、既定の適用優先順位ｐ_ｉとｐ_ｊとに基づいて、優先度が判定される。

一方、ｔ検定の結果、有意差が認められなかった場合（ステップＳ４０４でＮｏ）、予測関数情報列再構築部１５は、既定の適用優先順位ｐ_ｉとｐ_ｊとを比較して、予測関数情報ｘ_ｉ及びｘ_ｊの優先度を判定する（ステップＳ４０６）。

予測関数情報列再構築部１５は、上記の異なる要素の比較手順を用いて、予測関数情報列Ｌを並び替え、更新する。並び替えの方法は、クイックソート又はマージソート等、任意の方法でよい。

上述したように、本実施の形態によれば、過去の観測データから次の観測データを予測する方式において、複数の予測関数の中から、それぞれの予測関数の優先順位及び予測精度に基づいて、適切なデータ予測関数が選択され、選択された予測関数に基づいてデータ予測が実行される。これにより、予測時において、或る予測関数でのサンプルデータが不足している場合でも、他の予測関数でのサンプルデータが十分であれば、当該他の予測関数を用いてデータ予測を実行することができる。また、精度の高い予測関数が優先的に利用されるため、データ予測の精度を向上させることができる。また、データ予測の結果に基づいて動的に優先順位が決定されるため、データ分析実施者（オペレータなど）の分析稼動を小さくすることが可能となる。

なお、本実施の形態において、データ予測部１３は、予測部の一例である。予測精度更新部１４は、精度算出部の一例である。予測精度更新部１４は、変更部の一例である。予測関数は、データ予測方式の一例である。

以上、本発明の実施例について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。

本出願は、２０１５年６月１８日に出願された日本国特許出願第２０１５−１２３２７３号に基づきその優先権を主張するものであり、同日本国特許出願の全内容を参照することにより本願に援用する。

１０データ予測装置
１１データ収集部
１２予測関数情報列生成部
１３データ予測部
１４予測精度更新部
１５予測関数情報列再構築部
１００ドライブ装置
１０１記録媒体
１０２補助記憶装置
１０３メモリ装置
１０４ＣＰＵ
１０５インタフェース装置
１２１観測データ記憶部
１２２予測結果記憶部
１２３予測誤差列記憶部
１２４予測精度情報記憶部
Ｂバス

Claims

それぞれが適用条件及び優先順位を有する複数のデータ予測方式のうち、過去の観測データの集合によって満たされる適用条件を有するデータ予測方式の中で優先順位が最も高い第１のデータ予測方式を利用して、前記観測データの集合に基づいて、次の観測データの予測値を算出する予測部と、
次の観測データの入力に応じ、前記予測値と当該観測データとを比較して、前記第１のデータ予測方式の精度を算出する精度算出部と、
前記精度算出部によって算出された精度に基づいて、前記第１のデータ予測方式の優先順位を変更する変更部と、
を有することを特徴とするデータ予測装置。
前記精度算出部は、前記予測部によって前記第１のデータ予測方式が利用されて予測値が算出されるたびに、当該予測値と、当該予測値に対応する次の観測データとの差分を算出し、前記第１のデータ予測方式に関して算出された前記差分の履歴に基づいて、前記精度を算出する、
ことを特徴とする請求項１記載のデータ予測装置。
前記予測部は、前記過去の観測データの集合のうち、前記第１のデータ予測方式の適用対象に対して要求される共通性を満たす観測データの集合に前記第１のデータ予測方式を適用して、前記予測値を算出し、
前記複数のデータ予測方式のそれぞれは、適用対象に対して要求される共通性の粒度が相互に異なる、
ことを特徴とする請求項１又は２記載のデータ予測装置。
コンピュータが、
それぞれが適用条件及び優先順位を有する複数のデータ予測方式のうち、過去の観測データの集合によって満たされる適用条件を有するデータ予測方式の中で優先順位が最も高い第１のデータ予測方式を利用して、前記観測データの集合に基づいて、次の観測データの予測値を算出する予測手順と、
次の観測データの入力に応じ、前記予測値と当該観測データとを比較して、前記第１のデータ予測方式の精度を算出する精度算出手順と、
前記精度算出手順において算出された精度に基づいて、前記第１のデータ予測方式の優先順位を変更する変更手順と、
を実行することを特徴とするデータ予測方法。
前記精度算出手順は、前記予測手順において前記第１のデータ予測方式が利用されて予測値が算出されるたびに、当該予測値と、当該予測値に対応する次の観測データとの差分を算出し、前記第１のデータ予測方式に関して算出された前記差分の履歴に基づいて、前記精度を算出する、
ことを特徴とする請求項４記載のデータ予測方法。
前記予測手順は、前記過去の観測データの集合のうち、前記第１のデータ予測方式の適用対象に対して要求される共通性を満たす観測データの集合に前記第１のデータ予測方式を適用して、前記予測値を算出し、
前記複数のデータ予測方式のそれぞれは、適用対象に対して要求される共通性の粒度が相互に異なる、
ことを特徴とする請求項４又は５記載のデータ予測方法。
請求項１乃至３いずれか一項に記載のデータ予測装置における各機能部としてコンピュータを機能させるためのプログラム。