JP2015082259A - 時系列データ予測装置、時系列データ予測方法、及びプログラム - Google Patents

時系列データ予測装置、時系列データ予測方法、及びプログラム Download PDF

Info

Publication number
JP2015082259A
JP2015082259A JP2013220641A JP2013220641A JP2015082259A JP 2015082259 A JP2015082259 A JP 2015082259A JP 2013220641 A JP2013220641 A JP 2013220641A JP 2013220641 A JP2013220641 A JP 2013220641A JP 2015082259 A JP2015082259 A JP 2015082259A
Authority
JP
Japan
Prior art keywords
prediction
series data
time
data
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013220641A
Other languages
English (en)
Other versions
JP6109037B2 (ja
Inventor
斗紀知 有吉
Tokitomo Ariyoshi
斗紀知 有吉
貴浩 福重
Takahiro Fukushige
貴浩 福重
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2013220641A priority Critical patent/JP6109037B2/ja
Priority to US14/499,358 priority patent/US9811781B2/en
Publication of JP2015082259A publication Critical patent/JP2015082259A/ja
Application granted granted Critical
Publication of JP6109037B2 publication Critical patent/JP6109037B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Computational Linguistics (AREA)

Abstract

【課題】観測対象の過去の観測値を利用して、観測値の変動のパターンに変化がある場合でも、将来の観測値を精度よく予測する。【解決手段】取得部32は、所定の観測対象の観測値の時系列データから所定の時間間隔で連続する複数の観測値のデータを予測用データとして取得するとともにトレーニングデータを取得する。予測モデル生成部34は、トレーニングデータを用いて、与えられた時系列データに基づき予測される観測値からなる時系列データを算出する予測モデルを生成する。予測部36は、生成された予測モデルと、予測用データとを用いて観測値の予測値を算出する。【選択図】図3

Description

本発明は、時系列データ予測装置、時系列データ予測方法、及びプログラムに関する。
エネルギー消費量予測に関し、特に、宅内のエネルギー消費量予測を行う宅内エネルギー消費量予測システムについては、例えば特許文献1に開示されている。この技術では、エネルギー消費量計測装置と環境情報収集装置とから受信した時系列のエネルギー消費量情報を関連付けて格納するデータベースを備え、環境情報収集装置から受信する情報とデータベース内の情報とから宅内のエネルギー消費量を予測する。具体的には、データベース内のデータを用い、例えば、指数平滑平均(ESMA)のような統計処理を行って、当該日の消費電力量を予測している。
特開2013−109550号公報
上述した従来技術では、指数平滑化係数の大きさによって予測の精度が大幅に左右されてしまう。そのため、電力使用が同じような日が続く場合と、電力使用が大きく異なる日が続く場合の両方で、精度良く消費電力量を予測することは困難であった。このように、観測値の変動のパターンに変化がある場合に、過去の観測値を利用して、将来の観測値を精度良く予測することは困難であった。
本発明は、このような事情を考慮してなされたもので、観測対象の過去の観測値を利用して、観測値の変動のパターンに変化がある場合でも、将来の観測値を精度よく予測する時系列データ予測装置、時系列データ予測方法、及びプログラムを提供する。
本発明は、上記の課題を解決すべくなされたもので、観測値の時系列データに基づいて当該観測値の予測値を算出する時系列データ予測装置であって、所定の観測対象についての観測値の時系列データから所定の時間間隔で連続する複数の前記観測値を予測用データとして取得するとともにトレーニングデータを取得する取得部(例えば、実施形態による取得部32)と、前記トレーニングデータを用いて、与えられた時系列データに基づき予測される観測値からなる時系列データを算出する予測モデルを生成する予測モデル生成部(例えば、実施形態による予測モデル生成部34)と、前記予測モデル生成部により生成された予測モデルと、前記取得部が取得した前記予測用データとを用いて観測値の予測値を算出する予測部(例えば、実施形態による予測部36)と、を有することを特徴とする時系列データ予測装置である。
この発明によれば、時系列データ予測装置は、観測値の変動のパターンに変化がある場合でも、過去に観測された時系列データに基づいて、観測値の予測値を算出することができる。
また、本発明は、上述した時系列データ予測装置であって、前記取得部は、前記時系列データから所定の時間間隔で連続する複数の前記観測値を予測用データとして取得し、前記予測用データを除いた前記時系列データから前記所定の時間間隔で連続する複数の前記観測値をテストデータとして取得し、前記予測用データ及び前記テストデータを除いた前記時系列データからトレーニングデータを取得し、前記予測モデル生成部により生成された前記予測モデルの予測精度を、前記テストデータを用いて評価する評価部(例えば、実施形態による評価部35)をさらに備える、ことを特徴とする。
この発明によれば、時系列データ予測装置は、過去に観測された時系列データに基づいて生成した予測モデルの予測精度を、実際に観測された時系列データを用いて評価することができる。
また、本発明は、上述した時系列データ予測装置であって、過去に用いられた予測モデルを格納する記憶部(例えば、実施形態による記憶部31)をさらに有し、前記評価部は、前記テストデータを用いて、少なくとも前記記憶部から取得した前記予測モデルにより算出した予測値と、前記予測モデル生成部により生成された前記予測モデルにより算出した予測値と、所定期間の時系列データの平均に基づいて予測値を得る平均利用の予測モデルにより算出された予測値とを比較し、前記予測部は、前記評価部による比較の結果が最も良い予測モデルと、前記取得部が取得した前記予測用データとを用いて観測値の予測値を算出する、ことを特徴とする。
この発明によれば、時系列データ予測装置は、観測値の変動のパターンに変化がある場合でも、その変化に応じて精度のよい予測モデルを選択して観測値の予測値を算出することができる。
また、本発明は、上述した時系列データ予測装置であって、前記取得部は、前記時系列データの中から前記予測用データと相関性が所定より高い時系列データを検索し、検索により得られた時系列データを前記トレーニングデータに含める、ことを特徴とする。
この発明によれば、時系列データ予測装置は、予測に利用する時系列データと相関が高い時系列データをトレーニングデータに用いて予測モデルを生成するため、精度のよい予測モデルを生成することができる。
また、本発明は、上述した時系列データ予測装置であって、前記取得部は、前回の予測において前記平均利用の予測モデルが用いられた場合、前回の予測において予測用データとして用いた時系列データを前記トレーニングデータに含める、ことを特徴とする。
この発明によれば、時系列データ予測装置は、時系列データの変動のパターンが新たなパターンとなったと考えられるときの時系列データをトレーニングデータに含めるため、精度のよい予測モデルを生成することができる。
また、本発明は、上述した時系列データ予測装置であって、前記予測用データを用いて前記予測部により算出された前記予測値と、観測値との差分である実績ズレ量を検知するズレ量検知部(例えば、実施形態によるズレ量検知部37)をさらに有し、前記予測部は、前記実績ズレ量が所定値よりも小さく、かつ、前記予測値の算出に前記予測モデル生成部が生成した前記予測モデルが用いられた場合、前記予測値の算出に用いられた前記予測用データを用いて前記平均利用の予測モデルにより算出された予測値と前記観測値との差分が所定以下であるときには、前記平均利用の予測モデルにより観測値の予測値を算出する、ことを特徴とする。
この発明によれば、時系列データ予測装置は、平均利用の予測モデルによる予測の精度がある程度よい場合はその平均利用の予測モデルを予測に用いることにより、予測値の算出の負荷を軽減することができる。
また、本発明は、上述した時系列データ予測装置であって、前記予測部により算出された前記予測値と、観測値との差分である実績ズレ量を検知するズレ量検知部(例えば、実施形態によるズレ量検知部37)をさらに有し、前記ズレ量検知部が検知した前記実績ズレ量が所定値よりも大きい場合、前記取得部は、前記時系列データから前記トレーニングデータを再選択し、前記予測モデル生成部は、前記取得部が再選択した前記トレーニングデータを用いて予測モデルを生成する、ことを特徴とする。
この発明によれば、時系列データ予測装置は、予測結果の予測精度がよくない場合は、精度のよい予測モデルが得られまで、条件を変えて予測モデルの生成を繰り返すことができる。
また、本発明は、観測値の時系列データに基づいて当該観測値の予測値を算出する時系列データ予測装置であって、所定の観測対象についての観測値の時系列データを類似する複数のグループであるクラスタにクラスタリングするクラスタリング処理部(例えば、実施形態によるクラスタリング処理部33)と、前記クラスタリング処理部がクラスタリングした前記クラスタごとに、前記クラスタにクラスタリングされた前記時系列データを用いて、与えられた時系列データに基づき予測される観測値からなる時系列データを算出する予測モデルを生成する予測モデル生成部(例えば、実施形態による予測モデル生成部34)と、与えられた時系列データと、予測モデル生成部により前記クラスタごとに生成された予測モデルとを用いて時系列データの予測を行う予測部(例えば、実施形態による予測部36)と、を有することを特徴とする時系列データ予測装置である。
この発明によれば、時系列データ予測装置は、時系列データをクラスリングし、観測値の変動のパターンが類似する過去の時系列データからクラスタ毎にあてはまりのよい予測モデルを生成して予測に用いるため、予測の精度を高めることができる。
また、本発明は、上述した時系列データ予測装置であって、前記予測部は、与えられた時系列データが前記クラスタへ所属する確率を表すクラスタ近傍指数を用いて、前記クラスタ毎に生成された予測モデルを合成する、ことを特徴とする。
この発明によれば、時系列データ予測装置は、観測値の変動のパターンに変化がある場合でも、時系列データの予測値を精度よく算出することができる。
また、本発明は、観測値の時系列データに基づいて当該観測値の予測値を算出する時系列データ予測装置が実行する時系列データ予測方法であって、取得部が、所定の観測対象についての観測値の時系列データから所定の時間間隔で連続する複数の前記観測値を予測用データとして取得するとともにトレーニングデータを取得する取得過程と、予測モデル生成部が、前記トレーニングデータを用いて、与えられた時系列データに基づき予測される観測値からなる時系列データを算出する予測モデルを生成する予測モデル生成過程と、予測部が、前記予測モデル生成過程において生成された予測モデルと、前記取得過程において取得した前記予測用データとを用いて観測値の予測値を算出する予測過程と、を有することを特徴とする時系列データ予測方法である。
また、本発明は、観測値の時系列データに基づいて当該観測値の予測値を算出する時系列データ予測装置が実行する時系列データ予測方法であって、クラスタリング処理部が、所定の観測対象についての観測値の時系列データを類似する複数のグループであるクラスタにクラスタリングするクラスタリング処理過程と、予測モデル生成部が、前記クラスタリング処理過程においてクラスタリングされた前記クラスタごとに、前記クラスタにクラスタリングされた前記時系列データを用いて、与えられた時系列データに基づき予測される観測値からなる時系列データを算出する予測モデルを生成する予測モデル生成過程と、予測部が、与えられた時系列データと、予測モデル生成過程において前記クラスタごとに生成された予測モデルとを用いて時系列データの予測を行う予測過程と、を有することを特徴とする時系列データ予測方法である。
また、本発明は、観測値の時系列データに基づいて当該観測値の予測値を算出する時系列データ予測装置として用いられるコンピュータを、所定の観測対象についての観測値の時系列データから所定の時間間隔で連続する複数の観測値のデータを予測用データとして取得するとともにトレーニングデータを取得する取得部、前記トレーニングデータを用いて、与えられた時系列データに基づき予測される観測値からなる時系列データを算出する予測モデルを生成する予測モデル生成部、前記予測モデル生成部により生成された予測モデルと、前記取得部が取得した前記予測用データとを用いて観測値の予測値を算出する予測部、として機能させるプログラムである。
また、本発明は、観測値の時系列データに基づいて当該観測値の予測値を算出する時系列データ予測装置として用いられるコンピュータを、所定の観測対象についての観測値の時系列データを類似する複数のグループであるクラスタにクラスタリングするクラスタリング処理部、前記クラスタリング処理部がクラスタリングした前記クラスタごとに、前記クラスタにクラスタリングされた前記時系列データを用いて、与えられた時系列データに基づき予測される観測値からなる時系列データを算出する予測モデルを生成する予測モデル生成部、与えられた時系列データと、予測モデル生成部により前記クラスタごとに生成された予測モデルとを用いて時系列データの予測を行う予測部、として機能させるプログラムである。
本発明によれば、観測対象の過去の観測値を利用して、観測値の変動のパターンに変化がある場合でも、将来の観測値を精度よく予測することができる。
本発明の一実施の形態による時系列データ予測装置により実行される時系列データの予測アルゴリズムを示す図である。 同実施形態による時系列データ予測システムの構成を示すブロック図である。 同実施形態による時系列データ予測装置の内部構成を示すブロック図である。 同実施形態による時系列データ予測装置の時系列データ予測処理における動作を示すフローチャートである。 同実施形態による予測モデル生成部の詳細な構成を示すブロック図である。 同実施形態による第1特徴量テーブルを示す図である。 同実施形態による第2特徴量テーブルを示す図である。 同実施形態による予測モデル生成部の予測モデル生成処理における動作を示すフローチャートである。 同実施形態による予測モデル生成部の予測モデル学習処理における動作を示すフローチャートである。 同実施形態による評価部の予測モデル選択処理における動作を示すフローチャートである。 同実施形態による評価部のクラスタ別予測モデル適用処理の説明図である。 同実施形態による評価部のクラスタ別予測モデル適用処理における動作を示すフローチャートである。
以下、図面を参照して本発明の一実施の形態を説明する。
[予測アルゴリズムの概要]
図1は、本発明の一実施形態による時系列データ予測装置により実行される時系列データの予測アルゴリズムを示す図である。本実施形態では、時系列データが、宅内のエネルギー需要量の観測値の時系列データである場合を例にして説明する。
まず、時系列データ予測装置は、予め記憶している設定ファイルから、予測利用期間、及び予測対象期間を読み出す(ステップS10)。本実施形態では、時系列データが1分ごとの連続した1日分のエネルギー需要量の観測値を表すデータであり、読出対象期間が365日、予測利用期間が3日(72時間)、予測対象期間が2日(48時間)である場合について説明する。
時系列データ予測装置は、読出対象期間365日分の直近の過去の時系列データX,X,…,X(n=365)をデータベース(DB)から読み出す(ステップS15)。時系列データ予測装置は、読み出した時系列データのうち、予測利用期間3日分の最新の時系列データXn−2,Xn−1,Xを将来の予測対象期間2日分の時系列データの予測に用いる予測用データとし、残りの362日分の時系列データX,X,…,Xn−3を予測モデルの学習に用いる学習用データとする。予測モデルとは、予測利用期間の時系列データを入力パラメータとして入力することにより、予測利用期間の時系列データに続く予測対象期間の時系列データの予測値を算出するための計算式である。
さらに、時系列データ予測装置は、学習用データのうち、予測利用期間と予測対象期間とを合わせた5日分の連続した時系列データXn−7,Xn−6,Xn−5,Xn−4,Xn−3をテストデータとし、残りの時系列データX,X,…,Xn−8をトレーニングデータとする。時系列データ予測装置は、テストデータのうち予測利用期間3日分の時系列データXn−7,Xn−6,Xn−5を評価用テストデータとし、続く予測対象期間2日分の時系列データXn−4,Xn−3を正解照合用テストデータとする(ステップS20)。
時系列データ予測装置は、全てのトレーニングデータを用いて予測モデルを学習する(ステップS25)。この予測モデルを「クラスタなし予測モデル」と記載する。また、時系列データ予測装置は、トレーニングデータをクラスタリングし(ステップS30)、クラスタ別の予測モデルを学習する(ステップS35)。このクラスタ別の予測モデルを「クラスタ別予測モデル」と記載する。
時系列データ予測装置は、テストデータの評価用テストデータを用いて、最新予測モデル、前予測モデル、及び、平均利用予測モデルによる予測結果を算出する。最新予測モデルは、ステップS25で生成されたクラスタなし予測モデル、及びステップS35で生成されたクラスタ別予測モデルである。前予測モデルは、以前の予測に用いたクラスタなし予測モデル、またはクラスタ別予測モデルである。平均利用予測モデルは、予測利用期間分の連続した時系列データの平均を利用した予測モデルである。時系列データ予測装置は、算出した予測結果を正解照合用テストデータと照合し、最も誤差が少ない予測モデルを選択する(ステップS40)。
最新予測モデルは、最新の電力変動を反映した予測モデルであるため、最近特に大きな変動がない場合に、良い精度で予測を行うことができる。一方、前予測モデルは、良い精度を出した実績がある予測モデルである。前予測モデルは、多少前の予測モデルであることが多いため、最近電力変動が大きい場合に、良い精度で予測を行うことができる。また、夏休みに入った場合など、電力使用のパターンが変わった場合に、平均利用予測モデルを利用すると、追従しやすい。
時系列データ予測装置は、ステップS25で生成したクラスタなし予測モデルを選択した場合、内部に備える記憶部にクラスタなし予測モデルを書込むとともに、予測モデル書き換えフラグをONに設定し、クラスタリングフラグをOFFに設定する(ステップS45、ステップS50)。
また、時系列データ予測装置は、ステップS35で生成したクラスタ別予測モデルを選択した場合、内部に備える記憶部にクラスタ別予測モデルを書込むとともに、予測モデル書き換えフラグとクラスタリングフラグをONに設定する(ステップS45、ステップS50)。
また、時系列データ予測装置は、前予測モデルを選択した場合、予測モデル書き換えフラグをOFFに設定し、クラスタリングフラグはそのままとする(ステップS50)。
時系列データ予測装置は、選択した予測モデルにより、予測用データ(時系列データXn−2,Xn−1,X)を用いて、予測対象期間2日分の今後の時系列データの予測結果を算出し、算出した予測結果を出力する(ステップS55)。
[全体構成]
図2は、本発明の一実施形態による時系列データ予測システムの構成を示すブロック図であり、本実施形態と関係する機能ブロックのみを抽出して示してある。同図に示す時系列データ予測システムは、住宅等に備えられたエネルギー需要通知装置1と、時系列データ記憶装置2と、時系列データ予測装置3とを備えて構成される。エネルギー需要通知装置1と時系列データ記憶装置2とは、通信ネットワーク9により接続される。
エネルギー需要通知装置1は、例えば、宅内の配電盤などに取り付けられたセンサなどから宅内におけるエネルギー需要量の観測値を所定の時間間隔で取得する。エネルギー需要通知装置1は、取得したエネルギー需要量の観測値と、この観測値を取得した日時とを示す観測データを、時系列データ記憶装置2へ通知する。観測対象であるエネルギー需要量は、例えば、電力需要量、熱需要量、EV(Electric Vehicle)需要量などである。
時系列データ記憶装置2は、1台または複数台のコンピュータ装置により実現されるデータベースであり、エネルギー需要通知装置1から通知されたエネルギー需要量の観測データを時系列データとして記憶する。
図3は、時系列データ予測装置3の内部構成を示すブロック図であり、本実施形態と関係する機能ブロックのみを抽出して示してある。時系列データ予測装置3は、1台または複数台のコンピュータ装置により実現され、記憶部31、取得部32、クラスタリング処理部33、予測モデル生成部34、評価部35、予測部36、及びズレ量検知部37を備えて構成される。
記憶部31は、時系列データ記憶装置2から読み出されたエネルギー需要量の観測値の時系列データ、エネルギー需要予測を行うときの条件が記述された設定ファイル、前予測モデル、需要予測に用いる予測モデルの種類などの各種データを記憶する。需要予測に用いる予測モデルの種類は、クラスタリングフラグ、書き換えフラグ、平均フラグにより示される。クラスタリングフラグは、需要予測に用いる予測モデルとして選択された最新予測モデルまたは前予測モデルが、クラスタ別予測モデルであるか否かを示す。書き換えフラグは、需要予測に用いる予測モデルとして前予測モデルが選択されたか否かを示す。平均フラグは、需要予測に用いる予測モデルとして平均利用予測モデルが選択されたか否かを示す。
取得部32は、時系列データ記憶装置2から時系列データを読み出す。取得部32は、設定ファイルに従って、読み出した時系列データを、エネルギー需要の予測に用いる予測用データと、予測モデルの生成に用いる学習用データとに分け、さらに学習用データを、最新予測モデル(クラスタなし予測モデル、及びクラスタ別予測モデル)のモデル学習に用いるトレーニングデータと、予測モデルの評価に用いるテストデータとに分ける。
クラスタリング処理部33は、取得部32が取得したトレーニングデータをクラスタリングする。予測モデル生成部34は、取得部32が取得した全てのトレーニングデータを用いてクラスタなし予測モデルを生成するとともに、クラスタリング処理部33によりクラスタリングされたトレーニングデータを用いてクラスタ別予測モデルを生成する。
評価部35は、取得部32が取得した評価用テストデータを用いて各種予測モデルによる予測結果を算出し、算出した予測結果を正解照合用テストデータと照合して最も誤差が少ない予測モデルを選択する。各種予測モデルは、予測モデル生成部34が生成したクラスタなし予測モデル及びクラスタ別予測モデル、記憶部31に前予測モデルとして記憶されているクラスタなし予測モデルまたはクラスタ別予測モデル、ならびに、平均利用予測モデルである。評価部35は、需要予測に用いるとして選択した予測モデルの種類を示す情報を記憶部31に書き込むとともに、選択した予測モデルが最新予測モデルである場合、その選択した最新予測モデルを記憶部31に書き込む。
予測部36は、評価部35が選択した予測モデルにより、取得部32が取得した予測用データを用いて時系列データの予測結果を算出し、算出した予測結果を出力する。ズレ量検知部37は、予測用データを用いて予測部36が算出した予測値と、観測値との差分である実績ズレ量を検知する。
なお、時系列データ記憶装置2と時系列データ予測装置3が、1台のコンピュータ装置により実現されてもよい。
[全体フロー]
図4は、時系列データ予測装置3の時系列データ予測処理における動作を示すフローチャートである。エネルギー需要通知装置1が、エネルギー需要量として電力需要量、熱需要量、EV需要量の観測データを通知する場合、時系列データ予測装置3は、電力需要量、熱需要量、EV需要量それぞれについて、同図の処理を行う。
まず、時系列データ予測装置3の取得部32は、365日分の直近の過去の時系列データX,…,X(n=365)を時系列データ記憶装置2から読み出す(ステップS110)。各時系列データは、連続した1分ごとのエネルギー需要量の1日分の観測値を要素とするベクトルにより表される。なお、時系列データの単位(例えば、1分ごとの連続する観測値からなる1日分)や、時系列データの読出期間(例えば、365日)を記憶部31に記憶されている設定ファイルから読み出すようにしてもよい。取得部32は、読み出した時系列データを、記憶部31に書き込む。
取得部32は、設定ファイルに記述されている予測利用期間、及び予測対象期間に従って、読み出した時系列データの中から予測利用期間分の最新の時系列データを予測用データとし、残りの時系列データを学習用データとする。さらに、取得部32は、学習用データから予測利用期間と予測対象期間とを合わせたデータ数分の連続した時系列データをテストデータとし、残りの時系列データをトレーニングデータとする(ステップS120)。
ここでは、取得部32は、予測利用期間3日分の最新の時系列データXn−2,Xn−1,Xを予測用データとし、残りの362日分の時系列データX,X,…,Xn−3を学習用データとする。さらに、取得部32は、学習用データのうち新しいものから予測利用期間3日と予測対象期間2日とを合わせた5日分の時系列データXn−7,Xn−6,Xn−5,Xn−4,Xn−3をテストデータとし、残りの時系列データX,X,…,Xn−8をトレーニングデータとする。そして、取得部32は、テストデータのうち、古いものから予測利用期間3日分の時系列データXn−7,Xn−6,Xn−5を評価用テストデータとし、続く残りの予測対象期間2日分の時系列データXn−4,Xn−3を正解照合用テストデータとする。
予測利用期間分の時系列データの各要素(観測値)を推定する予測モデルの生成には、既知の特徴量と時系列データの要素との組が必要である。そこで、取得部32は、トレーニングデータから、予測利用期間だけ連続した時系列データからなる予測用トレーニングデータを生成し、生成した予測用トレーニングデータに続く予測対象期間の時系列データを正解取得用トレーニングデータとする。
例えば、取得部32は、時系列データX〜X,時系列データX〜X,時系列データX〜X,…のように含まれる時系列データが重ならないように予測用トレーニングデータとしてもよく、時系列データX〜X,時系列データX〜X,時系列データX〜X,…のように1日ずつずらして予測用トレーニングデータとしてもよい。
クラスタリング処理部33は、取得部32が取得した予測用トレーニングデータをクラスタ分けするカテゴライジングを行う(ステップS130)。そこで、クラスタリング処理部33は、予測用トレーニングデータから得られるクラスタリング用特徴量からなるクラスタリング用多次元データを生成する。クラスタリング用特徴値は、予測用トレーニングデータに含まれる時系列データの要素や、予測用トレーニングデータに含まれる時系列データの要素から算出される値(例えば、15分毎の電力需要量の平均値、電力需要量の最大値と最小値の差など)である。なお、クラスタリング処理部33は、予測用トレーニングデータをそのままクラスタリング用多次元データとして用いてもよい。クラスタリング処理部33は、生成したクラスタリング用多次元データを用いてk−means法や自己組織化マップ法により、学習用データをクラスタ分けする。クラスタ数は、学習用データの数に応じて予め決められた数を用いてもよく、クラスタ数を決定する既存の手法により決めてもよい。クラスタ数を決定する既存の手法には、クラスタ数を変えてクラスタ分析を何通りか行い、所定の基準に基づいて最適なクラスタ数を求める方法や、k−means法により小さいクラスタ数のクラスタに分類した後、分割が適当でないと判断されるまで、各クラスタをさらにk−means法により分割する方法などがある。クラスタリング処理部33は、記憶部31の予測用トレーニングデータに、当該予測用トレーニングデータのクラスタを対応付けて書込む。
予測モデル生成部34は、全ての予測用トレーニングデータとその正解取得用トレーニングデータを用いてクラスタなし予測モデルを学習し、さらに、クラスタリング別にクラスタに属する予測用トレーニングデータとその正解取得用トレーニングデータを用いてクラスタ別予測モデルを生成する(ステップS140)。予測モデル生成部34により学習される予測モデルは、予測利用期間の時系列データから、予測利用期間の時系列データの観測値それぞれの予測値を算出する近似モデルにより構成される。各近似モデルは、観測値の予測に影響を与えると判断された特徴量のみを入力パラメータとして用いたエネルギー需要量の予測式である。なお、この予測モデル生成処理の詳細については後述する。
評価部35は、評価用テストデータ(時系列データXn−7,Xn−6,Xn−5)を用いて、ステップS140において生成された最新予測モデルであるクラスタなし予測モデル、及びクラスタ別予測モデルと、記憶部31に記憶されている前予測モデル(前クラスタなし予測モデルまたは前クラスタ別予測モデル)と、平均利用予測モデルによる予測結果を算出する。評価部35は、算出した予測結果を正解照合用テストデータ(時系列データXn−4,Xn−3)と照合して最も誤差が少ない予測モデルを選択する(ステップS150)。なお、評価部35は、最新予測モデルを選択した場合、クラスタなし予測モデル、及びクラスタ別予測モデルの両方を記憶部31に書き込むようにしてもよい。
評価部35は、クラスタなし予測モデルを選択した場合、記憶部31にクラスタなし予測モデルを書込むとともに、記憶部31の予測モデル書き換えフラグをONに設定し、クラスタリングフラグ、及び平均フラグをOFFに設定する。また、評価部35は、クラスタ別予測モデルを選択した場合、記憶部31にクラスタ別予測モデルを書込むとともに、記憶部31の予測モデル書き換えフラグとクラスタリングフラグをONに設定し、平均フラグをOFFに設定する。また、評価部35は、前予測モデルを選択した場合、記憶部31の予測モデル書き換えフラグ及び平均フラグをOFFに設定し、クラスタリングフラグはそのままとする。また、評価部35は、平均利用予測モデルを選択した場合、記憶部31の平均フラグをONに設定する。
予測部36は、ステップS150において評価部35が選択した予測モデルにより予測用データ(時系列データXn−2,Xn−1,X)を用いて予測結果を算出し、算出した予測結果を出力する(ステップS160)。例えば、時系列データ予測装置3は、1日に1回ステップS110〜ステップS150までの処理を行い、予測モデルを選択する。そして、時系列データ予測装置3の予測部は、1時間ごとに評価部35が選択した予測モデルにより予測用データを用いて算出した48時間分の予測結果の中から、現在の時刻から24時間先までの予測結果を出力する。
なお、上記においては、予想用データの直前の時系列データをテストデータとし、予測モデルの学習に用いていないが、トレーニングデータの中に、直近の使用状況と近いものがあるほど、予測精度の高い予測モデルを生成することができる。そこで、取得部32は、予測用データと、学習用データに含まれる予測利用期間3日分の連続した時系列データとの相関を求め、相関が所定より高いと判断されたものだけを予測用トレーニングデータとして選択するようにしてもよい。つまり、取得部32は、予測用データと相関の高い予測利用期間3日分の連続した時系列データである予測用トレーニングデータと、その予測用トレーニングデータに続く予測対象期間2日分の正解取得用トレーニングデータとをトレーニングデータに含める。この場合、時系列データ予測装置3は、相関を求めずにトレーングデータを取得した場合と比較して、クラスタ数を減少させてもよく、クラスタ別予測モデルを生成しないようにしてもよい。
また、前回、平均利用予測モデルを使用した場合、今までにない新たな時系列パターンになったと考えられる。そこで、取得部32は、記憶部31の平均フラグがONになっている場合、前回の予測用データと、その前の所定の数日間のデータをトレーニングデータに含めるようにしてもよい。
また、取得部32は、学習用データのうち、予測用データと同じ曜日の連続する時系列データが評価用テストデータとなるようにテストデータを取得してもよい。
また、上記においては、取得部32は、予測用トレーニングデータ及び正解取得用トレーニングデータを含むトレーニングデータをテストデータ及び予測データと重ならないように取得しているが、正解取得用トレーニングデータについてはテストデータを含むようにしてもよい。また、テストデータが予測用データを含むようにしてもよい。
予測結果の出力後、次の最新予測モデル生成までの間に、ズレ量検知部37は、予測の対象となった日時における電力需要の観測値を時系列データ記憶装置2から読み出し、読み出した観測値と、予測部36が出力した予測値との差分である実績ズレ量を検知する。ズレ量検知部37は、検知した実績ズレ量が所定値よりも大きい場合、取得部32に予測モデルの生成のやり直しを指示する。これにより、時系列データ予測装置3は、条件を変えてステップS120またはステップS130からの処理を繰り返す。
実績ズレ量が、ズレ量が大きいと判断される所定の基準を超えている場合、ステップS120において、取得部32は、学習用データを再選択する。取得部32は、学習用データに含まれる時系列データX,X,…,Xn−3のうち、時系列データXn−(i+4)〜Xをトレーニングデータとし、X〜Xn−(i+5)及びXn−(i+1)〜Xn−3をトレーニングデータとするなど、学習用データのうち新しい所定期間の時系列データをトレーニングデータに含めるようにする。
あるいは、取得部32は、予測用データと相関の高い予測利用期間3日分の連続した時系列データである予測用トレーニングデータと、その予測用トレーニングデータに続く正解取得用トレーニングデータとをトレーニングデータに含めるようにしてもよい。また、あるいは、時系列データ予測装置3は、予測利用期間や予測対象期間を変えたり、上述したように、トレーニングデータに前回の予測用データが入るようにしてもよい。
また、実績ズレ量が、ズレ量が中程度であると判断される所定の基準を超えている場合、ステップS130からにおいて、クラスタリング処理部33は、クラスタ数を変えるなどして予測モデルの計算をやり直す。
実績ズレ量が所定値よりも小さく、かつ、記憶部31の平均フラグがOFFであり、予測部36が予測値の算出に平均利用予測モデル以外の予測モデル(クラスタなし予測モデル、クラスタ別予測モデル、前予測モデル)が用いられた場合、ズレ量検知部37は、予測用データを用いて平均利用予測モデルにより算出した予測値と、観測値との差分を算出する。算出された差分が所定以下である場合、次の最新予測モデルの生成までの間、予測部36は、平均利用予測モデルを用いて時系列データの予測値を算出する。これにより、予測値の計算量が軽減される。
評価部35は、予測部36が出力した予測結果に対応した日時の観測値が得られた後、事後的に、予測モデルを評価し、記憶部31の各種フラグを書き換えてもよい。つまり、評価部35は、予測結果を得たときに用いた予測用データを用いて、クラスタ別予測モデル、クラスタあり予測モデル、前予測モデル、及び、平均利用予測モデルのそれぞれにより予測結果を算出し、観測値との誤差が最も小さい予測モデルを選択する。評価部35は、選択した予測モデルに応じて、ステップS150の処理と同様に、記憶部31の予測モデル書き換えフラグ、クラスタリングフラグ、及び平均フラグを書き換え、クラスタ別予測モデル、またはクラスタあり予測モデルが選択された場合、選択された予測モデルを記憶部31に書き込む。
続いて、予測モデル生成部34、評価部35、及び予測部36の詳細な動作について説明する。
[予測モデル生成部34の詳細な構成と動作]
図5は、予測モデル生成部34の詳細な構成を示すブロック図である。この図5において、予測モデル生成部34は、トレーニングデータ取得部40、第1特徴量抽出部41、第2特徴量抽出部42、及び予測モデル作成部43を備えて構成される。
トレーニングデータ取得部40は、クラスタなし予測モデルやクラスタ別予測モデルを生成するために使用する予測用トレーニングデータと、その予測用トレーニングデータに対応した正解取得用トレーニングデータを取得する。
第1特徴量抽出部41は、予測モデルを構成する近似モデルの学習に用いる予測用トレーニングデータから特徴量を取得するとともに、当該予測用トレーングデータに続く正解取得用トレーニングデータから電力需要量を読み出す。第1特徴量抽出部41は、特徴量と電力需要量とを対応付けた予め設定された特徴量テーブルテンプレートに書き込んで図6に示す第1特徴量テーブルを生成する。
この図6は、近似モデルの学習に用いる予測用トレーニングデータD〜Ddn毎に抽出された特徴量(x〜x)からなる第1特徴量と、対応する正解取得用トレーニングデータから取得した電力需要量が示されている。第1特徴量テーブルには、予測用トレーニングデータ自体を記述してもよく、予測用トレーニングデータの識別情報を記述してもよい。また、電力需要量は、予測用トレーニングデータに対応した正解取得用トレーニングデータから得られる。
図5に示す第2特徴量抽出部42は、ARD(Automatic Relevance Determination)をモデル学習に用いた手法、例えばVBSR(Variational Bayesian Sparse Regression)の手法を用いたモデル学習を行い、第1特徴量から電力需要量の推定に寄与しない特徴量を除去することにより(詳細に後述)、第1特徴量から第2特徴量を抽出する。
また、第2特徴量抽出部42は、予め設定された特徴量テーブルテンプレートに対して、近似モデルの学習に用いる各予測用トレーニングデータについて抽出された第2特徴量と、予測用トレーニングデータに続く正解取得用トレーニングデータから取得した電力需要量を書き込み、図7に示す第2特徴量テーブルを生成する。
この図7は、図6と同様に、それぞれの予測用トレーニングデータD〜Ddn毎に抽出された特徴量(x〜x)及び電力需要量が示されている。ここで、m>sである。
図5に示す予測モデル作成部43は、第2特徴量テーブルの第2特徴量と電力需要量とから、複数の関数(基底関数)とこの関数の重み付けの係数とから近似される近似モデルを作成する。ここで、予測モデル作成部43は、クリギング(Kriging)法あるいはSVR(Suport Vector Regression)法などにより、特徴量を通過するように近似モデルの基底関数それぞれの係数(クリギング法の場合にはクリギング係数)を求めるモデル学習の処理を行う(後述)。予測モデル作成部43は、予測利用期間の時系列データの観測値それぞれを予測する近似モデルから予測モデルを生成する。
以下、第2特徴量抽出部42が行う、第1特徴量における電力需要量の算出に寄与しない特徴量のリダクション処理について説明する。以下の説明において、ADRの手法の一例としてVBSR法による近似モデルのモデル学習を用いた場合を説明する。
第2特徴量抽出部42は、以下に示す(1)式によるVBSRの予測近似式を用いてモデル学習、すなわち近似モデルに用いる特徴量のリダクション処理を行う。
Figure 2015082259
この(1)式において、ymeanは電力需要量の平均値であり、xは特徴量であり、μはバイアスであり、θは特徴量xの重み付け係数であり、Dはモデル式での予測時に有効な特徴量xの種類の数である。この(1)式の予測近似式は、特徴量と重み付け係数との単純な線形結合で表されており、1次元では直線となり、2次元では平面となる。
また、(1)式の関係を有する重み付け係数を求めるため、第2特徴量抽出部42は、以下の計算を行う。
まず、ベイズ推定における(2)式に示す事後分布を、変分ベイズ法における因子分解により(3)式として示す。すなわち、電力需要量(y)に対して、隠れ変数α及び重み付け係数θをすべて確率変数として、その確率分布を求める。
P(θ,α|y)は、平均電力需要量である場合におけるθ及びαの組を示す事後確率である。また、P(y|θ)はθである場合に平均電力需要量となる事前確率であり、P(θ|α)はαである場合にθとなる事前確率であり、P(α)はαである事前確率である。
Figure 2015082259
Figure 2015082259
また、(3)式に対して第2特徴量抽出部42は、ラプラス近似による以下の(4)式及び(5)式の各々を用いて、それぞれ、E(Q(θ))、E(Q(α))が最大値となるQ(θ)及びQ(α)を求める。
Figure 2015082259
Figure 2015082259
(4)式において、Hはヘッセ行列である。また、(5)式において、<θ Q(θ)は、Q(θ)におけるθ の期待値を示している。
次に、第2特徴量抽出部42は、α=1(i=1、2、…、D)、θ=0(i=1、2、…、D)として初期化し、勾配∂E/∂θを求め、この勾配から∂E/∂θ∂θにより、ヘッセ行列を算出する。このヘッセ行列において、θは、θの転置行列である。
そして、第2特徴量抽出部42は、ニュートン法を用いて(4)式におけるθを順次更新する。また、第2特徴量抽出部42は、更新されたθを用いて(5)式によりαを算出して更新する。
次に、第2特徴量抽出部42は、更新した際に、予め設定されたリダクション閾値未満のθを削除し、新たに∂E/∂θを求め、∂E/∂θ∂θにより、ヘッセ行列を算出し、(4)式及び(5)式を用いてθ及びαの更新処理を行う。ここで、リダクション閾値は、シミュレーション結果などに実験的に求めた、電力需要量の推定に寄与しないとする係数θの値として予め設定しておく。
そして、第2特徴量抽出部42は、上記リダクション閾値未満のθが無くなるまで上述した勾配を求め、θ及びαを更新する処理を繰り返す。
第2特徴量抽出部42は、リダクション閾値未満のθが無くなると、第1特徴量における電力需要量を削除し、残った特徴量を新たに第2特徴量として、図7に示す第2特徴量テーブルを生成する。
次に、予測モデル作成部43が行う、第2特徴量を用いたモデル学習による近似モデル作成処理について説明する。以下の説明において、一例としてクリギング法によるモデル学習を用いた場合を説明する。
予測モデル作成部43は、以下の(6)式に示す近似モデルとしてのクリギング予測式を最終的に求める。この(6)式は、特徴量xからなる関数f(x)と、その重み係数Cとからなる予測値yを推定する近似モデルである。
Figure 2015082259
この(6)式において、重み係数C、関数f(x)は、以下の(7)式及び(8)式により表される。この添字iは近似モデルを作成する際に用いた予測用トレーニングデータを示す番号である。
Figure 2015082259
Figure 2015082259
上記(7)式において、R(x,x−1は特徴量の空間相関行列の逆行列であり、空間相関行列R(x,x)は、以下の(9)式及び(10)式で表される。また、R(x,x)は予測における特徴量と第2特徴量における特徴量との空間的な位置関係を示した行列であり、R(x,x)は第2特徴量における特徴量間の位置関係を示した行列である。また、(9)式における係数βは、以下の(10)式で表される。
Figure 2015082259
Figure 2015082259
上記(9)式においてDは近似モデルを構成する特徴量の数であり、(10)式において添字dは特徴量の番号を示している。θはクリギング係数であり、空間相関の影響範囲を決める数値である。pは空間相関の関係の滑らかさを決める数値である。
また、(9)式における空間相関行列Rにおける縦行列rは、以下の(11)式により表される。この(11)式において、添字tは転置行列を示している。
Figure 2015082259
(6)式において、バイアスCは、以下の(12)式により表される。この(12)式においてIは単位ベクトルである。
Figure 2015082259
また、クリギング係数θは、各々の特徴量x毎に求められ、以下の(13)式により、尤度Lnを最大化するように決定する。
Figure 2015082259
この(13)式において、近似分散値σは、(14)式により求められる。この(14)式において、Nは上述した近似モデルの生成に用いたトレーニングデータの数である。
Figure 2015082259
予測モデル作成部43は、上述したln(Ln)が最大となるクリギング係数θを特徴量毎に求める。クリギング係数θ及び係数pの最適化手法としては、(13)式を用いて、勾配法、焼き鈍し法、遺伝的アルゴリズムが用いられている。本実施形態においては、局所的最適解に収束する場合を防止するため、遺伝的アルゴリズムにより、大域的な探索を行い、その後にln(Ln)が最大として収束させるため、焼き鈍し法を用いている。
次に、予測モデル生成部34の動作を説明する。
図8は、予測モデル生成部34の予測モデル生成処理における動作を示すフローチャートである。
まず、トレーニングデータ取得部40は、全ての予測用トレーニングデータと、それら予測用トレーニングデータそれぞれに続く正解取得用トレーニングデータを記憶部31から読み出して第1特徴量抽出部41に入力する(ステップS210)。予測モデル生成部34は、後述する図9に示す予測モデル学習処理を実行し、学習により生成された予測モデルをクラスタなし予測モデルとする(ステップS220)。
続いて、トレーニングデータ取得部40は、まだ選択していないクラスタを1つ選択する(ステップS230)。トレーニングデータ取得部40は、選択したクラスタに属する全ての予測用トレーニングデータと、それら予測用トレーニングデータそれぞれに対応する正解取得用トレーニングデータを記憶部31から読み出して第1特徴量抽出部41に入力する(ステップS240)、予測モデル生成部34は、後述する図9に示す予測モデル学習処理を実行し、学習により生成された予測モデルをステップS230において選択されたクラスタのクラスタ別予測モデルとする(ステップS250)。まだ選択していないクラスタがある場合(ステップS260)、予測モデル生成部34は、ステップS230の処理に戻る。トレーニングデータ取得部40は、まだ選択していないクラスタを1つ選択し(ステップS230)、予測モデル生成部34は、ステップS240、ステップS250の処理を行う。そして、すべてのクラスタを選択した場合、予測モデル生成部34は、処理を終了する(ステップS260)。
図9は、予測モデル生成部34による予測モデル学習処理における動作を示すフローチャートである。
第1特徴量抽出部41は、入力された予測用トレーニングデータから特徴量を抽出する。第1特徴量抽出部41は、予測用トレーニングデータと、当該予測用トレーニングデータから抽出された特徴量を設定した第1特徴量テーブルを記憶部31に書き込む(ステップS310)。
第1特徴量抽出部41は、予測対象期間の2日間に含まれる要素のうち、未選択の要素を予測対象として1つ選択する(ステップS320)。第1特徴量抽出部41は、各予測用トレーニングデータに続く正解取得用トレーニングデータから、予測対象の要素に対応した電力需要量を取得して、第1特徴量テーブルに書き込んで記憶部31に記憶させる(ステップS330)。
次に、第2特徴量抽出部42は、VBSR法などのARDをモデル学習に用いた手法により、記憶部31の第1特徴量テーブルから読み込んだ第1特徴量から、予測対象の要素の推定に寄与しない特徴量を除去する(ステップS340)。そして、第2特徴量抽出部42は、第1特徴量において除去されずに残った特徴量を、第2特徴量として抽出し(ステップS350)、第2特徴量テーブルを生成して記憶部31に書き込んで記憶させる(ステップS360)。
次に、予測モデル作成部43は、記憶部31の第2特徴量テーブルから第2特徴量を読み込む。そして、予測モデル作成部43は、読み込んだ第2特徴量に含まれる特徴量及び(13)式を用いたクリギング法によるモデル学習を行い(ステップS360)、クリギング予測式である近似モデルを生成する(ステップS370)。
予測モデル作成部43は、まだ予測対象としていない要素がある場合はステップS320に戻って、まだ未選択の要素を選択して予測対象とし、ステップS330からの処理を繰り返す(ステップS380)。予測モデル作成部43は、予測対象期間の2日間に含まれる要素を全て選択した場合、各要素について生成した近似モデルの組を、予測モデルとする(ステップS390)。クラスタ生成処理が、ステップS220から実行された場合、生成された予測モデルはクラスタなし予測モデルとなり、ステップS250から実行された場合、生成された予測モデルはクラスタ別予測モデルとなる。
上述したように、予め電力需要量の予測に寄与しない特徴量を、ARDを用いたモデル学習により削除し、電力需要量の推定に寄与する特徴量のみで、クリギング法を行い最終的な近似モデルを作成するため、クリギング法のみによる近似モデルの生成を行う従来例に比較して、より短い時間で近似モデルを生成することができる。
また、クリギング法のみで近似モデルを生成する場合、電力需要量の推定に寄与しないノイズとなる特徴量も近似モデルに反映されてしまう。
一方、本実施形態によれば、このノイズとなる特徴量をリダクション処理により除去した後に、電力需要量の推定に寄与するとして第2特徴量を抽出し、クリギング法によってこの第2特徴量を用いて近似モデルを学習して予測モデルを生成するため、従来例に比較してより精度の高い予測モデルを生成することが可能である。
[評価部35の詳細な動作]
図10は、評価部35の予測モデル選択処理における動作を示すフローチャートであり、図4のステップS150の詳細な処理を示す。
まず、評価部35は、評価用テストデータから、クラスタリング用特徴量と、予測モデルの入力パラメータとする特徴量を抽出する(ステップS410)。評価部35は、ステップS140において生成されたクラスタなし予測モデルに、抽出した評価用テストデータの特徴量を入力パラメータとしてクラスタ別予測モデルにより予測対象期間2日分の時系列データの予測結果を算出する(ステップS420)。つまり、評価部35は、クラスタなし予測モデルを構成する予測対象期間2日分の各要素の近似モデルそれぞれに、評価用テストデータ(時系列データXn−7,Xn−6,Xn−5)から抽出した特徴量を入力パラメータに用いて予測値を算出し、算出した各要素の予測値からなる予測対象期間2日分の時系列データの予測結果Xn−4’、Xn−3’を得る。
続いて、評価部35は、クラスタリング用特徴量に基づいて、評価用テストデータが各クラスタに属する確率を算出すると、クラスタ毎に生成されたクラスタ別予測モデルを算出した確率を用いて合成し、合成したクラスタ別予測モデルにより評価用テストデータを用いて予測結果を算出する。すなわち、評価部35は、クラスタ毎に評価用テストデータの特徴量を入力パラメータとしてクラスタ別予測モデルにより予測対象期間2日分の各要素の予測値を算出し、算出した各要素の予測値からなる予測対象期間2日分の時系列データの予測結果を得る。評価部35は、各クラスタについて得られた予測対象期間2日分の時系列データの予測結果に、クラスタに属する確率であるクラスタ近傍指数を乗算し、各クラスタについて得られた予測値とクラスタ近傍指数との乗算結果の合計を、予測対象期間2日分の時系列データの予測結果Xn−4’、Xn−3’として算出する(ステップS430)。
評価部35は、記憶部31から、前予測モデルとクラスタリングフラグを読み出す。クラスタリングフラグがOFFである場合(ステップS440:NO)、評価部35は、前予測モデルがクラスタなし予測モデルであると判断する。評価部35は、ステップS420と同様に、抽出した特徴量を入力パラメータとして前予測モデルにより予測対象期間2日分の時系列データの予測結果Xn−4’、Xn−3’を算出する(ステップS450)。
一方、クラスタリングフラグがONである場合(ステップS440:YES)、評価部35は、前予測モデルがクラスタ別予測モデルであると判断する。予測部36は、ステップS430と同様に、前予測モデルを用いて予測対象期間2日分の時系列データの予測結果Xn−4’、Xn−3’を算出する(ステップS460)。
ステップS450またはステップS460の処理の後、評価部35は、評価用テストデータを用いて、平均利用予測モデルにより予測結果を算出する。具体的には、評価部35は、予測利用期間3日分の評価用テストデータ(時系列データXn−7,Xn−6,Xn−5)の平均を1日目の予測結果Xn−4’とし、新しいものから2日分の評価用テストデータ(時系列データXn−6,Xn−5)と1日目の予測結果Xn−4’との平均を予測対象期間2日目の予測結果Xn−3’として算出する(ステップS470)。
評価部35は、各予測モデルにより算出した予測結果Xn−4’、Xn−3’を正解照合用テストデータ(時系列データXn−4,Xn−3)と照合し(ステップS480)、最も誤差が少ない予測モデルを選択する(ステップS490)。誤差の算出には、例えば、赤池情報量基準(AIC:統計モデルの良さを評価するための指標)を用いることができる。具体的には、以下の(15)式により、正解と予測の残差平方和から、分散の最尤推定量を計算して最大対数尤度ll(σ^,a^,b^,c^,…|x,y)を求め、(16)式のlnLに(15)式により求めた最大対数尤度を用いてAICを計算する。求めたAICの値が小ほど、誤差が小さい。なお、x,yは、正解照合用テストデータXn−4、Xn−3の要素、予測結果Xn−4’、Xn−3’の要素、a^,b^,c^,…は、xからyを算出するための多項式のモデルの推定された係数、nはモデルのデータ数、σ2^は推定された偏差、kはモデルのパラメータ数である。
Figure 2015082259
Figure 2015082259
評価部35は、選択に基づいて、記憶部31の記憶内容を更新する。評価部35は、クラスタなし予測モデルを選択した場合、記憶部31にクラスタなし予測モデルを書込むとともに、予測モデル書き換えフラグをONに設定し、クラスタリングフラグ及び平均フラグをOFFに設定する。一方、評価部35は、クラスタ別予測モデルを選択した場合、記憶部31にクラスタ別予測モデルを書込むとともに、予測モデル書き換えフラグとクラスタリングフラグをONに設定し、平均フラグをOFFに設定する。また、評価部35は、前予測モデルを選択した場合、書き換えフラグ及び平均フラグをOFFに設定し、平均利用予測モデルを選択した場合、書き換えフラグをOFFに設定し、平均フラグをONに設定する。評価部35は、最新予測モデルを記憶部31に書き込む場合、予測モデルを構成する各近似モデルの重み付けパラメータの値を書込む。
予測部36は、ステップS490において評価部35が選択した予測モデルにより予測用データ(時系列データXn−2,Xn−1,X)を用いて予測結果を算出し、算出した予測結果を出力する。
図11は、クラスタ別予測モデル適用処理の説明図である。
評価部35は、クラスタ別予測モデルにより予測結果を生成する場合、同図に示すように、評価用テストデータが各クラスに属する確率であるクラスタ近傍指数(以下、「クラス所属確率」と記載する。)を算出するためのクラス分類モデルを作成する。クラスとはクラスタの番号であり、クラスc(c=1,2,…,C)のクラス所属確率をP、クラスcのクラスタをSとすると、クラスcのクラス所属確率Pはテストデータ(評価用テストデータ)がクラスタSに属する確率を表す。クラス分類モデルの作成には、ロジスティック回帰分析の確率導出式を利用したSLR(Sparse Logistic Regression)が用いられる。
評価部35は、作成したクラス分類モデルを用い、評価用テストデータから抽出されたクラスタリング用特徴量について、クラス所属確率P(c=1,2,…,C)を算出する。評価部35は、各クラスタSに分類されているクラスタ別予測モデルMそれぞれを用いて評価用テストデータから算出した解ANSを、以下の(17)式に示すように、その解ANSの算出に用いたクラスタ別予測モデルMに対応するクラス所属確率Pに応じて重み付けして足し合わせたANSを、予測結果とする。
Figure 2015082259
図12は、評価部35のクラスタ別予測モデル適用処理における動作を示すフローチャートあり、図10のステップS430の詳細な処理を示す。
評価部35は、記憶部31から予測用トレーニングデータを読み込むと(ステップS510)、読み込んだ予測用トレーニングデータから抽出したクラスタリング用特徴量を用いて、クラス分類モデルを作成する(ステップS520)。
ロジスティック回帰分析では、Xを従属変数のベクトル、xを説明変数、θを重みとした場合、以下の(18)式を最大化することによって、目的変数であるクラス所属確率Pを(19)式により得る。ただし、X=(x,x,…,x)、θ=(θ,θ,θ,…,θ)、θはクラスタリング用特徴量x(d=1,2,…,D)の重み、Dはクラスタリング用特徴量の種類の数である。なお、添え字(c)、(k)はクラスを示す。また、確率P(S|X)は、Xが与えられたときにクラスタSが得られる事後確率である。
Figure 2015082259
Figure 2015082259
上記より、既知判別結果を持つN個の予測用トレーニングデータがあるときの入力xと出力yの関係は、以下の(20)式となる。
Figure 2015082259
評価部35は、記憶部31から読み出した予測用トレーニングデータのクラスタリング用特徴量を用いて、上記の(20)式が最大となるように重みθを決定する。予測用トレーニングデータがN個である場合、n個目(n=1,2,…,N)の予測用トレーニングデータのクラスタリング用特徴量を従属変数のベクトルX、クラスが正解のときのy (c)を1、クラスが正解ではないときのy (c)を0とする。クラスが正解とは、クラスcのクラスタSが予測用トレーニングデータに設定されているクラスタと一致することをいう。なお、P (c)は、上記の(19)式により算出する。
評価部35は、(20)式が最大となるように決定したθを用いて、以下の(21)式に示すクラス所属確率の導出式、すなわちクラス分類モデルを生成する。なお、tは転置を示し、Xは分類対象の入力データである。
Figure 2015082259
評価部35は、ステップS520において生成したクラス分類モデルである(21)式を用い、評価用テストデータから取得したクラスタリング用特徴量をXとして、当該評価用テストデータのクラス所属確率P (1)〜P (C)を算出する(ステップS530)。評価部35は、図4のステップS140において生成されたクラスタ別予測モデルM〜Mそれぞれを用い、ステップS510において取得した評価用テストデータの特徴量から解ANS〜ANSを算出する。つまり、評価部35は、クラスタS(c=1,2,…,C)毎に、クラスタSのクラスタ別予測モデルを構成する予測対象期間分の各要素の近似モデルそれぞれに、評価用テストデータ(時系列データXn−7,Xn−6,Xn−5)の特徴量を入力パラメータに用いて予測値を算出し、算出した各要素の予測値からなる予測対象期間分の時系列データであるANSを算出する。評価部35は、上述した(17)式を用いて解ANS(c=1,2,…,C)を、クラス所属確率P (1)〜P (C)として得られたクラス所属確率Pにより重み付けして合算し、予測値を算出する(ステップS540)。
評価部35は、図10のステップS490においてクラスタ別予測モデルを選択した場合、各クラスタのクラスタ別予測モデルを記憶部31に書き込むとともに、各クラスタのクラス分類モデルも書き込む。そして、評価部35は、図10のステップS460において前予測モデルであるクラスタ別予測モデルにより予測値を算出する場合、クラス分類モデルを記憶部31から読み出し、図12のステップS530からの処理を行う。
なお、評価部35は、算出されたクラス所属確率のうち最も高いクラス所属確率のクラスのクラスタに分類されているクラスタ別予測モデルを選択し、選択したクラスタ別予測モデルのみを用いて評価用テストデータから予測値を算出してもよい。例えば、評価用テストデータについて算出したクラス所属確率P (1)〜P (C)のうち、最も高いクラス所属確率はP (1)である場合、評価部35は、クラス所属確率が最も高いクラス1のクラスタSに分類されているクラスタ別予測モデルMを選択する。評価部35は、選択したクラスタ別予測モデルMを用いて評価用テストデータから各要素のANSを求め、予測値とする。
[予測部36の詳細な動作]
図4のステップS160において、予測部36は、予測用データから、予測モデルの入力パラメータとする特徴量を抽出する。評価部35がクラスタなし予測モデルを選択した場合、予測部36は、ステップS140において生成されたクラスタなし予測モデルに、抽出した予測用データの特徴量を入力パラメータとしてクラスタ別予測モデルにより予測対象期間2日分の時系列データの予測結果を算出する。つまり、予測部36は、クラスタなし予測モデルを構成する予測対象期間2日分の各要素の近似モデルそれぞれに、予測用データ(時系列データXn−2,Xn−1,X)から抽出した特徴量を入力パラメータに用いて予測値を算出し、算出した各要素の予測値からなる予測対象期間2日分の時系列データの予測結果を算出する。
評価部35がクラスタなし予測モデルを選択した場合、予測部36は、予測用データからクラスタリング用特徴量を抽出し、図12のステップS530、ステップS540と同様の処理により、予測結果を算出する。つまり、予測部36は、ステップS520において評価部35が生成したクラス分類モデルである(21)式を用い、予測用データから取得したクラスタリング用特徴量をXとして、当該予測用データのクラス所属確率P (1)〜P (C)を算出する。予測部36は、図4のステップS140において生成されたクラスタ別予測モデルM〜Mを構成する予測対象期間2日分の各要素の近似モデルそれぞれに、予測用データの特徴量を入力パラメータに用いて予測値を算出し、算出した各要素の予測値からなる予測対象期間2日分の時系列データであるANSを算出する。予測部36は、(17)式を用いて解ANS(c=1,2,…,C)を予測用データのクラス所属確率Pにより重み付けして合算し、予測値を算出する。
評価部35が前予測モデルであるクラスタなし予測モデルを選択した場合、予測部36は、記憶部31から前予測モデルを読み出し、読み出した予測モデルを構成する予測対象期間2日分の各要素の近似モデルそれぞれに、予測用データから抽出した特徴量を入力パラメータに用いて予測値を算出する。予測部36は、算出した各要素の予測値からなる予測対象期間2日分の時系列データの予測結果を算出する。
評価部35が前予測モデルであるクラスタ別予測モデルを選択した場合、予測部36は、記憶部31から前予測モデルとクラス分類モデルを読み出す。予測部36は、図12のステップS530、ステップS540と同様の処理により、予測値を算出する。つまり、予測部36は、読み出したクラス分類モデルである(21)式を用い、予測用データから取得したクラスタリング用特徴量をXとして、当該予測用データのクラス所属確率P (1)〜P (C)を算出する。予測部36は、読み出した前予測モデルであるクラスタ別予測モデルM〜Mを構成する予測対象期間2日分の各要素の近似モデルそれぞれに、予測用データの特徴量を入力パラメータに用いて予測値を算出し、算出した各要素の予測値からなる予測対象期間2日分の時系列データであるANSを算出する。予測部36は、上述した(17)式を用いて解ANS(c=1,2,…,C)を予測用データのクラス所属確率Pにより重み付けして合算し、予測値を算出する。
評価部35が平均利用予測モデルを選択した場合、予測部36は、予測用データ(時系列データXn−2,Xn−1,X)の平均を1日目の予測結果とし、新しいものから2日分の予測用データ(時系列データXn−1,X)と1日目の予測結果との平均を2日目の予測結果として算出する。
[効果]
上述した実施形態によれば、時系列データ予測装置は、エネルギー使用状況が類似しているときのエネルギー需要量の時系列データをカテゴライズし、それぞれのカテゴリ(クラスタ)において予測モデルを生成し、生成した予測モデルを用いて過去のエネルギー需要量の変化から将来のエネルギー需要量の予測値を得るようにした。
また、過去のエネルギー需要量の時系列データをトレーニングデータとして予測モデルを生成する際に、予測対象とエネルギー使用状況が類似した時系列データがトレーニングデータに含まれていないと、精度のよい予測モデルが生成できない。そこで、時系列データ予測装置は、過去に精度がよいと判断された予測モデルを用いたり、予測対象と類似していると判断される時系列データをトレーニングデータに含んだりすることで、よい精度の予測モデルを利用できるようにしている。
よって、電力使用の状況が同じような日が続く場合だけでなく、電力使用の状況が大きく異なる日が続くなど、突発的な需要変動や電力の使用パターンの変動があった場合でも、時系列データ予測装置は、精度よく電力需要量を予測することができる。
[その他]
なお、上述の時系列データ予測装置3は、内部にコンピュータシステムを有している。そして、時系列データ予測装置3の動作の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータシステムが読み出して実行することによって、上記処理が行われる。ここでいうコンピュータシステムとは、CPU及び各種メモリやOS、周辺機器等のハードウェアを含むものである。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
1 エネルギー需要通知装置
2 時系列データ記憶装置
3 時系列データ予測装置
9 通信ネットワーク
31 記憶部
32 取得部
33 クラスタリング処理部
34 予測モデル生成部
35 評価部
36 予測部
37 ズレ量検知部
40 トレーニングデータ取得部
41 第1特徴量抽出部
42 第2特徴量抽出部
43 予測モデル作成部

Claims (13)

  1. 観測値の時系列データに基づいて当該観測値の予測値を算出する時系列データ予測装置であって、
    所定の観測対象についての観測値の時系列データから所定の時間間隔で連続する複数の前記観測値を予測用データとして取得するとともにトレーニングデータを取得する取得部と、
    前記トレーニングデータを用いて、与えられた時系列データに基づき予測される観測値からなる時系列データを算出する予測モデルを生成する予測モデル生成部と、
    前記予測モデル生成部により生成された予測モデルと、前記取得部が取得した前記予測用データとを用いて観測値の予測値を算出する予測部と、
    を有することを特徴とする時系列データ予測装置。
  2. 前記取得部は、前記時系列データから所定の時間間隔で連続する複数の前記観測値を予測用データとして取得し、前記予測用データを除いた前記時系列データから前記所定の時間間隔で連続する複数の前記観測値をテストデータとして取得し、前記予測用データ及び前記テストデータを除いた前記時系列データからトレーニングデータを取得し、
    前記予測モデル生成部により生成された前記予測モデルの予測精度を、前記テストデータを用いて評価する評価部をさらに備える、
    ことを特徴とする請求項1に記載の時系列データ予測装置。
  3. 過去に用いられた予測モデルを格納する記憶部をさらに有し、
    前記評価部は、前記テストデータを用いて、少なくとも前記記憶部から取得した前記予測モデルにより算出した予測値と、前記予測モデル生成部により生成された前記予測モデルにより算出した予測値と、所定期間の時系列データの平均に基づいて予測値を得る平均利用の予測モデルにより算出された予測値とを比較し、
    前記予測部は、前記評価部による比較の結果が最も良い予測モデルと、前記取得部が取得した前記予測用データとを用いて観測値の予測値を算出する、
    ことを特徴とする請求項2に記載の時系列データ予測装置。
  4. 前記取得部は、前記時系列データの中から前記予測用データと相関性が所定より高い時系列データを検索し、検索により得られた時系列データを前記トレーニングデータに含める、
    ことを特徴とする請求項1から請求項3のいずれか1項に記載の時系列データ予測装置。
  5. 前記取得部は、前回の予測において前記平均利用の予測モデルが用いられた場合、前回の予測において予測用データとして用いた時系列データを前記トレーニングデータに含める、
    ことを特徴とする請求項3に記載の時系列データ予測装置。
  6. 前記予測用データを用いて前記予測部により算出された前記予測値と、観測値との差分である実績ズレ量を検知するズレ量検知部をさらに有し、
    前記予測部は、前記実績ズレ量が所定値よりも小さく、かつ、前記予測値の算出に前記予測モデル生成部が生成した前記予測モデルが用いられた場合、前記予測値の算出に用いられた前記予測用データを用いて前記平均利用の予測モデルにより算出された予測値と前記観測値との差分が所定以下であるときには、前記平均利用の予測モデルにより観測値の予測値を算出する、
    ことを特徴とする請求項3に記載の時系列データ予測装置。
  7. 前記予測部により算出された前記予測値と、観測値との差分である実績ズレ量を検知するズレ量検知部をさらに有し、
    前記ズレ量検知部が検知した前記実績ズレ量が所定値よりも大きい場合、
    前記取得部は、前記時系列データから前記トレーニングデータを再選択し、
    前記予測モデル生成部は、前記取得部が再選択した前記トレーニングデータを用いて予測モデルを生成する、
    ことを特徴とする請求項1から請求項6のいずれか1項に記載の時系列データ予測装置。
  8. 観測値の時系列データに基づいて当該観測値の予測値を算出する時系列データ予測装置であって、
    所定の観測対象についての観測値の時系列データを類似する複数のグループであるクラスタにクラスタリングするクラスタリング処理部と、
    前記クラスタリング処理部がクラスタリングした前記クラスタごとに、前記クラスタにクラスタリングされた前記時系列データを用いて、与えられた時系列データに基づき予測される観測値からなる時系列データを算出する予測モデルを生成する予測モデル生成部と、
    与えられた時系列データと、予測モデル生成部により前記クラスタごとに生成された予測モデルとを用いて時系列データの予測を行う予測部と、
    を有することを特徴とする時系列データ予測装置。
  9. 前記予測部は、与えられた時系列データが前記クラスタへ所属する確率を表すクラスタ近傍指数を用いて、前記クラスタ毎に生成された予測モデルを合成する、
    ことを特徴とする請求項8に記載の時系列データ予測装置。
  10. 観測値の時系列データに基づいて当該観測値の予測値を算出する時系列データ予測装置が実行する時系列データ予測方法であって、
    取得部が、所定の観測対象についての観測値の時系列データから所定の時間間隔で連続する複数の前記観測値を予測用データとして取得するとともにトレーニングデータを取得する取得過程と、
    予測モデル生成部が、前記トレーニングデータを用いて、与えられた時系列データに基づき予測される観測値からなる時系列データを算出する予測モデルを生成する予測モデル生成過程と、
    予測部が、前記予測モデル生成過程において生成された予測モデルと、前記取得過程において取得した前記予測用データとを用いて観測値の予測値を算出する予測過程と、
    を有することを特徴とする時系列データ予測方法。
  11. 観測値の時系列データに基づいて当該観測値の予測値を算出する時系列データ予測装置が実行する時系列データ予測方法であって、
    クラスタリング処理部が、所定の観測対象についての観測値の時系列データを類似する複数のグループであるクラスタにクラスタリングするクラスタリング処理過程と、
    予測モデル生成部が、前記クラスタリング処理過程においてクラスタリングされた前記クラスタごとに、前記クラスタにクラスタリングされた前記時系列データを用いて、与えられた時系列データに基づき予測される観測値からなる時系列データを算出する予測モデルを生成する予測モデル生成過程と、
    予測部が、与えられた時系列データと、予測モデル生成過程において前記クラスタごとに生成された予測モデルとを用いて時系列データの予測を行う予測過程と、
    を有することを特徴とする時系列データ予測方法。
  12. 観測値の時系列データに基づいて当該観測値の予測値を算出する時系列データ予測装置として用いられるコンピュータを、
    所定の観測対象についての観測値の時系列データから所定の時間間隔で連続する複数の前記観測値を予測用データとして取得するとともにトレーニングデータを取得する取得部、
    前記トレーニングデータを用いて、与えられた時系列データに基づき予測される観測値からなる時系列データを算出する予測モデルを生成する予測モデル生成部、
    前記予測モデル生成部により生成された予測モデルと、前記取得部が取得した前記予測用データとを用いて観測値の予測値を算出する予測部、
    として機能させるプログラム。
  13. 観測値の時系列データに基づいて当該観測値の予測値を算出する時系列データ予測装置として用いられるコンピュータを、
    所定の観測対象についての観測値の時系列データを類似する複数のグループであるクラスタにクラスタリングするクラスタリング処理部、
    前記クラスタリング処理部がクラスタリングした前記クラスタごとに、前記クラスタにクラスタリングされた前記時系列データを用いて、与えられた時系列データに基づき予測される観測値からなる時系列データを算出する予測モデルを生成する予測モデル生成部、
    与えられた時系列データと、予測モデル生成部により前記クラスタごとに生成された予測モデルとを用いて時系列データの予測を行う予測部、
    として機能させるプログラム。
JP2013220641A 2013-10-23 2013-10-23 時系列データ予測装置、時系列データ予測方法、及びプログラム Expired - Fee Related JP6109037B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013220641A JP6109037B2 (ja) 2013-10-23 2013-10-23 時系列データ予測装置、時系列データ予測方法、及びプログラム
US14/499,358 US9811781B2 (en) 2013-10-23 2014-09-29 Time-series data prediction device of observation value, time-series data prediction method of observation value, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013220641A JP6109037B2 (ja) 2013-10-23 2013-10-23 時系列データ予測装置、時系列データ予測方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2015082259A true JP2015082259A (ja) 2015-04-27
JP6109037B2 JP6109037B2 (ja) 2017-04-05

Family

ID=52827082

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013220641A Expired - Fee Related JP6109037B2 (ja) 2013-10-23 2013-10-23 時系列データ予測装置、時系列データ予測方法、及びプログラム

Country Status (2)

Country Link
US (1) US9811781B2 (ja)
JP (1) JP6109037B2 (ja)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017120647A (ja) * 2015-12-31 2017-07-06 ダッソー システムズDassault Systemes 機械学習システムの更新
WO2017168458A1 (ja) * 2016-03-28 2017-10-05 日本電気株式会社 予測モデル選択システム、予測モデル選択方法および予測モデル選択プログラム
JP2017182308A (ja) * 2016-03-29 2017-10-05 富士通株式会社 相関因子抽出方法、相関因子抽出装置および相関因子抽出プログラム
WO2018150550A1 (ja) * 2017-02-17 2018-08-23 株式会社日立製作所 学習データ管理装置及び学習データ管理方法
KR101919076B1 (ko) 2017-12-20 2018-11-19 (주)지오시스템리서치 시계열 데이터 예측 시스템
JP2019016324A (ja) * 2017-07-11 2019-01-31 日本電信電話株式会社 予測装置、予測方法および予測プログラム
JP2019101490A (ja) * 2017-11-28 2019-06-24 株式会社東芝 時系列データ予測装置、時系列データ予測方法およびコンピュータプログラム
JP2019191777A (ja) * 2018-04-20 2019-10-31 富士通株式会社 機械学習プログラム、機械学習方法および機械学習装置
JP2019204459A (ja) * 2018-05-25 2019-11-28 清水建設株式会社 電力需要予測システム、学習装置及び電力需要予測方法
JP2019204458A (ja) * 2018-05-25 2019-11-28 清水建設株式会社 電力需要予測システム、学習装置及び電力需要予測方法
JP2020009400A (ja) * 2018-06-29 2020-01-16 学校法人慶應義塾 データ処理装置、データ処理システム及びプログラム
KR20200051343A (ko) * 2018-11-05 2020-05-13 (주)엔키아 시계열 데이터 예측 모델 평가 방법 및 장치
JP2020119487A (ja) * 2019-01-25 2020-08-06 株式会社 ビーアイマトリックスBi Matrix Co.,Ltd ピボットテーブル構造のolap結果を用いたディープラーニング予測データ反映システム
US11176481B2 (en) 2015-12-31 2021-11-16 Dassault Systemes Evaluation of a training set
JP2022536825A (ja) * 2019-04-23 2022-08-19 日本電気株式会社 操作結果を予測する方法、電子機器、及びコンピュータプログラム製品
KR102499412B1 (ko) * 2021-09-27 2023-02-13 한국생산기술연구원 데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법
JP2023025801A (ja) * 2021-08-11 2023-02-24 三菱重工業株式会社 予測装置、予測方法およびプログラム
WO2023119456A1 (ja) * 2021-12-21 2023-06-29 富士通株式会社 検知プログラム、検知装置、および検知方法

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095614A (zh) * 2014-04-18 2015-11-25 国际商业机器公司 更新预测模型的方法和装置
US9900215B2 (en) * 2014-11-13 2018-02-20 Microsoft Technology Licensing, Llc Automatically recommending point of presence centers
US11443015B2 (en) * 2015-10-21 2022-09-13 Adobe Inc. Generating prediction models in accordance with any specific data sets
US10949426B2 (en) * 2015-12-28 2021-03-16 Salesforce.Com, Inc. Annotating time series data points with alert information
KR102215690B1 (ko) * 2015-12-29 2021-02-16 삼성에스디에스 주식회사 시계열의 데이터를 모니터링 하는 방법 및 그 장치
CN105701562B (zh) * 2016-01-05 2019-12-17 上海思源弘瑞自动化有限公司 训练方法、所适用的预测发电功率的方法及各自系统
WO2017159402A1 (ja) * 2016-03-16 2017-09-21 日本電気株式会社 共クラスタリングシステム、方法およびプログラム
KR101779584B1 (ko) * 2016-04-29 2017-09-18 경희대학교 산학협력단 복잡도 감소에 기반한 ds-cdma 시스템에서의 원신호 복원 방법
US11537847B2 (en) * 2016-06-17 2022-12-27 International Business Machines Corporation Time series forecasting to determine relative causal impact
US10809674B2 (en) * 2016-09-16 2020-10-20 Honeywell Limited Model-plant mismatch detection using model parameter data clustering for paper machines or other systems
US11449046B2 (en) * 2016-09-16 2022-09-20 Honeywell Limited Model-plant mismatch detection with support vector machine for cross-directional process behavior monitoring
US10712733B2 (en) * 2016-12-12 2020-07-14 Mitsubishi Electric Research Laboratories, Inc. Methods and systems for discovery of prognostic subsequences in time series
EP3376446A1 (en) * 2017-03-18 2018-09-19 Tata Consultancy Services Limited Method and system for anomaly detection, missing data imputation and consumption prediction in energy data
JP6831280B2 (ja) * 2017-03-24 2021-02-17 株式会社日立製作所 予測システム、及び、予測方法
CN107944607B (zh) * 2017-11-03 2022-01-18 渤海大学 一种基于时间序列的抽油井停井时间集成预测方法
JP6954082B2 (ja) * 2017-12-15 2021-10-27 富士通株式会社 学習プログラム、予測プログラム、学習方法、予測方法、学習装置および予測装置
US20210064432A1 (en) * 2018-02-05 2021-03-04 Telefonaktiebolaget Lm Ericsson (Publ) Resource needs prediction in virtualized systems: generic proactive and self-adaptive solution
US20210383250A1 (en) * 2018-02-26 2021-12-09 Hitachi Information & Telecommunication Engineering, Ltd. State Prediction Apparatus and State Prediction Control Method
EP3779812A4 (en) * 2018-03-30 2021-12-29 NEC Solution Innovators, Ltd. Index computation device, prediction system, progress prediction evaluation method, and program
CN108776694A (zh) * 2018-06-05 2018-11-09 哈尔滨工业大学 一种时间序列异常点检测方法及装置
EP3585056A1 (en) * 2018-06-20 2019-12-25 Telefónica, S.A. Method and system for optimizing event prediction in data systems
CN108921355B (zh) * 2018-07-03 2022-02-01 国家计算机网络与信息安全管理中心 一种基于时间序列预测模型的告警阈值设定方法及装置
US20210182736A1 (en) * 2018-08-15 2021-06-17 Nippon Telegraph And Telephone Corporation Learning data generation device, learning data generation method, and non-transitory computer readable recording medium
US11556824B2 (en) * 2019-09-06 2023-01-17 Fujitsu Limited Methods for estimating accuracy and robustness of model and devices thereof
CN110659681B (zh) * 2019-09-17 2023-07-25 上海仪电(集团)有限公司中央研究院 基于模式识别的时序数据预测系统及方法
US11755946B2 (en) 2019-11-08 2023-09-12 International Business Machines Corporation Cumulative reward predictor training
US11823083B2 (en) 2019-11-08 2023-11-21 International Business Machines Corporation N-steps-ahead prediction based on discounted sum of m-th order differences
JP2021144415A (ja) * 2020-03-11 2021-09-24 本田技研工業株式会社 情報処理方法、情報処理装置、異常判定システム、異常判定装置、異常判定方法、及びプログラム
US11455322B2 (en) * 2020-05-12 2022-09-27 International Business Machines Corporation Classification of time series data
CN111814106A (zh) * 2020-07-09 2020-10-23 平安科技(深圳)有限公司 时序数据滞后性处理方法、装置、电子设备及存储介质
CN112288163A (zh) * 2020-10-29 2021-01-29 平安科技(深圳)有限公司 目标对象的目标因子预测方法及相关设备
CN113065702B (zh) * 2021-03-31 2023-08-08 中国地质大学(武汉) 基于st-seep分段法和时空arma模型的滑坡位移多线性预测方法
CN113591993B (zh) * 2021-08-02 2022-08-09 上海华能电子商务有限公司 一种基于时空聚类的电力物资需求预测方法
US20230100716A1 (en) * 2021-09-30 2023-03-30 Bmc Software, Inc. Self-optimizing context-aware problem identification from information technology incident reports
CN114118530A (zh) * 2021-11-04 2022-03-01 杭州经纬信息技术股份有限公司 一种基于多户电力消耗预测模型的预测方法及装置
US11863466B2 (en) * 2021-12-02 2024-01-02 Vmware, Inc. Capacity forecasting for high-usage periods
CN114418243B (zh) * 2022-03-28 2022-07-29 南方电网数字电网研究院有限公司 分布式新能源云端网格预测方法与系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001236337A (ja) * 2000-02-22 2001-08-31 Fuji Electric Co Ltd ニューラルネットワークによる予測装置
JP2004086896A (ja) * 2002-08-06 2004-03-18 Fuji Electric Holdings Co Ltd 適応的予測モデル構築方法及び適応的予測モデル構築システム
JP2004094437A (ja) * 2002-08-30 2004-03-25 Fuji Electric Holdings Co Ltd データ予測方法及びデータ予測システム
JP2013114629A (ja) * 2011-11-30 2013-06-10 Fujitsu Ltd 予測装置、予測プログラムおよび予測方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3334807B2 (ja) * 1991-07-25 2002-10-15 株式会社日立製作所 ニュ−ラルネットを利用したパタ−ン分類方法および装置
US7421380B2 (en) * 2004-12-14 2008-09-02 Microsoft Corporation Gradient learning for probabilistic ARMA time-series models
EP2614480A4 (en) * 2010-09-07 2015-05-06 Univ Leland Stanford Junior MEDICAL RADIATION SYSTEMS AND METHODS
JP2013109550A (ja) 2011-11-21 2013-06-06 Kddi Corp 宅内エネルギー消費量予測システム、宅内エネルギー消費量予測サーバ、宅内エネルギー消費量予測方法およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001236337A (ja) * 2000-02-22 2001-08-31 Fuji Electric Co Ltd ニューラルネットワークによる予測装置
JP2004086896A (ja) * 2002-08-06 2004-03-18 Fuji Electric Holdings Co Ltd 適応的予測モデル構築方法及び適応的予測モデル構築システム
JP2004094437A (ja) * 2002-08-30 2004-03-25 Fuji Electric Holdings Co Ltd データ予測方法及びデータ予測システム
JP2013114629A (ja) * 2011-11-30 2013-06-10 Fujitsu Ltd 予測装置、予測プログラムおよび予測方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
福沢充孝: "エネルギー管理パッケージEnemapと省エネ自動制御事例", 横河技報, vol. 第50巻,第3号, JPN6016041723, 15 September 2006 (2006-09-15), JP, pages 99 - 102, ISSN: 0003429689 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11176481B2 (en) 2015-12-31 2021-11-16 Dassault Systemes Evaluation of a training set
JP2017120647A (ja) * 2015-12-31 2017-07-06 ダッソー システムズDassault Systemes 機械学習システムの更新
US11308423B2 (en) 2015-12-31 2022-04-19 Dassault Systemes Update of a machine learning system
WO2017168458A1 (ja) * 2016-03-28 2017-10-05 日本電気株式会社 予測モデル選択システム、予測モデル選択方法および予測モデル選択プログラム
JPWO2017168458A1 (ja) * 2016-03-28 2018-09-13 日本電気株式会社 予測モデル選択システム、予測モデル選択方法および予測モデル選択プログラム
JP2017182308A (ja) * 2016-03-29 2017-10-05 富士通株式会社 相関因子抽出方法、相関因子抽出装置および相関因子抽出プログラム
WO2018150550A1 (ja) * 2017-02-17 2018-08-23 株式会社日立製作所 学習データ管理装置及び学習データ管理方法
JPWO2018150550A1 (ja) * 2017-02-17 2019-07-25 株式会社日立製作所 学習データ管理装置及び学習データ管理方法
JP2019016324A (ja) * 2017-07-11 2019-01-31 日本電信電話株式会社 予測装置、予測方法および予測プログラム
JP2019101490A (ja) * 2017-11-28 2019-06-24 株式会社東芝 時系列データ予測装置、時系列データ予測方法およびコンピュータプログラム
KR101919076B1 (ko) 2017-12-20 2018-11-19 (주)지오시스템리서치 시계열 데이터 예측 시스템
JP7067235B2 (ja) 2018-04-20 2022-05-16 富士通株式会社 機械学習プログラム、機械学習方法および機械学習装置
JP2019191777A (ja) * 2018-04-20 2019-10-31 富士通株式会社 機械学習プログラム、機械学習方法および機械学習装置
JP2019204458A (ja) * 2018-05-25 2019-11-28 清水建設株式会社 電力需要予測システム、学習装置及び電力需要予測方法
JP2019204459A (ja) * 2018-05-25 2019-11-28 清水建設株式会社 電力需要予測システム、学習装置及び電力需要予測方法
JP7079662B2 (ja) 2018-05-25 2022-06-02 清水建設株式会社 電力需要予測システム、学習装置及び電力需要予測方法
JP7079663B2 (ja) 2018-05-25 2022-06-02 清水建設株式会社 電力需要予測システム、学習装置及び電力需要予測方法
JP7272575B2 (ja) 2018-06-29 2023-05-12 慶應義塾 データ処理装置、データ処理システム及びプログラム
JP2020009400A (ja) * 2018-06-29 2020-01-16 学校法人慶應義塾 データ処理装置、データ処理システム及びプログラム
KR20200051343A (ko) * 2018-11-05 2020-05-13 (주)엔키아 시계열 데이터 예측 모델 평가 방법 및 장치
KR102124425B1 (ko) 2018-11-05 2020-06-18 (주)엔키아 시계열 데이터 예측 모델 평가 방법 및 장치
JP2020119487A (ja) * 2019-01-25 2020-08-06 株式会社 ビーアイマトリックスBi Matrix Co.,Ltd ピボットテーブル構造のolap結果を用いたディープラーニング予測データ反映システム
JP2022536825A (ja) * 2019-04-23 2022-08-19 日本電気株式会社 操作結果を予測する方法、電子機器、及びコンピュータプログラム製品
JP7355115B2 (ja) 2019-04-23 2023-10-03 日本電気株式会社 操作結果を予測する方法、電子機器、及びコンピュータプログラム製品
JP2023025801A (ja) * 2021-08-11 2023-02-24 三菱重工業株式会社 予測装置、予測方法およびプログラム
KR102499412B1 (ko) * 2021-09-27 2023-02-13 한국생산기술연구원 데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법
WO2023119456A1 (ja) * 2021-12-21 2023-06-29 富士通株式会社 検知プログラム、検知装置、および検知方法

Also Published As

Publication number Publication date
JP6109037B2 (ja) 2017-04-05
US20150112900A1 (en) 2015-04-23
US9811781B2 (en) 2017-11-07

Similar Documents

Publication Publication Date Title
JP6109037B2 (ja) 時系列データ予測装置、時系列データ予測方法、及びプログラム
CN109657805B (zh) 超参数确定方法、装置、电子设备及计算机可读介质
JP5143879B2 (ja) ランキング指向の協調フィルタリング推薦方法および装置
CN111258593B (zh) 应用程序预测模型的建立方法、装置、存储介质及终端
Petelin et al. Optimization of Gaussian process models with evolutionary algorithms
US20220253725A1 (en) Machine learning model for entity resolution
CN117391258B (zh) 一种负碳排放的预测方法、装置、设备及存储介质
JP7481902B2 (ja) 管理計算機、管理プログラム、及び管理方法
JP6950504B2 (ja) 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置
Cheng et al. Forecast combination with outlier protection
Li et al. Classification-oriented dawid skene model for transferring intelligence from crowds to machines
JPWO2014087590A1 (ja) 最適化装置、最適化方法および最適化プログラム
CN113435101A (zh) 一种基于粒子群优化的支持向量机停电预测方法
Villa Bayesian estimation of the threshold of a generalised pareto distribution for heavy-tailed observations
JP6233432B2 (ja) 混合モデルの選択方法及び装置
JP7458268B2 (ja) 情報処理装置、情報処理方法、コンピュータプログラム及び情報処理システム
CN114821248A (zh) 面向点云理解的数据主动筛选标注方法和装置
CN108897818B (zh) 确定数据处理过程老化状态的方法、装置及可读存储介质
CN113850314A (zh) 客户价值等级预测模型建立方法、装置、介质及设备
Fernández et al. Diffusion methods for wind power ramp detection
CN112906785A (zh) 基于融合的零样本物体种类识别方法、装置及设备
Vakilzadeh Stochastic model updating and model selection with application to structural dynamics
JP5421842B2 (ja) 影響力解析装置、影響力解析方法、およびプログラム
Liu et al. Identification of gene regulatory networks using variational bayesian inference in the presence of missing data
CN116679981B (zh) 一种基于迁移学习的软件系统配置调优方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170228

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170307

R150 Certificate of patent or registration of utility model

Ref document number: 6109037

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees