最初に、本発明の理解を容易にするために、本発明において用いられる種々のデータについて説明する。また、以下に示す説明では、予測対象が、ある発電事業者(特定規模電気事業者であってもよい。)の風力発電の発電量(以下、単に風力発電量と記す。)である場合を例にする。予測対象は、例えば、再生可能エネルギーの発電に関するものであり、次に述べる気象予報の対象とは、異なる。
気象予報データは、将来の気象の予報を示すデータである。ここで、気象予報の対象となる項目は1つとは限らず、雲量、気温、湿度等の複数の項目であってもよい。これらの項目の予報は数値で示されているものとする。例えば、予報の項目に天候がある場合、晴れ、曇り、雨、雪等は数値化されて示されているものとする。また、将来とは、例えば、3時間後等の1つの時点だけであっても、あるいは、3時間後、6時間後、および9時間後等の複数の時点であってもよい。すなわち、ある時点で得られた気象予報データは、例えば、その時点から3時間後、6時間後、および9時間後等の複数の時点における各項目の予測値を含んでいてもよい。なお、ここで示した「3時間後」等は例示であり、これらの値に限定されるわけでない。
気象予報データは、例えば、気象予報データ配信会社によって定期的に配信される。また、本発明では、ある時点で配信された気象予報データと、その時点における予測対象(風力発電量)の実績値とが対応付けられて、時系列順に記憶手段(例えば、後述の記憶装置3)に記憶されるものとする。図1は、気象予報データと予測対象の実績値とが対応付けられて時系列順に記憶されている状態を示す模式図である。以下、例えば、時刻t0に配信された気象予報データを時刻t0の気象予報データと記す。時刻t0の気象予報データは、時刻t0から見て将来の気象予報を含んでいる。図1に示す例では、時刻t0の気象予報データと実績値が最新である。
予測装置(例えば、後述の予測装置2)は、最新の気象予報データが得られると、記憶手段に記憶されている、時刻t0以前の過去の所定期間分の気象予報データと実績値とを学習データとして用いて、予測対象(風力発電量)の予測回帰モデルを導出する。図2は、時刻t0の気象予報データが得られた場合の学習データとなる気象予報データおよび実績値を示す模式図である。予測装置は、学習データを、時刻t0の気象予報データおよび実績値に対応付けて記憶手段に記憶させる。また、この学習データを時刻t0の学習データと記す。なお、図2では、過去の所定期間の例として、過去60日分を例示している。
なお、予測回帰モデルは、例えば、予測対象を目的変数とする数式(予測式)で表される。予測装置は、時刻t0の気象予報データを予測回帰モデルに適用することによって(例えば、時刻t0の気象予報データを予測回帰モデルに代入することによって)、予測対象の予測値を算出する。なお、予測回帰モデルを単に予測モデルと称してもよい。予測装置は、時刻t0の気象予報データを用いて算出した予測対象の予測値を、時刻t0の気象予報データ、予測対象の実績値、および学習データに対応付けて記憶手段に記憶させる。予測装置は、最新の気象予報データが得られる毎に同様の処理を行う。従って、図3に示すように、気象予報データ、実績値、学習データ、および予測値が時系列順に記憶手段に蓄積されていく。時刻t0の気象予報データおよび学習データを用いて算出された予測値は、時刻t0から一定期間後(以下の説明ではP時間後とする)における予測対象の予測値である。すなわち、時刻t0+Pにおける風力発電量の予測値である。
気象予報データおよび実績値は、定期的に得られる。気象予報データおよび実績値が得られる間隔は、例えば、1時間であっても、30分であっても、あるいは他の時間間隔であってもよい。以下に示す例では説明を簡単にするために、時刻t0+Pになると、時刻t0+Pの気象予報データおよび実績値が得られるものとする。すると、予測装置は、時刻t0に算出された予測値(時刻t0+Pにおける風力発電量の予測値)と、時刻t0+Pに得られた実績値(時刻t0+Pにおける風力発電量の実績値)との差分である誤差を計算する。予測装置は、この誤差を、時刻t0の気象予報データ、実績値、学習データ、および予測値に対応付けて記憶手段に記憶させる。予測装置は、最新の実績値が得られる毎に同様の処理を行う。従って、図4に示すように、気象予報データ、実績値、学習データ、予測値、および誤差が時系列順に記憶手段に蓄積されていく。
以上の説明から分かるように、時刻t0で気象予報データおよび実績値が得られた場合、時刻t0のデータとして気象予報データ、実績値、学習データ、および予測値が対応付けて記憶手段に記憶される。その時刻からP時間後に、新たに気象予報データおよび実績値が得られた時に、時刻t0のデータとして誤差も気象予報データ、実績値、学習データ、および予測値に対応付けられて、記憶手段に記憶される。
次に、本発明の予測分布推定システムは、上記のように記憶されたデータを用いて、新たに予測値が得られた場合に、予測対象の予測分布を推定する。以下、この動作の概略を説明する。
時刻t0の気象予報データおよび実績値が得られると、予測装置は、学習データを特定し、学習データから予測回帰モデルを導出し、さらに予測対象の予測値を算出する。そして、時刻t0のデータとして、気象予報データ、実績値、学習データ、および予測値が対応付けられて記憶される。図5は、この状態を示す模式図である。
本発明の予測分布推定システムは、個々の時刻における気象予報データおよび学習データの組に着目し、最新の時刻t0の気象予報データおよび学習データの組と、過去の時刻における気象予報データおよび学習データの組との類似の程度を表す指標値を算出する。最新の時刻t0以前の、この指標値を算出する対象となる過去の時間の範囲を探索対象期間と記す。図5では、探索対象期間の例として90日を例示している。
また、予測分布推定システムは、組同士の類似の程度を表す指標値として組同士の距離を用いてもよい。例えば、時刻t0における気象予報データおよび学習データをそれぞれV0,X0とする。また、探索対象期間内の時刻tにおける気象予報データおよび学習データをそれぞれVt,Xtとする。予測分布推定システムは、(X0,V0)と(Xt,Vt)との距離を算出すればよい。なお、X0,V0,Xt,Vtはそれぞれ、行列で表される。この場合、予測分布推定システムは、距離として、例えば、最近隣距離を算出することが好ましい。ただし、距離は、最近隣距離以外の距離であってもよい。距離が小さいほど、組同士は類似していることを表し、距離が大きいほど、組同士は類似していないことを表している。
予測分布推定システムは、最新の時刻t0の気象予報データおよび学習データの組と、探索対象期間の各時刻における気象予報データおよび学習データの組との距離を算出する。なお、予測分布推定システムは、誤差がまだ算出されていない時刻に関しては、距離の算出対象から除外してよい。
そして、予測分布推定システムは、距離が所定の条件を満たす過去の時刻における気象予報データおよび学習データの組を特定し、その組に対応する誤差を記憶手段から抽出する(換言すれば、読み込む)。ここで、所定の条件として、算出された距離に対して昇順に順位をつけたときに、例えば、上位15%以内の順位に入っているという条件等を用いることができる。すなわち、予測分布推定システムは、時刻t0の気象予報データおよび学習データの組との距離が短い過去の組を特定する。換言すれば、予測分布推定システムは、時刻t0の気象予報データおよび学習データの組と類似している過去の組を特定する。ここでは、上位15%以内の順位に入っているという条件を例示したが、条件として、例えば、上位所定番目までの順位に入っているという条件を用いてもよい。
予測分布推定システムは、上記のように抽出した各誤差から、誤差の分布を導出する。そして、その誤差の分布と、時刻t0に得られた予測値(すなわち、時刻t0+Pにおける風力発電量の予測値)とに基づいて、時刻t0+Pでの予測分布を算出する。
気象状況が同じであれば、予測対象(風力発電量)も同じになる。従って、気象予報データ同士が類似していれば、気象予報データが得られた時刻から所定時間後における予測対象の実績値同士も近い値になる。また、気象予報データ同士が類似していて、学習データ同士も類似していれば、得られる予測値同士も近い値になる。従って、時刻t0の気象予報データおよび学習データの組と類似している過去の組を特定し、その組に対応する誤差を抽出した場合、その誤差のばらつきは小さい。従って、ばらつきの小さい誤差の分布が得られ、その結果、予測分布においてもばらつきが小さくなる。すなわち、精度の高い予測分布が得られる。従って、信頼区間を算出する場合にも、信頼区間の幅は小さくなり、好ましい信頼区間が得られる。
以下、図面を参照して、本発明の実施形態を説明する。
図6は、本発明の予測分布推定システムの構成例を示すブロック図である。図6に例示する予測分布推定システムは、データ受信装置1と、予測装置2と、記憶装置3と、推定装置4と、算出装置5とを備える。
記憶装置3は、図4に例示するように、気象予報データ、実績値、学習データ、予測値、および誤差を対応付けて、時系列順に記憶する。なお、図6では、対応付けられたデータ(気象予報データ、実績値、学習データ、予測値、および誤差)の集合を時系列データベース31として、示している。
データ受信装置1は、データ受信部11と、気象予報データ出力部12とを備える。
データ受信部11は、例えば、外部のシステム(図示略)から、ある時刻に得られた気象予報データと、その時刻における予測対象(本例では、風力発電量)の実績値とを対応付けた情報を受信する。説明を簡単にするため、気象予報データおよび実績値は、時刻の情報も含んでいるものとする。ある時刻に得られた気象予報データとは、例えば、ある時刻に気象予報データ配信会社によって配信された気象予報データである。データ受信部11は、例えば、定期的に、ある時刻に得られた気象予報データと、その時刻における予測対象の実績値とを対応付けた情報を受信する。データ受信部11が、情報を受信する間隔は、例えば、1時間あるいは30分であるが、これらの時間間隔でなくてもよい。データ受信部11は、ある時刻の気象予報データおよび予測対象の実績値を対応付けた情報を受信すると、その情報を記憶装置3に記憶させる。また、データ受信部11は、受信した情報のうち、気象予報データを気象予報データ出力部12に送る。
気象予報データを気象予報データ出力部12は、データ受信部11から気象予報データが送られると、その気象予報データを予測装置2内の予測値・誤差算出部22と、推定装置4内の近傍データ抽出部41とに出力(送信)する。
データ受信部11および気象予報データ出力部12は、例えば、プログラムに従って動作するコンピュータのCPUによって実現される。また、データ受信部11および気象予報データ出力部12が別々のハードウェアによって実現されてもよい。
予測装置2は、モデル導出部21と、予測値・誤差算出部22とを備える。
モデル導出部21は、最新の時刻(時刻t0とする。)の気象予報データと予測対象の実績値とを対応付けた情報が記憶装置3に記憶されると、その時刻t0以前の過去の所定期間分の気象予報データと実績値とを学習データとして用いて、予測対象の予測回帰モデルを導出する。予測回帰モデルは、予測対象のP時間後の値(予測値)を算出するためのモデルである。モデル導出部21は、その時刻t0における予測回帰モデルの導出に用いた学習データを、その時刻t0の気象予報データ、実績値に対応させて、記憶装置3に記憶させる。また、モデル導出部21は、導出した予測回帰モデルを予測値・誤差算出部22に送る。
予測値・誤差算出部22は、モデル導出部21から受けた予測回帰モデルに、気象予報データ出力部12から入力された時刻t0の気象予報データを適用することによって、予測対象の予測値を算出する。この予測値は、時刻t0からP時間後(すなわち、時刻t0+P)における予測対象の予測値である。予測値・誤差算出部22は、この予測値を、時刻t0の気象予報データ、実績値、および学習データに対応させて、記憶装置3に記憶させる。
その後、データ受信装置1が、時刻t0+Pにおける予測対象の実績値を受信し、記憶装置3に記憶させたとする。すると、予測値・誤差算出部22は、時刻t0の気象予報データに対応付けられている予測値(時刻t0から見て将来の時刻である時刻t0+Pにおける予測値)と、時刻t0+Pにおける予測対象の実績値との差分である誤差を算出する。予測値・誤差算出部22は、この誤差を、時刻t0の気象予報データ、実績値、学習データ、および予測値に対応付けて、記憶装置3に記憶させる(図4参照)。
モデル導出部21および予測値・誤差算出部22は、例えば、プログラムに従って動作するコンピュータのCPUによって実現される。また、モデル導出部21および予測値・誤差算出部22が別々のハードウェアによって実現されてもよい。
推定装置4は、近傍データ抽出部41と、誤差分布導出部42とを備える。
近傍データ抽出部41は、気象予報データ出力部12から入力された最新の気象予報データに対応する学習データを記憶装置3から読み込み、最新の気象予報データおよび学習データの組を特定する。この組を最新の組と記す。近傍データ抽出部41は、探索対象期間内の気象予報データおよび学習データの組毎に、その組と、最新の組との距離を算出する。近傍データ抽出部41は、距離が所定の条件を満たしている探索対象期間内の組を特定し、その組に対応する誤差をそれぞれ記憶装置3から抽出する。以下、この条件が、算出した距離に対して昇順に順位をつけたときに距離が上位15%以内の順位に入っていることという条件である場合を例にして説明する。このような条件を満たしている組は、最新の組と類似している過去の組と言うことができる。また、そのような過去の組に対応する誤差群を近傍データと記す場合がある。近傍データ抽出部41は、記憶装置3から抽出した各誤差(近傍データ)を誤差分布導出部42に送る。なお、距離に関する条件は、上記の例に限定されない。例えば、例示した“15%”という値は、得られる距離の数に応じて、定めればよい。なお、予測分布の精度を向上させるためには、“15%”に相当する値は、可能な限り小さくすることが好ましい。
誤差分布導出部42は、近傍データ抽出部41から送られた各誤差に基づいて、誤差の分布を導出する。例えば、誤差分布導出部42は、各誤差を正規分布に合わせてフィッティングする。また、誤差分布導出部42は、その分布のパラメータを算出する。誤差分布導出部42は、導出した誤差の分布をそれぞれ、算出装置5内の予測分布導出部52および信頼区間算出部51に出力(送信)する。
近傍データ抽出部41および誤差分布導出部42は、例えば、プログラムに従って動作するコンピュータのCPUによって実現される。また、近傍データ抽出部41および誤差分布導出部42が別々のハードウェアによって実現されていてもよい。
算出装置5は、予測分布導出部52と、信頼区間算出部51と、表示部53とを備える。
予測分布導出部52は、最新の組に基づいて抽出された誤差群から導出された誤差の分布と、最新の予測値とに基づいて、最新の予測分布を導出する。例えば、上記の例のように、各誤差を正規分布に合わせてフィッティングした場合、誤差分布は正規分布として得られる。予測分布導出部52は、この正規分布の平均値が予測値になるように誤差の分布を平行移動することによって、予測分布を導出する。
信頼区間算出部51は、最新の組に基づいて抽出された誤差群から導出された誤差の分布と、最新の予測値とに基づいて、最新の予測値に対応する信頼区間を算出する。
表示部53は、予測値をグラフ表示するとともに、予測値に対応する予測分布をそのグラフ内に表示する。また、表示部53は、予測値に対応する信頼区間もグラフ内に表示する。信頼区間の表示は必須ではないが、表示部53は、予測値および予測分布とともに、信頼区間も表示することが好ましい。なお、信頼区間を表示しない場合には、信頼区間算出部51が設けられていなくてもよい。表示部53が表示するグラフの例については後述する。
予測分布導出部52、信頼区間算出部51および表示部53は、例えば、ディスプレイ装置を有し、プログラムに従って動作するコンピュータのCPUによって実現される。表示部53に関しては、グラフを定め、そのグラフをディスプレイ装置に表示させる部分がCPUによって実現される。なお、予測分布導出部52、信頼区間算出部51、表示部53(グラフを定め、そのグラフをディスプレイ装置に表示させる部分)、ディスプレイ装置がそれぞれ別々のハードウェアで実現されていてもよい。
次に、時刻t0を例にして、時刻t0に対応する各データを記憶装置3に記憶させる際の処理経過を説明する。図7は、この処理の例を示すフローチャートである。既に説明したように、各時刻において、気象予報データ、実績値、学習データ、および予測値が対応付けられて、記憶装置3に記憶されるタイミングと、誤差(実績値と予測値との差分)がさらに対応付けられて記憶されるタイミングにはずれがある。ここでは、時刻t0より前の時刻に関しては、気象予報データ、実績値、学習データ、および予測値が対応付けて記憶されていて、時刻t0−Pより前の時刻に関しては、それらのデータにさらに誤差も対応付けて記憶されているものとする。また、以下の説明では、データ受信部11が、最新の気象予報データおよび予測対象の実績値として、時刻t0の気象予報データおよび時刻t0の予測対象の実績値を受信する場合を例にする。
データ受信部11は、時刻t0の気象予報データと時刻t0の予測対象(本例では、風力発電量)の実績値とを対応付けた情報を受信する。すると、データ受信部11は、その情報(気象予報データおよび実績値)を記憶装置3に記憶させる(ステップS1)。この結果、図8に例示するように、時刻t0の気象予報データおよび時刻t0の実績値が記憶装置3に記憶される。時刻t0の気象予報データは、時刻t0から見て将来の気象(例えば、雲量、気温、湿度等)の予報を示すデータである。気象予報の対象となる項目は、特に限定されず、ここで例示した雲量等以外であってもよい。また、各項目の予報は、数値で表されている。
また、データ受信部11は、ステップS1で受信した情報のうち、時刻t0の気象予報データを気象予報データ出力部12に送る。気象予報データ出力部12は、時刻t0の気象予報データを予測値・誤差算出部22および近傍データ抽出部41に出力する(ステップS2)。なお、気象予報データが入力された後の近傍データ抽出部41の動作については、図7の説明では省略し、図11を用いて説明する。
モデル導出部21は、時刻t0の気象予報データおよび時刻t0の予測対象(風力発電量)の実績値が記憶装置3に記憶されると、時刻t0以前の過去の所定期間分(例えば、60日分)の気象予報データと実績値とを学習データとして特定し、その学習データを用いて、時刻t0+P(すなわち、時刻t0のP時間後)の風力発電量の予測値算出に用いる予測回帰モデルを導出する。例えば、モデル導出部21は、サポートベクターマシンを用いて、予測回帰モデルを導出してもよい。あるいは、モデル導出部21は、ニューラルネットワークや線形重回帰等の別の統計モデルを用いて、予測回帰モデルを導出してもよい。モデル導出部21は、予測回帰モデル導出時に用いた学習データ(時刻t0以前の過去の所定期間分の気象予報データと実績値の集合)を、時刻t0の気象データおよび実績値に対応付けて、記憶装置3に記憶させる(ステップS3)。なお、ここでは、学習データを特定するための時刻t0以前の過去の所定期間として60日を例示したが、この所定期間の長さは60日でなくてもよい。また、以下の説明では、予測回帰モデルが、予測式として導出されているものとして説明する。
モデル導出部21は、ステップS3で導出した予測回帰モデルを予測値・誤差算出部22に送る。予測値・誤差算出部22は、ステップS2で入力された時刻t0の気象予報データをその予測回帰モデルに適用することによって、時刻t0+Pの風力発電量の予測値を算出する。具体的には、予測値・誤差算出部22は、予測回帰モデル(予測式)の各説明変数に、気象予報データが示す各値を代入することによって、時刻t0+Pの風力発電量の予測値を算出する。モデル導出部21は、時刻t0+Pの風力発電量の予測値を、時刻t0の気象予報データ、実績値、および学習データに対応付けて、記憶装置3に記憶させる(ステップS4)。この結果、図9に例示するように、時刻t0の気象予報データ、実績値、ステップS3で特定された学習データ、および時刻t0+Pの風力発電量の予測値が記憶装置3に記憶される。
図8および図9に示すように、時刻t0−Pの気象予報データ等に対応する誤差は、記憶装置3に記憶されていない。また、時刻t0−Pの気象予報データに対応する風力発電量の予測値は、時刻((t0−P)+P)=t0の予測値である。従って、時刻t0の風力発電量の実績値がステップS2で予測値・誤差算出部22に入力されたことによって、予測値・誤差算出部22は、時刻t0の風力発電量の実績値と、時刻t0の風力発電量の予測値との誤差を求めることが可能となる。ステップS4の後、予測値・誤差算出部22は、ステップS2で入力された時刻t0の風力発電量の実績値から、既に記憶装置3に記憶されている時刻t0の風力発電量の予測値を減算することによって、時刻t0の風力発電量の実績値と予測値との誤差を算出する。そして、予測値・誤差算出部22は、その誤差を、時刻t0−Pの気象予報データ、実績値、学習データ、および予測値に対応付けて記憶装置3に記憶させる(ステップS5)。図10は、この動作を模式的に示す説明図である。予測値・誤差算出部22は、図10に示す時刻t0の実績値72から、時刻t0−Pの気象予報データに対応付けられている予測値71(時刻t0の予測値)を減算することによって、時刻t0の風力発電量の実績値と予測値との誤差73を算出し、その誤差73を、時刻t0−Pの気象予報データ等に対応付けて、記憶装置3に記憶させる。
予測分布推定システムは、新たに気象予報データおよび予測対象の実績値を受信する毎に、ステップS1〜S5を繰り返す。従って、時刻t0+Pの気象予報データおよび時刻t0+Pの風力発電量の実績値を受信することによって、予測分布推定システムがステップS1〜S4を実行し、さらに、ステップS5を実行するときに、予測値・誤差算出部22は、時刻t0+Pの風力発電量の実績値と予測値との誤差を算出し、その誤差を、時刻t0の気象予報データ等に対応付けて、記憶装置3に記憶させる。
ステップS1〜S5を繰り返すことによって、気象予報データ、風力発電量の実績値、学習データ、P時間後の風力発電量の予測値、P時間後の風力発電量の実績値と予測値との誤差とを対応付けた情報が、時系列順に記憶装置3に記憶される。次に説明する予測分布導出では、このような情報が時系列順に記憶装置3に記憶されていることを前提として説明する。
図11は、予測分布導出の処理経過の例を示すフローチャートである。以下の説明においても、データ受信部11が、最新の気象予報データおよび予測対象の実績値として、時刻t0の気象予報データおよび時刻t0の予測対象の実績値を受信した場合を例にする。データ受信部11が時刻t0の気象予報データおよび時刻t0の予測対象の実績値を対応付けた情報を受信した後のステップS1,S2の動作は既に説明しているので、ここでは説明を省略する。
ステップS2で近傍データ抽出部41に時刻t0の気象予報データが入力されると、近傍データ抽出部41は、時刻t0の気象予報データに対応する学習データを記憶装置3から読み込む。近傍データ抽出部41は、時刻t0の気象予報データとその学習データとの組を特定する(ステップS11)。既に説明したように、時刻t0における気象予報データをV0とし、その気象予報データに対応する学習データをX0とする。近傍データ抽出部41は、ステップS11で、(X0,V0)という組を特定する。この組を、以下、最新の組と記す場合がある。
次に、近傍データ抽出部41は、例えば、時刻t0以前の過去90日を探索対象期間とし、探索対象期間内の時刻毎に、気象予報データと学習データの組と、最新の組との距離を算出する。既に説明したように、探索対象期間内の時刻tにおける気象予報データおよび学習データをそれぞれVt,Xtとする。近傍データ抽出部41は、探索対象期間内の時刻t毎に組(Xt,Vt)を特定し、最新の組(X0,V0)との距離を算出する(ステップS12)。X0,V0,Xt,Vtは行列で表されるので、近傍データ抽出部41は、(X0,V0)と(Xt,Vt)との距離として、最近隣距離を算出することが好ましい。ただし、近傍データ抽出部41は、距離として、最近隣距離以外の距離(例えば、ユークリッド距離あるいはマハラノビス距離等)を算出してもよい。また、組同士の類似の程度を表す指標値として距離以外の指標値を用いてもよい。
また、ステップS12において、探索対象期間内の時刻であっても、時刻t0に近く、予測値と実績値との誤差はまだ算出されていない時刻は、距離の算出対象から除外してよい。
なお、上記の例では、探索対象期間として90日を例示したが、探索対象期間は、90日に限定されない。
近傍データ抽出部41は、ステップS12で算出した各距離に昇順に順位を付けたときに、距離が上位15%以内の順位に入っているという条件を満たす探索対象期間内の各組を特定する。近傍データ抽出部41は、その各組に対応する誤差(予測対象の実績値と予測値との差分)を記憶装置3から抽出する(ステップS13)。近傍データ抽出部41は、その誤差群を誤差分布導出部42に送る。
誤差分布導出部42は、近傍データ抽出部41から送られた誤差群に基づいて、その誤差の分布を導出する(ステップS14)。例えば、誤差分布導出部42は、各誤差を正規分布に合わせてフィッティングしてもよい。また、このとき、誤差分布導出部42は、最尤法を用いて、その分布のパラメータを算出する。ただし、フィッティングに用いる分布は、正規分布に限定でなくてもよい。また、分布のパラメータを算出する方法は、最尤法以外の分布パラメータ推定方法であってもよい。
上記の例では、誤差の分布は、正規分布を用いたフィッティングの結果と、その分布のパラメータ(例えば、平均値および分散)によって表される。
図12は、ステップS14で導出される誤差の分布の例を示す模式図である。図12に示す横軸は、誤差である。この誤差は、風力発電量の予測値と実績値との差分であるので、単位はワットである。また、図12に示す縦軸は、誤差の発生頻度である。また、図12に示す“a”は、誤差の平均値であり、誤差を正規分布に合わせてフィッティングした場合、a=0である。ただし、誤差の平均値が、分布の中央と合致していなくてもよい。
また、誤差分布導出部42は、誤差のヒストグラムを生成し、そのヒストグラムそのものを誤差の分布としてもよい。
誤差分布導出部42は、ステップS14で導出した誤差の分布を表す情報を、予測分布導出部52および信頼区間算出部51に出力する。
予測分布導出部52は、ステップS14で導出された誤差の分布と、前述のステップS4(図7参照)で算出された予測値(時刻t0+Pの風力発電量の予測値)とに基づいて、時刻t0+Pの風力発電量の予測分布を導出する。予測分布導出部52は、ステップS14で得られた誤差の分布を、横軸方向に予測値(時刻t0+Pの風力発電量の予測値)分だけ平行移動することによって、予測分布を導出する(ステップS15)。例えば、図12に例示する誤差の分布として、正規分布を用いてフィッティングした結果が得られているとする。この場合、a=0である。予測分布導出部52は、誤差の平均値aに予測値を加算した値を平均値として持ち、かつ、分散が図12に例示する分布の分散と等しい分布(すなわち、分布形状が図12に示す形状と同一である分布)を、予測分布として導出する。この予測分布の例を、図13に示す。図13に示すfは、ステップS4で算出された時刻t0+Pの風力発電量の予測値である。また、図13に示す横軸は、時刻t0+Pの風力発電量を表している。また、図13に示す縦軸は、時刻t0+Pの風力発電量の予測される発生頻度を示している。
信頼区間算出部51は、ステップS14で導出された誤差の分布と、前述のステップS4(図7参照)で算出された予測値(時刻t0+Pの風力発電量の予測値)とに基づいて、その予測値の信頼区間を算出する(ステップS16)。ここでは、信頼係数が予め定められている場合を例にして説明する。信頼区間算出部51は、信頼係数に応じて、ステップS14で導出された誤差の分布の裾幅wを算出する。例えば、信頼係数が98%である場合、信頼区間算出部51は、a−wからa+wの範囲に、ステップS13で抽出された誤差群の98%が収まるようなwを算出する。なお、ここでは、フィッティングに用いる分布が対称である場合を例にしている。図14に裾幅wを模式的に示す。なお、信頼係数は、誤差群における所定の割合を示す。
ステップS4で算出された時刻t0+Pの風力発電量の予測値をfとする。信頼区間算出部51は、[f+a−w,f+a+w]を信頼区間として算出する。
なお、分布が中心を基準として左右非対称である場合には、信頼区間算出部51は、信頼係数に応じて、左側の裾幅w1、右側の裾幅w2をそれぞれ、算出する。例えば、信頼係数が98%である場合、信頼区間算出部51は、a−w1からa+w2の範囲に、ステップS13で抽出された誤差群の98%が収まるようなw1、w2を算出する。この場合、信頼区間算出部51は、[f+a−w1,f+a+w2]を信頼区間として算出する。
次に、表示部53は、予測値をグラフ内に表示し、さらに、そのグラフ内で予測分布および信頼区間を表示する(ステップS17)。図15は、予測値等を示すグラフの例を示す模式図である。図15に示す横軸は、時刻であり、縦軸は、予測値である。すなわち、図15は、時間毎の予測値の変化を示す。データ受信部11が時刻t0の気象予報データおよび風力発電量の実績値を受信したことにより、予測値・誤差算出部22が時刻t0+Pにおける風力発電量の予測値を算出した場合、表示部53は、その予測値を最新の予測値として、グラフの右端に表示する(図15参照)。なお、図15に示す例では、予測値を示すマーカを黒丸で表している。表示部53は、予測値のマーカに重ねて、予測分布を示す矩形領域91を表示する。矩形領域91は縦方向に長い。矩形領域91の縦方向は、図13に示す予測分布の横軸に相当する。そして、表示部53は、矩形領域91内で、図13に示す予測分布の縦軸(予測される発生頻度)に応じた模様を表す。図15に示す例では、予測される発生頻度を「高」、「中」、「低」に区分し、「高」に相当する箇所を斜線で表示し、「中」に相当する箇所を横線で表示し、「低」に相当する箇所を散点模様で表示した場合を例示している。表示部53は、矩形領域91内で、予測される発生頻度に応じた模様を表示する代わりに、矩形領域91内で、予測される発生頻度を色の濃淡で表現してもよい。例えば、表示部53は、矩形領域91内で、予測される発生頻度が高いほど、濃い色を表示し、予測される発生頻度が低いほど、薄い色を表示してもよい。このように、表示部53は、予測値をグラフ内に表示するとともに、そのグラフ内で予測分布を、その予測分布が示す発生頻度に応じた態様で表現して表示してもよい。
また、表示部53は、信頼区間の下限を表す線82と、信頼区間の上限を表す線81とを表示する。線82は、上述の信頼区間[f+a−w,f+a+w]における下限f+a−wを表している。線81は、上述の信頼区間[f+a−w,f+a+w]における上限f+a+wを表している。なお、信頼区間の表示態様は、図15に示す例に限定されない。
既に説明したように、気象予報データ同士が類似していれば、その気象予報データが得られた時刻から所定時間後における予測対象の実績値も近い値になる。また、気象予報データ同士が類似していて、学習データ同士も類似していれば、得られる予測値も近い値になる。従って、最新の時刻t0の気象予報データおよび学習データの組と類似している過去の組を特定し、その組に対応する誤差を抽出した場合、その誤差のばらつきは小さい。本発明の予測分布推定システムは、そのような誤差を抽出し、その誤差に基づいて誤差の分布を導出し、さらに予測分布を導出する。従って、予測分布のばらつきは小さく、精度の高い予測分布が得られる。また、信頼区間の幅が小さくなり、好ましい信頼区間が得られる。
図16は、本発明による誤差のばらつきと、学習データを考慮しない場合の誤差のばらつきとの比較を示す図である。図16に示す横軸は、裾幅の2倍を示している。また、図16に示す縦軸は、その裾幅の2倍の範囲に、抽出された誤差の何パーセントが属しているかを示している。また、丸のマーカは、本発明の予測分布推定システムがステップS13で誤差を抽出した場合の結果を示している。また、三角形のマーカは、学習データを考慮せずに、最新の時刻の気象予報データのみと類似する気象予報データのみを特定し、その気象予報データに対応する誤差を抽出した場合の結果を示している。図16から、裾幅が同じであれば、本発明の処理を実行した方が、より多くの誤差がその裾幅の2倍の範囲に注中していることが分かる。従って、本発明では誤差の分布のばらつきが小さいことが図16に示す実験結果からも分かる。
また、本発明では、気象予報データと学習データとの組同士の距離に基づいて、誤差を抽出する。従って、学習データを用いてどのような方法で予測回帰モデルを導出するかは、誤差の抽出に影響しない。従って、予測回帰モデルの導出アルゴリズムによらず、精度の高い予測分布が得られる。
次に、本発明の変形例について説明する。
上記の実施形態の説明では、予測対象が風力発電量である場合を例示した。予測対象は、風力発電量以外であってもよい。例えば、太陽光発電量や日射量を予測対象としてもよい。ただし、この場合、太陽光発電量や日射量の予測対象となる時刻は、夜間ではない。従って、この場合、予測分布推定システムは、気象予報データ、予測対象の実績値、学習データ、予測値および誤差を対応付けたデータを、予測対象時刻が日中の時間になるような所定の時間帯に関して時系列順に記憶させればよい。例えば、予測分布推定システムは、5時から19時までの時間帯に関して、上記のデータを時系列順に記憶させればよい。なお、ここで述べた5時から19時までの時間帯は例示であり、この時間帯に限定されない。上記のようにデータを記憶装置3に記憶している状態で、ステップS12,S13の処理を実行してもよい。
また、風力発電量と異なり、太陽光発電量や日射量は、時間帯による変動が大きい。そのため、近傍データ抽出部41は、最新の組(X0,V0)と、探索対象期間における組(Xt,Vt)との距離を計算する際、探索対象期間内の時刻のうち最新の時刻と同時刻における組のみを、最新の組(X0,V0)との距離計算の対象としてもよい。例えば、最新の組(X0,V0)が14時に対応しているとする。この場合、近傍データ抽出部41は、探索対象期間内の各時刻のうち、14時に対応する(Xt,Vt)のみを抽出し、その(Xt,Vt)と(X0,V0)との距離を計算すればよい。この場合、抽出される過去の組の数が少なくなるので、探索対象期間を長く定めてもよい。
また、探索対象期間を分割して定めていてもよい。例えば、探索対象期間が90日であるとする。この場合、最新の時刻t0以前の30日分と、時刻t0の1年前以前の30日分と、時刻t0の2年前以前の30日分とに、探索対象期間を分割してもよい。再生可能エネルギーの発電量等は、季節による影響を受けることもある。このように、年を跨いて探索対象期間を分割することで、季節による影響を減少することができる。すなわち、近傍データ抽出部41は、新たな気象予報データと学習データの組と類似しているか否かの判定対象を、その新たな気象予報データが得られた時刻から所定期間前までの気象予報データとその気象予報データに対応する学習データの組、および、その所定期間に相当する前年以前の時期における気象予報データとその気象予報データに対応する学習データの組としてもよい。
また、上記の実施形態の説明では、信頼区間を定めるときに用いる信頼係数が予め定められている場合を例にして説明した。信頼係数を外部から指定できる構成としてもよい。図17は、信頼係数を外部から指定できる構成とした場合の算出装置5の例を示すブロック図である。なお、図17では、算出装置5以外の図示を省略している。図17に示す例では、算出装置5は、信頼区間算出部51、予測分布導出部52、表示部53に加えて、信頼係数入力部54を備える。信頼係数入力部54は、信頼係数が入力される入力デバイス(例えば、キーボード等)である。信頼区間算出部51は、信頼係数入力部54を介して入力された信頼係数に応じて、裾幅wを算出し、さらに信頼区間を算出する。その他の点については、既に説明した実施形態と同様である。本例では、例えば、予測分布推定システムの管理者が、信頼係数を調整することができる。
また、データ受信装置1および予測装置2が本発明の予測分布推定システムの外部の装置として設けられていてもよい。また、記憶装置3が本発明の予測分布推定システムの外部の装置として設けられていてもよい。あるいは、既に説明したように、予測分布推定システムが、データ受信装置1と、予測装置2と、記憶装置3と、推定装置4と、算出装置5とを備える構成であってもよい。
また、データ受信装置1、予測装置2、記憶装置3、推定装置4、および算出装置5が、記憶装置3を有する一台のコンピュータによって実現されていてもよい。この場合、データ受信部11、気象予報データ出力部12、モデル導出部21、予測値・誤差算出部22、近傍データ抽出部41、誤差分布導出部42、信頼区間算出部51、予測分布導出部52、および表示部53は、予測分布推定プログラムに従って動作するそのコンピュータのCPUによって実現されてもよい。CPUは、コンピュータのプログラム記憶装置(図示略)等のプログラム記録媒体から予測分布推定プログラムを読み込み、その予測分布推定プログラムに従って、上記の各要素として動作すればよい。なお、表示部53のうち、グラフをさだめ、そのグラフをディスプレイ装置に表示させる部分がCPUによって実現される。表示部53のうち、実際に表示を行う部分は、ディスプレイ装置によって実現される。
なお、本発明は、再生可能エネルギーに関する事項以外の事項を予測対象とする場合にも、適用可能である。
以下、本発明の概要を説明する。図18は、本発明の予測分布推定システムの概要を示すブロック図である。本発明の予測分布推定システムは、抽出手段95と、誤差分布導出手段96と、予測分布導出手段97とを備える。
抽出手段95(例えば、近傍データ抽出部41)は、気象予報データと、その気象予報データに対応する予測値および学習データとが特定された際に、その気象予報データとその学習データの組に類似していると判定される過去の気象予報データと学習データの組をそれぞれ抽出する。
誤差分布導出手段96(例えば、誤差分布導出部42)は、過去の気象予報データと学習データの組毎に得られる、過去の気象予報データと学習データとに基づく予測値と、当該予測値に対応する実績値との誤差に基づいて、誤差の分布を導出する。
予測分布導出手段97(例えば、予測分布導出部52)は、誤差の分布に基づいて、予測対象の予測分布を導出する。
そのような構成により、予測対象の予測分布を高い精度で推定することができる。
誤差の分布と、特定された予測値とに基づいて、当該予測値の信頼区間を算出する信頼区間算出手段(例えば、信頼区間算出部51)を備える構成であってもよい。
誤差の分布と、誤差群における所定の割合を示す信頼係数とに基づいて、予測分布の信頼区間を算出する信頼区間算出手段(例えば、信頼区間算出部51)を備える構成であってもよい。
信頼係数が入力される信頼係数入力手段(例えば、信頼係数入力部54)を備え、信頼区間算出手段が、信頼係数に応じた信頼区間を算出する構成であってもよい。
抽出手段95が、類似の程度を表す指標値として、過去の気象予報データと学習データの組と、新たな気象予報データと新たな学習データの組との距離を算出する構成であってもよい。
予測値をグラフ内に表示するとともに、そのグラフ内で予測分布を、その予測分布が示す発生頻度に応じた態様で表現して表示する表示手段(例えば、表示部53)を備える構成であってもよい。
気象予報データと、気象予報データが得られた時点の予測対象の実績値と、その時点から所定時間後における予測対象の予測値と、当該予測値を算出するための予測モデルを導出する際に用いた学習データと、予測値と上記の時点から所定時間後における予測対象の実績値との差分である誤差とを対応付けて記憶する記憶手段(例えば、記憶装置3)を備える構成であってもよい。
新たな気象予報データと、新たな気象予報データに対応する新たな実績値とが入力されたときに、新たな気象予報データと新たな実績値を記憶手段に記憶させるデータ追加手段(例えば、データ受信部11)と、新たな気象予報データに対応する新たな学習データを特定し、新たな学習データから予測モデルを導出し、新たな学習データを新たな気象予報データに対応付けて記憶手段に記憶させるモデル導出手段(例えば、モデル導出部21)と、予測モデルと新たな気象予報データとに基づいて、新たな気象予報データが得られた時点から所定時間後における予測対象の予測値を算出し、当該予測値を、新たな気象予報データに対応付けて記憶手段に記憶させる予測手段(例えば、予測値・誤差算出部22)とを備え、予測手段が、上記の時点から所定時間後における予測対象の実績値が入力されたときに、予測値と実績値との誤差を算出し、新たな気象予報データに対応付けて記憶手段に記憶させる構成であってもよい。
抽出手段95が、特定された気象予報データと学習データの組と類似しているか否かの判定対象を、特定された気象予報データが得られた時刻と得られた時刻が同じである過去の気象予報データと当該気象予報データに対応する学習データの組とする構成であってもよい。
抽出手段95が、特定された気象予報データと学習データの組と類似しているか否かの判定対象を、特定された気象予報データが得られた時刻から所定期間前までの気象予報データと当該気象予報データに対応する学習データの組、および、その所定期間に相当する前年以前の時期における気象予報データと当該気象予報データに対応する学習データの組とする構成であってもよい。
上記の実施形態は、以下の付記のようにも記載され得るが、以下に限定されるわけではない。
(付記1)気象予報データと、前記気象予報データが得られた時点の予測対象の実績値と、前記時点から所定時間後における前記予測対象の予測値と、当該予測値を算出するための予測モデルを導出する際に用いた学習データと、前記予測値と前記時点から所定時間後における前記予測対象の実績値との差分である誤差とを対応付けて記憶する記憶手段を用いて、新たな気象予報データと、前記新たな気象予報データに対応する新たな予測値および新たな学習データとが特定された際に、前記記憶手段に記憶されている気象予報データと学習データの組毎に、前記新たな気象予報データと前記新たな学習データの組との類似の程度を表す指標値を算出し、前記指標値が所定の条件を満たす気象予報データと学習データの各組を特定し、特定した組毎に、特定した組に対応する前記誤差を前記記憶手段から抽出する抽出手段と、前記抽出手段によって抽出された誤差に基づいて誤差の分布を導出する誤差分布導出手段と、前記誤差の分布と、前記新たな予測値とに基づいて、前記予測対象の予測分布を導出する予測分布導出手段とを備えることを特徴とする予測分布推定システム。
(付記2)誤差の分布と、新たな予測値とに基づいて、当該新たな予測値の信頼区間を算出する信頼区間算出手段を備える付記1に記載の予測分布推定システム。
(付記3)信頼係数が入力される信頼係数入力手段を備え、信頼区間算出手段は、前記信頼係数に応じた信頼区間を算出する付記2に記載の予測分布推定システム。
(付記4)抽出手段は、類似の程度を表す指標値として、記憶手段に記憶されている気象予報データと学習データの組と、新たな気象予報データと新たな学習データの組との距離を算出する付記1から付記3のうちのいずれかに記載の予測分布推定システム。
(付記5)予測値をグラフ内に表示するとともに、前記グラフ内で予測分布を色の濃淡で表現して表示する表示手段を備える 付記1から付記4のうちのいずれかに記載の予測分布推定システム。
(付記6)気象予報データと、前記気象予報データが得られた時点の予測対象の実績値と、前記時点から所定時間後における前記予測対象の予測値と、当該予測値を算出するための予測モデルを導出する際に用いた学習データと、前記予測値と前記時点から所定時間後における前記予測対象の実績値との差分である誤差とを対応付けて記憶する記憶手段を備える付記1から付記5のうちのいずれかに記載の予測分布推定システム。
(付記7)新たな気象予報データと、前記新たな気象予報データに対応する新たな実績値とが入力されたときに、前記新たな気象予報データと前記新たな実績値を記憶手段に記憶させるデータ追加手段と、前記新たな気象予報データに対応する新たな学習データを特定し、前記新たな学習データから予測モデルを導出し、前記新たな学習データを前記新たな気象予報データに対応付けて前記記憶手段に記憶させるモデル導出手段と、前記予測モデルと前記新たな気象予報データとに基づいて、前記新たな気象予報データが得られた時点から所定時間後における予測対象の予測値を算出し、当該予測値を、前記新たな気象予報データに対応付けて前記記憶手段に記憶させる予測手段とを備え、前記予測手段は、前記時点から所定時間後における予測対象の実績値が入力されたときに、前記予測値と前記実績値との誤差を算出し、前記新たな気象予報データに対応付けて前記記憶手段に記憶させる付記1から付記6のうちのいずれかに記載の予測分布推定システム。
(付記8)気象予報データと、前記気象予報データが得られた時点の予測対象の実績値と、前記時点から所定時間後における前記予測対象の予測値と、当該予測値を算出するための予測モデルを導出する際に用いた学習データと、前記予測値と前記時点から所定時間後における前記予測対象の実績値との差分である誤差とを対応付けて記憶する記憶手段を用いて、新たな気象予報データと、前記新たな気象予報データに対応する新たな予測値および新たな学習データとが特定された際に、前記記憶手段に記憶されている気象予報データと学習データの組毎に、前記新たな気象予報データと前記新たな学習データの組との類似の程度を表す指標値を算出し、前記指標値が所定の条件を満たす気象予報データと学習データの各組を特定し、特定した組毎に、特定した組に対応する前記誤差を前記記憶手段から抽出し、抽出した誤差に基づいて誤差の分布を導出し、前記誤差の分布と、前記新たな予測値とに基づいて、前記予測対象の予測分布を導出することを特徴とする予測分布推定方法。
(付記9)コンピュータに、気象予報データと、前記気象予報データが得られた時点の予測対象の実績値と、前記時点から所定時間後における前記予測対象の予測値と、当該予測値を算出するための予測モデルを導出する際に用いた学習データと、前記予測値と前記時点から所定時間後における前記予測対象の実績値との差分である誤差とを対応付けて記憶する記憶手段を用いて、新たな気象予報データと、前記新たな気象予報データに対応する新たな予測値および新たな学習データとが特定された際に、前記記憶手段に記憶されている気象予報データと学習データの組毎に、前記新たな気象予報データと前記新たな学習データの組との類似の程度を表す指標値を算出し、前記指標値が所定の条件を満たす気象予報データと学習データの各組を特定し、特定した組毎に、特定した組に対応する前記誤差を前記記憶手段から抽出する抽出処理、前記抽出処理で抽出された誤差に基づいて誤差の分布を導出する誤差分布導出処理、および、前記誤差の分布と、前記新たな予測値とに基づいて、前記予測対象の予測分布を導出する予測分布導出処理を実行させるための予測分布推定プログラム。