JP6481468B2

JP6481468B2 - 予測分布推定システム、予測分布推定方法、および予測分布推定プログラム

Info

Publication number: JP6481468B2
Application number: JP2015072092A
Authority: JP
Inventors: 康将本間; 鈴木　勝也; 勝也鈴木; 耕治工藤
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2015-03-31
Filing date: 2015-03-31
Publication date: 2019-03-13
Anticipated expiration: 2035-03-31
Also published as: JP2016192864A

Description

予測対象の予測分布を推定する予測分布推定システム、予測分布推定方法、および予測分布推定プログラムに関する。

再生可能エネルギーの急速な導入に伴い、安定的な電力供給に向けて、再生可能エネルギーの高精度な予測ニーズが高まっている。例えば、太陽光発電量を可能な限り正確に予測することは、停電等を引き起こさないためにも非常に重要である。特に、再生可能エネルギーを提供する特定規模電気事業者は、再生可能エネルギーの発電量が予測値より低くなった場合、例えば、他の電力事業者から電力の提供を受けなければならなくなる。すると、特定規模電気事業者に経済的な損失が生じることになる。

また、発電事業者は、翌日の需給バランスをとるために、コストを最小限に抑えながら発電機の運転計画（経済負荷配分制御や発電機起動停止計画等）を準備する必要がある。

しかし、再生可能エネルギーの変動は激しい。そのため、予測値そのものだけから十分な信頼性を有する計画を作成することは困難であった。

そこで、ある程度の幅を持たせて予測値を推定する技術が種々提案されている（例えば、特許文献１〜３参照）。

特許文献１には、予測値の誤差の分布を正規分布と仮定し、将来の日射量の予測値に対して誤差の分布の標準偏差から信頼区間を求めることが記載されている。

特許文献２には、回帰係数の信頼区間および日射量の予報値と実測値との誤差の信頼区間を演算し、それらの信頼区間をもとに太陽光発電量の上限値および下限値を含む予測値を算出する予測システムが記載されている。

特許文献３には、予測値の分布をベータ分布等で仮定し、予測値の確率分布を推定する方法が記載されている。

また、特許文献４には、予測日の気象予測値と類似日の気象実績値との差の度数分布を求め、予測日の気象予測値とこの気象予測値に対する誤差の出現確率を算出することが記載されている。類似日とは、予測日と、月、週（その月の何週目か）、曜日が同一となる１年以上前の日である。

特開２０１３−２５３８０５号公報特開２０１１−１４２７９０号公報特開２０１４−２１５５５号公報特開２００９−２９４９６９号公報

特許文献１〜３に記載された技術では、過去に蓄積したデータを用いるが、過去のデータの選別が十分ではない。そのため、特許文献１〜３に記載された技術では、信頼区間や予測分布を精度よく求めることが難しく、運用に適した信頼区間や予測分布を提供できない。なお、信頼区間に関しては、例えば、単純に、信頼区間の下限を０とし、上限を年間最大発電量として信頼区間を定めれば、信頼レベルを１００％にすることができる。しかし、そのような信頼区間は、区間幅が広すぎ、有用ではない。

また、特許文献４に記載された技術では、予測日の気象予測値と類似日の気象実績値との差の度数分布を求める。しかし、類似日は、月、週、曜日が同一となる一年以上前の日であり、十分に適切な気象実績値を用いているとは限らない。

このように、特許文献１〜４に記載された技術では、予測対象の予測分布を精度よく得ることができない。

そこで、本発明は、予測対象の予測分布を高い精度で推定することができる予測分布推定システム、予測分布推定方法、および予測分布推定プログラムを提供することを目的とする。

本発明による予測分布推定システムは、気象予報データと、その気象予報データの配信時刻から一定時間後における再生可能エネルギーの発電量の予測値と、その配信時刻以前の過去の所定期間分の気象予報データと過去の気象予報データの配信時刻における再生可能エネルギーの発電量の実績値とを含む学習データとが特定された際に、その気象予報データとその学習データの組に類似していると判定される過去の気象予報データと学習データの組をそれぞれ抽出する抽出手段と、過去の気象予報データと学習データの組毎に得られる、過去の気象予報データと学習データとに基づく予測値と、当該予測値に対応する実績値との誤差に基づいて、誤差の分布を導出する誤差分布導出手段と、誤差の分布に基づいて、予測対象の予測分布を導出する予測分布導出手段とを備えることを特徴とする。

また、本発明による予測分布推定方法は、気象予報データと、その気象予報データの配信時刻から一定時間後における再生可能エネルギーの発電量の予測値と、その配信時刻以前の過去の所定期間分の気象予報データと過去の気象予報データの配信時刻における再生可能エネルギーの発電量の実績値とを含む学習データとが特定された際に、その気象予報データとその学習データの組に類似していると判定される過去の気象予報データと学習データの組をそれぞれ抽出し、過去の気象予報データと学習データの組毎に得られる、過去の気象予報データと学習データとに基づく予測値と、当該予測値に対応する実績値との誤差に基づいて、誤差の分布を導出し、誤差の分布に基づいて、予測対象の予測分布を導出することを特徴とする。

また、本発明による予測分布推定プログラムは、コンピュータに、気象予報データと、その気象予報データの配信時刻から一定時間後における再生可能エネルギーの発電量の予測値と、その配信時刻以前の過去の所定期間分の気象予報データと過去の気象予報データの配信時刻における再生可能エネルギーの発電量の実績値とを含む学習データとが特定された際に、その気象予報データとその学習データの組に類似していると判定される過去の気象予報データと学習データの組をそれぞれ抽出する抽出処理、過去の気象予報データと学習データの組毎に得られる、過去の気象予報データと学習データとに基づく予測値と、当該予測値に対応する実績値との誤差に基づいて、誤差の分布を導出する誤差分布導出処理、および、誤差の分布に基づいて、予測対象の予測分布を導出する予測分布導出処理を実行させることを特徴とする。

本発明によれば、予測対象の予測分布を高い精度で推定することができる。

気象予報データと予測対象の実績値とが対応付けられて時系列順に記憶されている状態を示す模式図である。時刻ｔ_０の気象予報データが得られた場合の学習データとなる気象予報データおよび実績値を示す模式図である。気象予報データ、実績値、学習データ、および予測値が時系列順に記憶される状態を示す模式図である。気象予報データ、実績値、学習データ、予測値、および誤差が時系列順に記憶される状態を示す模式図である。時刻ｔ_０のデータとして、気象予報データ、実績値、学習データ、および予測値が対応付けられて記憶された状態を示す模式図である。本発明の予測分布推定システムの構成例を示すブロック図である。時刻ｔ_０に対応する各データを記憶装置３に記憶させる際の処理経過の例を示すフローチャートである。時刻ｔ_０の気象予報データおよび時刻ｔ_０の実績値が記憶された状態を示す模式図である。時刻ｔ_０の気象予報データ、実績値、ステップＳ３で特定された学習データ、および時刻ｔ_０＋Ｐの風力発電量の予測値が記憶された状態を示す模式図である。誤差が追加記憶される状態を示す模式図である。予測分布導出の処理経過の例を示すフローチャートである。誤差の分布の例を示す模式図である。予測分布の例を示す模式図である。誤差の分布の裾幅の例を示す模式図である。予測値等を示すグラフの例を示す模式図である。本発明による誤差のばらつきと、学習データを考慮しない場合の誤差のばらつきとの比較を示す図である。算出装置の変形例を示すブロック図である。本発明の予測分布推定システムの概要を示すブロック図である。

最初に、本発明の理解を容易にするために、本発明において用いられる種々のデータについて説明する。また、以下に示す説明では、予測対象が、ある発電事業者（特定規模電気事業者であってもよい。）の風力発電の発電量（以下、単に風力発電量と記す。）である場合を例にする。予測対象は、例えば、再生可能エネルギーの発電に関するものであり、次に述べる気象予報の対象とは、異なる。

気象予報データは、将来の気象の予報を示すデータである。ここで、気象予報の対象となる項目は１つとは限らず、雲量、気温、湿度等の複数の項目であってもよい。これらの項目の予報は数値で示されているものとする。例えば、予報の項目に天候がある場合、晴れ、曇り、雨、雪等は数値化されて示されているものとする。また、将来とは、例えば、３時間後等の１つの時点だけであっても、あるいは、３時間後、６時間後、および９時間後等の複数の時点であってもよい。すなわち、ある時点で得られた気象予報データは、例えば、その時点から３時間後、６時間後、および９時間後等の複数の時点における各項目の予測値を含んでいてもよい。なお、ここで示した「３時間後」等は例示であり、これらの値に限定されるわけでない。

気象予報データは、例えば、気象予報データ配信会社によって定期的に配信される。また、本発明では、ある時点で配信された気象予報データと、その時点における予測対象（風力発電量）の実績値とが対応付けられて、時系列順に記憶手段（例えば、後述の記憶装置３）に記憶されるものとする。図１は、気象予報データと予測対象の実績値とが対応付けられて時系列順に記憶されている状態を示す模式図である。以下、例えば、時刻ｔ_０に配信された気象予報データを時刻ｔ_０の気象予報データと記す。時刻ｔ_０の気象予報データは、時刻ｔ_０から見て将来の気象予報を含んでいる。図１に示す例では、時刻ｔ_０の気象予報データと実績値が最新である。

予測装置（例えば、後述の予測装置２）は、最新の気象予報データが得られると、記憶手段に記憶されている、時刻ｔ_０以前の過去の所定期間分の気象予報データと実績値とを学習データとして用いて、予測対象（風力発電量）の予測回帰モデルを導出する。図２は、時刻ｔ_０の気象予報データが得られた場合の学習データとなる気象予報データおよび実績値を示す模式図である。予測装置は、学習データを、時刻ｔ_０の気象予報データおよび実績値に対応付けて記憶手段に記憶させる。また、この学習データを時刻ｔ_０の学習データと記す。なお、図２では、過去の所定期間の例として、過去６０日分を例示している。

なお、予測回帰モデルは、例えば、予測対象を目的変数とする数式（予測式）で表される。予測装置は、時刻ｔ_０の気象予報データを予測回帰モデルに適用することによって（例えば、時刻ｔ_０の気象予報データを予測回帰モデルに代入することによって）、予測対象の予測値を算出する。なお、予測回帰モデルを単に予測モデルと称してもよい。予測装置は、時刻ｔ_０の気象予報データを用いて算出した予測対象の予測値を、時刻ｔ_０の気象予報データ、予測対象の実績値、および学習データに対応付けて記憶手段に記憶させる。予測装置は、最新の気象予報データが得られる毎に同様の処理を行う。従って、図３に示すように、気象予報データ、実績値、学習データ、および予測値が時系列順に記憶手段に蓄積されていく。時刻ｔ_０の気象予報データおよび学習データを用いて算出された予測値は、時刻ｔ_０から一定期間後（以下の説明ではＰ時間後とする）における予測対象の予測値である。すなわち、時刻ｔ_０＋Ｐにおける風力発電量の予測値である。

気象予報データおよび実績値は、定期的に得られる。気象予報データおよび実績値が得られる間隔は、例えば、１時間であっても、３０分であっても、あるいは他の時間間隔であってもよい。以下に示す例では説明を簡単にするために、時刻ｔ_０＋Ｐになると、時刻ｔ_０＋Ｐの気象予報データおよび実績値が得られるものとする。すると、予測装置は、時刻ｔ_０に算出された予測値（時刻ｔ_０＋Ｐにおける風力発電量の予測値）と、時刻ｔ_０＋Ｐに得られた実績値（時刻ｔ_０＋Ｐにおける風力発電量の実績値）との差分である誤差を計算する。予測装置は、この誤差を、時刻ｔ_０の気象予報データ、実績値、学習データ、および予測値に対応付けて記憶手段に記憶させる。予測装置は、最新の実績値が得られる毎に同様の処理を行う。従って、図４に示すように、気象予報データ、実績値、学習データ、予測値、および誤差が時系列順に記憶手段に蓄積されていく。

以上の説明から分かるように、時刻ｔ_０で気象予報データおよび実績値が得られた場合、時刻ｔ_０のデータとして気象予報データ、実績値、学習データ、および予測値が対応付けて記憶手段に記憶される。その時刻からＰ時間後に、新たに気象予報データおよび実績値が得られた時に、時刻ｔ_０のデータとして誤差も気象予報データ、実績値、学習データ、および予測値に対応付けられて、記憶手段に記憶される。

次に、本発明の予測分布推定システムは、上記のように記憶されたデータを用いて、新たに予測値が得られた場合に、予測対象の予測分布を推定する。以下、この動作の概略を説明する。

時刻ｔ_０の気象予報データおよび実績値が得られると、予測装置は、学習データを特定し、学習データから予測回帰モデルを導出し、さらに予測対象の予測値を算出する。そして、時刻ｔ_０のデータとして、気象予報データ、実績値、学習データ、および予測値が対応付けられて記憶される。図５は、この状態を示す模式図である。

本発明の予測分布推定システムは、個々の時刻における気象予報データおよび学習データの組に着目し、最新の時刻ｔ_０の気象予報データおよび学習データの組と、過去の時刻における気象予報データおよび学習データの組との類似の程度を表す指標値を算出する。最新の時刻ｔ_０以前の、この指標値を算出する対象となる過去の時間の範囲を探索対象期間と記す。図５では、探索対象期間の例として９０日を例示している。

また、予測分布推定システムは、組同士の類似の程度を表す指標値として組同士の距離を用いてもよい。例えば、時刻ｔ_０における気象予報データおよび学習データをそれぞれＶ_０，Ｘ_０とする。また、探索対象期間内の時刻ｔにおける気象予報データおよび学習データをそれぞれＶ_ｔ，Ｘ_ｔとする。予測分布推定システムは、（Ｘ_０，Ｖ_０）と（Ｘ_ｔ，Ｖ_ｔ）との距離を算出すればよい。なお、Ｘ_０，Ｖ_０，Ｘ_ｔ，Ｖ_ｔはそれぞれ、行列で表される。この場合、予測分布推定システムは、距離として、例えば、最近隣距離を算出することが好ましい。ただし、距離は、最近隣距離以外の距離であってもよい。距離が小さいほど、組同士は類似していることを表し、距離が大きいほど、組同士は類似していないことを表している。

予測分布推定システムは、最新の時刻ｔ_０の気象予報データおよび学習データの組と、探索対象期間の各時刻における気象予報データおよび学習データの組との距離を算出する。なお、予測分布推定システムは、誤差がまだ算出されていない時刻に関しては、距離の算出対象から除外してよい。

そして、予測分布推定システムは、距離が所定の条件を満たす過去の時刻における気象予報データおよび学習データの組を特定し、その組に対応する誤差を記憶手段から抽出する（換言すれば、読み込む）。ここで、所定の条件として、算出された距離に対して昇順に順位をつけたときに、例えば、上位１５％以内の順位に入っているという条件等を用いることができる。すなわち、予測分布推定システムは、時刻ｔ_０の気象予報データおよび学習データの組との距離が短い過去の組を特定する。換言すれば、予測分布推定システムは、時刻ｔ_０の気象予報データおよび学習データの組と類似している過去の組を特定する。ここでは、上位１５％以内の順位に入っているという条件を例示したが、条件として、例えば、上位所定番目までの順位に入っているという条件を用いてもよい。

予測分布推定システムは、上記のように抽出した各誤差から、誤差の分布を導出する。そして、その誤差の分布と、時刻ｔ_０に得られた予測値（すなわち、時刻ｔ_０＋Ｐにおける風力発電量の予測値）とに基づいて、時刻ｔ_０＋Ｐでの予測分布を算出する。

気象状況が同じであれば、予測対象（風力発電量）も同じになる。従って、気象予報データ同士が類似していれば、気象予報データが得られた時刻から所定時間後における予測対象の実績値同士も近い値になる。また、気象予報データ同士が類似していて、学習データ同士も類似していれば、得られる予測値同士も近い値になる。従って、時刻ｔ_０の気象予報データおよび学習データの組と類似している過去の組を特定し、その組に対応する誤差を抽出した場合、その誤差のばらつきは小さい。従って、ばらつきの小さい誤差の分布が得られ、その結果、予測分布においてもばらつきが小さくなる。すなわち、精度の高い予測分布が得られる。従って、信頼区間を算出する場合にも、信頼区間の幅は小さくなり、好ましい信頼区間が得られる。

以下、図面を参照して、本発明の実施形態を説明する。
図６は、本発明の予測分布推定システムの構成例を示すブロック図である。図６に例示する予測分布推定システムは、データ受信装置１と、予測装置２と、記憶装置３と、推定装置４と、算出装置５とを備える。

記憶装置３は、図４に例示するように、気象予報データ、実績値、学習データ、予測値、および誤差を対応付けて、時系列順に記憶する。なお、図６では、対応付けられたデータ（気象予報データ、実績値、学習データ、予測値、および誤差）の集合を時系列データベース３１として、示している。

データ受信装置１は、データ受信部１１と、気象予報データ出力部１２とを備える。

データ受信部１１は、例えば、外部のシステム（図示略）から、ある時刻に得られた気象予報データと、その時刻における予測対象（本例では、風力発電量）の実績値とを対応付けた情報を受信する。説明を簡単にするため、気象予報データおよび実績値は、時刻の情報も含んでいるものとする。ある時刻に得られた気象予報データとは、例えば、ある時刻に気象予報データ配信会社によって配信された気象予報データである。データ受信部１１は、例えば、定期的に、ある時刻に得られた気象予報データと、その時刻における予測対象の実績値とを対応付けた情報を受信する。データ受信部１１が、情報を受信する間隔は、例えば、１時間あるいは３０分であるが、これらの時間間隔でなくてもよい。データ受信部１１は、ある時刻の気象予報データおよび予測対象の実績値を対応付けた情報を受信すると、その情報を記憶装置３に記憶させる。また、データ受信部１１は、受信した情報のうち、気象予報データを気象予報データ出力部１２に送る。

気象予報データを気象予報データ出力部１２は、データ受信部１１から気象予報データが送られると、その気象予報データを予測装置２内の予測値・誤差算出部２２と、推定装置４内の近傍データ抽出部４１とに出力（送信）する。

データ受信部１１および気象予報データ出力部１２は、例えば、プログラムに従って動作するコンピュータのＣＰＵによって実現される。また、データ受信部１１および気象予報データ出力部１２が別々のハードウェアによって実現されてもよい。

予測装置２は、モデル導出部２１と、予測値・誤差算出部２２とを備える。

モデル導出部２１は、最新の時刻（時刻ｔ_０とする。）の気象予報データと予測対象の実績値とを対応付けた情報が記憶装置３に記憶されると、その時刻ｔ_０以前の過去の所定期間分の気象予報データと実績値とを学習データとして用いて、予測対象の予測回帰モデルを導出する。予測回帰モデルは、予測対象のＰ時間後の値（予測値）を算出するためのモデルである。モデル導出部２１は、その時刻ｔ_０における予測回帰モデルの導出に用いた学習データを、その時刻ｔ_０の気象予報データ、実績値に対応させて、記憶装置３に記憶させる。また、モデル導出部２１は、導出した予測回帰モデルを予測値・誤差算出部２２に送る。

予測値・誤差算出部２２は、モデル導出部２１から受けた予測回帰モデルに、気象予報データ出力部１２から入力された時刻ｔ_０の気象予報データを適用することによって、予測対象の予測値を算出する。この予測値は、時刻ｔ_０からＰ時間後（すなわち、時刻ｔ_０＋Ｐ）における予測対象の予測値である。予測値・誤差算出部２２は、この予測値を、時刻ｔ_０の気象予報データ、実績値、および学習データに対応させて、記憶装置３に記憶させる。

その後、データ受信装置１が、時刻ｔ_０＋Ｐにおける予測対象の実績値を受信し、記憶装置３に記憶させたとする。すると、予測値・誤差算出部２２は、時刻ｔ_０の気象予報データに対応付けられている予測値（時刻ｔ_０から見て将来の時刻である時刻ｔ_０＋Ｐにおける予測値）と、時刻ｔ_０＋Ｐにおける予測対象の実績値との差分である誤差を算出する。予測値・誤差算出部２２は、この誤差を、時刻ｔ_０の気象予報データ、実績値、学習データ、および予測値に対応付けて、記憶装置３に記憶させる（図４参照）。

モデル導出部２１および予測値・誤差算出部２２は、例えば、プログラムに従って動作するコンピュータのＣＰＵによって実現される。また、モデル導出部２１および予測値・誤差算出部２２が別々のハードウェアによって実現されてもよい。

推定装置４は、近傍データ抽出部４１と、誤差分布導出部４２とを備える。

近傍データ抽出部４１は、気象予報データ出力部１２から入力された最新の気象予報データに対応する学習データを記憶装置３から読み込み、最新の気象予報データおよび学習データの組を特定する。この組を最新の組と記す。近傍データ抽出部４１は、探索対象期間内の気象予報データおよび学習データの組毎に、その組と、最新の組との距離を算出する。近傍データ抽出部４１は、距離が所定の条件を満たしている探索対象期間内の組を特定し、その組に対応する誤差をそれぞれ記憶装置３から抽出する。以下、この条件が、算出した距離に対して昇順に順位をつけたときに距離が上位１５％以内の順位に入っていることという条件である場合を例にして説明する。このような条件を満たしている組は、最新の組と類似している過去の組と言うことができる。また、そのような過去の組に対応する誤差群を近傍データと記す場合がある。近傍データ抽出部４１は、記憶装置３から抽出した各誤差（近傍データ）を誤差分布導出部４２に送る。なお、距離に関する条件は、上記の例に限定されない。例えば、例示した“１５％”という値は、得られる距離の数に応じて、定めればよい。なお、予測分布の精度を向上させるためには、“１５％”に相当する値は、可能な限り小さくすることが好ましい。

誤差分布導出部４２は、近傍データ抽出部４１から送られた各誤差に基づいて、誤差の分布を導出する。例えば、誤差分布導出部４２は、各誤差を正規分布に合わせてフィッティングする。また、誤差分布導出部４２は、その分布のパラメータを算出する。誤差分布導出部４２は、導出した誤差の分布をそれぞれ、算出装置５内の予測分布導出部５２および信頼区間算出部５１に出力（送信）する。

近傍データ抽出部４１および誤差分布導出部４２は、例えば、プログラムに従って動作するコンピュータのＣＰＵによって実現される。また、近傍データ抽出部４１および誤差分布導出部４２が別々のハードウェアによって実現されていてもよい。

算出装置５は、予測分布導出部５２と、信頼区間算出部５１と、表示部５３とを備える。

予測分布導出部５２は、最新の組に基づいて抽出された誤差群から導出された誤差の分布と、最新の予測値とに基づいて、最新の予測分布を導出する。例えば、上記の例のように、各誤差を正規分布に合わせてフィッティングした場合、誤差分布は正規分布として得られる。予測分布導出部５２は、この正規分布の平均値が予測値になるように誤差の分布を平行移動することによって、予測分布を導出する。

信頼区間算出部５１は、最新の組に基づいて抽出された誤差群から導出された誤差の分布と、最新の予測値とに基づいて、最新の予測値に対応する信頼区間を算出する。

表示部５３は、予測値をグラフ表示するとともに、予測値に対応する予測分布をそのグラフ内に表示する。また、表示部５３は、予測値に対応する信頼区間もグラフ内に表示する。信頼区間の表示は必須ではないが、表示部５３は、予測値および予測分布とともに、信頼区間も表示することが好ましい。なお、信頼区間を表示しない場合には、信頼区間算出部５１が設けられていなくてもよい。表示部５３が表示するグラフの例については後述する。

予測分布導出部５２、信頼区間算出部５１および表示部５３は、例えば、ディスプレイ装置を有し、プログラムに従って動作するコンピュータのＣＰＵによって実現される。表示部５３に関しては、グラフを定め、そのグラフをディスプレイ装置に表示させる部分がＣＰＵによって実現される。なお、予測分布導出部５２、信頼区間算出部５１、表示部５３（グラフを定め、そのグラフをディスプレイ装置に表示させる部分）、ディスプレイ装置がそれぞれ別々のハードウェアで実現されていてもよい。

次に、時刻ｔ_０を例にして、時刻ｔ_０に対応する各データを記憶装置３に記憶させる際の処理経過を説明する。図７は、この処理の例を示すフローチャートである。既に説明したように、各時刻において、気象予報データ、実績値、学習データ、および予測値が対応付けられて、記憶装置３に記憶されるタイミングと、誤差（実績値と予測値との差分）がさらに対応付けられて記憶されるタイミングにはずれがある。ここでは、時刻ｔ_０より前の時刻に関しては、気象予報データ、実績値、学習データ、および予測値が対応付けて記憶されていて、時刻ｔ_０−Ｐより前の時刻に関しては、それらのデータにさらに誤差も対応付けて記憶されているものとする。また、以下の説明では、データ受信部１１が、最新の気象予報データおよび予測対象の実績値として、時刻ｔ_０の気象予報データおよび時刻ｔ_０の予測対象の実績値を受信する場合を例にする。

データ受信部１１は、時刻ｔ_０の気象予報データと時刻ｔ_０の予測対象（本例では、風力発電量）の実績値とを対応付けた情報を受信する。すると、データ受信部１１は、その情報（気象予報データおよび実績値）を記憶装置３に記憶させる（ステップＳ１）。この結果、図８に例示するように、時刻ｔ_０の気象予報データおよび時刻ｔ_０の実績値が記憶装置３に記憶される。時刻ｔ_０の気象予報データは、時刻ｔ_０から見て将来の気象（例えば、雲量、気温、湿度等）の予報を示すデータである。気象予報の対象となる項目は、特に限定されず、ここで例示した雲量等以外であってもよい。また、各項目の予報は、数値で表されている。

また、データ受信部１１は、ステップＳ１で受信した情報のうち、時刻ｔ_０の気象予報データを気象予報データ出力部１２に送る。気象予報データ出力部１２は、時刻ｔ_０の気象予報データを予測値・誤差算出部２２および近傍データ抽出部４１に出力する（ステップＳ２）。なお、気象予報データが入力された後の近傍データ抽出部４１の動作については、図７の説明では省略し、図１１を用いて説明する。

モデル導出部２１は、時刻ｔ_０の気象予報データおよび時刻ｔ_０の予測対象（風力発電量）の実績値が記憶装置３に記憶されると、時刻ｔ_０以前の過去の所定期間分（例えば、６０日分）の気象予報データと実績値とを学習データとして特定し、その学習データを用いて、時刻ｔ_０＋Ｐ（すなわち、時刻ｔ_０のＰ時間後）の風力発電量の予測値算出に用いる予測回帰モデルを導出する。例えば、モデル導出部２１は、サポートベクターマシンを用いて、予測回帰モデルを導出してもよい。あるいは、モデル導出部２１は、ニューラルネットワークや線形重回帰等の別の統計モデルを用いて、予測回帰モデルを導出してもよい。モデル導出部２１は、予測回帰モデル導出時に用いた学習データ（時刻ｔ_０以前の過去の所定期間分の気象予報データと実績値の集合）を、時刻ｔ_０の気象データおよび実績値に対応付けて、記憶装置３に記憶させる（ステップＳ３）。なお、ここでは、学習データを特定するための時刻ｔ_０以前の過去の所定期間として６０日を例示したが、この所定期間の長さは６０日でなくてもよい。また、以下の説明では、予測回帰モデルが、予測式として導出されているものとして説明する。

モデル導出部２１は、ステップＳ３で導出した予測回帰モデルを予測値・誤差算出部２２に送る。予測値・誤差算出部２２は、ステップＳ２で入力された時刻ｔ_０の気象予報データをその予測回帰モデルに適用することによって、時刻ｔ_０＋Ｐの風力発電量の予測値を算出する。具体的には、予測値・誤差算出部２２は、予測回帰モデル（予測式）の各説明変数に、気象予報データが示す各値を代入することによって、時刻ｔ_０＋Ｐの風力発電量の予測値を算出する。モデル導出部２１は、時刻ｔ_０＋Ｐの風力発電量の予測値を、時刻ｔ_０の気象予報データ、実績値、および学習データに対応付けて、記憶装置３に記憶させる（ステップＳ４）。この結果、図９に例示するように、時刻ｔ_０の気象予報データ、実績値、ステップＳ３で特定された学習データ、および時刻ｔ_０＋Ｐの風力発電量の予測値が記憶装置３に記憶される。

図８および図９に示すように、時刻ｔ_０−Ｐの気象予報データ等に対応する誤差は、記憶装置３に記憶されていない。また、時刻ｔ_０−Ｐの気象予報データに対応する風力発電量の予測値は、時刻（（ｔ_０−Ｐ）＋Ｐ）＝ｔ_０の予測値である。従って、時刻ｔ_０の風力発電量の実績値がステップＳ２で予測値・誤差算出部２２に入力されたことによって、予測値・誤差算出部２２は、時刻ｔ_０の風力発電量の実績値と、時刻ｔ_０の風力発電量の予測値との誤差を求めることが可能となる。ステップＳ４の後、予測値・誤差算出部２２は、ステップＳ２で入力された時刻ｔ_０の風力発電量の実績値から、既に記憶装置３に記憶されている時刻ｔ_０の風力発電量の予測値を減算することによって、時刻ｔ_０の風力発電量の実績値と予測値との誤差を算出する。そして、予測値・誤差算出部２２は、その誤差を、時刻ｔ_０−Ｐの気象予報データ、実績値、学習データ、および予測値に対応付けて記憶装置３に記憶させる（ステップＳ５）。図１０は、この動作を模式的に示す説明図である。予測値・誤差算出部２２は、図１０に示す時刻ｔ_０の実績値７２から、時刻ｔ_０−Ｐの気象予報データに対応付けられている予測値７１（時刻ｔ_０の予測値）を減算することによって、時刻ｔ_０の風力発電量の実績値と予測値との誤差７３を算出し、その誤差７３を、時刻ｔ_０−Ｐの気象予報データ等に対応付けて、記憶装置３に記憶させる。

予測分布推定システムは、新たに気象予報データおよび予測対象の実績値を受信する毎に、ステップＳ１〜Ｓ５を繰り返す。従って、時刻ｔ_０＋Ｐの気象予報データおよび時刻ｔ_０＋Ｐの風力発電量の実績値を受信することによって、予測分布推定システムがステップＳ１〜Ｓ４を実行し、さらに、ステップＳ５を実行するときに、予測値・誤差算出部２２は、時刻ｔ_０＋Ｐの風力発電量の実績値と予測値との誤差を算出し、その誤差を、時刻ｔ_０の気象予報データ等に対応付けて、記憶装置３に記憶させる。

ステップＳ１〜Ｓ５を繰り返すことによって、気象予報データ、風力発電量の実績値、学習データ、Ｐ時間後の風力発電量の予測値、Ｐ時間後の風力発電量の実績値と予測値との誤差とを対応付けた情報が、時系列順に記憶装置３に記憶される。次に説明する予測分布導出では、このような情報が時系列順に記憶装置３に記憶されていることを前提として説明する。

図１１は、予測分布導出の処理経過の例を示すフローチャートである。以下の説明においても、データ受信部１１が、最新の気象予報データおよび予測対象の実績値として、時刻ｔ_０の気象予報データおよび時刻ｔ_０の予測対象の実績値を受信した場合を例にする。データ受信部１１が時刻ｔ_０の気象予報データおよび時刻ｔ_０の予測対象の実績値を対応付けた情報を受信した後のステップＳ１，Ｓ２の動作は既に説明しているので、ここでは説明を省略する。

ステップＳ２で近傍データ抽出部４１に時刻ｔ_０の気象予報データが入力されると、近傍データ抽出部４１は、時刻ｔ_０の気象予報データに対応する学習データを記憶装置３から読み込む。近傍データ抽出部４１は、時刻ｔ_０の気象予報データとその学習データとの組を特定する（ステップＳ１１）。既に説明したように、時刻ｔ_０における気象予報データをＶ_０とし、その気象予報データに対応する学習データをＸ_０とする。近傍データ抽出部４１は、ステップＳ１１で、（Ｘ_０，Ｖ_０）という組を特定する。この組を、以下、最新の組と記す場合がある。

次に、近傍データ抽出部４１は、例えば、時刻ｔ_０以前の過去９０日を探索対象期間とし、探索対象期間内の時刻毎に、気象予報データと学習データの組と、最新の組との距離を算出する。既に説明したように、探索対象期間内の時刻ｔにおける気象予報データおよび学習データをそれぞれＶ_ｔ，Ｘ_ｔとする。近傍データ抽出部４１は、探索対象期間内の時刻ｔ毎に組（Ｘ_ｔ，Ｖ_ｔ）を特定し、最新の組（Ｘ_０，Ｖ_０）との距離を算出する（ステップＳ１２）。Ｘ_０，Ｖ_０，Ｘ_ｔ，Ｖ_ｔは行列で表されるので、近傍データ抽出部４１は、（Ｘ_０，Ｖ_０）と（Ｘ_ｔ，Ｖ_ｔ）との距離として、最近隣距離を算出することが好ましい。ただし、近傍データ抽出部４１は、距離として、最近隣距離以外の距離（例えば、ユークリッド距離あるいはマハラノビス距離等）を算出してもよい。また、組同士の類似の程度を表す指標値として距離以外の指標値を用いてもよい。

また、ステップＳ１２において、探索対象期間内の時刻であっても、時刻ｔ_０に近く、予測値と実績値との誤差はまだ算出されていない時刻は、距離の算出対象から除外してよい。

なお、上記の例では、探索対象期間として９０日を例示したが、探索対象期間は、９０日に限定されない。

近傍データ抽出部４１は、ステップＳ１２で算出した各距離に昇順に順位を付けたときに、距離が上位１５％以内の順位に入っているという条件を満たす探索対象期間内の各組を特定する。近傍データ抽出部４１は、その各組に対応する誤差（予測対象の実績値と予測値との差分）を記憶装置３から抽出する（ステップＳ１３）。近傍データ抽出部４１は、その誤差群を誤差分布導出部４２に送る。

誤差分布導出部４２は、近傍データ抽出部４１から送られた誤差群に基づいて、その誤差の分布を導出する（ステップＳ１４）。例えば、誤差分布導出部４２は、各誤差を正規分布に合わせてフィッティングしてもよい。また、このとき、誤差分布導出部４２は、最尤法を用いて、その分布のパラメータを算出する。ただし、フィッティングに用いる分布は、正規分布に限定でなくてもよい。また、分布のパラメータを算出する方法は、最尤法以外の分布パラメータ推定方法であってもよい。

上記の例では、誤差の分布は、正規分布を用いたフィッティングの結果と、その分布のパラメータ（例えば、平均値および分散）によって表される。

図１２は、ステップＳ１４で導出される誤差の分布の例を示す模式図である。図１２に示す横軸は、誤差である。この誤差は、風力発電量の予測値と実績値との差分であるので、単位はワットである。また、図１２に示す縦軸は、誤差の発生頻度である。また、図１２に示す“ａ”は、誤差の平均値であり、誤差を正規分布に合わせてフィッティングした場合、ａ＝０である。ただし、誤差の平均値が、分布の中央と合致していなくてもよい。

また、誤差分布導出部４２は、誤差のヒストグラムを生成し、そのヒストグラムそのものを誤差の分布としてもよい。

誤差分布導出部４２は、ステップＳ１４で導出した誤差の分布を表す情報を、予測分布導出部５２および信頼区間算出部５１に出力する。

予測分布導出部５２は、ステップＳ１４で導出された誤差の分布と、前述のステップＳ４（図７参照）で算出された予測値（時刻ｔ_０＋Ｐの風力発電量の予測値）とに基づいて、時刻ｔ_０＋Ｐの風力発電量の予測分布を導出する。予測分布導出部５２は、ステップＳ１４で得られた誤差の分布を、横軸方向に予測値（時刻ｔ_０＋Ｐの風力発電量の予測値）分だけ平行移動することによって、予測分布を導出する（ステップＳ１５）。例えば、図１２に例示する誤差の分布として、正規分布を用いてフィッティングした結果が得られているとする。この場合、ａ＝０である。予測分布導出部５２は、誤差の平均値ａに予測値を加算した値を平均値として持ち、かつ、分散が図１２に例示する分布の分散と等しい分布（すなわち、分布形状が図１２に示す形状と同一である分布）を、予測分布として導出する。この予測分布の例を、図１３に示す。図１３に示すｆは、ステップＳ４で算出された時刻ｔ_０＋Ｐの風力発電量の予測値である。また、図１３に示す横軸は、時刻ｔ_０＋Ｐの風力発電量を表している。また、図１３に示す縦軸は、時刻ｔ_０＋Ｐの風力発電量の予測される発生頻度を示している。

信頼区間算出部５１は、ステップＳ１４で導出された誤差の分布と、前述のステップＳ４（図７参照）で算出された予測値（時刻ｔ_０＋Ｐの風力発電量の予測値）とに基づいて、その予測値の信頼区間を算出する（ステップＳ１６）。ここでは、信頼係数が予め定められている場合を例にして説明する。信頼区間算出部５１は、信頼係数に応じて、ステップＳ１４で導出された誤差の分布の裾幅ｗを算出する。例えば、信頼係数が９８％である場合、信頼区間算出部５１は、ａ−ｗからａ＋ｗの範囲に、ステップＳ１３で抽出された誤差群の９８％が収まるようなｗを算出する。なお、ここでは、フィッティングに用いる分布が対称である場合を例にしている。図１４に裾幅ｗを模式的に示す。なお、信頼係数は、誤差群における所定の割合を示す。

ステップＳ４で算出された時刻ｔ_０＋Ｐの風力発電量の予測値をｆとする。信頼区間算出部５１は、［ｆ＋ａ−ｗ，ｆ＋ａ＋ｗ］を信頼区間として算出する。

なお、分布が中心を基準として左右非対称である場合には、信頼区間算出部５１は、信頼係数に応じて、左側の裾幅ｗ_１、右側の裾幅ｗ_２をそれぞれ、算出する。例えば、信頼係数が９８％である場合、信頼区間算出部５１は、ａ−ｗ_１からａ＋ｗ_２の範囲に、ステップＳ１３で抽出された誤差群の９８％が収まるようなｗ_１、ｗ_２を算出する。この場合、信頼区間算出部５１は、［ｆ＋ａ−ｗ_１，ｆ＋ａ＋ｗ_２］を信頼区間として算出する。

次に、表示部５３は、予測値をグラフ内に表示し、さらに、そのグラフ内で予測分布および信頼区間を表示する（ステップＳ１７）。図１５は、予測値等を示すグラフの例を示す模式図である。図１５に示す横軸は、時刻であり、縦軸は、予測値である。すなわち、図１５は、時間毎の予測値の変化を示す。データ受信部１１が時刻ｔ_０の気象予報データおよび風力発電量の実績値を受信したことにより、予測値・誤差算出部２２が時刻ｔ_０＋Ｐにおける風力発電量の予測値を算出した場合、表示部５３は、その予測値を最新の予測値として、グラフの右端に表示する（図１５参照）。なお、図１５に示す例では、予測値を示すマーカを黒丸で表している。表示部５３は、予測値のマーカに重ねて、予測分布を示す矩形領域９１を表示する。矩形領域９１は縦方向に長い。矩形領域９１の縦方向は、図１３に示す予測分布の横軸に相当する。そして、表示部５３は、矩形領域９１内で、図１３に示す予測分布の縦軸（予測される発生頻度）に応じた模様を表す。図１５に示す例では、予測される発生頻度を「高」、「中」、「低」に区分し、「高」に相当する箇所を斜線で表示し、「中」に相当する箇所を横線で表示し、「低」に相当する箇所を散点模様で表示した場合を例示している。表示部５３は、矩形領域９１内で、予測される発生頻度に応じた模様を表示する代わりに、矩形領域９１内で、予測される発生頻度を色の濃淡で表現してもよい。例えば、表示部５３は、矩形領域９１内で、予測される発生頻度が高いほど、濃い色を表示し、予測される発生頻度が低いほど、薄い色を表示してもよい。このように、表示部５３は、予測値をグラフ内に表示するとともに、そのグラフ内で予測分布を、その予測分布が示す発生頻度に応じた態様で表現して表示してもよい。

また、表示部５３は、信頼区間の下限を表す線８２と、信頼区間の上限を表す線８１とを表示する。線８２は、上述の信頼区間［ｆ＋ａ−ｗ，ｆ＋ａ＋ｗ］における下限ｆ＋ａ−ｗを表している。線８１は、上述の信頼区間［ｆ＋ａ−ｗ，ｆ＋ａ＋ｗ］における上限ｆ＋ａ＋ｗを表している。なお、信頼区間の表示態様は、図１５に示す例に限定されない。

既に説明したように、気象予報データ同士が類似していれば、その気象予報データが得られた時刻から所定時間後における予測対象の実績値も近い値になる。また、気象予報データ同士が類似していて、学習データ同士も類似していれば、得られる予測値も近い値になる。従って、最新の時刻ｔ_０の気象予報データおよび学習データの組と類似している過去の組を特定し、その組に対応する誤差を抽出した場合、その誤差のばらつきは小さい。本発明の予測分布推定システムは、そのような誤差を抽出し、その誤差に基づいて誤差の分布を導出し、さらに予測分布を導出する。従って、予測分布のばらつきは小さく、精度の高い予測分布が得られる。また、信頼区間の幅が小さくなり、好ましい信頼区間が得られる。

図１６は、本発明による誤差のばらつきと、学習データを考慮しない場合の誤差のばらつきとの比較を示す図である。図１６に示す横軸は、裾幅の２倍を示している。また、図１６に示す縦軸は、その裾幅の２倍の範囲に、抽出された誤差の何パーセントが属しているかを示している。また、丸のマーカは、本発明の予測分布推定システムがステップＳ１３で誤差を抽出した場合の結果を示している。また、三角形のマーカは、学習データを考慮せずに、最新の時刻の気象予報データのみと類似する気象予報データのみを特定し、その気象予報データに対応する誤差を抽出した場合の結果を示している。図１６から、裾幅が同じであれば、本発明の処理を実行した方が、より多くの誤差がその裾幅の２倍の範囲に注中していることが分かる。従って、本発明では誤差の分布のばらつきが小さいことが図１６に示す実験結果からも分かる。

また、本発明では、気象予報データと学習データとの組同士の距離に基づいて、誤差を抽出する。従って、学習データを用いてどのような方法で予測回帰モデルを導出するかは、誤差の抽出に影響しない。従って、予測回帰モデルの導出アルゴリズムによらず、精度の高い予測分布が得られる。

次に、本発明の変形例について説明する。
上記の実施形態の説明では、予測対象が風力発電量である場合を例示した。予測対象は、風力発電量以外であってもよい。例えば、太陽光発電量や日射量を予測対象としてもよい。ただし、この場合、太陽光発電量や日射量の予測対象となる時刻は、夜間ではない。従って、この場合、予測分布推定システムは、気象予報データ、予測対象の実績値、学習データ、予測値および誤差を対応付けたデータを、予測対象時刻が日中の時間になるような所定の時間帯に関して時系列順に記憶させればよい。例えば、予測分布推定システムは、５時から１９時までの時間帯に関して、上記のデータを時系列順に記憶させればよい。なお、ここで述べた５時から１９時までの時間帯は例示であり、この時間帯に限定されない。上記のようにデータを記憶装置３に記憶している状態で、ステップＳ１２，Ｓ１３の処理を実行してもよい。

また、風力発電量と異なり、太陽光発電量や日射量は、時間帯による変動が大きい。そのため、近傍データ抽出部４１は、最新の組（Ｘ_０，Ｖ_０）と、探索対象期間における組（Ｘ_ｔ，Ｖ_ｔ）との距離を計算する際、探索対象期間内の時刻のうち最新の時刻と同時刻における組のみを、最新の組（Ｘ_０，Ｖ_０）との距離計算の対象としてもよい。例えば、最新の組（Ｘ_０，Ｖ_０）が１４時に対応しているとする。この場合、近傍データ抽出部４１は、探索対象期間内の各時刻のうち、１４時に対応する（Ｘ_ｔ，Ｖ_ｔ）のみを抽出し、その（Ｘ_ｔ，Ｖ_ｔ）と（Ｘ_０，Ｖ_０）との距離を計算すればよい。この場合、抽出される過去の組の数が少なくなるので、探索対象期間を長く定めてもよい。

また、探索対象期間を分割して定めていてもよい。例えば、探索対象期間が９０日であるとする。この場合、最新の時刻ｔ_０以前の３０日分と、時刻ｔ_０の１年前以前の３０日分と、時刻ｔ_０の２年前以前の３０日分とに、探索対象期間を分割してもよい。再生可能エネルギーの発電量等は、季節による影響を受けることもある。このように、年を跨いて探索対象期間を分割することで、季節による影響を減少することができる。すなわち、近傍データ抽出部４１は、新たな気象予報データと学習データの組と類似しているか否かの判定対象を、その新たな気象予報データが得られた時刻から所定期間前までの気象予報データとその気象予報データに対応する学習データの組、および、その所定期間に相当する前年以前の時期における気象予報データとその気象予報データに対応する学習データの組としてもよい。

また、上記の実施形態の説明では、信頼区間を定めるときに用いる信頼係数が予め定められている場合を例にして説明した。信頼係数を外部から指定できる構成としてもよい。図１７は、信頼係数を外部から指定できる構成とした場合の算出装置５の例を示すブロック図である。なお、図１７では、算出装置５以外の図示を省略している。図１７に示す例では、算出装置５は、信頼区間算出部５１、予測分布導出部５２、表示部５３に加えて、信頼係数入力部５４を備える。信頼係数入力部５４は、信頼係数が入力される入力デバイス（例えば、キーボード等）である。信頼区間算出部５１は、信頼係数入力部５４を介して入力された信頼係数に応じて、裾幅ｗを算出し、さらに信頼区間を算出する。その他の点については、既に説明した実施形態と同様である。本例では、例えば、予測分布推定システムの管理者が、信頼係数を調整することができる。

また、データ受信装置１および予測装置２が本発明の予測分布推定システムの外部の装置として設けられていてもよい。また、記憶装置３が本発明の予測分布推定システムの外部の装置として設けられていてもよい。あるいは、既に説明したように、予測分布推定システムが、データ受信装置１と、予測装置２と、記憶装置３と、推定装置４と、算出装置５とを備える構成であってもよい。

また、データ受信装置１、予測装置２、記憶装置３、推定装置４、および算出装置５が、記憶装置３を有する一台のコンピュータによって実現されていてもよい。この場合、データ受信部１１、気象予報データ出力部１２、モデル導出部２１、予測値・誤差算出部２２、近傍データ抽出部４１、誤差分布導出部４２、信頼区間算出部５１、予測分布導出部５２、および表示部５３は、予測分布推定プログラムに従って動作するそのコンピュータのＣＰＵによって実現されてもよい。ＣＰＵは、コンピュータのプログラム記憶装置（図示略）等のプログラム記録媒体から予測分布推定プログラムを読み込み、その予測分布推定プログラムに従って、上記の各要素として動作すればよい。なお、表示部５３のうち、グラフをさだめ、そのグラフをディスプレイ装置に表示させる部分がＣＰＵによって実現される。表示部５３のうち、実際に表示を行う部分は、ディスプレイ装置によって実現される。

なお、本発明は、再生可能エネルギーに関する事項以外の事項を予測対象とする場合にも、適用可能である。

以下、本発明の概要を説明する。図１８は、本発明の予測分布推定システムの概要を示すブロック図である。本発明の予測分布推定システムは、抽出手段９５と、誤差分布導出手段９６と、予測分布導出手段９７とを備える。

抽出手段９５（例えば、近傍データ抽出部４１）は、気象予報データと、その気象予報データに対応する予測値および学習データとが特定された際に、その気象予報データとその学習データの組に類似していると判定される過去の気象予報データと学習データの組をそれぞれ抽出する。

誤差分布導出手段９６（例えば、誤差分布導出部４２）は、過去の気象予報データと学習データの組毎に得られる、過去の気象予報データと学習データとに基づく予測値と、当該予測値に対応する実績値との誤差に基づいて、誤差の分布を導出する。

予測分布導出手段９７（例えば、予測分布導出部５２）は、誤差の分布に基づいて、予測対象の予測分布を導出する。

そのような構成により、予測対象の予測分布を高い精度で推定することができる。

誤差の分布と、特定された予測値とに基づいて、当該予測値の信頼区間を算出する信頼区間算出手段（例えば、信頼区間算出部５１）を備える構成であってもよい。

誤差の分布と、誤差群における所定の割合を示す信頼係数とに基づいて、予測分布の信頼区間を算出する信頼区間算出手段（例えば、信頼区間算出部５１）を備える構成であってもよい。

信頼係数が入力される信頼係数入力手段（例えば、信頼係数入力部５４）を備え、信頼区間算出手段が、信頼係数に応じた信頼区間を算出する構成であってもよい。

抽出手段９５が、類似の程度を表す指標値として、過去の気象予報データと学習データの組と、新たな気象予報データと新たな学習データの組との距離を算出する構成であってもよい。

予測値をグラフ内に表示するとともに、そのグラフ内で予測分布を、その予測分布が示す発生頻度に応じた態様で表現して表示する表示手段（例えば、表示部５３）を備える構成であってもよい。

気象予報データと、気象予報データが得られた時点の予測対象の実績値と、その時点から所定時間後における予測対象の予測値と、当該予測値を算出するための予測モデルを導出する際に用いた学習データと、予測値と上記の時点から所定時間後における予測対象の実績値との差分である誤差とを対応付けて記憶する記憶手段（例えば、記憶装置３）を備える構成であってもよい。

新たな気象予報データと、新たな気象予報データに対応する新たな実績値とが入力されたときに、新たな気象予報データと新たな実績値を記憶手段に記憶させるデータ追加手段（例えば、データ受信部１１）と、新たな気象予報データに対応する新たな学習データを特定し、新たな学習データから予測モデルを導出し、新たな学習データを新たな気象予報データに対応付けて記憶手段に記憶させるモデル導出手段（例えば、モデル導出部２１）と、予測モデルと新たな気象予報データとに基づいて、新たな気象予報データが得られた時点から所定時間後における予測対象の予測値を算出し、当該予測値を、新たな気象予報データに対応付けて記憶手段に記憶させる予測手段（例えば、予測値・誤差算出部２２）とを備え、予測手段が、上記の時点から所定時間後における予測対象の実績値が入力されたときに、予測値と実績値との誤差を算出し、新たな気象予報データに対応付けて記憶手段に記憶させる構成であってもよい。

抽出手段９５が、特定された気象予報データと学習データの組と類似しているか否かの判定対象を、特定された気象予報データが得られた時刻と得られた時刻が同じである過去の気象予報データと当該気象予報データに対応する学習データの組とする構成であってもよい。

抽出手段９５が、特定された気象予報データと学習データの組と類似しているか否かの判定対象を、特定された気象予報データが得られた時刻から所定期間前までの気象予報データと当該気象予報データに対応する学習データの組、および、その所定期間に相当する前年以前の時期における気象予報データと当該気象予報データに対応する学習データの組とする構成であってもよい。

上記の実施形態は、以下の付記のようにも記載され得るが、以下に限定されるわけではない。

（付記１）気象予報データと、前記気象予報データが得られた時点の予測対象の実績値と、前記時点から所定時間後における前記予測対象の予測値と、当該予測値を算出するための予測モデルを導出する際に用いた学習データと、前記予測値と前記時点から所定時間後における前記予測対象の実績値との差分である誤差とを対応付けて記憶する記憶手段を用いて、新たな気象予報データと、前記新たな気象予報データに対応する新たな予測値および新たな学習データとが特定された際に、前記記憶手段に記憶されている気象予報データと学習データの組毎に、前記新たな気象予報データと前記新たな学習データの組との類似の程度を表す指標値を算出し、前記指標値が所定の条件を満たす気象予報データと学習データの各組を特定し、特定した組毎に、特定した組に対応する前記誤差を前記記憶手段から抽出する抽出手段と、前記抽出手段によって抽出された誤差に基づいて誤差の分布を導出する誤差分布導出手段と、前記誤差の分布と、前記新たな予測値とに基づいて、前記予測対象の予測分布を導出する予測分布導出手段とを備えることを特徴とする予測分布推定システム。

（付記２）誤差の分布と、新たな予測値とに基づいて、当該新たな予測値の信頼区間を算出する信頼区間算出手段を備える付記１に記載の予測分布推定システム。

（付記３）信頼係数が入力される信頼係数入力手段を備え、信頼区間算出手段は、前記信頼係数に応じた信頼区間を算出する付記２に記載の予測分布推定システム。

（付記４）抽出手段は、類似の程度を表す指標値として、記憶手段に記憶されている気象予報データと学習データの組と、新たな気象予報データと新たな学習データの組との距離を算出する付記１から付記３のうちのいずれかに記載の予測分布推定システム。

（付記５）予測値をグラフ内に表示するとともに、前記グラフ内で予測分布を色の濃淡で表現して表示する表示手段を備える付記１から付記４のうちのいずれかに記載の予測分布推定システム。

（付記６）気象予報データと、前記気象予報データが得られた時点の予測対象の実績値と、前記時点から所定時間後における前記予測対象の予測値と、当該予測値を算出するための予測モデルを導出する際に用いた学習データと、前記予測値と前記時点から所定時間後における前記予測対象の実績値との差分である誤差とを対応付けて記憶する記憶手段を備える付記１から付記５のうちのいずれかに記載の予測分布推定システム。

（付記７）新たな気象予報データと、前記新たな気象予報データに対応する新たな実績値とが入力されたときに、前記新たな気象予報データと前記新たな実績値を記憶手段に記憶させるデータ追加手段と、前記新たな気象予報データに対応する新たな学習データを特定し、前記新たな学習データから予測モデルを導出し、前記新たな学習データを前記新たな気象予報データに対応付けて前記記憶手段に記憶させるモデル導出手段と、前記予測モデルと前記新たな気象予報データとに基づいて、前記新たな気象予報データが得られた時点から所定時間後における予測対象の予測値を算出し、当該予測値を、前記新たな気象予報データに対応付けて前記記憶手段に記憶させる予測手段とを備え、前記予測手段は、前記時点から所定時間後における予測対象の実績値が入力されたときに、前記予測値と前記実績値との誤差を算出し、前記新たな気象予報データに対応付けて前記記憶手段に記憶させる付記１から付記６のうちのいずれかに記載の予測分布推定システム。

（付記８）気象予報データと、前記気象予報データが得られた時点の予測対象の実績値と、前記時点から所定時間後における前記予測対象の予測値と、当該予測値を算出するための予測モデルを導出する際に用いた学習データと、前記予測値と前記時点から所定時間後における前記予測対象の実績値との差分である誤差とを対応付けて記憶する記憶手段を用いて、新たな気象予報データと、前記新たな気象予報データに対応する新たな予測値および新たな学習データとが特定された際に、前記記憶手段に記憶されている気象予報データと学習データの組毎に、前記新たな気象予報データと前記新たな学習データの組との類似の程度を表す指標値を算出し、前記指標値が所定の条件を満たす気象予報データと学習データの各組を特定し、特定した組毎に、特定した組に対応する前記誤差を前記記憶手段から抽出し、抽出した誤差に基づいて誤差の分布を導出し、前記誤差の分布と、前記新たな予測値とに基づいて、前記予測対象の予測分布を導出することを特徴とする予測分布推定方法。

（付記９）コンピュータに、気象予報データと、前記気象予報データが得られた時点の予測対象の実績値と、前記時点から所定時間後における前記予測対象の予測値と、当該予測値を算出するための予測モデルを導出する際に用いた学習データと、前記予測値と前記時点から所定時間後における前記予測対象の実績値との差分である誤差とを対応付けて記憶する記憶手段を用いて、新たな気象予報データと、前記新たな気象予報データに対応する新たな予測値および新たな学習データとが特定された際に、前記記憶手段に記憶されている気象予報データと学習データの組毎に、前記新たな気象予報データと前記新たな学習データの組との類似の程度を表す指標値を算出し、前記指標値が所定の条件を満たす気象予報データと学習データの各組を特定し、特定した組毎に、特定した組に対応する前記誤差を前記記憶手段から抽出する抽出処理、前記抽出処理で抽出された誤差に基づいて誤差の分布を導出する誤差分布導出処理、および、前記誤差の分布と、前記新たな予測値とに基づいて、前記予測対象の予測分布を導出する予測分布導出処理を実行させるための予測分布推定プログラム。

本発明は、予測対象の予測分布を推定する予測分布推定システムに好適に適用される。

１データ受信装置
２予測装置
３記憶装置
４推定装置
５算出装置
１１データ受信部
１２気象予報データ出力部
２１モデル導出部
２２予測値・誤差算出部
４１近傍データ抽出部
４２誤差分布導出部
５１信頼区間算出部
５２予測分布導出部
５３表示部
５４信頼係数入力部

Claims

気象予報データと、前記気象予報データの配信時刻から一定時間後における再生可能エネルギーの発電量の予測値と、前記配信時刻以前の過去の所定期間分の気象予報データと過去の気象予報データの配信時刻における前記再生可能エネルギーの発電量の実績値とを含む学習データとが特定された際に、前記気象予報データと前記学習データの組に類似していると判定される過去の気象予報データと学習データの組をそれぞれ抽出する抽出手段と、
前記過去の気象予報データと学習データの組毎に得られる、前記過去の気象予報データと学習データとに基づく予測値と、当該予測値に対応する実績値との誤差に基づいて、誤差の分布を導出する誤差分布導出手段と、
前記誤差の分布に基づいて、予測対象の予測分布を導出する予測分布導出手段とを備える
ことを特徴とする予測分布推定システム。
誤差の分布と、特定された予測値とに基づいて、当該予測値の信頼区間を算出する信頼区間算出手段を備える
請求項１に記載の予測分布推定システム。
誤差の分布と、誤差群における所定の割合を示す信頼係数とに基づいて、予測分布の信頼区間を算出する信頼区間算出手段を備える
請求項１または請求項２に記載の予測分布推定システム。
信頼係数が入力される信頼係数入力手段を備え、
信頼区間算出手段は、前記信頼係数に応じた信頼区間を算出する
請求項２または請求項３に記載の予測分布推定システム。
抽出手段は、類似の程度を表す指標値として、過去の気象予報データと学習データの組と、新たな気象予報データと新たな学習データの組との距離を算出する
請求項１から請求項４のうちのいずれか１項に記載の予測分布推定システム。
予測値をグラフ内に表示するとともに、前記グラフ内で予測分布を、当該予測分布が示す発生頻度に応じた態様で表現して表示する表示手段を備える
請求項１から請求項５のうちのいずれか１項に記載の予測分布推定システム。
気象予報データと、前記気象予報データが得られた時点の予測対象の実績値と、前記時点から所定時間後における前記予測対象の予測値と、当該予測値を算出するための予測モデルを導出する際に用いた学習データと、前記予測値と前記時点から所定時間後における前記予測対象の実績値との差分である誤差とを対応付けて記憶する記憶手段を備える
請求項１から請求項６のうちのいずれか１項に記載の予測分布推定システム。
新たな気象予報データと、前記新たな気象予報データに対応する新たな実績値とが入力されたときに、前記新たな気象予報データと前記新たな実績値を記憶手段に記憶させるデータ追加手段と、
前記新たな気象予報データに対応する新たな学習データを特定し、前記新たな学習データから予測モデルを導出し、前記新たな学習データを前記新たな気象予報データに対応付けて前記記憶手段に記憶させるモデル導出手段と、
前記予測モデルと前記新たな気象予報データとに基づいて、前記新たな気象予報データが得られた時点から所定時間後における予測対象の予測値を算出し、当該予測値を、前記新たな気象予報データに対応付けて前記記憶手段に記憶させる予測手段とを備え、
前記予測手段は、前記時点から所定時間後における予測対象の実績値が入力されたときに、前記予測値と前記実績値との誤差を算出し、前記新たな気象予報データに対応付けて前記記憶手段に記憶させる
請求項７に記載の予測分布推定システム。
抽出手段は、特定された気象予報データと学習データの組と類似しているか否かの判定対象を、前記特定された気象予報データが得られた時刻と得られた時刻が同じである過去の気象予報データと当該気象予報データに対応する学習データの組とする
請求項１から請求項８のうちのいずれか１項に記載の予測分布推定システム。
抽出手段は、特定された気象予報データと学習データの組と類似しているか否かの判定対象を、前記特定された気象予報データが得られた時刻から所定期間前までの気象予報データと当該気象予報データに対応する学習データの組、および、前記所定期間に相当する前年以前の時期における気象予報データと当該気象予報データに対応する学習データの組とする
請求項１から請求項８のうちのいずれか１項に記載の予測分布推定システム。
気象予報データと、前記気象予報データの配信時刻から一定時間後における再生可能エネルギーの発電量の予測値と、前記配信時刻以前の過去の所定期間分の気象予報データと過去の気象予報データの配信時刻における前記再生可能エネルギーの発電量の実績値とを含む学習データとが特定された際に、前記気象予報データと前記学習データの組に類似していると判定される過去の気象予報データと学習データの組をそれぞれ抽出し、
前記過去の気象予報データと学習データの組毎に得られる、前記過去の気象予報データと学習データとに基づく予測値と、当該予測値に対応する実績値との誤差に基づいて、誤差の分布を導出し、
前記誤差の分布に基づいて、予測対象の予測分布を導出する
ことを特徴とする予測分布推定方法。
コンピュータに、
気象予報データと、前記気象予報データの配信時刻から一定時間後における再生可能エネルギーの発電量の予測値と、前記配信時刻以前の過去の所定期間分の気象予報データと過去の気象予報データの配信時刻における前記再生可能エネルギーの発電量の実績値とを含む学習データとが特定された際に、前記気象予報データと前記学習データの組に類似していると判定される過去の気象予報データと学習データの組をそれぞれ抽出する抽出処理、
前記過去の気象予報データと学習データの組毎に得られる、前記過去の気象予報データと学習データとに基づく予測値と、当該予測値に対応する実績値との誤差に基づいて、誤差の分布を導出する誤差分布導出処理、および、
前記誤差の分布に基づいて、予測対象の予測分布を導出する予測分布導出処理
を実行させるための予測分布推定プログラム。