JP7257276B2 - データ予測システム及びその方法 - Google Patents

データ予測システム及びその方法 Download PDF

Info

Publication number
JP7257276B2
JP7257276B2 JP2019126321A JP2019126321A JP7257276B2 JP 7257276 B2 JP7257276 B2 JP 7257276B2 JP 2019126321 A JP2019126321 A JP 2019126321A JP 2019126321 A JP2019126321 A JP 2019126321A JP 7257276 B2 JP7257276 B2 JP 7257276B2
Authority
JP
Japan
Prior art keywords
factor
prediction
data
variation
contribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019126321A
Other languages
English (en)
Other versions
JP2021012539A (ja
Inventor
将人 内海
徹 渡辺
郁雄 茂森
功 萩谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2019126321A priority Critical patent/JP7257276B2/ja
Publication of JP2021012539A publication Critical patent/JP2021012539A/ja
Application granted granted Critical
Publication of JP7257276B2 publication Critical patent/JP7257276B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Supply And Distribution Of Alternating Current (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、データ予測システム及びその方法に関し、例えば、将来の電力需要を予測するデータ予測システムに適用して好適なものである。
電力事業やガス事業などのエネルギー事業分野や、通信事業分野や、タクシーや配送業などの運送事業分野などでは、消費者の需要に合わせた設備稼働や資源配分を行うために、将来の需要量の値の予測を行う。
例えば、電力事業の分野では、電気の発電量と需要量とを常に一致させなければならない同時同量の制約がある。電力事業者は、同時同量を達成するために必要十分な電力供給能力を確保するように発電機の総出力を調整し、ピーク需要が到来する以前から全力稼働の準備をして待機する必要がある。したがって、電力事業者は、電力の需要を正確に予測する必要がある。
近年では、電力需要に占める冷暖房消費電力の比率が高いため、電力需要は気温の影響を受けて変動する。これに対し、電力事業者は、外気温を説明変数(因子)として電力需要の予測を行う。予測値を算出するための予測モデルは、観測済みの因子及び予測対象のデータに適合するように、同定あるいは学習を行って用いられる。
予測モデルは、因子の新たな値を入力することで予測対象の予測値を出力する。予測モデルは、同定あるいは学習において、観測データへの過剰適合(オーバーフィッティング)の防止が重要である。過剰適合の防止とは、因子の新たな値に対する予測対象の予測値が過剰な値となることを防ぐことをいう。
特許文献1に、ニューラルネットワークによる予測装置が開示されている。これは、人口知能による需要予測装置を用いて、推定評価された最新予測値の予測誤差を小さくしようとする技術である。この特許文献1の段落[0021]に、次のようなことが記載されている。逐次予測部は、最新予測値の精度を逐次に推定評価する。推定評価された最新予測値の予測誤差が小さければ、その最新予測値を有効とする。逆に、最新予測値の予測誤差が大きければ、その最新予測値と現在の予測モデルを無効とする、といったことである。
特開2001-236337号公報
ところで、電力需要などの予測対象の予測を行う場合、外気温などの因子の値について、予め予測しておく必要がある。また、予測対象日時における因子それぞれの値には誤差(因子変動量)が生じる。この因子変動量が過大となった場合、予測対象の予測値にも過大な誤差が生じる。
しかしながら、予測モデルに入力する因子の誤差値(変動)に起因する影響を抑制する技術は、いまだかつて開示されていない。加えて、因子の値の変動特性は、定常と限らない。換言すると、因子の誤差量の分布は、定常と限らない。
このような因子の変動特性、又は因子の誤差量の分布は、典型例として、季節性の周期的変化が知られている。予測モデルに入力する因子に対し、季節性変化を始めとして、何らかの事象による突発的変化が発生するものの、その対処法は、特許文献1にも開示されていない。最新予測値の予測誤差が大きければ、その最新予測値と現在の予測モデルを無効にする、といったことである。
このため、予測対象に対応した予測モデルを用いた従来の予測システムにおいて、因子の変動に起因する予測値の過大誤差が発生することを抑制できず、高精度の予測値は得難いという問題があった。本発明は、以上の点を考慮してなされたもので、従来よりも予測値の誤差を低減させ得るデータ予測システムを提供しようとするものである。
かかる課題を解決する本発明は、予測データを算出するデータ予測システムであって、予測対象の予測値を算出するための予測モデルに用いる因子に関し、各因子の変動量に基づいて前記予測モデルの同定における各因子の寄与度を制御するデータを出力する因子変動評価部と、前記予測対象の標本、因子の標本、及び各因子の寄与度を制御するデータに基づいて前記予測モデルを同定し、前記予測対象の予測値を出力する予測部と、を有するものである。
本発明によれば、従来よりも予測値の誤差を低減させ得るデータ予測システムを実現することができる。
本発明の実施形態に係るデータ管理システムの概略構成を示す模式説明図である。 本発明の実施形態に係るデータ予測システム(本システム)の構成を示すブロック図である。 図2の本システムにおける信号の流れを示すブロック図である。 図1~図3の本システムにおける予測処理の手順を示すフローチャートである。 図2及び図3の因子変動評価部における信号の流れを示すブロック図である。 図2、図3及び図5の予測部における信号の流れを示すブロック図である。 本システムの効果を示す概念図である。 図5の因子変動評価部に対する変形例を示すブロック図である。 図8の因子変動評価部に対する変形例を示すブロック図である。 予測対象の具体例による予測処理の概念図である。
以下、図面を参照しながら、本発明の実施の形態を詳述する。なお、本発明の実施形態に係るデータ予測システムを「本システム」と略称する。
(1)基本例
(1-1)本システムを含むデータ管理システムの構成
図1は、本発明の実施形態に係るデータ管理システムの概略構成を示す模式説明図である。図1に示すデータ管理システム1は、電力事業分野で好適に採用できる。その場合、データ管理システム1は、過去の電力需要の実績量に基づいて、将来の所定期間の電力の需要量を予測する。
その予測結果に基づいて、電力事業者は、円滑な電力の需給管理を可能にする。ある電力事業者は、自社設備による発電機の運転計画を適確に策定してそれを実行することができる。その電力事業者は、他の電気事業者から電力を調達する取引計画についても、適確に策定して実行することができる。
データ管理システム1は、予測演算装置2、データ管理装置3、情報入出力端末4、計画作成及び/又は実行管理装置(以下、「計画作成/実行管理装置」と略す)5、データ観測装置6、データ配信装置7、及び通信経路8から構成される。
通信経路8は、例えば、LAN(Local Area Network)やWAN(Wide Area Network)であり、データ管理システム1を構成する各種装置、及び端末を互いに通信可能に接続できれば、他の形態でも構わない。データ管理装置3は、予測対象や因子の標本データ、及び因子の予測データを憶再生可能であり、予測対象の予測値を算出するためにそれらのデータを提供する。
予測対象の標本データには、時間推移に伴って観測された予測対象の過去の観測データである予測対象標本データを少なくとも含む。また、因子の標本データには、予測対象の値の増減に影響を及ぼす可能性のある各種因子の過去の観測データである因子標本データを少なくとも含む。また、因子の予測データには、因子標本データに含まれる因子それぞれの予測データを少なくとも含む。
予測対象には、例えば、電力、ガス、水道などのエネルギー消費量データ、あるいは太陽光発電や風力発電などのエネルギーの生産量データ、あるいは一例として、日本卸電力取引所(JEPX)で取引されるエネルギーの取引量や価格、などがある。本システム12は、電力需要地域の天気予報、特に、気温に基づいて、該当地域の翌日の電力需要に関する予想データを出力する。この予想データに基づいて、電力事業者は、電力供給量を決定する。
また、電力事業分野以外では、通信基地局などで計測される通信量データ、自動車などの移動体の位置情報履歴データ、などがある。また、これらの標本データは、計測器単位のデータ、あるいは複数の計測器を併せて得られるデータ、などである。
また、因子には、例えば、気温、湿度、日射量、風速、気圧などの気象データ、年月日、曜日、任意に設定した日の種別を示すフラグ値などの暦日データ、台風やイベントなどの突発事象の発生有無を示すデータ、などがある。
これら以外にも、因子には、エネルギーの消費者数、産業動向や景況指数などの経済状況を示すデータ、特急列車の乗車率、乗車客数、予約席数、あるいは道路交通状況などの人や移動体の移動状況を示すデータ、などがある。これら以外にも、通信基地局に接続する通信端末数、などのデータがある。上述したように、これらの予測対象に対する過去の観測データも因子に含む。
データ管理装置3は、情報入出力端末4を介して予め設定した過去日時から最新の観測日時までの標本データを記憶する。このデータ管理装置3は、他装置からのデータ取得要求に応じて、標本データの検索及び送信も行う。予測演算装置2は、データ管理装置3に記憶されたデータを用いて予測を行う。
図2及び図3を用いて後述するように、予測演算装置2は、因子変動評価部251と、予測部252と、を有する。因子変動評価部251は、予測モデルに用いる因子の寄与度を制御するデータを出力する。この因子変動評価部251は、各因子が過去に得た予測値に基づいて、既存の分類のなかから帰属先を捜すように予測モデルを同定する。図7を用いて後述するように、同定された予測モデルは、予測対象について各因子を当て嵌めて予測データを算出した結果の集合体としてグラフに可視化して表示することもできる。なお、予測データを算出するとは、例えば、y=xといった数式で構成された予測モデルに対し、x値を代入してy値を算出することをいう。
因子変動評価部251は、予測モデルを同定するとともに、各因子が過去に得た予測値に基づく当たり外れの程度に応じて寄与度を制御するデータを出力する。因子変動評価部251は、当たり易い因子の寄与度を高く制御し、外れ易い因子の寄与度を低く制御する。なお、「寄与度」を「重み付け」と読み替えても良いが、この技術分野では、もっぱら寄与度という。つまり、当たり易い因子を重視するように重み付けて、外れ易い因子を軽視するように重み付ける。予測部252は、この要領で、予測対象の観測標本、因子の観測標本、及び各因子の寄与度を制御するデータに基づいて、予測モデル同定し、予測対象の予測値を出力する。
計画作成/実行管理装置5は、予測演算装置2が出力した予測データを基に、所定の目標を達成するための物理的な設備の運転計画の作成と実行を行う。ここで物理的な設備の運転計画とは、エネルギー分野においては、例えば、予測した将来のエネルギー需要値又は予測した将来のエネルギー需要値に基づいて作成したエネルギー需要計画値を充足させるような、発電機の運転計画である。
具体的には、発電機の起動台数及びそれら発電機の出力配分の計画と、ガス導管や水道管に流すガスや水の流量や圧力の配分計画と、を例示できる。あるいは、デマンドレスポンスと呼ばれる電力需要の調整制御における需要調整量配分の計画と、その調整制御の実行と、も例示できる。デマンドレスポンスにおける調整制御の対象は、デマンドレスポンスに参加している電力消費者、又はその需要設備である。
また通信分野においては、例えば、通信基地局の収容容量を超えないように、各通信基地局に接続する通信端末数の制御計画である。また運送分野においては、例えば、予測した利用者数を充足させることが出来るようなタクシーの配車計画である。
なお、設備の運転計画は、計画作成/実行管理装置5を利用する主体者による直接的な実行に限定されるものではなく、間接的に実現される形態でも良い。間接的な設備の運転とは、例えば、電力分野において、直接的な相対取引契約や取引所を介した取引契約に基づいた他者による物理的な設備の運転である。この場合、取引契約の実行計画が設備の運転計画に相当する。これらは、後述する3分割された電力会社における運用を例示している。
情報入出力端末4は、予測演算装置2、データ管理装置3、及び計画作成/実行管理装置5へデータ入力する。また、これらの装置が記憶するデータ、又は出力するデータは、情報入出力端末4で表示することも可能である。データ観測装置6は、不図示の予測対象過去計測データ及び予測説明因子データを所定の時間間隔で定期的に計測し、これらのデータをデータ配信装置7、又はデータ管理装置3へ送信する。データ配信装置7は、データ観測装置6から受信したデータを記憶し、これらのデータを予測演算装置2と、データ管理装置3と、少なくとも何れかに送信する。
(1-2)装置内部構成
図2は、本システム12の構成を示すブロック図である。図2は、データ管理システム1におけるデータ予測システム12(図3も参照)を構成する各装置の機能構成を示す。本システム12は予測演算装置2とデータ管理装置3とから構成される。
データ管理装置3は、データ管理装置3の動作を統括的に制御するCPU(Central Processing Unit)31、入力装置32、出力装置33、通信装置34、及び記憶装置35から構成される。このデータ管理装置3は、例えば、パーソナルコンピュータ、サーバコンピュータ、又はハンドヘルドコンピュータ、などの情報処理装置である。
入力装置32は、キーボード又はマウスから構成され、出力装置33は、ディスプレイ又はプリンタから構成される。通信装置34は、無線LAN又は有線LANに接続するためのNIC(Network Interface Card)を備えて構成される。記憶装置35は、RAM(Random Access Memory)やROM(Read Only Memory)などの記憶媒体である。また、各処理部の出力結果や中間結果は、出力装置33を介して適宜出力しても良い。
記憶装置35には、予測対象標本データ記憶部351、因子標本データ記憶部352、因子予測データ記憶部353、などのデータベースが格納されている。予測対象標本データ記憶部351には、予測対象標本データ351Aが保持されている。因子標本データ記憶部352には、因子標本データ352Aが保持されている。因子予測データ記憶部353には、因子予測データ353Aが保持されている。
予測対象標本データ351Aは、予測対象の過去の観測値が記憶されたデータである。予測対象とは、例えば、電力、ガス、水道などのエネルギー消費量データ、通信基地局などで計測される通信量データ、自動車はどの移動体の位置情報履歴データ、などである。
したがって標本データに含まれる予測対象の過去のデータは、例えば、計量器単位又は複数計量器の合計としての電力、ガス、又は水道などのエネルギー消費量データのほか、ある通信基地局の通信量データや、タクシーなどの移動体の時間毎の稼働台数データ、などである。
因子標本データ352Aは、予測対象の値の増減に影響を与える各種因子の過去の観測値が記憶されたデータである。因子とは、つぎに例示列挙する項目に係るデータをいう。例えば、気温、湿度、日射量、風速、気圧などの気象データ、又は年月日、曜日、任意に設定した日の種別を示すフラグ値などの暦日データ、又は台風やイベントなどの突発事象の発生有無を示すデータ、又はエネルギーの消費者数、産業動向や景況指数などの経済状況を示すデータ、又は特急列車の乗車率、乗車客数、予約席数、その他の道路交通状況における人や移動体の移動状況を示すデータ、又は通信基地局に接続する通信端末数を示すデータ、などである。
また、因子標本データ352Aは、上記例示列挙した項目の予測対象に係る過去の観測データそのものも含む。さらに、因子予測データ353Aは、因子標本データ352Aに格納されている各因子について、各時間断面における過去の予測値が記憶されたデータである。この因子予測データ353Aを用い、過去の予測値に対する当たり外れについて、後日に検証することが有益な場合もある。上述のように、因子変動評価部251は、予測モデルを同定するとともに、各因子が過去に得た予測値に基づく当たり外れの程度に応じて寄与度を制御するデータを出力する。
予測演算装置2は、予測演算装置2の動作を統括的に制御するCPU(Central Processing Unit)21、入力装置22、出力装置23、通信装置24、及び記憶装置25、から構成される。予測演算装置2は、例えば、パーソナルコンピュータ、サーバコンピュータ又はハンドヘルドコンピュータなどの情報処理装置である。記憶装置25には、因子変動評価部251、及び予測部252、などの各種コンピュータプログラムが格納されている。
因子変動評価部251は、予測対象標本データ351A、因子標本データ352A、因子予測データ353A、を入力し、予測対象の予測モデルの同定に際しての因子それぞれの寄与度を制御するデータ、すなわち寄与度制御データを出力する。
具体的に因子変動評価部251は、予測対象標本データ351Aと因子標本データ352Aを用いて予測対象の予測モデルを同定し、同定した予測モデルに因子予測データ353Aを入力することで予測対象の予測値を算出する。ここで使用する因子予測データ353Aは、過去に得られた因子予測データ353Aを使用する。
したがって算出される予測対象の予測値は、過去を対象とした推定値である。算出した推定値と同期間の因子標本データ352Aとの差分を算出し、差分が小さくなるように各因子の予測モデル同定における寄与度を調整する。因子変動評価部251は、調整後の各因子の寄与度を寄与度制御データとして出力する。
予測部252は、予測対象標本データ351A、因子標本データ352A、因子予測データ353A、及び寄与度制御データと、を入力し、予測データ253Aを出力する。
具体的に予測部252は、予測対象標本データ351Aと因子標本データ352A、及び寄与度制御データを用いて、予測対象の予測値を算出する予測モデルを同定する。同定処理においては、寄与度制御データに基づいて各因子の予測モデルへの寄与度を調整する。予測部252は、調整後の予測モデルに予測対象日時における因子予測データ353Aを入力することで、予測対象日時における予測対象の予測値を算出し予測データ253Aとして出力する。
(1-3)本システム12全体の処理及びデータフロー
図3及び図4を参照して、本システム12の処理及びデータフローについて説明する。図3は、図2の本システムにおける信号の流れを示すブロック図である。
データ管理装置3は、データ観測装置6又はデータ配信装置7から予測対象標本データ351A、因子標本データ352A、及び因子予測データ353Aを受信し、それぞれ予測対象標本データ記憶部351、因子標本データ記憶部352、因子予測データ記憶部353に記憶する。予測演算装置2は、因子変動評価部251において、因子それぞれの変動量を評価し、予測対象の予測モデルに対する各因子の寄与度を制御するデータを出力する。
まず、因子変動評価部251は、予測対象標本データ351Aと因子標本データ352Aから予測対象の予測モデルを同定する。つぎに、因子変動評価部251は、同定した予測モデルに過去に得られた因子予報データ353Aを入力することで過去期間の予測対象の値の推定値を算出する。つぎに、因子変動評価部251は、算出した推定値と当該過去期間の予測対象の観測値との差分が小さくなるように各因子の予測モデルへの寄与度を調整し、その調整結果を寄与度制御データとして出力する。
そして、予測演算装置2は、予測部252において、予測対象標本データ351A、因子標本データ352A、因子予測データ353A、及び寄与度制御データ、を入力し、予測データ253Aを出力する。
具体的に予測部252は、予測対象標本データ351A、予測対象標本データ352A及び寄与度制御データと、を用いて、予測対象の予測値を算出する予測モデルを同定する。予測部252は、同定に際し、寄与度制御データを用いて、各因子の予測モデルに対する寄与度を調整する。
そして、同定した予測モデルに因子予測データ353Aを入力することで、予測対象日時における予測対象の予測値を算出し予測データを出力する。その後、算出した予測データ253Aを予測データ記憶部253に格納する。最後に、予測演算装置2は、算出した予測データを、計画作成/実行管理装置5に直接、もしくは予測データ記憶部253を介して送信する。なお、予測モデルに因子予測データ353Aを入力して予測値を算出するとは、例えば、y=xといった数式で構成された予測モデルに対し、x値を代入してy値を算出することを意味する。
次に図4を参照して、本システム12のデータ予測処理の処理手順を説明する。図4は、図1~図3の本システム12における予測処理の手順を示すフローチャートである。図4のステップS1~S4の処理は、予測演算装置2によって実行される。これらの処理は、予測演算装置2が装置利用者からの入力操作を受け付けたこと、又は情報入出力端末4を介して予め設定した実行時刻が到来したこと、の少なくとも何れかを契機として始まる。
なお、本システム12のデータ予測処理は、予測演算装置2、及びデータ管理装置3を用いて実行されることにより機能目的を達成する。ある処理は、予測演算装置2において、記憶装置25に格納されている各種コンピュータプログラムがCPU21で実行されて達成される。他の処理は、データ管理装置3において、記憶装置35に格納されている各種コンピュータプログラムがCPU31で実行されて達成される。説明の便宜上もあって、主語のない処理の処理主体は、予測演算装置2及び予測演算装置2が有する各種コンピュータプログラムとする。
先ず、予測演算装置2は、データ管理装置3から、予測対象標本データ351A、因子標本データ352A、及び因子予測データ353Aを取得受信する(S1)。
次いで、予測演算装置2が有する因子変動評価部251は、予測対象標本データ351A。因子標本データ352A、及び因子予測データ353Aから、各因子それぞれの変動量を評価する(S2)。
そして、予測演算装置2が有する因子変動評価部251は、因子それぞれの変動の評価結果に基づいて、予測対象の予測モデルへの各因子それぞれの寄与度を制御するデータを出力する(S3)。
そして、予測演算装置2が有する予測部252は、予測対象標本データ351A、因子標本データ352A、因子予測データ353A、及び寄与度制御データから、予測対象の予測値を算出する予測モデルを同定し、予測対象日時における予測対象の予測値を出力する(S4)。つまり、予測処理を行う。
最後に、予測演算装置2は、予測部252が出力した予測対象の予測データを、予測データ記憶部253に記憶するか、あるいは、計画作成/実行管理装置5に送信する。以上の処理を以って、本システム12におけるデータ予測処理が終了する。以降、図5~図7を用いて、各構成要素の詳細を説明する。
(1-4)各構成要素の詳細
(1-4-1)因子変動評価部
図5を参照して、因子変動評価部251の処理動作を説明する。図5は、図2及び図3の因子変動評価部251における信号の流れを示すブロック図である。因子変動予測部251は、因子それぞれの変動量を評価し、予測対象の予測モデルに対する各因子の寄与度を制御するデータを出力する。
先ず、因子変動評価部251は、データ管理装置3から予測対象標本データ351A、因子標本データ352Aを取得し、予測モデル同定部251Aに入力する。加えて因子変動評価部251は、予測対象の予測モデルの同定における各因子の寄与度を制御するデータを初期化し、寄与度制御データの初期値として予測モデル同定部251Aに入力する。
次いで、予測モデル同定部251Aは、予測対象標本データ351Aと、因子標本データ352Aと、を用いて、予測対象の予測値を算出するための予測モデルを同定する。予測モデルの同定は、入力された寄与度制御データに基づいて、各因子の寄与度を増減させた後に行う。
より具体的に、例えば、用いる因子が、x1とx2の2種である場合と、予測モデルが多変量回帰モデルや自己回帰モデルなどの線形回帰モデルである場合と、何れかである場合、予測モデルは、下記式(1)で与えられる。
Y=a×x1×w1 + b×x2×w2 + c ・・・(1)
ここで、Yは予測対象の値である。またa,b,cは、回帰モデルのパラメータである。そしてw1,w2は、寄与度制御データである。例えば、w1よりw2の値が大きい場合、因子x1に対しx2の予測モデルへの寄与度が高いことを意味する。また、例えば、カーネル法などのデータ同士の類似度に基づいた予測モデルであって、類似度をユークリッド距離で算出する場合、類似度は、下記式(2)で与えられる。
d_ij∝w1(x1_i-x1_j)^2+w2(x2_i-x2_j)^2・・・(2)
ここでd_ijは、i番目とj番目の標本のユークリッド距離である。そしてw1,w2が寄与度制御データである。予測モデル同定部251Aは上述の予測モデルを同定し出力する。
次いで、過去値推定部251Bは、予測モデル同定部251Aが出力した予測モデルに対し、予測対象の推定値を算出する。すなわち、過去値推定部251Bは、予測モデルに対し、予測モデル同定部251Aが使用した標本データの過去期間の一部もしくは全部の期間において、過去に得た因子予測データ353Aを入力する。そして、過去値推定部251Bは、予測モデルに対し、当該過去期間における予測対象の推定値を算出する。
また、寄与度算出部251Cは、過去値推定部251Bが算出した予測対象の過去の推定値と、同期間の予測対象の過去の観測値と、の乖離量を算出する。このように算出された乖離量が減少するように、寄与度算出部251Cは、寄与度制御データを更新して出力する。出力された寄与度制御データは、再び予測モデル同定部251Aへ入力されることにより、繰り返し処理が行われる。
寄与度算出部251Cは、予め設定された繰り返し処理の終了条件が満たされているか否かを都度判定し、終了条件が満たされた場合、寄与度制御データの更新を終了し予測部252に対して送信する。なお、終了条件とは、例えば、繰り返し処理の回数、繰り返し処理の延べ時間、あるいは上述の乖離量がゼロ、もしくは、予め設定された閾値としての乖離量以下になった場合などである。以上をもって、因子変動評価部251の動作を終了する。
本システム12は、過去に得られた因子予測データ353Aを予測モデルに入力することで得られた過去の予測対象の推定値と、同期間の予測対象の観測値と、の乖離量が減少するように、各因子の寄与度を調整している。言い換えれば、各因子の過去の因子予測データ353Aの傾向に基づいて、各因子の予測モデルへの寄与度を制御している。
例えば、因子予測データ353Aに含まれる因子の中で、過去に得られた予測値に大きな誤差が生じる傾向がある因子が存在している場合、当該因子は予測対象の予測値に大きな誤差を生じる要因となる。この場合、当該因子の予測モデルの寄与度を減少させることで予測対象の予測値の誤差の量を軽減し得る。したがって、本システム12の寄与度算出部251Cは、当該因子の予測モデルへの寄与度を減少するように調整を行う。
なお、予測モデル同定部251Aで適用する予測対象の予測モデルは、上述のモデルに限らず、他の公知の手法を適用して良い。公知の手法とは、以下に例示列挙するものをいう。例えば、重回帰モデルなどの線形回帰モデルやロジスティック回帰などの一般化線形モデルなどの線形性を仮定する手法、ARX(AutoRegressive with Exogenous)モデルなどの自己回帰性を仮定する手法、Ridge回帰、Lasso回帰、ElasticNetなどの縮小推定器を利用する手法、部分最小二乗法や主成分回帰などの次元縮退器を利用する手法、多項式を用いた非線形モデル、あるいはサポートベクトル回帰、回帰木、ガウス過程回帰、ニューラルネットなどのノンパラメトリック、と呼ばれる手法である。
(1-4-2)予測部
図6を参照して、予測部252の処理動作を説明する。図6は、図2、図3及び図5の予測部252における信号の流れを示すブロック図である。予測部252は、予測対象標本データ351A、因子標本データ352A、因子予測データ353A、及び因子変動評価部251が出力した寄与度制御データを用いて、予測対象の予測値を算出する予測モデルを同定し、予測対象日時における予測値を出力する。
先ず、予測部252は、データ管理装置3から予測対象標本データ351A、及び因子標本データ352Aを取得する。それらに加えて、予測部252は、因子変動評価部251から、寄与度制御データも取得する。予測部252は、取得したこれらのデータを予測モデル同定部252Aへ入力する。
次いで、予測モデル同定部252Aは、予測対象標本データ351A、及び因子標本データ352Aを用いて、予測対象の予測値を算出する予測モデルを同定する。予測モデルの同定は、寄与度制御データに基づいて、各因子の寄与度を調整した後に実行される。
そして、予測値算出部252Bは、予測モデル同定部252Aが出力した予測モデルに対し、予測対象日時における因子予測データ353Aを入力することで、予測対象日時における予測対象の予測値を算出し、その算出値を予測データとして出力する。以上をもって、予測部252の動作を終了し、同時に、本システム12の演算処理も終了する。
(1-5)効果
次に、図7を参照しながら本システム12の効果を説明する。図7は、本システム12の効果を示す概念図である。この図7は、予測対象の予測値を算出する予測モデルにおいて、因子Aと因子Bの2種の因子を用いた場合を例示している。図7(a)は、データ管理システム12において、因子変動評価部251を用いない場合に、予測モデル同定部252Aが出力した直後の予測対象の予測値を算出する予測モデルを図示している。
図7は、図の簡略化のため、因子Aと因子Bそれぞれの断面部分のみでの予測モデルの適合状況をそれぞれ7A1と7A2の曲線で示している。ここで因子Aと因子Bの予測対象日時における予測値が7A3と7A4であったとする。このとき予測モデルによって算出される予測対象の予測値は点7A5の値が算出される。
しかし、事後観測された因子Aと因子Bの観測値がそれぞれ点7A6と点7A7であったとすると、実際の予測対象の観測値は点7A8である。特に因子Aの変動量が過大であったため、予測対象の予測値にも過大な誤差が生じている。
一方、図7(b)は、本システム12の特徴的な因子変動評価部251を用いた場合に、予測部252における予測モデル同定部252Aが出力した直後の予測モデルを示している(7A9,7A2)。図7(b)では、因子変動評価部251において、過去期間における予測対象の推定値と観測値との乖離量が減少するように、因子それぞれの予測モデルへの寄与度を調整した。その結果、因子Aの寄与度が小さくなったことを図7(b)に示している。
この寄与度制御データに基づいて同定した予測モデルでは、因子Aの予測値の誤差に対する予測対象の予測値の影響が減じられていることから、変更後の予測モデルによる予測対象の予測値は点7A10となる。このように、予測値の点7A10は、予測対象について事後観測される点7A8との乖離が減少する。つまり、誤差が減少している。
以上のように本実施において、過去に得た因子予測データを用いた過去の予測対象の推定値と、当該期間の予測対象の観測値との乖離が減少するように、因子それぞれの予測モデルへの寄与度を調整することで、因子の変動量に起因する予測対象の予測の過大誤差の発生を抑制することが可能となり、よって予測精度を向上させることが出来る。
(2)変形例
(2-1)因子変動評価部の変形例
本システム12における因子変動評価部251は、各因子の因子予測データ353Aの過去の変動の傾向に基づいて、各因子の予測モデルへの寄与度を制御する、という基本形について説明した。これに限らず、図8を用いて説明する変形例に示すように、予測対象日時における各因子の変動の予測に基づいて寄与度を制御しても良い。
図8は、図5の因子変動評価部251に対する変形例(以下、「本変形例」という)を示すブロック図である。本変形例による因子変動評価部251Xは、因子標本データ352A及び因子予測データ353Aを用いて、予測対象日時における各因子の変動量を予測し、予測した変動量に基づいて予測モデルに対する各因子の寄与度制御データを出力する。
なお、「因子の変動量」とは、つぎに例示列挙する項目に係るデータをいう。例えば、信頼区間や予測区間、あるいはモンテカルロ計算などにより得られた因子の予測値上下限や分散などの指標で示される因子の予測値の変動範囲、もしくは事後観測される観測値との差である誤差の期待値あるいは分散などで示される計算した予測値に対する実観測値の発生範囲を示す指標値、もしくは誤差そのものである。
ここで先ず、因子変動評価部251Xは、因子標本データ352A及び因子予測データ353Aを因子変動予測モデル同定部251Dに入力する。次いで、因子変動予測モデル同定部251Dは、因子それぞれについて、予測対象日時における変動量を算出するための予測モデルを同定する。
より具体的に、例えば、因子の変動量として、因子の予測値の変動範囲を算出する場合、微分方程式やマルチエージェントシミュレータなどの演繹的なモデルにおける内部の各種パラメータを、因子標本データ352A及び因子予測データ353Aを用いて最適化する。上述したように、予測モデルはコンピュータで演算処理可能な関数式であり、パラメータ、及びデータを用いて予測値を演算出力する。
あるいは、因子が気象要素である場合、データ同化処理を行う。なお、データ同化(data assimilation)とは、主に地球科学の分野において数値モデルの再現性を高めるために行われる作業をいう。つまり、データ同化とは、モデルに実際の観測値を入力してより現実に近い結果が出るようにする作業をいう。
あるいは、因子変動予測モデル同定部251Dは、過去データの統計や回帰分析などの帰納的なモデルにおける内部パラメータの最適化を行う。例えば、対象とする因子の予測の期待値がαであり、実際の事後の観測値がβである確率がパラメータθを持つ分布に従うと仮定した場合(P(β|α、θ))、因子標本データ352A及び因子予測データ353Aを用い、最尤推定などの手法によってパラメータθを推定する。
また、因子の変動量として因子の予測値の誤差の期待値や分散を算出する場合、因子の過去の各時点後との誤差を因子標本データ352A及び因子予測データ353Aから算出し、因子標本データ352Aを用いて統計や回帰分析などの帰納的なモデルを同定する。
そして、因子変動量予測値算出部251Eは、因子変動予測モデル同定部251Dが同定した各因子の変動量予測モデルに、予測対象日時における因子予測データ353Aを入力することで、予測対象日時における因子の変動量の予測値を出力する。
なお、同定したモデルが微分方程式やマルチエージェントシミュレータなどの演繹的なモデルである場合、因子予測データ353Aをランダムに変化させた新たな因子予測データ353A2を複数生成し、それぞれをモデルに入力することで複数の予測値を算出し、予測値の変動量を算出する。上述の処理を、因子標本データ352A及び因子予測データ353Aに含まれる因子のなかで、予め設定した因子について、もしくは全ての因子について行う。
次いで、寄与度算出部251Fは、因子変動量予測値算出部251Eが出力した各因子の予測対象日時における変動量に基づいて、予測対象の予測モデルにおける各因子の寄与度を調整し、寄与度調整データとして出力する。より具体的に、各因子の予測対象日時における変動量が大きい因子ほど、予測モデルへの寄与度を減じるような寄与度制御データを出力する。例えば、各因子の予測対象日時における変動量の逆数を各因子の寄与度としても良い。
以上をもって、本システム12における因子変動評価部251Xの処理動作が完了する。なお、因子変動予測モデル同定部251Dで因子の変動量予測モデルを同定する際、統計や回帰分析などの帰納的なモデルを適用する場合は、他の公知の手法を適用して良い。
公知の手法とは、例えば、重回帰モデルなどの線形回帰モデルやロジスティック回帰などの一般化線形モデルなどの線形性を仮定する手法、ARX(AutoRegressive with Exogenous)モデルなどの自己回帰性を仮定する手法、Ridge回帰、Lasso回帰、ElasticNetなどの縮小推定器を利用する手法、部分最小二乗法や主成分回帰などの次元縮退器を利用する手法、多項式を用いた非線形モデル、あるいはサポートベクトル回帰、回帰木、ガウス過程回帰、ニューラルネットなどのノンパラメトリックと呼ばれる手法である。
本変形例は、予測対象日時における各因子の変動量の予測値に基づいて各因子の寄与度を逐次、動的に制御する。したがって本来は重要な因子であって、かつ予測対象日時における変動量も小さいと予測された場合、予測対象の予測精度の向上が可能となる。
また、図8に示した変形例における因子変動評価部251Xは、各因子の過去の因子予測データの傾向か、あるいは予測対象日時における変動量の予測値か、何れかに基づいて寄与度制御データを出力するものとして説明した。これに限らず、図9を用いて次に説明するように、両者を併用した変形例であっても良い。
図9は、図8の因子変動評価部251Xに対する変形例(これも「本変形例」という)を示すブロック図である。図9に示す本変形例による因子変動評価部251Yは、各因子の過去の因子予測データ353Aの傾向に加えて、予測対象日時における各因子の変動量の予測値に基づいて、各因子に対する寄与度制御データを出力する。
具体的に因子変動評価部251は、予測対象標本データ351A,因子標本データ352A、及び因子予測データ353Aを取得し、予測モデル同定部251Aに入力する。その後、予測モデル同定部251A及び過去値推定部251Bは、図5を用いて上述した処理動作を行う。
並行して因子変動評価部251Yは、因子標本データ352Aと因子予測データ353Aを因子変動予測モデル同定部251Dに入力する。その後、因子変動予測モデル同定部251D及び因子変動量予測値算出部251Eは、図8を用いて上述した処理動作を行う。
そして、図9に示す本変形例の寄与度算出部251Gは、過去値推定部251Bが出力した過去期間における予測対象の推定値と、因子変動量予測値算出部251Eが出力した予測対象日時における因子の変動量の予測値の入力を受け、各因子の寄与度制御データを出力する。
より具体的に、寄与度算出部251Gは、過去値推定部251Bが出力した過去期間における予測対象の推定値と、同期間における予測対象の観測値との差分である乖離量を減少するように、各因子の寄与度を調整する。
加えて、乖離量の減少分の算定の際、因子変動量予測値算出部251Eが出力した各因子の予測対象日時における変動量に基づいて、大きな変動量が予測されている因子の寄与度を調整したことによる乖離量の減少分はより大きな重みを付与し、反対に小さな変動量が予測されている因子の寄与度を調整したことによる乖離量の減少分は小さな重みを付与する。
この重みは、例えば、因子変動量予測値算出部251Eが出力した各因子の予測対象日時における変動量の逆数でも良い。寄与度算出部251Gが出力した寄与度制御データは、再び予測モデル同定部251Aに入力され、以降は前記説明した処理動作の通り、所定の終了条件が満たされるまで繰り返し寄与度制御データを更新する。
以上が図8及び図9に示した本変形例における因子変動評価部251の処理動作である。本変形例では、各因子の過去の因子予測データ353Aの変動の傾向に基づいて、変動の大きい傾向にある因子の寄与度を減じるよう調整する一方、予測対象日時における当該因子の変動量が小さいと予測されている場合、寄与度の過度な減少を抑制する。
これにより、予測対象日時における因子の変動量の予測が外れていた場合であっても、予測対象の予測値が過大な誤差を生じる減少を抑制でき、予測精度の向上が可能となる。
図8及び図9に示した本変形例における因子変動評価部251の因子変動予測モデル同定部251Dでは、各因子の変動量予測モデルを同定する際、因子標本データ352Aと因子予測データ353Aから抽出するデータの時間に関する言及は省略したが、前後時刻のデータを同時に用いたモデルの同定及び予測処理を行うとしても良い。
より具体的には、例えば、ある因子Aのある時間断面tにおける変動量の予測値を算出するモデルを同定する際に、時間断面tのデータのみでなく、時間断面t-nあるいは時間断面t+nのデータも用いてモデルの同定を行う。そして同定したモデルに対して予測対象時点τの因子予測データに加えて、τ-nあるいはτ+nの因子予測データも入力することで、因子Aの予測対象時点τの変動量の予測値を算出する。
上述の前後時間を決定するnの値は、予め定めた所定の値であっても良いし、例えば、交差検定などの手法によって標本から最適な値を算出しても良い。本変形例は、因子の変動量の時間発展をモデル化しており、因子の変動量の時間推移が過去時点の状況に影響を受けている場合、因子の変動量の予測精度が向上し、よって予測対象の予測精度の向上が可能となる。
また、ある因子Aが、GPSデータや交通状況データや鉄道運行状況データなどの緯度経度の2次現平面上に含まれるデータの場合、あるいは気象データのような高度も含めた3次元空間上に含まれるデータの場合、因子Aの変動量の予測値の算出に際し、それら平面や空間上の複数のデータを用いて予測しても良い。
より具体的に、例えば、因子Aがある地点の気象状況である場合、隣接する他の地点の気象状況のデータを用いて因子Aの変動量を予測するモデルを同定し、因子Aの変動量の予測値を算出しても良い。同一空間上に存在する因子は相互に影響を及ぼすため、空間上の他の因子のデータを用いることで因子の変動量の予測精度が向上し、よって予測対象の予測精度の向上が可能となる。
また、図8及び図9に示した本変形例における因子変動評価部251では、因子標本データ352Aに記憶されている各因子の観測データには観測誤差が無いものとして説明したが、各因子の観測データの観測誤差の情報を用いて、各因子の予測値の変動量を予測しても良い。
より具体的に、例えば、因子が気象のデータである場合、図示を省略するが、気象の予測データは緯度経度及び高度の3次元上に整列された格子点毎に計算される。そして各格子点の初期値は各地の気象観測所の観測データを基に推定された値を用いる。
なお、格子点と観測所の空間上の位置は必ずしも一致しておらず、また各格子点の初期値は推定値であることから、誤差が生じる。また、GPSなどの移動体データも、GPSの計測データには誤差が生じる。あるいは交通状況や鉄道運行状況のデータも、道路上の走行車両数や、鉄道車両の乗客数などを常に厳密に計測することは難しく、観測データに誤差が生じる。
観測誤差が大きい因子では、因子の予測値を算出するモデルの適合度が悪化する。したがって、観測データに対する観測誤差の情報を用いることで、因子の予測値の変動量の予測精度が向上し、予測対象の予測精度の向上が可能となる。
また、図8及び図9に示した本変形例では、因子変動評価部251X,251Yにおける因子変動予測モデル同定部251Dでは、各因子の変動量をそれぞれ独立してモデル化するものとして処理を行うように説明したが、これに限定されない。すなわち、ある因子の因子変動予測モデルを同定する際に、複数の因子を同時に用いても良い。複数の因子を同時に用いることで、ある因子の変動量の説明力の向上が期待されるため、因子の変動量の予測精度が向上し、結果として予測対象の予測精度の向上が可能となる。
また、図8及び図9に示した本変形例では、因子変動評価部251X,251Yにおける因子変動量予測値算出部251Eは、予測対象日時における因子の変動量を出力するのみであり、因子の予測値には加工を加えないものとして説明したが、これに限定されない。すなわち、因子の変動量が因子の予測値の誤差を意味する場合、因子変動評価部が出力した因子の変動量の予測値を因子予測データに加算することで、因子の予測値を補正しても良い。予測対象の予測モデルに入力する因子の予測値そのものを補正することで、予測対象の予測値の過大な誤差発生を抑制することが可能となる。
また、図5示した本システム12、図8及び図9に示した本変形例では、因子変動評価部251,251X,251Yにおける寄与度算出部251C,251F,251Gは、因子の変動量にのみ基づいて寄与度制御データを出力するものとして説明したが、これに限らず、予測対象の予測において元来重要な因子か否かの評価に基づいた寄与度を加えても良い。
具体的に、図5に示した本システム12の因子変動評価部251と、図9に示した本変形例の因子変動評価部251Yと、それぞれの寄与度算出部251C,251Gは、寄与度制御データの更新の際、過去値推定部251Bが出力した過去の予測対象の推定値と同期間における予測対象の観測値との差分である乖離量が減じるように、各因子の寄与度を調整すると同時に、可能な限り多くの因子の寄与度をゼロに近づける動作を行う。
より具体的には、寄与度制御データの更新において、L1正則化やL2正則化と呼ばれる正則化を付与する。また予測対象日時における因子の変動量を予測することで寄与度制御データを更新する寄与度算出部251Fでは、予め算出した各因子の重要度を重みとして、各因子の寄与度制御データを更新する。
因子の重要度の算出には公知の手法を用いれば良い。例えば、CART(Classification And Regression Trees)、すなわち、学習アルゴリズムとして2進木による決定木を用いた方法や、Lassoなどの縮小推定器を用いた方法なのである。本変形例により、予測対象の予測において元来不要な因子が混在している場合、これら因子の寄与度は変動量に関わらず小さくなり、仮にこれら因子の予測対象日時における変動が過大であったとしても、予測対象の予測値への影響が抑制できることから、予測精度向上が可能となる。
また、図8及び図9に示した本変形例では、寄与度制御データが常に更新されるものとして説明したが、これに限らず、更新しない場合の方がより高い予測精度が期待される場面においては、寄与度制御データを更新しなくても良い。具体的に、本変形例における因子変動評価部251は、各因子の寄与度を全て同一の値、もしくは予測対象の予測における各因子の元来の重要度の値として固定し、この固定的な寄与度制御データに基づいて予測対象の予測モデルを同定しておく。
そして、寄与度算出部251C(図5)、251F(図8)は、過去値推定部251B(図5)が更新後の寄与度制御データに基づいて推定した過去期間の予測対象の推定値の乖離量と、上述の予め同定した固定的な寄与度制御データに基づく予測モデルによる推定値の乖離量とを比較し、寄与度制御データを更新した場合の乖離量の方が小さくなる場合においてのみ更新後の寄与度制御データを出力する。
一方、寄与度制御データを繰り返し更新し、しかし固定的な寄与度制御データに基づいた推定量の乖離量より小さくならない場合、最終的に因子変動評価部は固定的な寄与度制御データを出力する。この変形例では、最終的な予測対象の予測の期待精度は、固定的な寄与度制御データによる予測以上であることを担保されているため、予測対象の予測精度の過度な悪化を防ぐことが可能となる。
(2-2)因子変動評価部及び予測部で用いる予測モデルの変形例
図2~図4で説明した本システム12の因子変動評価部251及び予測部252で用いる予測対象の予測モデルの同定において、因子とする値の時間に関する言及は省略したが、ある時刻の予測対象の値に対し、当該時刻も含めた過去の時間の因子標本データを用いて算出しても良い。
例えば、ある時刻tにおける予測対象の値の予測モデルの同定において因子Aを用いる場合、因子Aの時刻tの値のみでなく、時刻t-nの値も併用する。さかのぼる時間を調整するnは予め設定した値でも良いし、交差検定などで事前に調整した値であっても良い。
例えば、予測対象が電力需要であり、また因子Aが外気温である場合、外気温の時間変化に対して屋内室温の変化には時間遅れが生じるため、電力需要にも時間遅れが生じる。したがって過去の時刻に遡って影響度合いを示す指標値を算出することで、上述の因子の値の時間変化に対する予測対象の値の時間変化の遅れをモデルに組み込むことが可能となり、予測対象の予測の精度を向上させることが可能となる。
また、本システム12における予測対象の予測モデルでは、予測対象の値を構成する計測データ数について言及はしなかったが、予測対象の値が複数の計測データの合算値として構成される場合、計測値の時間推移が類似する計測データをグループとして事前に分類し、グループごとに本発明を適用し予測処理を行っても良い。
予測対象の値が複数の計測データの合算値として構成されるデータとは、例えば、スマートメータなどの電力消費建屋ごとのデータや、電気自動車の充電ステーション毎のデータなどの合算値で構成される総電力消費量である。また予測対象の時間推移のみでなく、例えば、充電ステーション毎の時刻単位の接続有無を示すデータなども含めた複数種類の時間推移データに基づいて分類しても良い。
図10は、予測対象の具体例による予測処理の概念図である。図10では、充電ステーションAからEの5つの充電ステーションのデータが予測対象標本データ記憶部351に記憶されているとしている。ここで充電ステーションごとの電力需要(すなわち電気自動車への充電)の時間推移のデータは、それぞれグラフ10A1から10E1に示されている。加えて、各充電ステーションA~Eでの電気自動車のプラグ接続有無の時間推移が、グラフ10A2から10E2に示されている。
例えば、充電ステーションAにおけるグラフ10A1では、図示する期間のうちに4回の電力需要が発生しており、またそれぞれの時間において10A2に示すように電気自動車が接続されている。また充電ステーションCの電力需要のグラフ10C1では、図示の期間の後半に一定期間にわたって電力需要が発生しているとともに、グラフ10C2に示すようにその期間で電気自動車の接続がなされている。
なお、グラフ10C2において期間冒頭にも接続を示す値が示されている一方で、グラフ10C1の当該電力需要はゼロを示している。これは充電ステーションCに電気自動車が接続されているものの、充電はしていないことを意味している。
これら各充電ステーションの充放電を示す電力需要データと電気自動車の接続有無を示す接続信号データを用いて、時間推移の傾向が類似する充電ステーションを分類した結果を、図10の右側に示している。ここでは3つのグループ10G1~10G3に分類されたことを示しており、充放電データと接続信号データの時間推移が両方とも類似する充電ステーション同士が分類されている。
例えば、充電ステーショングループ10G3には充電ステーションBのみが分類されている。これは充放電の時間推移は充電ステーションCとDに類似するものの、接続信号の時間推移が非類似していることから、充電ステーションCとDとは同じグループに分類されなかったためである。
なお、分類の処理は公知の手法を用いて良い。公知の手法とは、例えば、ウォード方などの階層型やk-meansや自己組織化マップなどの非階層型といったクラスタリング手法、あるいはSVM(Support Vector Machine)などの分離境界学習型の手法などである。
上述の同定により、各充電ステーションの電力需要の推移をより正確にモデル化することが可能となる。また、充電ステーション毎の消費電力の時間推移の傾向と、電気自動車の接続有無の時間推移の傾向と、の両者の傾向を同定できる。つまり、類似する充電ステーションに分類するように同定できる。
あるいは、電気自動車を用いたデマンドレスポンス(Demand Response)やVPP(Virtual Power Plant)の制御及び/又はそれらの実行において、各充電ステーションが供出可能な調整量についても正確に予測することも可能となる。さらに、本システム12を適用することで、予測に対して過大な誤差の発生を抑制することが可能となる。
また、本システム12における予測モデルでは予測対象と因子の種類について得に言及はしなかったが、例えば、予測対象が電力需要である場合、因子としては暦日データや気象データの他に、列車の乗車率、乗車客数、予約席数などの鉄道情報や、道路の平均移動速度などの道路交通情報を用いても良い。電力需要は気温のみならず人口動態にも依存するため、人口動態をより的確に捉えることで電力需要の予測精度を向上することが可能となる。また、上述のように、気象データと電力需要との因果関係について、時間差を考慮する必要がある。すなわち、気象の変化に対して、建物内部の室温変化は時間遅れが存在する。したがって、冷暖房用の電力需要にも時間遅れが生じる。
また、電力需要は気象や人口動態など複数の要因に影響を受ける。したがって、予測対象が電力需要である場合、複数の要因に基づいて電力需要の時間推移が求められる。ここで、求める電力需要以前に、各要因をそれぞれ予測対象とすることもある。これら分解された要因それぞれを、本システム12を用いて予測しても良い。
なお、図示は省略するが、上述した各要因の時間推移をグラフ化し、変動特性曲線で表した場合、曲線を周波数成分で表現することもできる。このような、電力需要に固有の変動特性について、周波数成分などの要因に分解することで、これら要因毎の時系列データをより的確に捉えることが可能となる。なお、周波数成分などの要因に分解するとは、要因毎に時系列データの変動特性を曲線グラフ化し、そのグラフの波形曲線を周波数成分としてスペクトル分解することをいう。
本システム12は、以下のように総括できる。
[1]本システム12は、因子変動評価部251と、予測部252と、を有しており、予測データを算出するためのコンピュータ装置である。因子変動評価部251は、予測モデルを同定する際に、寄与度制御データを出力する。寄与度制御データは、因子毎のデータであるとともに、当該因子の寄与度を制御するデータである。また、当該因子の寄与度は、当該因子の変動量に基づいて変化させる。すなわち、因子変動評価部251が、予測対象の予測値を算出するための予測モデルに用いる因子に関し、各因子の過去に得た予測値に基づいて予測モデルの同定における各因子の寄与度を制御するデータを出力する(図4の第1のステップS3)。
予測部252は、予測対象の標本、因子の標本、及び各因子の寄与度を制御するデータに基づいて、予測モデルを同定する。このように同定された予測モデルにより、予測対象の予測値が出力される。つまり、予測部252は、因子に基づいて演算処理可能な予測モデルを同定し、その因子に対応付けられた予測対象の予測値を算出する。すなわち、予測部252が、予測対象の観測標本、因子の観測標本、及び各因子の寄与度を制御するデータに基づいて予測モデル同定し、予測対象の予測値を出力する(図4の第2のステップS4)。
本システム12は、因子それぞれの変動量を事前に評価し、評価に基づいて予測モデルを同定するため、因子の変動量に起因する予測対象の予測の過大誤差の発生を抑制することができる。つまり、本システム12は、因子の変動に起因する予測対象の過大誤差の発生を抑制できる。その結果、予測対象の予測誤差を従来よりも極力低減させて高精度の予測値を得ることが容易になった。
[2]図9に示す因子変動評価部251Yにおいて、まず、過去に得た各因子の予測値が、予測対象の予測モデルに入力されて、予測対象の過去期間の推定値を算出すると良い。次に、算出された予測対象の過去期間の推定値と、同期間での予測対象の実績値と、の差分である乖離量を算出すると良い。最後に、この乖離量を減じるように各因子の寄与度制御データを算出すると良い。このようにして、因子変動評価部251Yは、各因子の寄与度を制御するデータを、過去の統計的傾向に基づいて算出することができる。
因子変動評価部251Yは、予測モデルに対する各因子の寄与度を制御するデータを、このように算出することができる。つまり、過去に得た各因子の予測値と、同期間での予測対象の実績値と、の差分である乖離量が大きい程、その因子は予測の正確さを低減させる原因になる危険性が高い。そのように危険性の高い因子の寄与度を低めるようにすれば、全体の予測値の精度を向上させることができる。
[3]因子変動評価部251は、予測対象期間において、特定因子の変動量の予測値を算出するにあたって、特定因子の変動量と相関を有する他の一つ以上の因子の変動量を用いることが好ましい。例えば、隣接地域の気象データには、相関性が認められる。
まず、予測された特定因子の変動量に基づいて、特定因子の予測モデルへの寄与度を制御するデータを算出する。このとき、特定因子に関連する複数の因子を同時に用いることで、特定因子の変動量の説明力の向上が期待される。したがって、特定因子の変動量の予測精度が向上し、結果として予測対象の予測精度を向上させることが可能となる。
[4]寄与度を制御するデータは、変動量の大きい因子の寄与度を減じるように調整されることが好ましい。換言すれば、変動量が相対的に大きい因子の寄与度制御データに従う寄与度は、変動量が相対的に小さい因子の寄与度制御データに従う寄与度よりも小さい方が良い。
[5]寄与度を制御するデータは、因子に基づく標本同士の類似度を示す指標値の算出において、変動量の大きい因子に基づいた類似度を示す指標値の値が減じられるように調整しても良い。換言すれば、因子に基づく標本同士の類似度を示す指標値の算出において、上記[4]のように、寄与度を制御するデータが調整されると良い。このように、変動量の大きい因子、又は変動量の大きい因子に基づいた類似度を示す指標値の値は、予測の正確さを低減させる原因になる危険性が高い。そのように危険性の高い因子の寄与度を低めることによって、全体の予測値の精度を向上させることができる。
[6]因子変動評価部251Xは、以下の機能を有すると良い。まず、予測対象の過去期間の推定値を、各因子について過去に得た予測値を予測対象の予測モデルに入力することで算出する。ここで得られた過去期間の推定値と、同期間での予測対象の実績値との差分である乖離量と、を算出する。このとき、因子変動評価部251は、乖離量を減じる方向に、各因子の寄与度を制御するデータを算出する。
次に、因子の変動量と相関を有する一つ以上の他の因子の変動量を用いて、予測対象期間におけるその因子の変動量の予測値を算出する。このように、予測された予測対象期間における変動量を重みとして、算出した各因子の寄与度を制御するデータを更新する。このようにしてデータ更新された寄与度は、より高精度の予測結果をもたらす。
[7]因子変動評価部251X(図8),251Y(図9)は、以下の機能を有すると良い。まず、各因子について過去に得た予測値を予測対象の予測モデルに入力し、予測対象の過去期間の推定値を算出する。このように算出された予測対象の過去期間の推定値と、同期間での予測対象の実績値と、の差分である乖離量を算出する。次に、各因子の寄与度を制御するデータを算出するに際し、上述のように算出された乖離量を減じるように、なるべく多くの因子の寄与度をゼロに近づけるように寄与度を制御するデータを算出する。
[8]因子変動評価部251X(図8),251Y(図9)は、算出された乖離量を減じるようにデータを算出する要領について、上記[7]と同様であるが、以下の点で異なる。すなわち、乖離量が、予め定めた各因子の寄与度を制御するデータに基づいて算出された閾値としての乖離量より小さくなるように、各因子の寄与度を制御するデータを算出する機能を備えていることが好ましい。これにより、寄与度を調整しない場合より、常に予測精度が高くなる。
[9]因子変動評価部251は、予測対象時刻の前時刻、もしくは後時刻の少なくとも何れかの因子予測データを用いて因子の変動量を算出することが好ましい。
[10]因子変動評価部251は、因子の変動量を算出するためのモデルの同定において、地理平面及び高度から構成される空間上の少なくとも一点の因子のデータを用いることが好ましい。
[11]予測対象の値を予測するモデルは、因子の過去時刻からの値の推移を示すデータを新たな因子として用いることが好ましい。これによれば、因子の値の時間変化に対する予測対象の値の時間変化の遅れをモデルに組み込むことが可能となり、予測対象の予測の精度を向上させることが可能となる。
[12]因子変動評価部251は、因子それぞれの観測データの観測誤差に基づいて、因子それぞれの変動量を算出することが好ましい。
[13]因子の変動量は、因子の予測値の変動範囲、もしくは因子の予測値の誤差の発生範囲、もしくは因子の予測値の誤差値の何れかであることが好ましい。このように、誤差の発生範囲、観測誤差、その他の誤差情報を用いて予測精度を向上させることができる。
[14]予測対象の値を予測するモデルは、人口の動態情報を因子として用いることが好ましい。電力需要、交通混雑、その他の社会情勢の因子は、人口に由来することが多い。
[15]人口の動態情報は、通信端末の所在値情報、あるいは交通機関の乗車数、乗車率、座席予約数、あるいは道路交通情報の少なくとも何れか一つを含むことが好ましい。これらは、互いに相関関係が高い。
[16]予測対象の値を予測するモデルは、図10に示すような電気自動車の充電設備それぞれの稼働状況を示すデータを用いて、稼動傾向が類似する充電設備を分類することが好ましい。
[17]電気自動車の充電設備それぞれの稼動状況を示すデータは、充電設備それぞれの時刻毎の電力消費量、あるいは充電設備への接続有無を示す情報の少なくとも一つを含むことが好ましい。
[18]予測対象の値を予測するモデルは、予測対象の値の時間推移についてデータ構成する要因をそれぞれ分離し、分離した要因毎に予測値を算出することが好ましい。
[19]予測対象の値の時間推移についてデータ構成する要因は、予測対象の値の時間推移の周波数成分であることが好ましい。この周波数成分とは、要因毎に時系列データの変動特性をグラフ化した曲線を周波数成分としてスペクトル分解した成分比率をいう。
[20]本システム12は、電力需要を予測対象として好適に機能し、電力需要の予測誤差を従来よりも極力低減させることが可能となる。したがって、本システム12は、遠隔又は他社間であることによる不利な緊急電力融通を未然に予知し、予防対応するための準備時間を確保し易くする。このように、本システム12によれば、不利な緊急電力融通を予知して抑制する効果が得られる。
なお、本システム12が有益と認められる背景には、緊急電力融通を困難にする昨今の社会環境があり、その原因には、発送電分離を始めとする電力供給体制の変更もある。すなわち、電力会社において、発電、送配電、及び電力販売の3事業に対する企業実態が、従来は単一経営で迅速制御も容易であったところ、昨今になって3分割された例もある。
この例によれば、3分割などの発送電分離が原因で緊急電力融通するための迅速制御も困難、かつコスト増大に直結するという事情がある。これに対し、本システム12は、緊急電力融通を未然に予知して低減させることが可能な高精度の電力需要予測を実現して社会貢献するものである。
1…データ管理システム、2…予測演算装置、3…データ管理装置、4…情報入出力端末、5…計画作成/実行管理装置、6…データ観測装置、7…データ配信装置、8…通信経路、12…データ予測システム、251,251X,251Y…因子変動評価部、252…予測部

Claims (13)

  1. 予測対象の予測値を算出するための予測モデルに用いる因子に関し、各因子の変動量に基づいて前記予測モデルの同定における各因子の寄与度を制御するデータを出力する因子変動評価部と、
    前記予測対象の標本と、因子の標本と、因子毎のデータであり当該因子の寄与度を制御するデータである寄与度制御データとに基づいて、前記予測モデルを同定し、当該同定された予測モデルを用いて前記予測対象の予測値を出力する予測部と、
    を有し、
    前記因子変動評価部は、
    各因子について過去に得た予測値を前記予測モデルに入力することで算出される前記予測対象の過去期間の推定値と、同期間での前記予測対象の実績値との差分である乖離量を算出し、
    該乖離量を減じるように各因子の寄与度制御データを算出し、
    因子の変動量と相関を有する一つ以上の他の因子の変動量を用いて、予測対象期間における当該因子の変動量の予測値を算出し、
    予測した予測対象期間における変動量を重みとして、前記算出した各因子の寄与度制御データを更新する、
    データ予測システム。
  2. 前記因子変動評価部は、
    測した変動量に基づいて当該因子の寄与度制御データを算出する、
    請求項1に記載のデータ予測システム。
  3. 変動量が相対的に大きい因子の寄与度制御データに従う寄与度は、変動量が相対的に小さい因子の寄与度制御データに従う寄与度よりも小さい、
    請求項1に記載のデータ予測システム。
  4. 動量が相対的に大きい因子の寄与度制御データに従う寄与度は、変動量が相対的に小さい因子の寄与度制御データに従う寄与度よりも小さく調整される、
    請求項1に記載のデータ予測システム。
  5. 乖離量を減じるように各因子の寄与度制御データを算出する際に、正則化することで寄与度制御データを算出する、
    請求項1に記載のデータ予測システム。
  6. 乖離量を減じるように各因子の寄与度制御データを算出する際に、前記乖離量が、各因子について予め定めた寄与度制御データに基づいて算出された閾値としての乖離量より小さくなるように、各因子の寄与度制御データを算出する、
    請求項1に記載のデータ予測システム。
  7. 前記因子変動評価部は、
    予測対象時刻の前時刻、もしくは後時刻の少なくとも何れかの因子予測データを用いて因子の変動量を算出する、
    請求項1に記載のデータ予測システム。
  8. 前記因子変動評価部は、
    因子の変動量を算出するためのモデルの同定において、地理平面及び高度から構成される空間上の少なくとも一点の因子のデータを用いる、
    請求項1に記載のデータ予測システム。
  9. 前記予測対象の値を予測するモデルは、
    因子の過去時刻からの値の推移を示すデータを新たな因子として用いる、
    請求項1に記載のデータ予測システム。
  10. 前記因子変動評価部は、
    因子それぞれの観測データの観測誤差に基づいて観測データを補正し、因子それぞれの変動量を算出する、
    請求項1に記載のデータ予測システム。
  11. 因子の変動量は、
    因子の予測値の変動範囲、もしくは因子の予測値の誤差の発生範囲、もしくは因子の予測値の誤差値の何れかである、
    請求項1に記載のデータ予測システム。
  12. 前記予測対象が電力需要である、
    請求項1に記載のデータ予測システム。
  13. CPUがコンピュータプログラムを実行することにより、予測対象の予測データを算出するデータ予測方法であって、
    因子変動評価部が、前記予測対象の予測値を算出するための予測モデルに用いる因子に関し、各因子の過去に得た前記予測値に基づいて前記予測モデルの同定における各因子の寄与度を制御するデータを出力する第1のステップと、
    予測部が、前記予測対象の観測標本、因子の観測標本、及び各因子の寄与度を制御するデータに基づいて前記予測モデルを同定し、前記予測対象の前記予測値を出力する第2のステップと、
    を有し、
    前記第1のステップは、前記因子変動評価部が、
    各因子について過去に得た予測値を前記予測モデルに入力することで算出される前記予測対象の過去期間の推定値と、同期間での前記予測対象の実績値との差分である乖離量を算出し、
    該乖離量を減じるように各因子の寄与度制御データを算出し、
    因子の変動量と相関を有する一つ以上の他の因子の変動量を用いて、予測対象期間における当該因子の変動量の予測値を算出し、
    予測した予測対象期間における変動量を重みとして、前記算出した各因子の寄与度制御データを更新する、
    データ予測方法。
JP2019126321A 2019-07-05 2019-07-05 データ予測システム及びその方法 Active JP7257276B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019126321A JP7257276B2 (ja) 2019-07-05 2019-07-05 データ予測システム及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019126321A JP7257276B2 (ja) 2019-07-05 2019-07-05 データ予測システム及びその方法

Publications (2)

Publication Number Publication Date
JP2021012539A JP2021012539A (ja) 2021-02-04
JP7257276B2 true JP7257276B2 (ja) 2023-04-13

Family

ID=74227623

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019126321A Active JP7257276B2 (ja) 2019-07-05 2019-07-05 データ予測システム及びその方法

Country Status (1)

Country Link
JP (1) JP7257276B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016127643A (ja) 2014-12-26 2016-07-11 株式会社日立パワーソリューションズ 風力発電量の予測方法
JP2017224268A (ja) 2016-06-09 2017-12-21 株式会社日立製作所 データ予測システムおよびデータ予測方法
JP2018092439A (ja) 2016-12-05 2018-06-14 株式会社日立製作所 データ処理システム及びデータ処理方法
JP2018124727A (ja) 2017-01-31 2018-08-09 株式会社東芝 電力需要予測装置
JP2018163515A (ja) 2017-03-24 2018-10-18 株式会社日立製作所 予測システム、及び、予測方法
JP2019049850A (ja) 2017-09-08 2019-03-28 株式会社日立製作所 予測システム及び方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016127643A (ja) 2014-12-26 2016-07-11 株式会社日立パワーソリューションズ 風力発電量の予測方法
JP2017224268A (ja) 2016-06-09 2017-12-21 株式会社日立製作所 データ予測システムおよびデータ予測方法
JP2018092439A (ja) 2016-12-05 2018-06-14 株式会社日立製作所 データ処理システム及びデータ処理方法
JP2018124727A (ja) 2017-01-31 2018-08-09 株式会社東芝 電力需要予測装置
JP2018163515A (ja) 2017-03-24 2018-10-18 株式会社日立製作所 予測システム、及び、予測方法
JP2019049850A (ja) 2017-09-08 2019-03-28 株式会社日立製作所 予測システム及び方法

Also Published As

Publication number Publication date
JP2021012539A (ja) 2021-02-04

Similar Documents

Publication Publication Date Title
Lin et al. Short-term load forecasting based on LSTM networks considering attention mechanism
Tang et al. Taxi trips distribution modeling based on Entropy-Maximizing theory: A case study in Harbin city—China
JP7157620B2 (ja) 予測システムおよび予測方法
Duan et al. A novel hybrid prediction model for aggregated loads of buildings by considering the electric vehicles
Buzna et al. An ensemble methodology for hierarchical probabilistic electric vehicle load forecasting at regular charging stations
Yi et al. Electric vehicle charging demand forecasting using deep learning model
Yao et al. Short‐term traffic speed prediction for an urban corridor
CN107111794B (zh) 预测和利用地图服务中出行时间的可变性
US20150317589A1 (en) Forecasting system using machine learning and ensemble methods
CN108564790B (zh) 一种基于交通流时空相似性的城市短时交通流预测方法
Zhan et al. Multi-step-ahead traffic speed forecasting using multi-output gradient boosting regression tree
US20160125307A1 (en) Air quality inference using multiple data sources
Xu et al. Trip-oriented travel time prediction (TOTTP) with historical vehicle trajectories
Gómez et al. Evaluation of trade-offs between two data sources for the accurate estimation of origin–destination matrices
JP7340081B2 (ja) 電力需給管理システム、データ予測方法、およびデータ予測装置
Lai et al. Understanding drivers' route choice behaviours in the urban network with machine learning models
Khafidli et al. Forecast of Aviation Traffic in Indonesia Based on Google Trend and Macroeconomic Data using Long Short-Term Memory
ElGhanam et al. Machine learning-based electric vehicle charging demand prediction using origin-destination data: A uae case study
Scarpel et al. A data analytics approach for anticipating congested days at the São Paulo International Airport
Abrishami et al. Using real-world store data for foot traffic forecasting
JP7231504B2 (ja) 気象数値解析システム、予測対象データ生成システムおよび気象数値解析方法
JP7257276B2 (ja) データ予測システム及びその方法
Darapaneni et al. Demand and revenue forecasting through machine learning
Taieb et al. Probabilistic time series forecasting with boosted additive models: an application to smart meter data
Paredes et al. Reconfiguration and reinforcement allocation as applied to hourly medium‐term load forecasting of distribution feeders

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220207

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230309

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230403

R150 Certificate of patent or registration of utility model

Ref document number: 7257276

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150