JP2019105979A - 予測システム、予測方法、および予測プログラム - Google Patents

予測システム、予測方法、および予測プログラム Download PDF

Info

Publication number
JP2019105979A
JP2019105979A JP2017237711A JP2017237711A JP2019105979A JP 2019105979 A JP2019105979 A JP 2019105979A JP 2017237711 A JP2017237711 A JP 2017237711A JP 2017237711 A JP2017237711 A JP 2017237711A JP 2019105979 A JP2019105979 A JP 2019105979A
Authority
JP
Japan
Prior art keywords
phenomenon
prediction
label
time
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017237711A
Other languages
English (en)
Inventor
均 服部
Hitoshi Hattori
均 服部
一男 米倉
Kazuo Yonekura
一男 米倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IHI Corp
Original Assignee
IHI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IHI Corp filed Critical IHI Corp
Priority to JP2017237711A priority Critical patent/JP2019105979A/ja
Publication of JP2019105979A publication Critical patent/JP2019105979A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】将来の現象をより精度良く予測することを目的とする。【解決手段】一実施形態に係る予測システムは時系列データに対する機械学習を実行することで、将来の時期における現象の予測を示す予測データを生成する予測部を備える。時系列データは、過去の個々の時点における現象を示す複数の測定レコードと、測定レコードに対応付けられたラベルとを含む。ラベルは、第1現象から第2現象への遷移を示す開始ラベルと、第2現象から第1現象への遷移を示す終了ラベルと、第1現象または第2現象の継続を示す継続ラベルとを少なくとも含むラベル群から選択される。【選択図】図2

Description

本発明の一側面は、ニューラルネットワークを用いた予測システム、予測方法、および予測プログラムに関する。
従来から、ニューラルネットワークを用いて将来の現象を予測する手法が知られている。例えば、特許文献1には、ニューロコンピュータに大気状態を推測させる気象予測システムが記載されている。この気象予測システムは、ニューロコンピュータに大気状態の変化の様子を学習させる第1の制御手段と、任意の大気状態の変化の様子を基に、ニューロコンピュータに以降の大気状態を推測させる第2の制御手段とを備える。また、特許文献2には、ガスタービンの燃焼器で発生する燃焼振動を数式モデルにより予測する燃焼振動予測装置が記載されている。この装置は、プラントデータおよび気象データから内圧変動を説明する数式モデルを構築し、構築した数式モデルに基づいて燃焼振動の発生し易い領域と発生しにくい領域とを求める。
特開平6−347563号公報 特開2002−54460号公報
時間の経過により変化する現象の中には、ある時間帯において断続的に発生するものがある。例えば、ガスタービンの燃焼器は、運転条件または環境条件の変化に伴い、燃焼振動が発生していない状態から燃焼振動が発生した状態へと移行するか、または燃焼振動が発生している状態から燃焼振動が発生しない状態へと移行する。気象を例にとると、晴れまたは曇りの状態から降水(例えば降雨または降雪)の状態に移行し、その後降水が止んで晴れまたは曇りの状態に移行する。従来の予測手法では、現象の本来の開始または終了と、現象の中断または再開とを区別することができない。そのため、将来の現象をより精度良く予測することが望まれている。
本発明の一側面に係る予測システムは、時系列データに対する機械学習を実行することで、将来の時期における現象の予測を示す予測データを生成する予測部を備え、時系列データが、過去の個々の時点における現象を示す複数の測定レコードと、測定レコードに対応付けられたラベルとを含み、ラベルが、第1現象から第2現象への遷移を示す開始ラベルと、第2現象から第1現象への遷移を示す終了ラベルと、第1現象または第2現象の継続を示す継続ラベルとを少なくとも含むラベル群から選択される。
本発明の一側面に係る予測方法は、少なくとも一つのプロセッサを備える予測システムにより実行される予測方法であって、時系列データに対する機械学習を実行することで、将来の時期における現象の予測を示す予測データを生成する予測ステップを含み、時系列データが、過去の個々の時点における現象を示す複数の測定レコードと、測定レコードに対応付けられたラベルとを含み、ラベルが、第1現象から第2現象への遷移を示す開始ラベルと、第2現象から第1現象への遷移を示す終了ラベルと、第1現象または第2現象の継続を示す継続ラベルとを少なくとも含むラベル群から選択される。
本発明の一側面に係る予測プログラムは、時系列データに対する機械学習を実行することで、将来の時期における現象の予測を示す予測データを生成する予測ステップをコンピュータシステムに実行させ、時系列データが、過去の個々の時点における現象を示す複数の測定レコードと、測定レコードに対応付けられたラベルとを含み、ラベルが、第1現象から第2現象への遷移を示す開始ラベルと、第2現象から第1現象への遷移を示す終了ラベルと、第1現象または第2現象の継続を示す継続ラベルとを少なくとも含むラベル群から選択される。
このような側面においては、機械学習への入力として用いられる時系列データに開始ラベル、終了ラベル、または継続ラベルが付与される。このラベル付けにより機械学習において現象の変化が考慮されるので、将来の現象をより精度良く予測することが可能になる。
他の側面に係る予測システムでは、継続ラベルが、第1現象の継続を示す第1継続ラベルと、第2現象の継続を示す第2継続ラベルとを含んでもよい。より詳細なラベル付けにより、将来の現象をより精度良く予測できる。
他の側面に係る予測システムでは、機械学習が、ラベル群に対応する複数のニューラルネットワークを用いる処理であり、予測部が、時系列データから選択された1以上の測定レコードで構成される入力ベクトルで示されるラベルに基づいて、該入力ベクトルを処理する一つのニューラルネットワークを複数のニューラルネットワークから選択してもよい。現象の遷移または継続に応じて複数のニューラルネットワークを用意し、測定データで示される現象に応じてニューラルネットワークを切り替えながら機械学習を行うことで、将来の現象をより精度良く予測できる。
他の側面に係る予測システムでは、時系列データにおいて、開始ラベルが付与された測定レコードの個数の第1比率と、終了ラベルが付与された測定レコードの個数の第2比率とが上がるように、複数の測定レコードの一部に対して複製および間引きの少なくとも一方が実行されることで、時系列データにおける各ラベルの比率が調整され、予測部が、各ラベルの比率が調整された時系列データに対する機械学習を実行してもよい。現象の変化を示すラベルの個数が現象の継続を示すラベルの個数と比べてかなり少ないと、機械学習において現象の変化が適切に捕捉されないために予測の精度が下がる可能性がある。現象の変化を示すラベルの個数と現象の継続を示すラベルの個数との差を小さくするように時系列データにおける各ラベルの比率を調整することで、将来の現象をより精度良く予測できる。
他の側面に係る予測システムでは、将来の第1時期における現象を予測する場合よりも、該第1時期よりも現在から遠い将来の第2時期における現象を予測する場合において、第1比率および第2比率の上昇度が低くなるように、時系列データにおける各ラベルの比率が調整されてもよい。予測の対象となる時期に応じて各ラベルの比率を調整することで、将来の現象をより精度良く予測できる。
他の側面に係る予測システムでは、現象が降水に関し、第1現象が降水のない状態であり、第2現象が降水のある状態であってもよい。この場合には、将来の降水の状況をより精度良く予測することが可能になる。
他の側面に係る予測システムでは、時系列データのデータ項目が感雨および降水強度を含み、予測部が、将来の時期における感雨および降水強度を予測し、該予測された感雨および降水強度に基づいて降水指数を求めてもよい。感雨および降水強度を総合的に考慮した指数を導入することで、人の直感に合うように将来の降水の状況を予測することができる。
本発明の一側面によれば、将来の現象をより精度良く予測することができる。
実施形態に係る予測システムで用いられるコンピュータのハードウェア構成を示す図である。 実施形態に係る予測システムの機能構成を示す図である。 気象データ(時系列データ)の例を示す図である。 実施形態に係る予測システムの動作を示すフローチャートである。 気象データに対するラベル付けの例を示す図である。 気象データの各ラベルの比率を調整する例を示す図である。 実施形態に係る予測システムで用いられるニューラルネットワークの例を示す図である。 実施形態に係る予測システムで用いられるニューラルネットワークの例を示す図である。 予測データの一例である降水指数を示す図である。 実施形態に係る予測プログラムの構成を示す図である。 複数の予測手法の精度を示すグラフである。
以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。なお、図面の説明において同一または同等の要素には同一の符号を付し、重複する説明を省略する。
[システムの構成]
実施形態に係る予測システム10は、将来の現象を予測するコンピュータシステムである。「現象」とは、人間が知覚することができる物事、または何らかのセンサを用いて知覚することができる物事である。予測システム10が予測する現象は限定されない。例えば、予測システム10は自然界での現象を予測してもよく、例えば気象を予測してもよい。あるいは、予測システム10は人工物で起こる現象を予測してもよく、例えばガスタービンの振動を予測してもよい。あるいは、予測システム10は人間の社会生活から生じる現象、すなわち社会現象を予測してもよく、例えば、交通渋滞を予測してもよい。一例として、本実施形態では予測システム10は気象の一種である降水を予測する。降水とは、大気中の水蒸気が地上に落下する現象であり、例えば雨、雪、雹などである。
図1は予測システム10を構成するコンピュータ100の一般的なハードウェア構成を示す。例えば、コンピュータ100はプロセッサ101、主記憶部102、補助記憶部103、通信制御部104、入力装置105、および出力装置106を備える。プロセッサ101はオペレーティングシステムおよびアプリケーション・プログラムを実行する。主記憶部102は例えばROMおよびRAMで構成される。補助記憶部103は例えばハードディスクまたはフラッシュメモリで構成され、一般に主記憶部102よりも大量のデータを記憶する。通信制御部104は例えばネットワークカードまたは無線通信モジュールで構成される。入力装置105は例えばキーボード、マウス、タッチパネルなどで構成される。出力装置106は例えばモニタおよびスピーカで構成される。
予測システム10の各機能要素は、プロセッサ101または主記憶部102の上に所定のソフトウェア(例えば、後述する予測プログラムP1)を読み込ませてそのソフトウェアを実行させることで実現される。プロセッサ101はそのソフトウェアに従って、通信制御部104、入力装置105、または出力装置106を動作させ、主記憶部102または補助記憶部103におけるデータの読み出しおよび書き込みを行う。処理に必要なデータまたはデータベースは主記憶部102または補助記憶部103内に格納される。
予測システム10は1台のコンピュータで構成されてもよいし、複数台のコンピュータで構成されてもよい。複数台のコンピュータを用いる場合には、これらのコンピュータがインターネットやイントラネットなどの通信ネットワークを介して接続されることで、論理的に一つの予測システム10が構築される。
図2は予測システム10の機能構成を示す。予測システム10は機能的構成要素として取得部11、前処理部12、および予測部13を備える。予測システム10はインターネットやイントラネットなどの通信ネットワークを介してデータベース20にアクセスすることができる。
データベース20は、予測システム10からの任意のデータ操作(例えば、抽出、追加、削除、上書きなど)に対応できるように時系列データを記憶する機能要素または装置である。データベースの実装方法は限定されないが、例えばデータベース管理システム(DBMS)が用いられてもよい。データベース20の管理主体および設置場所は限定されない。例えば、データベース20は、予測システム10とは異なるコンピュータシステムにより管理されてもよいし、予測システム10の一部であってもよい。データベース20は、予測システム10の運営者が他の機関から提供された時系列データを記憶してもよいし、該運営者が自身で収集した時系列データを記憶してもよい。「時系列データ」とは、過去の個々の時点において実際に発生した現象を示す複数の測定レコードを時間の経過に沿って並べることで得られるデータである。「測定レコード」は、1時点において発生した現象を示す1以上の値の集合である。
本実施形態では、予測システム10は、データベース20に記憶された気象データを用いて将来の気象(具体的には降水)を予測する。気象データは、1以上の観測地点において所定の単位時間間隔で(例えば10分間隔で)観測された気象の記録であり、時系列データの一例である。なお、気象データを得るための装置(気象観測装置)の種類は何ら限定されず、例えばアメダス(AMeDAS)、気象レーダなどであってもよい。
図3は、データベース20および気象データの構成の例を模式的に示す。本実施形態では、気象データは複数の地点での気象の記録(観測記録)であり、データ項目として時点、気温、圧力(海面圧力)、湿度、感雨、風向、風速、および降水強度を含む。「時点」とは、気温および圧力などの測定値が得られた日時であり、測定時点ということもできる。「感雨」とは降水があるかないかを示す指標であり、降水強度とは単位時間当たりの降水量である。個々の地点の気象データは、複数の時点(t,tなど)における測定レコードを含む。図3は、一つの地点Paに関する気象データを特に示す。
気象データの構成は図3の例に限定されない。例えば、気象データに対して任意の正規化または冗長化が為されてもよい。あるいは、気象データが日照などの他のデータ項目を含んでもよいし、図3に記載のデータ項目の少なくとも一つが省略されてもよい。
予測システム10では、取得部11が気象データを取得し、前処理部12がその気象データを前処理(編集)し、予測部13が前処理(編集)された気象データに対して機械学習を実行することで予測データを生成する。
取得部11は、気象データを取得する機能要素である。取得部11は、予測に関する指示の入力に応じて、その指示に対応する気象データをデータベース20から読み出す。
前処理部12は、予測を実行する前に、取得された気象データを前処理(編集)する機能要素である。本実施形態では、前処理部12は正規化と、ラベル付けと、各ラベルの比率の調整とを実行する。したがって、前処理部12はラベリング部および調整部としても機能する。
「正規化」とは、気象データの各データ項目の値を所定の数値範囲内で変形する処理であり、この処理により気象データが無次元化される。例えば、各データ項目の値が0から1の範囲内に収まるように正規化が行われてもよい。
「ラベル付け」とは、個々の測定レコードにラベルを付与する処理である。「ラベル」とは、測定レコードを複数のグループに分類するために気象データ(時系列データ)に追加されるデータ項目である。「測定レコードにラベルを付与する」とは、測定レコードからそのラベルが特定できるように、該測定レコードと該ラベルとを対応付ける処理である。本実施形態では、このラベルは気象データの更なる編集と、利用するニューラルネットワークの選択とのために用いられ、ラベルの利用により予測の精度の向上が期待できる。
経時的に発生と消滅とを繰り返す系で特定の現象(注目現象)を予測する場合には、該注目現象が発生していない状況を「第1現象」とし、該注目現象が発生している状況を「第2現象」とみなすことができる。本実施形態で付与されるラベルは、第1現象または第2現象の継続を示す継続ラベルと、これら二つの現象の一方から他方への遷移を示す遷移ラベルとを含む。本実施形態では、第1現象の継続を示すラベルを「第1継続ラベル」といい、第2現象の継続を示すラベルを「第2継続ラベル」という。また、第1現象から第2現象への遷移を示すラベルを「開始ラベル」といい、第2現象から第1現象への遷移を示すラベルを「終了ラベル」という。
「各ラベルの比率の調整」とは、ラベル毎の測定レコードの個数の比率を変える処理である。あるいは、「各ラベルの比率の調整」とは、ラベル毎の学習機会の比率を調整する処理であるともいえる。前処理部12は、ラベルが付与された時系列データの少なくとも一部を複製するかまたは間引くことで、その比率を調整する。現象が時間の経過と共に変化する場合、一般には、現象がある状態から別の状態に変わる期間の長さは、現象がある状態を継続する期間の長さよりも短い。そのため、時系列データ上では、現象の変化を示すラベルの個数は、現象の継続を示すラベルの個数より少ない。現象の変化を示すラベルの個数が現象の継続を示すラベルの個数と比べてかなり少ないと、機械学習において現象の変化が適切に捕捉されないために予測の精度が下がる可能性がある。そこで、前処理部12は、現象の変化を示すラベルの個数と現象の継続を示すラベルの個数との差を小さくするように、気象データにおける各ラベルの比率を調整する。
予測部13は、前処理(編集)された気象データに対する機械学習を実行することで予測データを生成する機能要素である。「機械学習」とは、与えられた情報に基づいて反復的に学習することで、法則またはルールを自律的に見つけ出す手法である。「予測データ」とは、将来の特定の時期における現象の予測を示すデータである。予測データで示される将来の時期はいつでもよく、例えば1秒後、1分後、10分後、1時間後、1日後、1ヶ月後、または1年後でもよい。本実施形態では、予測データは降水に関する情報を示す。本実施形態では、予測部13は深層学習により予測データを生成する。「深層学習」とは多層構造のニューラルネットワーク(深層ニューラルネットワーク(DNN))を用いた機械学習である。「ニューラルネットワーク」とは、人間の脳神経系の仕組みを模した情報処理のモデルである。
予測部13は、前処理された気象データの一部である学習データを処理しながらニューラルネットワークの重みの更新を重ねることで、最も予測精度が高いと推定される最良のニューラルネットワーク(以下では、単に「最良のニューラルネットワーク」という)を生成する。このステップをニューラルネットワークの学習と呼ぶ。なお、ニューラルネットワークの学習により得られた「最良のニューラルネットワーク」が“現実に最良である”とは限らないことに留意されたい。予測部13は前処理された気象データの残りを検証データとして用い、最良のニューラルネットワークを用いてその検証データを処理し、学習により得られた「最良のニューラルネットワーク」による予測データと、検証データとの差異を検証し、そのニューラルネットワークを定量的に評価する。このステップをニューラルネットワーク検証と呼ぶ。ニューラルネットワーク検証のステップにおいて、予測部13は、評価結果を含む予測データを出力してもよいし、評価結果を含まない予測データを出力してもよい。
[システムの動作]
予測システム10の動作を説明するとともに本実施形態に係る予測方法について説明する。以下、予測システム10に含まれるニューラルネットワークの学習のステップと、ニューラルネットワークの検証のステップとを含む動作を記載する。図4は予測システム10の動作を示すフローチャートであり、より具体的には、ある1地点における将来の降水を予測するための処理を示す。複数の地点の降水を予測する場合には、図4で示される処理が複数回実行される。
ステップS11では、取得部11がデータベース20から気象データ(時系列データ)を取得する(取得ステップ)。取得部11は予測システム10のオペレータにより入力された指示に応じて、その指示に対応する時系列データを取得してもよいし、スケジューラに設定されたタイミングで、所定の条件に対応する時系列データを取得してもよい。取得部11はある1地点(予測地点)での降水を予測するために、該予測地点の気象データのみを取得してもよい。あるいは、取得部11は一つの予測地点での降水を予測するために、該予測地点の気象データと、該予測地点の周辺にある1以上の地点の気象データとを取得してもよい。
取得部11は気象データの値をそのまま後続の処理(前処理部12および予測部13)に流してもよい。あるいは、取得部11は気象データ中の各時点の値を、一つ前の時点からの差分(勾配)に変換した上で、変換された気象データを後続の処理に流してもよい。
続いて、前処理部12がデータベース20から読み出された気象データを前処理(編集)する。ステップS12では、前処理部12は気象データの各データ項目の値(気象データの各測定レコードの各値)を正規化する。正規化で用いられる数値範囲は限定されないが、例えば前処理部12は0以上1以下の範囲で各要素を正規化してもよい。正規化の具体的な規則は限定されず、またその正規化方法はデータ項目ごとに異なってもよい。例えば、前処理部12は値を二値(0または1)に変換してもよいし、0から1の間の任意の実数に変換してもよい。
ステップS13では、前処理部12は気象データに対するラベル付けを実行する(ラベリングステップ)。本実施形態では、前処理部12は予め定められた規則に従って各測定レコードに「感雨なし(0)」、「降り途中(1)」、「降り始め(2)」、および「降り終わり(3)」という4種類のラベルのいずれか一つを付与する。例えば、前処理部12は、時点tにおける観測記録を示す測定レコードRのラベル付けを下記の規則Qa〜Qdに従って実行する。下記の測定レコードRk−1は、時点tの一つ前の時点tk−1における観測記録を示す。
・規則Qa:測定レコードRのデータ項目「感雨」が「感雨なし」であり、かつ測定レコードRk−1におけるデータ項目「感雨」が「感雨なし」である場合には、ラベルは「感雨なし(0)」である。
・規則Qb:測定レコードRでの「感雨」が「感雨あり」であり、かつ測定レコードRk−1での「感雨」が「感雨あり」である場合には、ラベルは「降り途中(1)」である。
・規則Qc:測定レコードRでの「感雨」が「感雨あり」であり、かつ測定レコードRk−1での「感雨」が「感雨なし」である場合には、ラベルは「降り始め(2)」である。
・規則Qd:測定レコードRでの「感雨」が「感雨なし」であり、かつ測定レコードRk−1での「感雨」が「感雨あり」である場合には、ラベルは「降り終わり(3)」である。
本実施形態では、降水がない状態を第1現象とし、降水がある状態を第2現象とする。したがって、「感雨なし(0)」は第1継続ラベルであり、「降り途中(1)」は第2継続ラベルであり、「降り始め(2)」は開始ラベル(遷移ラベル)であり、「降り終わり(3)」は終了ラベル(遷移ラベル)である。
図5は、図3に示す地点Paの気象データに対するラベル付けの例を示す。図5ではラベルを数値のみで示しており、0は「感雨なし」、1は「降り途中」、2は「降り始め」、3は「降り終わり」を示す。
ステップS14では、前処理部12が、ラベル付けされた気象データを学習データと検証データとに分割する。学習データはニューラルネットワークの学習のステップで使用するデータである。検証データはニューラルネットワークの検証のステップで使用するデータである。前処理部12は気象データを前半と後半の二つに分ける。前半の気象データは、測定時点が相対的に古い測定レコードの群であり、予測システム10はこの群を学習データとして用いる。後半の気象データは、測定時点が相対的に新しい測定レコードの群であり、予測システム10はこの群を検証データとして用いる。学習データと検証データとの間の測定レコードの個数の比率は限定されない。例えば、前処理部12は気象データを半々に分けることで学習データおよび検証データを得てもよい。
ステップS15では、前処理部12はラベルが付与された学習データの少なくとも一部を複製するかまたは間引くことで、ラベル毎の測定レコードの個数の比率を調整する(調整ステップ)。降水を例に取ると、降水の始まりまたは終わりに対応する期間の長さは、降水がない期間または降水が続く期間の長さよりもだいぶ短い。したがって、「降り始め(2)」または「降り終わり(3)」が付与された測定レコードの個数は、「感雨なし(0)」または「降り途中(1)」というラベルが付与された測定レコードの個数よりもかなり少ない。そのため、ラベルが付与されたデータをそのまま用いると、降水の開始および終了を精度良く予測することが難しくなる。そこで、前処理部12は気象データにおける各ラベルの比率を調整する。
例えば、前処理部12は、継続ラベル(例えば、「感雨なし(0)」または「降り途中(1)」)が付与された測定レコードを間引くことで当該測定レコードの個数を減らしてもよい。あるいは、前処理部12は遷移ラベル(例えば、「降り始め(2)」または「降り終わり(3)」)が付与された測定レコードを複製することで当該測定レコードの個数を増やしてもよい。あるいは、前処理部12は間引きおよび複製の双方を実行してもよい。
前処理部12は、現象の開始および終了に対応する測定レコードのみを複製してもよい。具体的には、前処理部12は、遷移ラベル(「降り始め(2)」または「降り終わり(3)」)が付与された測定レコードのうち、実際に降水が始まったまたは終わったと推定される時点に対応する測定レコードを複製する。例えば、前処理部12は、時点tにおける観測記録を示す測定レコードRが下記の条件Ca,Cbのいずれかを満たす場合にその測定レコードRを複製する。
・条件Ca:付与されたラベルが「降り始め(2)」(開始ラベル)であり、かつ、時点tの直前の所定の時間帯(例えば60分間)における測定レコードのラベルがすべて「感雨なし(0)」(第1継続ラベル)である。
・条件Cb:付与されたラベルが「降り終わり(3)」(終了ラベル)であり、かつ、時点tの直後の所定の時間帯(例えば60分間)における測定レコードのラベルが「感雨なし(0)」(第1継続ラベル)である。
図6は各ラベルの比率の調整の例を示す。この例では、前処理部12は、直前の所定の時間帯(例えば時点t〜t)がすべて「感雨なし(0)」である時点tの測定レコードを2個複製して時点t,tの間にその複製を挿入している。さらに、前処理部12は、直後の所定の時間帯(例えば時点t17〜t22)がすべて「感雨なし(0)」である時点t16の測定レコードを2個複製して、時点t16,t17の間にその複製を挿入している。
間引きまたは複製する測定レコードの個数は限定されない。例えば、前処理部12は継続ラベルと遷移ラベルとの比率が所定値(例えば5:1)になるように各ラベルの比率を調整してもよい。
比率の調整の程度も限定されない。例えば、前処理部12は、将来の第1時期における現象を予測する場合よりも、該第1時期よりも現在から遠い将来の第2時期における現象を予測する場合において、遷移ラベルの比率の上昇度が低くなるように、時系列データにおける各ラベルの比率を調整してもよい。すなわち、前処理部12は、短期予測では遷移ラベルの比率の上昇度を高くし、長期予測ではその上昇度を短期予測の場合よりも低くしてもよい。ここで、遷移ラベルの比率とは、開始ラベルの比率(第1比率)と終了ラベルの比率(第2比率)とを含む概念である。
続いて、予測部13がラベル付けされた気象データに対する機械学習を実行するニューラルネットワークの学習のステップについて記載する。ステップS16では、予測部13は、調整された学習データを用いた学習を実行してニューラルネットワークの重みを更新することで、最良のニューラルネットワークを自律的に生成する。予測部13は時点tから時点ti+jまでの測定レコードで構成される入力ベクトルxをニューラルネットワークに入力することで、時点ti+j+nにおける予測を示す出力ベクトルyを求める。予測時点の設定方法は任意であり、例えば、予測時点はti+j+1(n=1)、でもti+j+3(n=3)でもよい。ニューラルネットワークは予測時点の設定に応じて生成されるので、予測時点を変えるのであれば別途ニューラルネットワークを生成する必要がある。予測部13は時点ti+j+nにおける実際の測定結果(すなわち、教師データ)tに対する出力ベクトルyの誤差を示す誤差関数Eを求め、この誤差関数Eに基づいてニューラルネットワークの重みを更新する。例えば、予測部13はバックプロパゲーション(誤差逆伝播法)を用いて重みを更新してもよい。バックプロパゲーションは、出力側から入力側に向かって進みながら、各ニューロンの重みを局所誤差が小さくなるように修正する手法である。予測部13は入力ベクトルxの期間を1単位時間ずつシフトさせながら学習を繰り返すことで、最適な重みが設定されたニューラルネットワーク(すなわち、最良のネットワーク)を得る。
図7は、一つのデータ項目(例えば降水強度)を予測するために用いるニューラルネットワーク30の例を示す。ニューラルネットワーク30は6層の深層ニューラルネットワーク(DNN)である。入力層L、中間層L、および中間層Lはデータ項目(気温、圧力、湿度、感雨、風向、風速、および降水強度)毎に用意された複数のブロックで構成され、したがって、これら3層では各データ項目が他のデータ項目とは独立して処理される。ニューラルネットワーク30の最初の3層は、気象データのデータ項目の個数のブロックB〜Bで構成される。中間層LではこれらのブロックB〜Bの出力が合成されて処理され、これは、複数のデータ項目を総合的に判断することに相当する。中間層Lおよび出力層Lで更なる演算が行われて最終結果が得られる。
本実施形態では、予測部13は、6時点にわたって8地点(一つの予測地点と、該予測地点の周辺の7地点)で測定された観測結果を示す48個の測定レコードで構成される入力ベクトルをニューラルネットワーク30に入力する。したがって、各ブロックB〜Bの入力層Lは48個のノードから成る。本実施形態では、各ブロックB〜Bの中間層L,Lはそれぞれ50個のノードから成り、中間層Lは300個のノードからなり、中間層Lは200個のノードから成る。本実施形態では、過学習を避けるために、中間層のノードのいくつかを無効にして学習を行うドロップアウト(dropout)を採用しているので、中間層L,Lのノード数は入力層Lのノードの総数より少ない。なお、各層のノードの個数は図7の例に限定されず、任意に定めてよい。
図8は、感雨を予測するために用いるニューラルネットワークの例を示す。本実施形態では、予測部13は4種類のラベルに対応する4個のニューラルネットワーク41〜44を用いて感雨を予測する。ニューラルネットワーク41〜44の構成はニューラルネットワーク30と基本的に同じである。したがって、前半の3層では個々のデータ項目が独立に処理され、後半の3層では、前半の結果が合成された上で演算が行われる。
ニューラルネットワーク41は、予測対象の地点における直近の測定レコードのラベル(以下ではこれを「直近ラベル」という)が「感雨なし(0)」である場合に用いられる。ニューラルネットワーク42は直近ラベルが「降り途中(1)」である場合に用いられる。ニューラルネットワーク43は直近ラベルが「降り始め(2)」である場合に用いられる。ニューラルネットワーク44は直近ラベルが「降り終わり(3)」である場合に用いられる。ニューラルネットワーク41〜44の出力はいずれも、「感雨なし」または「感雨あり」のいずれかである。
時点tから時点ti+5までの6時点にわたって8地点で測定された観測結果を示す48個の測定レコードから成る入力ベクトルが与えられた場合を例に、データ項目「感雨」の予測について説明する。この場合、直近ラベルは予測地点での時点ti+5における測定レコードのラベルである。直近ラベルが「感雨なし(0)」であれば、予測部13はニューラルネットワーク41にその入力ベクトルを入力することで、時点ti+5+nにおける「感雨」の予測を示す出力ベクトルを求める。そして、予測部13はその出力ベクトルの誤差を示す誤差関数に基づくニューラルネットワーク41の重みを調整する。直近ラベルが「降り途中(1)」であれば、予測部13はニューラルネットワーク42にその入力ベクトルを入力することで、時点ti+5+nにおける「感雨」の予測を示す出力ベクトルを求める。そして、予測部13はその出力ベクトルの誤差を示す誤差関数に基づきニューラルネットワーク42の重みを調整する。直近ラベルが「降り始め(2)」であれば、予測部13はニューラルネットワーク43にその入力ベクトルを入力することで、時点ti+5+nにおける「感雨」の予測を示す出力ベクトルを求める。そして、予測部13はその出力ベクトルの誤差を示す誤差関数に基づきニューラルネットワーク43の重みを調整する。直近ラベルが「降り終わり(3)」であれば、予測部13はニューラルネットワーク44にその入力ベクトルを入力することで、時点ti+5+nにおける「感雨」の予測を示す出力ベクトルを求める。そして、予測部13はその出力ベクトルの誤差を示す誤差関数に基づきニューラルネットワーク44の重みを調整する。
複製された測定レコードが含まれる場合は、予測部13は、その複製により連続して並んでいる測定レコードを一つだけ選択して入力ベクトルを構成する。一例として、時系列に沿って見た場合に、時点ti+5に続く時点t’i+5における測定レコードが,時点ti+5における測定レコードの複製である場合を考える。この場合、予測部13は、オリジナルである時点ti+5の測定レコードを除いた、直近の過去6時点にわたる測定レコードから成る入力ベクトルを構成する。すなわち、予測部13は6個の時点[t,ti+1,ti+2,ti+3,ti+4,t’i+5]における測定レコードから成る入力ベクトルを構成する。この入力ベクトルは,時点tから時点ti+5にわたる6時点の測定レコードで構成される入力ベクトルと一致する。一方、ti+4の次の時点t’i+4における測定レコードが時点ti+4における測定レコードの複製である場合は、予測部13は時点t’i+4を除いた6個の時点[t,ti+1,ti+2,ti+3,ti+4,ti+5]における測定レコードから成る入力ベクトルを構成する。このように、複製された測定レコードが含まれる場合には、その複製により連続して並ぶ測定レコードが直近に位置する場合にのみ、予測部13は複製された測定レコードを直近とする入力ベクトルを重複して(言い換えると、複数回にわたり)学習する。
測定レコードの一部が間引かれた場合は、予測部13は、間引かれた測定レコードを直近とする入力ベクトルの学習を行わない。一例として、時点ti+5における測定レコードが間引かれた場合は、予測部13は時点[ti−1,t,ti+1,ti+2,ti+3,ti+4]における測定レコードで構成される入力ベクトルと、時点[ti+1,ti+2,ti+3,ti+4,ti+5,ti+6]における測定レコードで構成される入力ベクトルとについては学習を行う。しかし、予測部13は、時点[t,ti+1,ti+2,ti+3,ti+4,ti+5]の測定レコードで構成される入力ベクトルについては学習を行わない。
続いて、ニューラルネットワークの検証のステップについて記載する。ステップS17では、予測部13は検証データを用いて予測データを生成する(予測ステップ)。検証データで示される期間が時点t,ti+1,ti+2,…,ti+Mであるとし、ti+Mが検証データの中で最も新しい測定時点であるとする。検証を行うニューラルネットワークを用いて予測データを得たい将来の時期(以下ではこれを「対象時期」という)tが現時点t、単位時間k、および自然数Nを用いてt=t+Nkで表されるとする。すなわち、検証を行うニューラルネットワークは、直近の測定時点から時間Nk後の予測を行うニューラルネットワークである。上記のように、予測部13は、時系列の測定レコードで構成される入力ベクトルを処理して予測データ(出力ベクトル)を生成する。すなわち、予測部13は、所定の時間の範囲の測定レコードを検証データから抽出して入力ベクトルを構成し、ニューラルネットワークにより出力ベクトルを生成する。
生成される出力ベクトルは、入力ベクトルを構成する測定レコードのうち最も直近の測定から、時間Nk後の現象を予測するデータである。ニューラルネットワークの検証のステップでは、予測部13は、入力ベクトルを構成する測定レコードの時間範囲をずらしながら時系列の出力ベクトルを得る。得られる時系列の出力ベクトルは、検証データに対応する時点の予測をするデータである。すなわち、検証データは出力ベクトルが予測した時点における測定レコードを含む。予測部13は、時系列の出力ベクトルと、対応する時点の測定レコードとの差異を検証する。例えば、予測部13は評価の指標として適中率および捕捉率を求める。なお、時系列の出力ベクトルの時間間隔は等しくなくてもよい。
予測部13は、ニューラルネットワークの学習および検証のステップを経た後に運用を行う。運用のステップは、入力ベクトルを構成する時系列データを測定により更新し、将来の時点を予測する出力ベクトル(予測データ)を出力するステップである。運用のステップは学習のステップと検証のステップとを含んでもよい。
運用のステップにおける学習のステップとは、将来の時点を予測する出力ベクトルと、該将来の時点に達したときに実際に測定した測定結果とを用いて、バックプロパゲーション(誤差逆伝播法)などによりニューラルネットワークの重みを更新するステップである。予測部13は、運用のステップにおける学習を、時間の経過により逐次実行してもよいし、所定の時間間隔の測定データが蓄積された後に一度に実行してもよい。
運用のステップにおける検証のステップとは、運用のステップにおいて蓄積した測定データと、ニューラルネットワークにより予測した出力ベクトルとの差異を検証するステップである。予測部13は、主記憶部102または補助記憶部103に、学習前後のニューラルネットワークの重みを記録してもよい。この場合には、予測部13は、検証の結果、過学習の発生を認識した場合に、学習前のニューラルネットワークの重みを主記憶部102または補助記憶部103から読み込んで学習やり直すことができる。
予測部13は、予測結果を用いて入力ベクトルを作成して、さらに先の将来の時点を予測してもよい。予測システム10は、単位時間をkとして最大でNk先の将来の時点を予測するニューラルネットワークを含む場合に、予測結果を用いて入力ベクトルを作成することで、その時点Nkよりさらに先の将来の時点の現象を予測することができる。予測システム10が、入力ベクトルの直近の時点に対して、単位時間k先の将来を予測するニューラルネットワークを含むとする。また、そのニューラルネットワークは、測定レコードを構成する各パラメータを予測できるとする。予測部13は現在から対象時期に向かって、単位期間が経過した時点での出力ベクトルを順番に求める。現時点をtとし、便宜的に、将来の時期(t+1k)における出力ベクトルを求めるための測定レコードの集合(すなわち、入力ベクトル)VをV={v,v,…,v}とすると、予測部13はこの集合Vをニューラルネットワークに入力することで、将来の時期(t+1k)における現象の予測を示す出力ベクトルv´を得る。
続いて、予測部13は集合Vの中で最も古い測定レコードvを除き、代わりにその出力ベクトルv´を集合Vに加える。この結果、測定レコードの集合Vは{v,…,v,v´}に変わる。予測部13はこの集合Vをニューラルネットワークに入力することで、将来の時期(t+2k)における現象の予測を示す出力ベクトルv´を得る。
続いて、予測部13は集合Vの中で最も古い測定レコードvを除き、代わりにその出力ベクトルv´を集合Vに加えることで、測定レコードの集合V={v,…,v、v´,v´}を得る。予測部13はこの集合Vをニューラルネットワークに入力することで、将来の時期(t+3k)における現象の予測を示す出力ベクトルv´を得る。
このように、予測部13は測定レコードの集合で示される期間を将来に向かってシフトさせながら出力ベクトルを求め続け、最終的に、対象時期t(=t+Nk)における出力ベクトルv´を求める。そして、予測部13は、これらの出力ベクトルv´〜v´の少なくとも一つを用いて、将来の特定の時点または時間帯における現象の推移を示す予測データを生成する。
予測部13は、入力ベクトルの直近の時点から見た場合の予測時点が異なる複数のニューラルネットワークを組み合わせて予測を実行してもよい。時間Nkだけ先の将来を予測する第1のニューラルネットワークと、時間Nkだけ先の将来を予測する第2のニューラルネットワークを用いる例を説明する(ただし、N<N)。第1のニューラルネットワークは、M個の時系列の測定レコードからなる入力ベクトルを入力し、時間Nkだけ先の将来を予測するニューラルネットワークであるとする。第2のニューラルネットワークは、M個の時系列の測定レコードからなる入力ベクトルを入力し、時間Nkだけ先の将来を予測するニューラルネットワークであるとする。
予測部13は、第1のニューラルネットワークと第2のニューラルネットワークとを用いて、時間(Nk+Nk)だけ先の将来を予測する。すなわち、予測部13は、現時点をtとして、そのt以前の測定レコードを用いて出力ベクトルを作成する。予測部13は、第2のニューラルネットワークに入力する入力ベクトルとして、時点tから時点{t−(N−N+1)}までの期間に対応する(N−N+1)個の入力ベクトルを生成する。予測部13はこの(N−N+1)個の入力ベクトルを第2のニューラルネットワークに入力することで、時点(t+Nk)から時点{t+(N−1)k}までの出力ベクトルを得る。同様に、予測部13は、時点(t+Nk)から時点{t−M+(N−N+1)}までの期間に対応する{M−(N−N+1)}個の入力ベクトルを生成する。予測部13はこの{M−(N−N+1)}個の入力ベクトルを第1のニューラルネットワークに入力することで、時点(t+Nk)から時点{t+(N−M)k}までの出力ベクトルを得る。予測部13は、これにより得られた時点(t+N)から時点{t+(N−M)k}の出力ベクトルに基づいて入力ベクトルを構成し、その入力ベクトルを第1のニューラルネットワークに入力することで、時点(t+Nk+Nk)について予測する。この例では、予測部13は第2のニューラルネットワークにより{t+(N+1)k}までの時点を予測するが、予測部13は時点{t+(N+1)k}より前の時点まで予測してもよい。また、予測部13は3以上のニューラルネットワークを用いてもよい。
本実施形態では、予測部13は最良のニューラルネットワーク30に検証データを入力することで降水強度の予測データを生成する。加えて、予測部13は最良のニューラルネットワーク41〜44を用いて検証データを処理することで感雨(降水の有無、開始、または終了)の予測データを生成する。感雨を予測する際には、予測部13は、入力ベクトルで示される直近ラベルに基づいてニューラルネットワーク41〜44から一つのニューラルネットワークを選択し、該選択したニューラルネットワークを用いて出力ベクトルを求める。すなわち、予測部13は入力ベクトルの直近ラベルに応じてニューラルネットワーク41〜44を使い分ける。
本実施形態において、予測部13は降水強度の予測データと感雨の予測データとから降水指数を求めてもよい。「降水指数」とは、人の直感に合うように将来の降水の程度を示す指標であり、これも予測データである。例えば、降水指数は下記の式(1)により得られてもよい。
Figure 2019105979

ここで、softmax関数は、スコア(ベクトル)を、最小値が0であり最大値が1であり合計が1である確率分布に変換する関数である。降水強度の予測値の単位はmm/hである。
降水指数は0から1までの範囲の実数を取る。雨の場合でいうと、降水指数が0.5未満であれば、人が雨を気にしない状況(雨が降っていないかまたはごく弱い雨が降っている状況)にあるといえる。降水指数が0.5以上であれば、人が雨を気にする状況(一定以上の雨が降っている状況)にあるといえる。降水指数が1に近ければ本降りであるといえる。図9は感雨および降水強度の予測データと、これらのデータから得られる降水指数との例を示すグラフである。このグラフから分かるように、降水指数は感雨および降水強度を総合的に考慮することで得られる値である。
ステップS18では、予測部13は予測データを出力する。予測データの出力方法は限定されない。例えば、予測部13は予測データを、モニタ上に表示してもよいし、所定のデータベースに格納してもよいし、他のコンピュータシステムに送信してもよい。予測データの表現方法も任意であり、例えば、予測部13が予測データをモニタ上に表示するのであれば、テキスト、表、グラフ、イラストなどの任意の手法で予測データを表現してもよい。気象データはステップS12で正規化されているので、予測部13は予測データの出力に際して正規化の逆変換を行わなくてもよい。予測部13は降水指数、感雨の予測データ、および降水強度の予測データのうちの少なくとも一つを出力してもよい。このように予測データの出力方法および表現方法は何ら限定されないが、いずれにしても、予測システム10のユーザは予測データを参照することで、気象が今後どのように変化するかの見当を付けることができる。
[プログラム]
図10を参照しながら、少なくとも1台のコンピュータを予測システム10として機能させるための予測プログラムP1を説明する。図10は予測プログラムP1の構成を示す図である。
予測プログラムP1はメインモジュールP10、取得モジュールP11、前処理モジュールP12、および予測モジュールP13を含む。メインモジュールP10は予測処理を統括的に管理する部分である。取得モジュールP11、前処理モジュールP12、および予測モジュールP13を実行することで、取得部11、前処理部12、および予測部13が実現する。
予測プログラムP1は、例えば、CD−ROM、DVD−ROM、半導体メモリなどの有形の記録媒体に固定的に記録された上で提供されてもよい。あるいは、予測プログラムP1は、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。
[効果]
以上説明したように、本発明の一側面に係る予測システムは、時系列データに対する機械学習を実行することで、将来の時期における現象の予測を示す予測データを生成する予測部を備え、時系列データが、過去の個々の時点における現象を示す複数の測定レコードと、測定レコードに対応付けられたラベルとを含み、ラベルが、第1現象から第2現象への遷移を示す開始ラベルと、第2現象から第1現象への遷移を示す終了ラベルと、第1現象または第2現象の継続を示す継続ラベルとを少なくとも含むラベル群から選択される。
本発明の一側面に係る予測方法は、少なくとも一つのプロセッサを備える予測システムにより実行される予測方法であって、時系列データに対する機械学習を実行することで、将来の時期における現象の予測を示す予測データを生成する予測ステップを含み、時系列データが、過去の個々の時点における現象を示す複数の測定レコードと、測定レコードに対応付けられたラベルとを含み、ラベルが、第1現象から第2現象への遷移を示す開始ラベルと、第2現象から第1現象への遷移を示す終了ラベルと、第1現象または第2現象の継続を示す継続ラベルとを少なくとも含むラベル群から選択される。
本発明の一側面に係る予測プログラムは、時系列データに対する機械学習を実行することで、将来の時期における現象の予測を示す予測データを生成する予測ステップをコンピュータシステムに実行させ、時系列データが、過去の個々の時点における現象を示す複数の測定レコードと、測定レコードに対応付けられたラベルとを含み、ラベルが、第1現象から第2現象への遷移を示す開始ラベルと、第2現象から第1現象への遷移を示す終了ラベルと、第1現象または第2現象の継続を示す継続ラベルとを少なくとも含むラベル群から選択される。
このような側面においては、機械学習への入力として用いられる時系列データに開始ラベル、終了ラベル、または継続ラベルが付与される。このラベル付けにより機械学習において現象の変化が考慮されるので、将来の現象をより精度良く予測することが可能になる。特に、現象の変化の予測の精度を上げることができる。
他の側面に係る予測システムでは、継続ラベルが、第1現象の継続を示す第1継続ラベルと、第2現象の継続を示す第2継続ラベルとを含んでもよい。より詳細なラベル付けにより、将来の現象をより精度良く予測できる。
他の側面に係る予測システムでは、機械学習が、ラベル群に対応する複数のニューラルネットワークを用いる処理であり、予測部が、時系列データから選択された1以上の測定レコードで構成される入力ベクトルで示されるラベルに基づいて、該入力ベクトルを処理する一つのニューラルネットワークを複数のニューラルネットワークから選択してもよい。現象の遷移または継続に応じて複数のニューラルネットワークを用意し、測定データで示される現象に応じてニューラルネットワークを切り替えながら機械学習を行うことで、将来の現象をより精度良く予測できる。
他の側面に係る予測システムでは、時系列データにおいて、開始ラベルが付与された測定レコードの個数の第1比率と、終了ラベルが付与された測定レコードの個数の第2比率とが上がるように、複数の測定レコードの一部に対して複製および間引きの少なくとも一方が実行されることで、時系列データにおける各ラベルの比率が調整され、予測部が、各ラベルの比率が調整された時系列データに対する機械学習を実行してもよい。現象の変化を示すラベルの個数が現象の継続を示すラベルの個数と比べてかなり少ないと、機械学習において現象の変化が適切に捕捉されないために予測の精度が下がる可能性がある。現象の変化を示すラベルの個数と現象の継続を示すラベルの個数との差を小さくするように時系列データにおける各ラベルの比率を調整することで、将来の現象をより精度良く予測できる。
他の側面に係る予測システムでは、将来の第1時期における現象を予測する場合よりも、該第1時期よりも現在から遠い将来の第2時期における現象を予測する場合において、第1比率および第2比率の上昇度が低くなるように、時系列データにおける各ラベルの比率が調整されてもよい。予測の対象となる時期に応じて各ラベルの比率を調整することで、将来の現象をより精度良く予測できる。
他の側面に係る予測システムでは、現象が降水に関し、第1現象が降水のない状態であり、第2現象が降水のある状態であってもよい。この場合には、将来の降水の状況をより精度良く予測することが可能になる。
他の側面に係る予測システムでは、時系列データのデータ項目が感雨および降水強度を含み、予測部が、将来の時期における感雨および降水強度を予測し、該予測された感雨および降水強度に基づいて降水指数を求めてもよい。感雨および降水強度を総合的に考慮した指数を導入することで、人の直感に合うように将来の降水の状況を予測することができる。
[実施例]
以下、実施例に基づいて本発明を具体的に説明するが、本発明はそれらに何ら限定されるものではない。
共通の時系列データに対していくつかの手法で将来の現象を予測し、その結果を比較した。実験では下記の6種類の手法を用いた。
・上記実施形態に相当する深層ニューラルネットワークを用いた深層学習(DNN)
・ランダムフォレスト(RandomForest)
・RBFカーネルを用いたサポートベクターマシン(Support Vector Machine)(SVM(rbf))
・多項式カーネルを用いたサポートベクターマシン(SVM(poly))
・オウム返し法
・k−近傍法
時系列データとして、POTEKA(登録商標)という超高密度気象観測システムから得られる観測値を用いた。観測値は、気温、湿度、海面気圧、現地気圧、感雨、降水量、風向、風速を含み、1分毎に連続して記録されたものである。
図11は上記6種類の手法の精度を示すグラフである。グラフ(a)は、現在からどのくらい先の時点かを示す予測時点(分)と雨に関するスコアとの関係を示す。グラフ(b)は、雨および晴の適中率と雨の捕捉率との関係を示す。ここで、それぞれの値は下記式で得られる。
・適中率=(A+D)/(A+B+C+D)
・雨の捕捉率=A/(A+B)
・スコア=(2*適中率*捕捉率)/(適中率+捕捉率)
変数A〜Dの意味は以下の通りである。
A:予測および実況(正解)の双方が「雨」であった予測の個数。
B:予測が「晴」で実況が「雨」であった予測の個数。
C:予測が「雨」で実況が「晴」であった予測の個数。
D:予測および実況の双方が「晴」であった予測の個数。
[変形例]
以上、本発明をその実施形態および実施例に基づいて詳細に説明した。しかし、本発明は上記の実施形態および実施例に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。
上記実施形態では機械学習として深層学習を用いるが、機械学習の具体的な手法は限定されない。例えば、予測部はパターンマッチング、ランダムフォレスト、サポートベクターマシンなどの他の手法を用いてもよい。深層学習においてラベルの種類に応じて複数のニューラルネットワークを用いることは必須ではない。
時系列データ(複数の測定レコード)に付与するラベルの種類は上記実施形態に限定されず、現象の特性に応じて任意に定めてよい。例えば、第1現象の継続と第2現象の継続とが「継続ラベル」という一つのラベルで示されてもよい。
上記実施形態では前処理部12が正規化と各ラベルの比率の調整とを実行するが、これら2種類の処理のうちの少なくとも一方が省略されてもよい。
上記実施形態では予測システム10が降水を予測するが、上述したように、予測する現象は何ら限定されない。例えば、予測システムは日照、波浪、暴風などの他の気象を予測してもよい。あるいは、予測システムは気象に基づく様々な指数(例えば不快指数)を予測してもよい。あるいは、予測システムは他の自然現象を予測してもよいし、人工物で起こる現象を予測してもよいし、社会現象を予測してもよい。
上記実施形態では予測システム10が取得部11、前処理部(ラベリング部および調整部)12、および予測部13を備えるが、予測システムの構成はこれに限定されない。例えば、予測システムは取得部、ラベリング部、および調整部を備えることなく予測部を備えてもよい。この場合には、予測システムは、過去の個々の時点における現象を示す複数の測定レコードと、該測定レコードに対応付けられ且つ調整されたラベルとを含む時系列データの入力を他のコンピュータシステムから受け付ける。予測部は、受け付けられた時系列データに対する機械学習を実行することで、将来の時期における現象の予測を示す予測データを生成する。上記実施形態と同様に、ラベルは、第1現象から第2現象への遷移を示す開始ラベルと、第2現象から第1現象への遷移を示す終了ラベルと、第1現象または第2現象の継続を示す継続ラベルとを少なくとも含むラベル群から選択される。あるいは、予測システムは取得部およびラベリング部を備えることなく調整部および予測部を備えてもよい。この場合には、予測システムは、過去の個々の時点における現象を示す複数の測定レコードと、該測定レコードに対応付けられ且つ未調整のラベルとを含む時系列データの入力を他のコンピュータシステムから受け付ける。調整部は、上記実施形態での前処理部12と同様に、受け付けられた時系列データにおける各ラベルの比率を調整する。予測部は、その比率が調整された時系列データに対する機械学習を実行することで、将来の時期における現象の予測を示す予測データを生成する。
少なくとも一つのプロセッサにより実行される予測方法の処理手順は上記実施形態での例に限定されない。例えば、上述したステップ(処理)の一部が省略されてもよいし、別の順序で各ステップが実行されてもよい。また、上述したステップのうちの任意の2以上のステップが組み合わされてもよいし、ステップの一部が修正又は削除されてもよい。あるいは、上記の各ステップに加えて他のステップが実行されてもよい。
予測システム内で二つの数値の大小関係を比較する際には、「以上」および「よりも大きい」という二つの基準のどちらを用いてもよく、「以下」および「未満」という二つの基準のうちのどちらを用いてもよい。このような基準の選択は、二つの数値の大小関係を比較する処理についての技術的意義を変更するものではない。
本発明の一側面によれば、将来の現象をより精度良く予測することができる。
10 予測システム
11 取得部
12 前処理部(ラベリング部、調整部)
13 予測部
20 データベース
30、41〜44 ニューラルネットワーク
P1 予測プログラム
P10 メインモジュール
P11 取得モジュール
P12 前処理モジュール
P13 予測モジュール

Claims (9)

  1. 時系列データに対する機械学習を実行することで、将来の時期における現象の予測を示す予測データを生成する予測部を備え、
    前記時系列データが、過去の個々の時点における現象を示す複数の測定レコードと、前記測定レコードに対応付けられたラベルとを含み、
    前記ラベルが、第1現象から第2現象への遷移を示す開始ラベルと、前記第2現象から前記第1現象への遷移を示す終了ラベルと、前記第1現象または前記第2現象の継続を示す継続ラベルとを少なくとも含むラベル群から選択される、
    予測システム。
  2. 前記継続ラベルが、前記第1現象の継続を示す第1継続ラベルと、前記第2現象の継続を示す第2継続ラベルとを含む、
    請求項1に記載の予測システム。
  3. 前記機械学習が、前記ラベル群に対応する複数のニューラルネットワークを用いる処理であり、
    前記予測部が、前記時系列データから選択された1以上の前記測定レコードで構成される入力ベクトルで示されるラベルに基づいて、該入力ベクトルを処理する一つのニューラルネットワークを前記複数のニューラルネットワークから選択する、
    請求項1または2に記載の予測システム。
  4. 前記時系列データにおいて、前記開始ラベルが付与された前記測定レコードの個数の第1比率と、前記終了ラベルが付与された前記測定レコードの個数の第2比率とが上がるように、前記複数の測定レコードの一部に対して複製および間引きの少なくとも一方が実行されることで、前記時系列データにおける各ラベルの比率が調整され、
    前記予測部が、各ラベルの比率が調整された前記時系列データに対する前記機械学習を実行する、
    請求項1〜3のいずれか一項に記載の予測システム。
  5. 将来の第1時期における現象を予測する場合よりも、該第1時期よりも現在から遠い将来の第2時期における現象を予測する場合において、前記第1比率および前記第2比率の上昇度が低くなるように、前記時系列データにおける各ラベルの比率が調整される、
    請求項4に記載の予測システム。
  6. 前記現象が降水に関し、前記第1現象が降水のない状態であり、前記第2現象が降水のある状態である、
    請求項1〜5のいずれか一項に記載の予測システム。
  7. 前記時系列データのデータ項目が感雨および降水強度を含み、
    前記予測部が、前記将来の時期における前記感雨および前記降水強度を予測し、該予測された感雨および降水強度に基づいて降水指数を求める、
    請求項6に記載の予測システム。
  8. 少なくとも一つのプロセッサを備える予測システムにより実行される予測方法であって、
    時系列データに対する機械学習を実行することで、将来の時期における現象の予測を示す予測データを生成する予測ステップを含み、
    前記時系列データが、過去の個々の時点における現象を示す複数の測定レコードと、前記測定レコードに対応付けられたラベルとを含み、
    前記ラベルが、第1現象から第2現象への遷移を示す開始ラベルと、前記第2現象から前記第1現象への遷移を示す終了ラベルと、前記第1現象または前記第2現象の継続を示す継続ラベルとを少なくとも含むラベル群から選択される、
    予測方法。
  9. 時系列データに対する機械学習を実行することで、将来の時期における現象の予測を示す予測データを生成する予測ステップをコンピュータシステムに実行させ、
    前記時系列データが、過去の個々の時点における現象を示す複数の測定レコードと、前記測定レコードに対応付けられたラベルとを含み、
    前記ラベルが、第1現象から第2現象への遷移を示す開始ラベルと、前記第2現象から前記第1現象への遷移を示す終了ラベルと、前記第1現象または前記第2現象の継続を示す継続ラベルとを少なくとも含むラベル群から選択される、
    予測プログラム。
JP2017237711A 2017-12-12 2017-12-12 予測システム、予測方法、および予測プログラム Pending JP2019105979A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017237711A JP2019105979A (ja) 2017-12-12 2017-12-12 予測システム、予測方法、および予測プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017237711A JP2019105979A (ja) 2017-12-12 2017-12-12 予測システム、予測方法、および予測プログラム

Publications (1)

Publication Number Publication Date
JP2019105979A true JP2019105979A (ja) 2019-06-27

Family

ID=67062014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017237711A Pending JP2019105979A (ja) 2017-12-12 2017-12-12 予測システム、予測方法、および予測プログラム

Country Status (1)

Country Link
JP (1) JP2019105979A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021044475A1 (ja) * 2019-09-02 2021-03-11 アイマトリックスホールディングス株式会社 文章解析システムおよびこれを用いたメッセージ交換における特徴評価システム
WO2021095822A1 (ja) * 2019-11-12 2021-05-20 株式会社Ihi プラント運転予測装置
CN114046179A (zh) * 2021-09-15 2022-02-15 山东省计算中心(国家超级计算济南中心) 一种基于co监测数据智能识别和预测井下安全事故的方法
WO2023162482A1 (ja) * 2022-02-25 2023-08-31 株式会社天地人 降水予測システム、降水予測方法、プログラム、基地局選択システム及び基地局選択方法
CN118033786A (zh) * 2024-04-15 2024-05-14 江西省水利科学院(江西省大坝安全管理中心、江西省水资源管理中心) 一种预测山区城市暴雨强度的方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021044475A1 (ja) * 2019-09-02 2021-03-11 アイマトリックスホールディングス株式会社 文章解析システムおよびこれを用いたメッセージ交換における特徴評価システム
JPWO2021044475A1 (ja) * 2019-09-02 2021-09-27 アイマトリックスホールディングス株式会社 文章解析システムおよびこれを用いたメッセージ交換における特徴評価システム
JP7007693B2 (ja) 2019-09-02 2022-01-25 アイマトリックスホールディングス株式会社 文章解析システムおよびこれを用いたメッセージ交換における特徴評価システム
CN114341822A (zh) * 2019-09-02 2022-04-12 艾梅崔克斯持株公司株式会社 文章解析系统及使用其的消息交换的特征评价系统
WO2021095822A1 (ja) * 2019-11-12 2021-05-20 株式会社Ihi プラント運転予測装置
CN114046179A (zh) * 2021-09-15 2022-02-15 山东省计算中心(国家超级计算济南中心) 一种基于co监测数据智能识别和预测井下安全事故的方法
CN114046179B (zh) * 2021-09-15 2023-09-22 山东省计算中心(国家超级计算济南中心) 一种基于co监测数据智能识别和预测井下安全事故的方法
WO2023162482A1 (ja) * 2022-02-25 2023-08-31 株式会社天地人 降水予測システム、降水予測方法、プログラム、基地局選択システム及び基地局選択方法
CN118033786A (zh) * 2024-04-15 2024-05-14 江西省水利科学院(江西省大坝安全管理中心、江西省水资源管理中心) 一种预测山区城市暴雨强度的方法

Similar Documents

Publication Publication Date Title
JP2019105979A (ja) 予測システム、予測方法、および予測プログラム
Velasco et al. Week-ahead rainfall forecasting using multilayer perceptron neural network
JP2009225550A (ja) 電力の需要予測処理方法及び装置、並びに発電予測処理方法
Vuyyuru et al. A novel weather prediction model using a hybrid mechanism based on MLP and VAE with fire-fly optimization algorithm
Suryo et al. Improved time series prediction using LSTM neural network for smart agriculture application
Ferrarini et al. Improving niche projections of plant species under climate change: Silene acaulis on the British Isles as a case study
Jalaee et al. A novel hybrid method based on Cuckoo optimization algorithm and artificial neural network to forecast world's carbon dioxide emission
Hudnurkar et al. Binary classification of rainfall time-series using machine learning algorithms
Moriondo et al. Reproduction of olive tree habitat suitability for global change impact assessment
Pai et al. Long range forecast on south west monsoon rainfall using artificial neural networks based on clustering approach
CN113033910A (zh) 一种光伏发电功率的预测方法、存储介质及终端设备
Sahu et al. Forecasting of Precipitation in India by Different Data Types using Investigation of Radial Basis Function Neural Network Model
San Pedro et al. A case-based fuzzy multicriteria decision support model for tropical cyclone forecasting
Naik et al. Rainfall prediction based on deep neural network: a review
CN114897204A (zh) 一种海上风电场短期风速预测方法和装置
Yaseen et al. Artificial intelligence based flood forecasting for River Hunza at Danyor Station in Pakistan
de Lima et al. Rainfall prediction for Manaus, Amazonas with artificial neural networks
Perera et al. Comparison of Multiple Linear Regression and Artificial Neural Network Models for the Prediction of Solid Waste Generation in Sri Lanka.
Matías et al. Functional support vector machines and generalized linear models for glacier geomorphology analysis
Qureshi et al. Heat Stress Modeling Using Neural Networks Technique
Khudhur et al. Comparative Evaluation for Humidity Forecasting Using Deep Learning
CN114741976B (zh) 一种位移预测方法、装置、设备及可读存储介质
Duong et al. Application of Machine Learning to Forecast Drought Index for the Mekong Delta
Prathibha et al. Rainfall Prediction Using Machine Learning
da Cunha Mariano Weather AI