JP2019197323A - 予測システムおよび予測方法 - Google Patents

予測システムおよび予測方法 Download PDF

Info

Publication number
JP2019197323A
JP2019197323A JP2018090085A JP2018090085A JP2019197323A JP 2019197323 A JP2019197323 A JP 2019197323A JP 2018090085 A JP2018090085 A JP 2018090085A JP 2018090085 A JP2018090085 A JP 2018090085A JP 2019197323 A JP2019197323 A JP 2019197323A
Authority
JP
Japan
Prior art keywords
prediction
probability
feature
feature amount
solar flare
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018090085A
Other languages
English (en)
Other versions
JP7199075B2 (ja
Inventor
孔明 杉浦
Komei Sugiura
孔明 杉浦
直人 西塚
Naoto Nishizuka
直人 西塚
恒 河井
Hisashi Kawai
恒 河井
石井守
Mamoru Ishii
守 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Information and Communications Technology
Original Assignee
National Institute of Information and Communications Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Information and Communications Technology filed Critical National Institute of Information and Communications Technology
Priority to JP2018090085A priority Critical patent/JP7199075B2/ja
Publication of JP2019197323A publication Critical patent/JP2019197323A/ja
Application granted granted Critical
Publication of JP7199075B2 publication Critical patent/JP7199075B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】宇宙空間に生じる現象の発生メカニズムの解明にも利用可能な予測モデルを用いた予測システムが提供される。【解決手段】予測システムは、宇宙空間に由来する時系列の観測データを取得する取得部と、観測データのうち予測タイミングより前のデータ要素に基づいて複数の特徴量を算出する特徴量算出部と、特徴量算出部により算出された複数の特徴量を予測モデルに与えることで、予測タイミングに引き続く所定長さの予測期間内において、1または複数の事象の各々が発生する確率を算出する推定部とを含む。【選択図】図1

Description

本技術は、宇宙空間に生じる現象を予測するための予測システムおよび予測方法に関する。
宇宙空間で生じる様々な現象の解析および予測は、観測できる情報が限られていることもあり容易ではない。宇宙空間で生じる様々な現象の一つとして、従来から、太陽の活動、特に太陽で生じる爆発現象(一般的に「太陽フレア」、あるいは単に「フレア」と称される。)の観測および予測が続けられている。大規模な太陽フレアが発生すると、高エネルギー粒子の放出、フレアX線放射、太陽風じょう乱などが生じる。この結果、衛星障害、衛星測位の障害、短波通信の障害、航空機の経路変更、送電設備のトラブルといった社会影響が生じ得る。そのため、太陽フレアの発生を予測して、不慮の事態に備える体制が整えられている。
このような太陽フレアの発生を予測する手法として、例えば、非特許文献1には、太陽の観測画像をニューラルネットワークの一つであるCNN(Convolutional Neural Network)に入力して、太陽フレアの発生確率をクラス(規模)毎に算出する方法が開示されている。
Xin Huang, Huaning Wang, Long Xu, Jinfu Liu, Rong Li, and Xinghua Dai, "Deep Learning Based Solar Flare Forecasting Model. I. Results for Line-of-sight Magnetograms," The American Astronomical Society, The Astrophysical Journal, 856:7(11pp), 2018 March 20 N. Nishizuka, K. Sugiura, Y. Kubo, M. Den, S. Watari, M. Ishii, "Solar Flare Prediction Model with Three Machine-learning Algorithms using Ultraviolet Brightening and Vector Magnetograms," The Astrophysical Journal, 835:156(10pp), 2017 February 1
非特許文献1に開示される手法によれば、ラベル付けされた観測画像をCNNに与えることで予測モデルが構築される。このような画像ベースの手法で構築された予測モデルが良好な予測精度を示したとしても、太陽フレアの発生を予測するために、観測画像中に現れるどのような現象に着目すればよいのかといった科学的知見を得ることは難しい。すなわち、太陽フレアの発生確率を単に予測できるだけではなく、太陽フレアの発生メカニズムを解明するための何らかのフィードバックが得られるような予測モデルが好ましい。
本技術は、宇宙空間に生じる現象の発生メカニズムの解明にも利用可能な予測モデルを用いた予測システムを提供することを目的としている。
本発明のある局面によれば、宇宙空間に生じる現象を予測するための予測システムが提供される。予測システムは、宇宙空間に由来する時系列の観測データを取得する取得部と、観測データのうち予測タイミングより前のデータ要素に基づいて複数の特徴量を算出する特徴量算出部と、特徴量算出部により算出された複数の特徴量を予測モデルに与えることで、予測タイミングに引き続く所定長さの予測期間内において、1または複数の事象の各々が発生する確率を算出する推定部とを含む。
複数の特徴量は、予測タイミングの直前の所定期間内において観測されたデータ要素に基づいて算出される特徴量を含むようにしてもよい。
推定部は、予測期間内において第1の事象が発生する第1の確率と、予測期間内において第1の事象が発生しない第2の確率とを算出するようにしてもよい。
推定部は、複数の事象の各々が発生する確率を算出するとともに、算出された確率が最大となる事象を予測結果として出力するようにしてもよい。
予測モデルは、直列に接続された複数の線形結合層と、複数の線形結合層のうち第1の線形結合層の入力と第1の線形結合層とは異なる第2の線形結合層の出力とを結合するスキップ経路とを含むようにしてもよい。
1または複数の事象は、所定クラス以上の太陽フレアが発生する確率を含むようにしてもよい。
特徴量算出部は、太陽の活動領域を検出および時間的にトラッキングする手段と、トラッキングされる活動領域において生じた太陽フレアのクラスを取得する手段と、所定の算出周期毎に、複数の特徴量を算出するとともに、当該算出した複数の特徴量に、複数の特徴量の算出タイミングに引き続く予測期間内において生じた太陽フレアの最大のクラスを示すラベルを付与して、トレーニングサンプルを生成する手段とを含むようにしてもよい。予測システムは、トレーニングサンプルを用いた教師有り学習により予測モデルを規定するネットワークパラメータを最適化する学習部をさらに含んでいてもよい。
予測システムは、予測モデルの予測精度への各特徴量の影響度を算出する影響度算出部をさらに含んでいてもよい。
本発明の別の局面によれば、宇宙空間に生じる現象を予測するための予測方法が提供される。予測方法は、宇宙空間に由来する時系列の観測データを取得するステップと、観測データのうち予測タイミングより前のデータ要素に基づいて複数の特徴量を算出するステップと、算出された複数の特徴量を予測モデルに与えることで、予測タイミングに引き続く所定長さの予測期間内において、1または複数の事象の各々が発生する確率を算出するステップとを含む。
本発明のさらに別の局面によれば、太陽フレアが発生する確率を推定するように、コンピュータを機能させるための学習済モデルが提供される。学習済モデルは、太陽の活動領域を検出および時間的にトラッキングするステップと、トラッキングされる活動領域において生じた太陽フレアのクラスを取得するステップと、所定の算出周期毎に、複数の特徴量を算出するとともに、当該算出した複数の特徴量に、複数の特徴量の算出タイミングに引き続く予測期間内において生じた太陽フレアの最大のクラスを示すラベルを付与して、トレーニングサンプルを生成するステップと、トレーニングサンプルを用いた教師有り学習により予測モデルを規定するネットワークパラメータを最適化するステップとにより生成される。
本技術によれば、宇宙空間に生じる現象の発生メカニズムの解明にも利用可能な予測モデルを用いた予測システムを実現できる。
本実施の形態に従う予測システムの概略構成を示す模式図である。 本実施の形態に従う予測システムによる太陽フレアの発生確率を算出する時間的関係を説明するための図である。 本実施の形態に従う予測システムにおいて用いられる観測画像および検出された活動領域の一例を示す図である。 本実施の形態に従う予測システムによる教師ラベルの付与およびトレーニングサンプルの生成処理を説明するための図である。 本実施の形態に従う予測システムが採用する予測モデルのネットワークの一例を示す模式図である。 図5に示すニューラルネットワークの一例を示す模式図である。 本実施の形態に従う予測装置を実現するためのハードウェア構成の一例を示す模式図である。 本実施の形態に従う予測システムの学習フェーズに係る処理手順を示すフローチャートである。 本実施の形態に従う予測システムの運用フェーズに係る処理手順を示すフローチャートである。 本実施の形態に従う予測システムが提供する予測結果の出力例を示す図である。 本実施の形態に従う予測システムにおいて特徴量の重要度の評価手順を説明するための模式図である。
本発明の実施の形態について、図面を参照しながら詳細に説明する。なお、図中の同一または相当部分については、同一符号を付してその説明は繰返さない。
[A.予測システムのアプリケーション例]
本実施の形態に従う予測システム1は、宇宙空間に由来する時系列の観測データに基づいて、宇宙空間に生じる1または複数の現象を予測する。1または複数の現象の予測は、各現象の発生確率を算出することを含む。
以下の説明においては、このような宇宙空間に生じる現象の一例として、太陽フレアの発生確率を予測するアプリケーションについて例示する。より具体的には、予測システム1が予測する1または複数の事象としては、所定クラス以上の太陽フレアが発生する確率を含む。
図1は、本実施の形態に従う予測システム1の概略構成を示す模式図である。図1を参照して、予測システム1は、太陽2で生じる爆発現象である太陽フレアの発生確率を事前に予測する。
予測システム1は、宇宙空間に由来する時系列の観測データを取得する機能を有している。より具体的には、予測システム1は、太陽2を観測する構成として、地上観測施設4を利用可能になっている。地上観測施設4は、光学望遠鏡6、および/または、電波へリオグラフ、太陽電波強度偏頗計、ミリ波電波望遠鏡、ミリ波干渉計などの電波望遠鏡7と、観測装置8とを含む。
観測装置8は、光学望遠鏡6および/または電波望遠鏡7により観測された信号に基づいて時系列の観測データを出力する。複数の地上観測施設4から観測データを収集するようにしてもよいし、単一の地上観測施設4に複数の光学望遠鏡6および/または電波望遠鏡7を配置するようにしてもよい。
予測システム1は、さらに、観測用衛星10と、地上受信施設12とをさらに利用可能であってもよい。観測用衛星10は、宇宙空間において太陽2から放射される各種電磁波や粒子を観測し、その観測結果を地上受信施設12に送信する。地上受信施設12は、通信用アンテナ14と、通信装置16とを含む。通信装置16は、通信用アンテナ14により受信された電波を信号処理して観測データを出力する。
観測装置8および/または通信装置16から出力される観測データは、観測データ収集装置18に蓄積される。観測データ収集装置18は、要求に応じて、蓄積している観測データを出力する。
予測システム1における宇宙空間に由来する時系列の観測データを取得する機能は、観測施設および観測装置を現実に有している必要はなく、利用可能な観測施設および観測装置から時系列の観測データを取得(典型的には、ダウンロードなど)するための任意の手段を含む。
予測システム1は、特徴量算出部30および推定器40を含む予測装置20を有している。
特徴量算出部30は、観測データ収集装置18からの観測データに基づいて、太陽フレアの発生確率の算出に用いられる互いに異なる複数の特徴量を算出する。予測時においては、特徴量算出部30は、観測データのうち予測タイミングより前のデータ要素に基づいて複数の特徴量を算出することになる。
推定器40は、後述するようにDNN(Deep Neural Network:深層ニューラルネットワーク)を利用した予測モデルを有しており、特徴量算出部30により算出されるそれぞれの特徴量を要素とする特徴量ベクトルが入力されると、太陽フレアの発生確率を算出する。より具体的には、推定器40は、特徴量算出部30により算出された複数の特徴量を予測モデルに与えることで、予測タイミングに引き続く所定長さの予測期間内において、1または複数の事象の各々(所定クラス以上の太陽フレア)が発生する確率を算出する。
図2は、本実施の形態に従う予測システム1による太陽フレアの発生確率を算出する時間的関係を説明するための図である。図2を参照して、任意の時間に推定処理を実施したとする。この推定処理を実施したタイミングから予め定められた期間だけ先までの間(予測期間)において、太陽フレアが発生する確率が算出される。既存の太陽フレア観測の運用に倣って、本実施の形態に従う予測システム1においては、太陽フレアの規模(クラス)別に発生確率を算出する。
例えば、太陽フレアの規模の指標として、X線等級を用いると、放射されるX線強度の最大値によって、低い方からA,B,C,M,Xの計5つのクラスが規定されている。実用上、X,M,Cクラスの太陽フレアの発生確率が重要であり、特に、発生頻度が相対的に高いMクラスおよびCクラスに注目されることが多い。
なお、本実施の形態に従う予測システム1が出力する発生確率は、例えば、Mクラス以上の太陽フレアが発生する確率およびCクラス以上の太陽フレアが発生する確率をそれぞれ算出するようにしてもよい。さらに、太陽フレアの規模(クラス)の指標としては、X線等級に代えて、Hα等級あるいはRスケールなどを用いてもよい。
推定処理においては、当該推定処理を実施した時刻の直前の観測データから算出された複数の特徴量が用いられる。特徴量算出部30(図1)により算出される特徴量は、予測タイミングの直前の所定期間内において観測されたデータ要素に基づいて算出される特徴量を含む。
各特徴量の算出に用いられる観測データの観測期間などは任意に決定される。予測精度を高めるためには、特徴量の算出に用いられる観測データの種類、算出される特徴量の内容、および特徴量の算出に用いられる観測データの期間などを多様化することが好ましい。
[B.特徴量]
本実施の形態に従う予測モデルにおいては、上述の先行技術とは異なり、観測データから算出された複数の特徴量を用いて、太陽フレアの発生確率を予測する。まず、特徴量の算出方法などについて説明する。
(b1:概要)
太陽フレアの観測の歴史は古く、かつ、世界各国において観測設備が整えられている。本願発明者らは、アメリカ航空宇宙局(NASA:National Aeronautics and Space Administration)が管理する太陽観測衛星であるSDO(Solar Dynamics Observatory)、および、アメリカ海洋大気庁(NOAA:National Oceanic and Atmospheric Administration)が管理する気象衛星であるGOES(Geostationary Operational Environmental Satellite)により収集された観測データを利用した。
様々な観測データが収集されているが、本実施の形態においては、(1)視線方向磁場画像(line-of-sight magnetogram)、(2)ベクトル磁場画像(vector magnetogram)、(3)1600Åフィルター処理がなされたEUV高温コロナ発光画像(hot coronal brightening)画像、(4)131Åフィルター処理がなされたEUV高温コロナ発光画像、(5)軟X線放射強度曲線(the light curves of the soft X-ray emission)などを用いた。
なお、視線方向磁場画像は、SDOに搭載されたHMI(Helioseismic and Magnetic Imager)により観測される。また、光球上部のUV連続光は、SDOに搭載されたAIA(Atmospheric Imaging Assembly)の1600Åフィルター処理結果により得られる。太陽フレアが生じている領域のEUV高温コロナ発光画像は、SDOによる131Åフィルター処理結果により得られる。1−8Åの範囲に亘るX線放射の全面積分値はGOESにより観測される。
視線方向磁場画像の観測周期は45秒であり、ベクトル磁場画像の観測周期は12分であり、1600Åフィルター処理画像および131Åフィルター処理画像の観測周期はいずれも12秒であり、GOESの観測周期は1分以下である。このような観測周期で生じるデータサイズなどを考慮して、本実施の形態に従う予測システム1においては、1時間周期で特徴量の算出および予測が可能に構成されている。
予測システム1においては、視線方向磁場の全面画像(full-disk images)から活動領域(active regions:以下「AR」または「ARs」とも標記される。)が検出され、各活動領域は時間経過に沿ってトラッキングされる。
各活動領域について、複数波長による観測結果から特徴量が算出されるとともに、対象の画像が観測された時間から24時間以内にX,M,Cのいずれかのクラスの太陽フレアが発生している場合には、当該算出された特徴量にその発生した太陽フレアのクラスを示すラベルが付与されて、データベースに格納される。
このようにラベル付けされた特徴量をトレーニングサンプルとして、DNNによる教師有り学習を実行する。すなわち、本実施の形態に従う予測システム1において用いられる予測モデルは、教師有り学習により生成される学習済みモデルに相当する。
本実施の形態における教師有り学習では、1時間毎に、次に続く24時間以内に生じ得る太陽フレアの最大のクラスを予測するというタスクを学習する。今回利用した観測データの観測周期などの都合上、1時間毎に特徴量が算出されることになっており、これに応じて、教師有り学習の周期も決定されている。
なお、各トレーニングサンプルにおいて、対応する観測データが欠落している場合には、直近の30分以内に存在する過去の観測データが探索され、それも欠落している場合には、当該周期の学習処理はスキップされる。
本願発明者らは、2010年6月から2015年12月までにSDO(2010年2月より運用開始)によって取得された観測データを利用した。この期間内において、Xクラスの太陽フレアが26回、Mクラスの太陽フレアが383回、Cクラスの太陽フレアが4054回観測されている。これらの太陽面上において観測された太陽フレアは、当該期間内に発生した全太陽フレアの約90%に相当する。
(b2:活動領域の検出)
まず、取得された観測画像から特徴量を算出するための活動領域(AR)が検出される。すなわち、特徴量算出部30は、太陽の活動領域を検出および時間的にトラッキングする。典型的には、視線方向磁場の全面画像から活動領域が検出されてもよい。視線方向磁場画像は、ベクトル磁場画像に比較してノイズが少なく、活動領域の検出処理をより正確に実行できる。
活動領域の検出は、例えば、各視線方向磁場画像において、予め定められたしきい値(例えば、140G(ガウス))以上の領域を探索および抽出することで実現できる。そして、検出された活動領域のフレーム内の座標位置が他の画像(すなわち、異なる波長で観測された画像)にも適用される。なお、光球面画像(photospheric images)において天体の外縁に検出された活動領域については、無効なものとして特徴量の算出対象から除外するようにしてもよい。検出された活動領域をトラッキングするにあたって、ユニークな識別番号を付与するようにしてもよい。より具体的な活動領域の検出方法については、非特許文献2などを参照のこと。
図3は、本実施の形態に従う予測システム1において用いられる観測画像および検出された活動領域の一例を示す図である。図3(a)には、SDOに搭載されたHMIにより観測された白色光強度(while light intensity)の全面画像の一例を示す。図3(a)には、4箇所の活動領域が検出されている。図3(b)には、SDOに搭載されたHMIにより観測された視線方向磁場の全面画像の一例を示す。図3(c)には、SDOに搭載されたAIAにより観測され1600Åフィルター処理がなされたUV連続光の全面画像の一例を示す。図3(d)には、SDOに搭載されたAIAにより観測され131Åフィルター処理がなされた高温コロナ発光の全面画像の一例を示す。
なお、図3(a)〜(d)の各画像に設定された活動領域AR1においては、図3(a)〜(d)の各画像が観測された時点から3時間後にX5.4クラスの太陽フレアが生じている。
(b3:活動領域についての特徴量算出)
本実施の形態に従う予測システム1においては、視線方向磁場画像、ベクトル磁場画像、1600Åフィルター処理がなされたEUV高温コロナ発光画像、および、GOESにより収集された1−8Åの範囲のX線データから必要な特徴量が算出される。
さらに、10K以上の温度で放出される20価の鉄イオン(FeXX)および23価の鉄イオン(FeXXIII)の輝線発光を示す、131Åフィルター処理がなされたEUV高温コロナ発光画像(SDOに搭載されたAIAにより観測される)を用いた特徴量を算出してもよい。
実用上の予測を想定すると、131Åフィルター処理がなされたEUV高温コロナ発光画像、および、GOESにより収集されたX線データの直前1時間前および直前2時間前の画像も特徴量として採用してもよい。
また、131Åフィルター処理がなされたEUV高温コロナ発光画像における各活動領域における最大強度を特徴量として採用してもよい。
より具体的には、本書の最後に付録として添付した79次元(79種類)の特徴量を用いる。なお、各特徴量は、検出された活動領域(AR)の各々について算出される。
本実施の形態に従う予測システム1においては、各特徴量を要素とする特徴量ベクトルを生成して、予測モデルに入力することで、対象の活動領域における太陽フレアの発生確率が推定される。
なお、上述した特徴量のすべてを含む特徴量ベクトルを必ずしも生成する必要はなく、その一部およびその時系列を用いるようにしてもよい。
(b4:特徴量へのラベル付与およびトレーニングサンプルの生成)
次に、所定周期毎に算出される特徴量(特徴量ベクトル)に対する教師ラベルの付与およびトレーニングサンプルの生成について説明する。
図4は、本実施の形態に従う予測システム1による教師ラベルの付与およびトレーニングサンプルの生成処理を説明するための図である。図4を参照して、上述したような複数の特徴量は、所定の算出周期(例えば、1時間)毎に算出される。特徴量の算出タイミングに引き続く所定期間(例えば、24時間)(予測期間に相当)内に生じた太陽フレアのうち最も大きなクラスを当該特徴量の教師ラベルとして設定する。
従って、例えば、時刻tにおいて特徴量群(特徴量ベクトル)が算出されると、当該時刻tに引き続く予測期間内に生じた太陽フレアのうち最も大きなクラスが教師ラベルとして決定される。
その結果、任意の活動領域ARについての時刻tのトレーニングサンプルとして、{AR(t):教師ラベル|特徴量1,特徴量2,特徴量3,・・・}が生成される。活動領域毎に、トラッキング可能な時間期間に亘って、所定周期毎にトレーニングサンプルが順次生成される。このように、特徴量算出部30は、トラッキングされる活動領域において生じた太陽フレアのクラスを取得する。そして、特徴量算出部30は、所定の算出周期毎に、複数の特徴量を算出するとともに、当該算出した複数の特徴量に、複数の特徴量の算出タイミングに引き続く予測期間内において生じた太陽フレアの最大のクラスを示すラベルを付与して、トレーニングサンプルを生成する。
これらのトレーニングサンプルを用いて、予測モデルを学習することになる。すなわち、本実施の形態に従う予測システム1は、トレーニングサンプルを用いた教師有り学習により予測モデルを規定するネットワークパラメータを最適化する。
[C.予測モデル]
次に、本実施の形態に従う予測システム1が採用する予測モデル400について説明する。
図5は、本実施の形態に従う予測システム1が採用する予測モデル400のネットワークの一例を示す模式図である。図5に示す予測モデル400は、DNNに分類されるネットワークであり、推定器40内に実装される。予測モデル400は、複数の層を有しており、入力には観測データから算出される特徴量ベクトル(本実施の形態においては、79次元の規格化された特徴量)が与えられ、クラス毎の太陽フレアの発生確率が出力される。
図5には、予測モデル400における入力から出力までのマップが示されている。予測モデル400は、線形結合および活性化関数(通常は、非線形)を含む、複数のニューラルネットワークの層を含む。より具体的には、予測モデル400は、線形結合層411,412,413,414,415,416と、非線形結合層417とを含む。
図6は、図5に示すニューラルネットワークの一例を示す模式図である。図6(a)には、線形結合層411,412,413,414,415,416のネットワークの一例を示し、図6(b)には、非線形結合層417のネットワークの一例を示す。
図6(a)には、最も単純なネットワークとして、入力層442と出力層444との間に1つの隠れ層443が配置された構成例を示す。入力層442には特徴量を示す入力ベクトル441が与えられ、出力層444からは線型結合された結果である出力ベクトル445が出力される。
基本的には、入力層442に含まれる各ノードと隠れ層443に含まれる各ノードとは相互に結合している。入力層442の各ノードと隠れ層443の各ノードとの間の結合に付与される重み係数の集合である重み係数ベクトル446が学習により決定される。同様に、隠れ層443に含まれる各ノードと出力層444に含まれる各ノードとは相互に結合している。隠れ層443の各ノードと出力層444の各ノードとの間の結合に付与される重み係数の集合である重み係数ベクトル447が学習により決定される。
必要に応じて、隠れ層443の各ノードに付加されるバイアスの集合であるバイアスベクトル448、および、出力層444の各ノードに付加されるバイアスの集合であるバイアスベクトル449が設定される。
図6(a)に示すようなネットワークを用いることで、入力ベクトル441から出力ベクトル445までの間は、重み係数ベクトル446,447およびバイアスベクトル448,449で規定される1次の線形結合となる。すなわち、図6(a)に示すネットワークは、入力データ群を線形変換する集合であり、入力ベクトルxと出力ベクトルyとの間は、重み係数ベクトルW(図6(a)に示す重み係数ベクトルW1,W2をまとめたもの)と、バイアスベクトルb(図6(a)に示すバイアスベクトルb1,b2をまとめたもの)とを用いて、以下のようなアフィン変換の形で表すことができる。
y=f(x;W,b)=f(Wx+b)
図6(b)には、図6(a)に示すネットワークに加えて、活性化関数としての正規化線形関数(rectified linear unit;以下「ReLU関数」とも称す。)451と、Softmax関数452とがさらに付加されているネットワークを示す。ReLU関数451は、非線形の活性化関数に従って、各ノードに入力される特徴量を後段に伝達する。より具体的には、ReLU関数451は、入力ベクトルxに対して、以下のような値を出力する。
ReLU(x)=log(1+exp(x))≒max(x,0)
Softmax関数452は、ReLU関数451から出力される特徴ベクトルについての確率を正規化してクラス毎の確率を推定する。
なお、図6(a)および図6(b)に示すネットワークは一例であり、線形結合層411,412,413,414,415,416および非線形結合層417の各々において、入力層のノード数、出力層のノード数、隠れ層の層数などは適宜決定すればよい。また、活性化関数についても、ReLU関数およびSoftmax関数に限定されず、任意の活性化関数を用いることができる。
再度図5を参照して、予測モデル400は、太陽フレアの発生確率p(y)を出力する。本実施の形態においては、推定器40は、予測モデル400を用いて、予測期間内において第1の事象が発生する第1の確率と、予測期間内において第1の事象が発生しない第2の確率との2種類の確率を少なくとも算出する。
一例として、Mクラス以上(あるいは、Cクラス以上)の太陽フレアの発生確率に着目している。ここで、yは太陽フレアのクラスを示すベクトルであり、y=(y,y)として定義される。(y,y)=(0,1)であるときには、Mクラス以上(あるいは、Cクラス以上)の太陽フレアが発生するとの事象を示し、(y,y)=(1,0)であるときには、Mクラス未満(あるいは、Cクラス未満)の太陽フレアが発生する、あるいは、太陽フレアが発生しないとの事象を示すものとする。
後述する予測性能評価においては、Mクラス以上(あるいは、Cクラス以上)の太陽フレアが発生するとの事象の発生確率と、Mクラス(あるいは、Cクラス以上)未満の太陽フレアが発生する、あるいは、太陽フレアが発生しないとの事象の発生確率とをそれぞれ推定し、その推定された発生確率のうち値の大きな方を最終結果として採用した。
予測モデル400において、各層の間には、バッチ正規化処理(Batch Normalization:「BN」とも標記される。)421,422,423,424,425,426が実施される。バッチ正規化処理は、各層の入力パラメータを正規化することで、学習を安定化させるとともに、予測精度を高める。
入力ベクトルx={x,x,・・・,x}に対するバッチ正規化処理からの出力ベクトルy={y,y,・・・,y}は以下の(1A)および(1B)式のように表すことができる。
ここで、μはミニバッチの平均値を示し、σはミニバッチの分散を示す。ミニバッチとは、1回のフォワード/バックワード経路におけるトレーニングサンプルの数に相当する。ミニバッチは、バッチ正規化処理によって実際に正規化される。式中のγおよびβは、重み係数と同様の方法で最適化される。εは、ゼロ除算が発生するのを防止するための任意の値を示し、添え字iは隠れ層のノードインデックスを示す。
さらに、図5に示す予測モデル400においては、層数を増大させるために、比較的簡素なスキップコネクションを導入している。すなわち、予測モデル400は、直列に接続された複数の線形結合層と、複数の線形結合層のうち第1の線形結合層の入力と第1の線形結合層とは異なる第2の線形結合層の出力とを結合するスキップ経路とを含む。このスキップコネクションは、予測モデルの予測精度を高めるとともに、層数が大きくなることによる勾配の消失または発散を防止するように機能する。
より具体的には、予測モデル400は、2つのスキップコネクションを有している。第1のスキップコネクションは、線形結合層411の入力側から線形結合層412の出力側に繋がるスキップ経路431と、スキップ経路431を線形結合層412の出力側に結合するための加算器432とからなる。第2のスキップコネクションは、線形結合層413の入力側から線形結合層415の出力側に繋がるスキップ経路433と、スキップ経路433を線形結合層415の出力側に結合するための加算器434とからなる。
一般的には、層数が増大しすぎるとモデル精度は低下する。この課題を解決するために、スキップコネクションを用いて各層の残差関数を学習させることで、ネットワークパラメータを最適化するアルゴリズムが提案されている。このようなスキップコネクションを採用することで、層数が増大した場合であっても、モデル精度の向上および学習を安定化できる。
推定器40は、複数の事象の各々が発生する確率を算出するとともに、算出された確率が最大となる事象を予測結果として出力する。すなわち、k個のラベルy の各々についての推定された発生確率p(y)のうち最大であるもの(発生確率が最大となるラベル)を予測結果として出力する。具体的には、以下の(2)式に示すような形で予測結果が決定される。
[D.予測モデルの学習]
次に、図5に示す予測モデル400を構築するための学習処理について説明する。予測精度を最大化するように、図5に示す予測モデル400を学習するにあたって、以下に示すようなコスト関数Jを最小化するように、ネットワークパラメータが最適化される。
一般的な識別問題においては、クロスエントロピーを最小化するように、ネットワークパラメータが最適化される。しかしながら、本実施の形態に従う予測モデル400が取り扱う事象においては、太陽フレアの発生確率がバランスしていないため、以下の(3)式に示すような、重み付きクロスエントロピーの総和をコスト関数Jとして採用している。
(3)式において、wは各クラスkについての重み係数であり、各クラスの発生確率の逆数が採用されている。ynk はクラスkにおけるn番目のトレーニングサンプルの教師ラベルを示し、p(ynk)はクラスkにおけるn番目のトレーニングサンプルについて推定された発生確率を示す。
本実施の形態に従う予測システム1においては、以下のTable1に示すようなパラメータに従う予測モデル400を設定し、任意の最適化メソッドを用いて、予測モデル400を規定するネットワークパラメータを最適化する。予測モデル400の各層のノード数およびバッチ正規化処理におけるバッチサイズは、50−200の範囲の値に設定されてもよい。また、線形結合層の数は4〜9ぐらいが好ましく、必要に応じて、スキップコネクションを適宜付加するようにしてもよい。
最適化メソッドとしては、例えば、Adam(Adaptive moment estimation)法を用いることができる。
[E.予測装置20のハードウェア構成]
次に、本実施の形態に従う予測装置20のハードウェア構成の一例について説明する。図7は、本実施の形態に従う予測装置20を実現するためのハードウェア構成の一例を示す模式図である。予測装置20は、典型的には、汎用コンピュータを用いて実現される。
図7を参照して、予測装置20は、主要なハードウェアコンポーネントとして、プロセッサ100と、主メモリ102と、ディスプレイ104と、入力デバイス106と、ネットワークインターフェイス(I/F:interface)108と、光学ドライブ110と、入力インターフェイス(I/F)114と、出力インターフェイス(I/F)116と、二次記憶装置120とを含む。これらのコンポーネントは、内部バス118を介して互いに接続される。
プロセッサ100は、後述するような各種プログラムを実行することで、本実施の形態に従う予測システム1の実現に必要な処理を実行する演算主体であり、例えば、1または複数のCPU(Central Processing Unit)やGPU(Graphics Processing Unit)などで構成される。複数のコアを有するようなCPUまたはGPUを用いてもよい。
主メモリ102は、プロセッサ100がプログラムを実行するにあたって、プログラムコードやワークメモリなどを一時的に格納する記憶領域であり、例えば、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)などの揮発性メモリデバイスなどで構成される。
ディスプレイ104は、処理に係るユーザインターフェイスや処理結果などを出力する表示部であり、例えば、LCD(Liquid Crystal Display)や有機EL(Electroluminescence)ディスプレイなどで構成される。
入力デバイス106は、ユーザからの命令や操作などを受付けるデバイスであり、例えば、キーボード、マウス、タッチパネル、ペンなどで構成される。また、入力デバイス106としては、機械学習に必要な音声を収集するためのマイクロフォンを含んでいてもよいし、機械学習に必要な音声を収集した集音デバイスと接続するためのインターフェイスを含んでいてもよい。
ネットワークインターフェイス108は、インターネット上またはイントラネット上の任意の情報処理装置などとの間でデータを遣り取りする。ネットワークインターフェイス108としては、例えば、イーサネット(登録商標)、無線LAN(Local Area Network)、Bluetooth(登録商標)などの任意の通信方式を採用できる。
光学ドライブ110は、CD−ROM(Compact Disc Read Only Memory)、DVD(Digital Versatile Disc)などの光学ディスク112に格納されている情報を読出して、内部バス118を介して他のコンポーネントへ出力する。光学ディスク112は、非一過的(non-transitory)な記録媒体の一例であり、任意のプログラムを不揮発的に格納した状態で流通する。光学ドライブ110が光学ディスク112からプログラムを読み出して、二次記憶装置120などにインストールすることで、コンピュータにより予測システム1の機能を提供できるようになる。従って、本発明の主題は、二次記憶装置120などにインストールされたプログラム自体、または、本実施の形態に従う機能や処理を実現するためのプログラムを格納した光学ディスク112などの記録媒体でもあり得る。
図7には、非一過的な記録媒体の一例として、光学ディスク112などの光学記録媒体を示すが、これに限らず、フラッシュメモリなどの半導体記録媒体、ハードディスクまたはストレージテープなどの磁気記録媒体、MO(Magneto-Optical disk)などの光磁気記録媒体を用いてもよい。
入力インターフェイス114は、外部の観測装置などと接続され、必要な観測データなどを取込む。出力インターフェイス116は、表示デバイスなどと接続され、太陽フレアの発生確率などの予測結果(推定結果)を出力する。入力インターフェイス114および出力インターフェイス116は、USB(Universal Serial Bus)などの汎用的な通信インターフェイスを用いることができる。
二次記憶装置120は、プロセッサ100にて実行されるプログラム、後述するようなニューラルネットワークを学習させるための訓練データセット、および、ニューラルネットワークを規定するネットワークパラメータなどを格納するコンポーネントであり、例えば、ハードディスク、SSD(Solid State Drive)などの不揮発性記憶装置で構成される。
より具体的には、二次記憶装置120は、図示しないOS(Operating System)の他、特徴量算出部30を実現するための特徴量算出プログラム122と、予測モデルを構築するための学習プログラム124と、予測モデルを用いて太陽フレアの発生確率を算出するための推定プログラム126と、予測モデルの実体であるニューラルネットワークを規定するネットワークパラメータ130とを格納している。また、二次記憶装置120には、トレーニングデータセット132が格納されていてもよい。
これらのプログラムをプロセッサ100で実行する際に必要となるライブラリや機能モジュールの一部を、OSが標準で提供するライブラリまたは機能モジュールを用いて代替するようにしてもよい。この場合には、各プログラム単体では、対応する機能を実現するために必要なプログラムモジュールのすべてを含むものにはならないが、OSの実行環境下にインストールされることで、必要な機能を実現できる。このような一部のライブラリまたは機能モジュールを含まないプログラムであっても、本発明の技術的範囲に含まれ得る。
また、これらのプログラムは、上述したようないずれかの記録媒体に格納されて流通するだけでなく、インターネットまたはイントラネットを介してサーバ装置などからダウンロードすることで配布されてもよい。
図7には、単一のコンピュータが予測システム1を構成する例を示すが、これに限らず、コンピュータネットワークを介して接続された複数のコンピュータが明示的または黙示的に連携して、予測システム1を含む全体システムを実現するようにしてもよい。複数のコンピュータが連携する場合、一部のコンピュータがいわゆるクラウドコンピュータと称される、ネットワーク上にある不特定のコンピュータであってもよい。
コンピュータ(プロセッサ100)がプログラムを実行することで実現される機能の全部または一部を、集積回路などのハードワイヤード回路(hard-wired circuit)を用いて実現してもよい。例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field-Programmable Gate Array)などを用いて実現してもよい。
当業者であれば、本発明が実施される時代に応じた技術を適宜用いて、本実施の形態に従う予測システムを実現できるであろう。
[F.処理手順]
次に、本実施の形態に従う予測システム1における処理手順の一例について説明する。
(f1:学習フェーズ)
まず、本実施の形態に従う予測システム1における予測モデル400を構築する学習フェーズに係る処理手順について説明する。
図8は、本実施の形態に従う予測システム1の学習フェーズに係る処理手順を示すフローチャートである。図8に示す各ステップは、典型的には、予測装置20のプロセッサ100が特徴量算出プログラム122および学習プログラム124(いずれも図7参照)を実行することで実現される。
図8を参照して、まず、予測装置20は、予測モデル400の学習に必要な観測データを収集する(ステップS100)。
そして、予測装置20は、活動領域の検出およびトラッキングを実行する。より具体的には、予測装置20は、収集されている観測データのうち、各時刻の視線方向磁場の全面画像から活動領域を検出し(ステップS102)、位置的および時間的に連続する活動領域を同一の活動領域としてトラッキングする(ステップS104)。そして、予測装置20は、トラッキングされた活動領域の時間系列について、各時刻における座標位置を決定する(ステップS106)。
続いて、トレーニングサンプルの生成処理が実行される。すなわち、予測装置20は、トラッキングされた活動領域のうち、1つの活動領域の時間系列を選択し(ステップS108)、選択されている活動領域のトラッキング中に生じた太陽フレアの発生時刻および発生したクラスを取得する(ステップS110)。さらに、予測装置20は、選択されている活動領域のトラッキング期間について所定の算出周期毎に、予め定められた複数の特徴量をそれぞれ算出して特徴量ベクトルを生成する(ステップS112)とともに、特徴量ベクトルを生成した基準タイミングに引き続く予測期間において発生した太陽フレアのクラスに基づいて教師ラベルを取得し(ステップS114)、当該取得した教師ラベルを生成した特徴量ベクトルに付与して、トレーニングサンプルを生成する(ステップS116)。
予測装置20は、選択されている活動領域のトラッキング期間のすべてについて、トレーニングサンプルの生成が完了したか否かを判断する(ステップS118)。選択されている活動領域のトラッキング期間のすべてについて、トレーニングサンプルの生成が完了していなければ(ステップS118においてNO)、ステップS112〜S116の処理が繰返される。
一方、選択されている活動領域のトラッキング期間のすべてについて、トレーニングサンプルの生成が完了してれば(ステップS118においてYES)、予測装置20は、トラッキングされた活動領域のすべてが処理済みであるか否かを判断する(ステップS122)。トラッキングされた活動領域のうち未処理の活動領域が存在していれば(ステップS122においてNO)、予測装置20は、未処理の活動領域のうち1つを選択し(ステップS124)、ステップS110以下の処理を再度実行する。
一方、トラッキングされた活動領域のすべてが処理済みであれば(ステップS122においてYES)、トレーニングサンプルの生成処理は完了する。
続いて、予測装置20は、予測モデル400を構築する処理を実行する。すなわち、予測装置20は、対象の予測モデル400の各ネットワークパラメータを初期化(ランダムに決定)し(ステップS126)、上述の処理によって生成された複数のトレーニングサンプルの各々に含まれる特徴量ベクトルを予測モデル400に入力し(ステップS128)、予測モデル400から出力される推定結果と入力されたトレーニングサンプルに付与されている教師ラベルとを比較して、予測モデル400を規定するネットワークパラメータを更新する(ステップS130)。
予測装置20は、予測モデル400に対する学習処理の終了条件が成立したか否かを判断し(ステップS132)、学習処理の終了条件が成立していなければ(ステップS132においてNO)、ステップS128以下の処理を繰返す。ここで、学習処理の終了条件としては、生成したすべてのトレーニングサンプルによる学習が完了したこと、および/または、新たなトレーニングサンプルを入力したときのネットワークパラメータの更新量が予め定められたしきい値未満であること、などを含めてもよい。
予測モデル400に対する学習処理の終了条件が成立していれば(ステップS132においてYES)、予測装置20は、現在の予測モデル400を規定するネットワークパラメータを学習結果として出力する(ステップS134)。そして、処理は終了する。
(f2:運用フェーズ)
次に、本実施の形態に従う予測システム1を用いた太陽フレアの発生確率を算出する運用フェーズに係る処理手順について説明する。
図9は、本実施の形態に従う予測システム1の運用フェーズに係る処理手順を示すフローチャートである。図9に示す各ステップは、典型的には、予測装置20のプロセッサ100が特徴量算出プログラム122および推定プログラム126(いずれも図7参照)を実行することで実現される。
図9を参照して、予測装置20は、予め定められた予測タイミングが到来したか否かを判断する(ステップS200)。予め定められた予測タイミングが到来していなければ(ステップS200においてNO)、ステップS200の処理が繰返される。
予め定められた予測タイミングが到来していれば(ステップS200においてYES)、予測装置20は、1または複数の活動領域が検出できるか否かを判断する(ステップS202)。活動領域が検出できなければ(ステップS202においてNO)、予測装置20は、予測対象の活動領域が存在しないことを結果として出力する(ステップS204)。そして、処理は終了する。
一方、1または複数の活動領域が検出できれば(ステップS202においてYES)、予測装置20は、検出された活動領域のうち1つの活動領域を選択する(ステップS206)。そして、予測装置20は、予め定められた複数の特徴量をそれぞれ算出して特徴量ベクトルを生成する(ステップS208)。続いて、予測装置20は、生成した特徴量ベクトルを予測モデル400に入力し、ラベル毎の発生確率を算出する(ステップS210)。そして、予測装置20は、算出されたラベル毎の発生確率のうち、発生確率が最大であるものを、選択されている活動領域の予測結果として決定する(ステップS212)。
続いて、予測装置20は、検出された活動領域のすべてが処理済みであるか否かを判断する(ステップS214)。検出された活動領域のうち未処理の活動領域が存在していれば(ステップS214においてNO)、予測装置20は、未処理の活動領域のうち1つを選択し(ステップS216)、ステップS208以下の処理を再度実行する。
一方、検出された活動領域のすべてが処理済みであれば(ステップS214においてYES)、予測装置20は、活動領域毎の太陽フレアの発生確率を出力し(ステップS218)、処理は終了する。
(f3:その他の形態)
説明の便宜上、予測装置20が予測モデル400の構築(学習フェーズ)と予測モデル400を用いた太陽フレアの発生確率の算出(運用フェーズ)との両方を実行する例を示したが、これに限らず、予測モデル400を構築する主体と、予測モデル400を用いて予測を実行する主体とが別であってもよい。
例えば、特定の機関が予測モデル400を構築し、その構築した予測モデル400を他の機関に提供するような実施形態も想定される。このような場合には、本発明の本質的部分は、構築された予測モデル400そのものである。
[G.予測結果の出力形態]
本実施の形態に従う予測システム1により出力される予測結果は、どのような形態で利用されてもよい。例えば、現在の運用では、専門家が観測データに基づいて太陽フレアの発生確率を予測しており、このような予測の一指標として利用されてもよい。
このような場合、各活動領域についての太陽フレアの発生確率を一見して把握できるようなユーザインターフェイスを提供するようにしてもよい。
図10は、本実施の形態に従う予測システム1が提供する予測結果の出力例を示す図である。図10においては、視線方向磁場画像から検出された活動領域毎に、各クラスの太陽フレアの発生確率がグラフ表示されている。より具体的には、活動領域毎に、Mクラス以上の太陽フレアが発生する確率(≧M)、Mクラス以上の太陽フレアが発生しない確率(<M)、Cクラス以上の太陽フレアが発生する確率(≧C)、および、Cクラス以上の太陽フレアが発生しない確率(<C)を示す棒グラフが表示されている。
このように実際に観測された画像上に算出された発生確率が視覚的に表示されることで、いずれの活動領域において太陽フレアの発生確率が高いのかを一見して把握できる。
[H.予測性能評価の結果]
次に、本実施の形態に従う予測システム1による予測結果に基づく予測性能評価の結果について説明する。以下の予測性能評価においては、既存の運用と同様に、24時間以内における太陽フレアの発生確率を推定した。
以下の予測性能評価においては、2010年から2015年までの観測データを2つのグループに分けた。具体的には、2010年から2014年までの観測データは、トレーニングおよびバリデーションに用いるグループとし、2015年の観測データはテスト(すなわち、予測性能評価)に用いるグループとした。
このように時系列に沿って2つのグループに分離することで、過去の観測データに基づいて将来(未知)の現象を予測するという予測タスクに対する性能をより正確に評価できる。
以下に示す予測性能評価を算出するにあたって、トレーニングデータセットのミニバッチを用いて、予測モデル400についての最適化処理を多数回に亘って繰返した。トレーニングサンプルに対応するミニバッチは、予測モデル400の1回のフォワード/バックワード経路におけるサンプルの数に対応させた。ミニバッチについては、重複を避けるために、すべてのトレーニングデータセットからランダムに選択した。学習において、予測モデル400のネットワークパラメータの更新は、エポック毎、すなわちフォワード/バックワード経路毎に実行した。また、ミニバッチを用いて収束を高速化した。
予測性能評価においては、2カテゴリーの予測を実行した。具体的には、(1)Mクラス以上の太陽フレアが発生するとの事象、または、Mクラス未満の太陽フレアが発生する、あるいは、太陽フレアが発生しないとの事象のいずれか、ならびに、(2)Cクラス以上の太陽フレアが発生するとの事象、または、Cクラス未満の太陽フレアが発生する、あるいは、太陽フレアが発生しないとの事象のいずれかである。なお、対象とした観測データには、Xクラスの太陽フレアの発生数が不十分であったので、Xクラスの単独ではなく、Mクラスに含める形で予測している。
予測性能評価においては、テストデータを用いて、構築した予測モデル400をエポック毎に評価した。これらの評価により、スキルスコアとしてTSS(true skill score)が最も高い予測モデル400を最も良いモデルとして選択した。
本実施の形態に従う予測モデル400の評価結果を以下のTable2−1および2−2に示す。
Table2−1および2−2においては、TP(True Positive)、FP(False Positive)、TN(True Negative)、FN(False Negative)の4種類の結果事象を示す。
TPは、太陽フレアが発生するとの予測に対して、実際の観測結果においても太陽フレアが発生した事象の数を示す。FPは、太陽フレアが発生するとの予測に対して、実際の観測結果においては太陽フレアが発生しなかった事象の数を示す。TNは、太陽フレアが発生しないとの予測に対して、実際の観測結果においても太陽フレアが発生しなかった事象の数を示す。FNは、太陽フレアが発生しないとの予測に対して、実際の観測結果においては太陽フレアが発生した事象の数を示す。
なお、多くの予測周期において太陽フレアは発生しないので、TNの事象数が相対的に多くなっている。また、Cクラス以上の太陽フレアの発生は、Mクラス以上の太陽フレアの発生を含むので、Cクラス以上についてのTPは、相対的に大きな値となっている。
太陽フレアの発生予測のタスクにおいては、代表的なスキルスコアとして、以下に示すような6種類が知られている。
POD(probability of detection)は、再現率を意味し、式(4A)に従って算出できる。CSI(criteria success of index)は、式(4B)に従って算出できる。FAR(false alarm ratio)は、式(4C)に従って算出できる。HSS(Heidke skill score)は、式(4D)に従って算出できる。TSS(true skill score)は、式(4E)に従って算出できる。正確性を意味するAccuracyは、式(4F)に従って算出できる。なお、式中の(´)は反転(NOT)を意味する。
本実施の形態に従う予測モデル400による予測結果を各スキルスコアに関して評価した結果を以下のTable3に示す。
上述のTable3には、ベースラインとして、非特許文献1に開示されるSVM、kNN、ERTの各手法でのスキルスコアを併せて示す。
Table3に示すように、本実施の形態に従う予測モデル400によれば、一般的な運用と同様の条件下において、Mクラス以上の太陽フレアの発生確率についてのTSSは「0.80」となり、Cクラス以上の太陽フレアの発生確率についてのTSSは「0.63」となっている。これらの結果は、専門家の予測に基づく発生確率についてのTSSより優れている。
[I.重要度評価]
次に、本実施の形態に従う予測システム1において用いられる予測モデル400は、複数の特徴量に基づいて太陽フレアの発生確率を予測する構成を採用しており、さらに、各特徴量の重要度を評価することもできる。
図11は、本実施の形態に従う予測システム1において特徴量の重要度の評価手順を説明するための模式図である。図11を参照して、まず、利用可能なすべての特徴量を含む特徴量ベクトル460を用いた学習処理により、予測モデル400を構築する。この構築した予測モデル400を基準予測モデルとし、この基準予測モデルに対してテストデータ470を与えた場合に得られる予測結果についてのスキルスコアを算出する。この算出されるスキルスコアが基準スキルスコアとなる。
続いて、例えば、利用可能なすべての特徴量のうち、特徴量1を削除した特徴量ベクトル461を生成し、特徴量ベクトル461を用いた学習処理により、予測モデル401を構築する。予測モデル401は、特徴量1を削除した状態での学習結果である。さらに、構築した予測モデル401に対してテストデータ471(特徴量1に相当する成分は削除されている)を与える場合に得られる予測結果についてもスキルスコアを算出する。この算出されるスキルスコアが特徴量1を削除した場合の性能となる。
最終的に、基準スキルスコアと特徴量1を削除した場合に算出されたスキルスコアとの差分(すなわち、スキルスコアの変化度合い)を、削除した特徴量1のスキルスコアへの影響度(すなわち、重要度)として算出できる。
図11と同様の方法に従って、各特徴量についてのスキルスコアへの影響度(重要度)をそれぞれ算出できる。最終的に、重要度に基づいて特徴量をランク付けすることで、太陽フレアの発生予測にどのような特徴量が重要であるかを推定できるとともに、その推定された特徴量の情報は太陽フレアの発生メカニズムを解明する手がかりとなり得る。
このように、本実施の形態に従う予測システム1は、予測モデル400の予測精度への各特徴量の影響度を算出する影響度算出機能を有しており、図11に示すような処理手順に従って、各特徴量の重要度を客観的に評価できる数値を出力するようにしてもよい。
[J.まとめ]
本実施の形態に従う予測システム1によれば、画像ベースではなく、太陽の活動を様々な観点でとらえた複数の特徴量を入力として用いた予測モデルを採用する。複数の特徴量を用いることで、画像をそのまま用いる場合に比較して、情報の次元数を抑制できるので、全結合ネットワークを構成することも可能となり、比較的少ない層数で予測精度の高い予測モデルを実現できる。
また、本実施の形態に従う予測システム1によれば、複数の特徴量を入力とする予測モデルを採用するので、学習の結果構築された予測モデルの予測精度に基づいて、予測精度に対する各特徴量の重要度を算出できる。これによって、どのような特徴量が予測に影響を与えるのかといった知識が得られ、太陽フレアの発生メカニズムを解明できる。
今回開示された実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施の形態の説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
[K.付録]
1 予測システム、2 太陽、4 地上観測施設、6 光学望遠鏡、7 電波望遠鏡、8 観測装置、10 観測用衛星、12 地上受信施設、14 通信用アンテナ、16 通信装置、18 観測データ収集装置、20 予測装置、30 特徴量算出部、40 推定器、100 プロセッサ、102 主メモリ、104 ディスプレイ、106 入力デバイス、108 ネットワークインターフェイス、110 光学ドライブ、112 光学ディスク、114 入力インターフェイス、116 出力インターフェイス、118 内部バス、120 二次記憶装置、122 特徴量算出プログラム、124 学習プログラム、126 推定プログラム、130 ネットワークパラメータ、132 トレーニングデータセット、400,401 予測モデル、411,412,413,414,415,416 線形結合層、417 非線形結合層、431,433 スキップ経路、432,434 加算器、441 入力ベクトル、442 入力層、443 隠れ層、444 出力層、445 出力ベクトル、446,447 重み係数ベクトル、448,449 バイアスベクトル、451 正規化線形関数(ReLU関数)、452 Softmax関数、460,461 特徴量ベクトル、470,471 テストデータ、AR 活動領域、J コスト関数。

Claims (6)

  1. 宇宙空間に生じる現象を予測するための予測システムであって、
    前記宇宙空間に由来する時系列の観測データを取得する取得部と、
    前記観測データのうち予測タイミングより前のデータ要素に基づいて複数の特徴量を算出する特徴量算出部と、
    前記特徴量算出部により算出された複数の特徴量を予測モデルに与えることで、前記予測タイミングに引き続く所定長さの予測期間内において、1または複数の事象の各々が発生する確率を算出する推定部とを備える、予測システム。
  2. 前記複数の特徴量は、前記予測タイミングの直前の所定期間内において観測されたデータ要素に基づいて算出される特徴量を含む、請求項1に記載の予測システム。
  3. 前記推定部は、複数の事象の各々が発生する確率を算出するとともに、算出された確率が最大となる事象を予測結果として出力する、請求項1または2に記載の予測システム。
  4. 前記1または複数の事象は、所定クラス以上の太陽フレアが発生する確率を含む、請求項1〜3のいずれか1項に記載の予測システム。
  5. 前記予測モデルの予測精度への各特徴量の影響度を算出する影響度算出部をさらに備える、請求項1〜4のいずれか1項に記載の予測システム。
  6. 宇宙空間に生じる現象を予測するための予測方法であって、
    前記宇宙空間に由来する時系列の観測データを取得するステップと、
    前記観測データのうち予測タイミングより前のデータ要素に基づいて複数の特徴量を算出するステップと、
    前記算出された複数の特徴量を予測モデルに与えることで、前記予測タイミングに引き続く所定長さの予測期間内において、1または複数の事象の各々が発生する確率を算出するステップとを備える、予測方法。
JP2018090085A 2018-05-08 2018-05-08 予測システムおよび予測方法 Active JP7199075B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018090085A JP7199075B2 (ja) 2018-05-08 2018-05-08 予測システムおよび予測方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018090085A JP7199075B2 (ja) 2018-05-08 2018-05-08 予測システムおよび予測方法

Publications (2)

Publication Number Publication Date
JP2019197323A true JP2019197323A (ja) 2019-11-14
JP7199075B2 JP7199075B2 (ja) 2023-01-05

Family

ID=68537537

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018090085A Active JP7199075B2 (ja) 2018-05-08 2018-05-08 予測システムおよび予測方法

Country Status (1)

Country Link
JP (1) JP7199075B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160411A (zh) * 2019-12-11 2020-05-15 东软集团股份有限公司 分类模型训练方法、图像处理方法、装置、介质及设备
CN111965733A (zh) * 2020-08-25 2020-11-20 哈尔滨工业大学 一种预报因子与太阳耀斑发生的相关性评估方法
CN113989273A (zh) * 2021-11-25 2022-01-28 江苏科技大学 一种基于k-近邻的太阳耀斑预报方法
CN114882961A (zh) * 2022-06-09 2022-08-09 佛山众陶联供应链服务有限公司 基于原料权重作为模型参数选择条件的烧成曲线预测方法
CN115795741A (zh) * 2023-01-31 2023-03-14 北京适创科技有限公司 缩孔缩松预测方法、装置及电子设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001324576A (ja) * 2000-05-15 2001-11-22 Nippon Telegr & Teleph Corp <Ntt> 事象予測方法及びシステム及び予測事象配信方法及びシステム
JP2004501354A (ja) * 2000-04-18 2004-01-15 カーメル システムズ リミテッド ライアビリティ カンパニー 宇宙気象予報方法及びシステム
JP2004157118A (ja) * 2002-10-16 2004-06-03 National Institute Of Information & Communication Technology プラズマ対流予測装置、プラズマ対流予測方法
US20090090869A1 (en) * 2007-09-21 2009-04-09 Ephraim Fischbach Detection of Solar Events
JP2016031282A (ja) * 2014-07-29 2016-03-07 国立大学法人京都大学 宇宙天気予報システムを構築するための機械学習方法及び当該方法によって構築された宇宙天気予報方法
JP2016152039A (ja) * 2015-02-19 2016-08-22 富士通株式会社 データ出力方法、データ出力プログラムおよびデータ出力装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004501354A (ja) * 2000-04-18 2004-01-15 カーメル システムズ リミテッド ライアビリティ カンパニー 宇宙気象予報方法及びシステム
JP2001324576A (ja) * 2000-05-15 2001-11-22 Nippon Telegr & Teleph Corp <Ntt> 事象予測方法及びシステム及び予測事象配信方法及びシステム
JP2004157118A (ja) * 2002-10-16 2004-06-03 National Institute Of Information & Communication Technology プラズマ対流予測装置、プラズマ対流予測方法
US20090090869A1 (en) * 2007-09-21 2009-04-09 Ephraim Fischbach Detection of Solar Events
JP2016031282A (ja) * 2014-07-29 2016-03-07 国立大学法人京都大学 宇宙天気予報システムを構築するための機械学習方法及び当該方法によって構築された宇宙天気予報方法
JP2016152039A (ja) * 2015-02-19 2016-08-22 富士通株式会社 データ出力方法、データ出力プログラムおよびデータ出力装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160411A (zh) * 2019-12-11 2020-05-15 东软集团股份有限公司 分类模型训练方法、图像处理方法、装置、介质及设备
CN111160411B (zh) * 2019-12-11 2023-09-29 东软集团股份有限公司 分类模型训练方法、图像处理方法、装置、介质及设备
CN111965733A (zh) * 2020-08-25 2020-11-20 哈尔滨工业大学 一种预报因子与太阳耀斑发生的相关性评估方法
CN113989273A (zh) * 2021-11-25 2022-01-28 江苏科技大学 一种基于k-近邻的太阳耀斑预报方法
CN114882961A (zh) * 2022-06-09 2022-08-09 佛山众陶联供应链服务有限公司 基于原料权重作为模型参数选择条件的烧成曲线预测方法
CN115795741A (zh) * 2023-01-31 2023-03-14 北京适创科技有限公司 缩孔缩松预测方法、装置及电子设备和存储介质
CN115795741B (zh) * 2023-01-31 2023-04-14 北京适创科技有限公司 缩孔缩松预测方法、装置及电子设备和存储介质

Also Published As

Publication number Publication date
JP7199075B2 (ja) 2023-01-05

Similar Documents

Publication Publication Date Title
JP7199075B2 (ja) 予測システムおよび予測方法
Muthukrishna et al. RAPID: early classification of explosive transients using deep learning
Wu et al. Retracted article: evolving deep convolutional neutral network by hybrid sine–cosine and extreme learning machine for real-time COVID19 diagnosis from X-ray images
Fayaz et al. A deep neural network framework for real‐time on‐site estimation of acceleration response spectra of seismic ground motions
Trippe et al. Conditional density estimation with bayesian normalising flows
US11423325B2 (en) Regression for metric dataset
Leka et al. The NWRA classification infrastructure: description and extension to the discriminant analysis flare forecasting system (DAFFS)
Dagaeva et al. Big spatio‐temporal data mining for emergency management information systems
Williams et al. Monitoring dynamic spatio‐temporal ecological processes optimally
TW201224812A (en) Probabilistic data mining model comparison engine
CN108986872A (zh) 用于大数据电子病历约简的多粒度属性权重Spark方法
Thompson et al. Inferring extinction risks from sighting records
Artemov et al. Nonparametric decomposition of quasi-periodic time series for change-point detection
Ho et al. Approximate Bayesian uncertainties on deep learning dynamical mass estimates of galaxy clusters
Kshirsagar et al. Becoming good at AI for good
Park et al. Anomaly detection in particulate matter sensor using hypothesis pruning generative adversarial network
Li et al. Efficient regional seismic risk assessment via deep generative learning of surrogate models
Nandhini et al. Predictive analytics for climate change detection and disease diagnosis
US20130013551A1 (en) Process analysis
Khuhawar et al. On‐Ground Distributed COVID‐19 Variant Intelligent Data Analytics for a Regional Territory
Conrado et al. Scenario-based reasoning and probabilistic models for decision support
Saxena et al. Multimodal spatio-temporal prediction with stochastic adversarial networks
Date et al. A new algorithm for latent state estimation in non-linear time series models
Popolizio et al. The GAIN Method for the Completion of Multidimensional Numerical Series of Meteorological Data.
Karaahmetoglu et al. Spatiotemporal sequence prediction with point processes and self-organizing decision trees

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210413

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220711

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221213

R150 Certificate of patent or registration of utility model

Ref document number: 7199075

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150