JP7198474B2 - モデリングシステム - Google Patents

モデリングシステム Download PDF

Info

Publication number
JP7198474B2
JP7198474B2 JP2018109495A JP2018109495A JP7198474B2 JP 7198474 B2 JP7198474 B2 JP 7198474B2 JP 2018109495 A JP2018109495 A JP 2018109495A JP 2018109495 A JP2018109495 A JP 2018109495A JP 7198474 B2 JP7198474 B2 JP 7198474B2
Authority
JP
Japan
Prior art keywords
variable
observed
modeling system
latent
nonlinear function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018109495A
Other languages
English (en)
Other versions
JP2019212159A (ja
Inventor
博史 峰野
瞬 柴田
涼介 水野
豪太 中西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shizuoka University NUC
Original Assignee
Shizuoka University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shizuoka University NUC filed Critical Shizuoka University NUC
Priority to JP2018109495A priority Critical patent/JP7198474B2/ja
Publication of JP2019212159A publication Critical patent/JP2019212159A/ja
Application granted granted Critical
Publication of JP7198474B2 publication Critical patent/JP7198474B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、現象の時間的変化をモデリングするモデリングシステムに関する。
近年、様々な現象の時間的変化をモデル化する技術が浸透し始めている。下記特許文献1には、電力系統の状態量を推定する装置が開示され、この装置は、電力量の出現分布情報を受信する電力系統計測部、電力系統の状態推定を非線形カルマンフィルタを用いて計算するシミュレータ部、電力系統の計測データとシミュレータデータとを用いて確率的に尤もらしい状態値を算出する最尤状態算出部、及び、計測データとシミュレータデータとの差が小さくなるようにシミュレータ部のパラメータを逐次修正するパラメータ補正部からなる。
国際公開2015/079554号公報
上述した従来の装置では、モデリング対象の現象に関する実測値が時間的に連続して得られず欠損値が生じやすい場合に、シミュレータ部のパラメータを予め適切に設定しておくことが困難な傾向にある。そのため、実測値に欠損値が生じやすい場合にモデリングの精度が低下する傾向にあった。
本発明の一側面は、上記課題に鑑みて為されたものであり、モデリング対象の現象に関する実測値に欠損値が生じやすい場合であっても、モデリングの精度を維持することが可能なモデリングシステムを提供することを目的とする。
上記課題を解決するため、本発明の一形態にかかるモデリングシステムは、複数の連続した時刻における直接観測できない変数である潜在変数を、直前の時刻の潜在変数から、非線形関数を用いて順次導出する第1の導出部と、複数の連続した時刻における直接観測できる変数である第1の観測変数を、同一の時刻の潜在変数から、非線形関数を用いて順次導出する第2の導出部と、複数の連続した時刻における直接観測できる変数である第2の観測変数を、同一の時刻の潜在変数から、非線形関数を用いて順次導出する第3の導出部と、を備える。
上記形態のモデリングシステムによれば、潜在変数の時間的な変化と、その変化に基づいた第1及び第2の観測変数の時間的な変化をモデリングすることにより、特定の現象における観測値のシミュレーションに利用することができる。特に、2つの観測変数を含んでモデリングされているので、2つの観測変数のうちの片方の観測変数の実測値が欠損しやすい状況下であっても、もう片方の実測値を用いてモデルのパラメータを推定できる。その結果、モデリングの精度を維持することができる。
ここで、前記第1の導出部は、外部から与えられた外部変数をさらに用いて前記潜在変数を順次導出してもよく、第2の導出部は、外部から与えられた外部変数をさらに用いて前記第1の観測変数を順次導出してもよく、前記第3の導出部は、外部から与えられた外部変数をさらに用いて前記第2の観測変数を順次導出してもよい。こうすれば、外部の環境を考慮に入れてモデリングの精度をより高めることができる。
また、潜在変数、第1の観測変数、及び第2の観測変数を、確率分布として導出する、こととしてもよく、特に、正規分布として導出してもよい。かかる構成を備えれば、生物の連続的な状態等の自然現象を適切にモデリングすることができる。
また、潜在変数、第1の観測変数、及び第2の観測変数を、確率分布として導出する、こととしてもよく、特に、離散分布として導出してもよい。かかる構成を備えれば、生物の離散的な状態等の自然現象を適切にモデリングすることができる。
また、非線形関数は、ニューラルネットワークを含んでいてもよく、任意の非線形関数を選択してもよい。この場合、この場合、生物成長等の非線形な現象を適切にモデリングすることができる。
また、非線形関数のパラメータを、第1の観測変数の実測値あるいは第2の観測変数の実測値を用いた機械学習により、予め最適化する学習部をさらに備える、こととしてもよい。かかる構成を採れば、第1及び第2の実測値の実測値を用いてモデルに利用される非線形関数のパラメータを最適化することができる。特に、2つの観測変数のうちの片方の観測変数の実測値が欠損しやすい状況下であっても、もう片方の実測値を用いてパラメータを効率的に最適化することができる。
また、学習部は、第1の観測変数の実測値及び第2の観測変数の実測値を基にして、非線形関数に関するELBO値を計算し、ELBO値を目的関数とした機械学習によりパラメータを最適化する、こととしてもよい。
また、学習部は、第2の観測変数の実測値が存在する時刻と第2の観測変数の実測値が存在しない時刻とで異なる演算式を用いてELBO値を計算し、複数の時刻で合計したELBO値を目的関数として用いる、こととしてもよい。これにより、2つの観測変数のうちの片方の観測変数の実測値が欠損しやすい状況下であっても、もう片方の実測値を用いてパラメータを効率的に最適化することができる。
本発明によれば、モデリング対象の現象に関する実測値に欠損値が生じやすい場合であっても、モデリングの精度を維持することができる。
実施形態にかかるモデリングシステムの概略構成を示す図である。 図1のモデリングシステムを構成するコンピュータのハードウェア構成を示す図である。 図1の予測値生成器7が用いる学習モデルのデータ系列の生成過程を説明する概念図である。 図1の予測値生成器7が用いる学習モデルにおける各変数の設定内容の例を示す図表である。 図1の予測値生成器7が用いる学習モデルのデータ系列の生成過程の他の例を説明する概念図である。 図1の予測値生成器7が用いる学習モデルのデータ系列の生成過程の他の例を説明する概念図である。 本実施形態おける算出糖度の誤差の評価値MAE、RMSE、RAE、RSEを示すグラフである。 本実施形態おける算出糖度の時間変化を示すグラフである。 本実施形態おける算出糖度の時間変化を示すグラフである。 本実施形態おける算出糖度の時間変化を示すグラフである。
以下、図面を参照しつつ本発明に係るモデリングシステムの好適な実施形態について詳細に説明する。なお、図面の説明においては、同一又は相当部分には同一符号を付し、重複する説明を省略する。
まず、図1~3を用いて、本発明の一実施形態にかかるモデリングシステム1の機能および構成を説明する。図1に示すモデリングシステム1は、事前に様々な現象を取り巻く環境をモデル化し、それによって生成された学習モデルを用いて現象の時間変化を探索するコンピュータシステムである。より具体的には、学習モデルを基に現象の時間変化を高精度に推定するモデリングシステムである。モデリングシステム1の探索対象の現象としては、例えば、トマト等の植物の生育状態とし、栽培環境および生育状態に関する観測値を訓練データとして用いて事前に学習モデルを最適化し、その学習モデルを用いて現在の生育状態を推定し定量化できる。
なお、モデリングシステム1の探索対象の現象としては、トマト等の植物の生育状態が挙げられるが、これには限定されない。例えば、モデリングシステム1は、動物または食品等のその他の有体物の状態、天候、病気、または漁獲等の自然現象の状態、通信ネットワーク、交通、ライフライン、株価、または需給等の社会現象の状態を探索対象としてもよい。また、本明細書でいう「系列」とは、複数の時点における現象の様々な観測値あるいは予測値を示す数値の系列であり、ある規則に基づいて複数の時点において観測することにより得られる数値の系列、学習モデルに従ったある計算式によって複数の時点に関して計算された数値の系列である。
図1に示すように、モデリングシステム1は、入力部3、学習部5、及び予測値生成器7を含んで構成されている。本実施形態では、モデリングシステム1は1つの装置によって構成されているが、データ送受信機能を有する複数の装置によって構成されていてもよい。
モデリングシステム1を構成するコンピュータ100の一般的なハードウェア構成を図2に示す。コンピュータ100は、オペレーティングシステムやアプリケーション・プログラムなどを実行する演算装置であるCPU(プロセッサ)101と、ROM及びRAMで構成される主記憶部102と、ハードディスクやフラッシュメモリなどで構成される補助記憶部103と、ネットワークカードあるいは無線通信モジュールで構成される通信制御部104と、キーボードやマウスなどの入力装置105と、ディスプレイやプリンタなどの出力装置106とを備える。当然ながら、搭載されるハードウェアモジュールはコンピュータ100の種類により異なる。例えば、据置型のPCおよびワークステーションは入力装置および出力装置としてキーボード、マウス、およびディスプレイを備えることが多いが、スマートフォンではタッチパネルが入力装置および出力装置として機能することが多い。また、CPU101にGPUが付加されていてもよい。
後述するモデリングシステム1の各機能要素は、CPU101または主記憶部102の上に所定のソフトウェアを読み込ませ、CPU101の制御の下で通信制御部104や入力装置105、出力装置106などを動作させ、主記憶部102または補助記憶部103におけるデータの読み出し及び書き込みを行うことで実現される。処理に必要なデータやデータベースは主記憶部102または補助記憶部103内に格納される。
図1に戻って、入力部3は、学習モデルのモデル化(以下、単に「モデル化」ともいう。)のために用いられる訓練データ系列、及び、モデル化した学習モデルに従って現象の時間変化を探索する処理(以下、単に「探索処理」ともいう。)において用いられる外部変数データ系列を外部から受け付ける。例えば、モデリングシステム1が対象とする現象が植物の生育状態である場合には、訓練データ系列に含まれる観測値(実測値)として、糖度、茎径、温度、光量、飽差、開花後の経過日数、灌水後の経過時間、積算温度、二酸化炭素濃度等が挙げられる。また、外部変数データ系列に含まれる数値として、温度、光量、飽差、開花後の経過日数、灌水後の経過時間、積算温度、二酸化炭素濃度、対象花房等が想定される。入力部3は、訓練データ系列を、温度センサ、光センサ、カメラ等の外部センサ装置からの信号を基に生成したデータ系列として受け付けてもよいし、他のコンピュータシステム等の外部装置を介して受け付けてもよい。入力部3は、外部変数データ系列を、ユーザ入力に基づいて受け付けてもよいし、内部のプログラム等によって生成されたものとして受け付けてもよいし、他のコンピュータシステム等の外部装置から受け付けてもよい。
学習部5は、入力部3によって受け付けられた訓練データ系列を用いて予測値生成器7に対応する学習モデルのパラメータを予め最適化する。学習部5による学習モデルのパラメータの最適化の処理の詳細は後述する。
予測値生成器7は、学習部5によってパラメータが最適化された学習モデルを用いて探索処理を実行する機能部分である。予測値生成器7は、入力部3によって受け付けられた外部変数データ系列を用いて探索処理を実行し、適切な生育状態(例えば、経時糖度等)を推定し定量化して出力する。
ここで、予測値生成器7が用いる学習モデルにおいてデータ系列を生成する過程を説明する。図3は、予測値生成器7が用いる学習モデルにおけるデータ系列の生成過程を説明する概念図である。このように、この学習モデルは、状態空間モデル(SSM:State Space Model)をベースとしており、直接観測できない状態モデルと状態モデルから生成される観測モデルの2系列のデータ系列を有する。状態モデルは、時刻tの潜在変数zと、その1つ前の時刻t-1の潜在変数zt-1と、その1つ後の時刻t+1の潜在変数zt+1とを含み、時刻tの潜在変数zは前の潜在変数zt-1と、zと同じ時刻の外部変数uを基に生成され、それ以降の潜在変数zt+1は同様にして順次生成される。この潜在変数zは、直接観測できない現象に関する数値であり、例えば、植物の状態を示す。観測モデルは、時刻tの2つの直接観測できる変数である観測変数x,yと、その1つ前の時刻t-1の観測変数xt-1,yt-1と、その1つ後の時刻t+1の観測変数xt+1,yt+1とを含む。時刻tの観測変数yは潜在変数zと、同じ時刻tの外部変数rを基に生成され、それ以降の観測変数yt+1は同様にして順次生成される。時刻tの観測変数xは潜在変数zと、同じ時刻tの外部変数sを基に生成され、それ以降の観測変数xt+1は同様にして順次生成される。すなわち、観測変数yと観測変数xとは同じ潜在変数zを基に生成される。外部変数u,r,sは、それぞれ、潜在変数z、観測変数y、観測変数xに作用する変数である。このように、この学習モデルにおいては、各変数z,y,xで異なる外部変数を持つことにより、モデル化時に各変数の生成過程に適したデータを設定することで適切に現象の予測を行うことが可能となる。
学習モデルの対象を植物の状態とする場合には、各変数には、図4に示すような数値が設定される。潜在変数zには植物の状態が設定され、観測変数x,yにはそれぞれ、植物の糖度、および植物の茎径が設定される。この観測変数xとしては、モデル化を行う際に系列のデータを連続して得ることが不可能である、あるいは、系列のデータを連続して得るためのコストが高い数値が設定され、この観測変数yとしては、モデル化を行う際に系列のデータを連続して得ることが可能である、あるいは、系列のデータを連続して得るためのコストが低い数値が設定される。また、外部変数uとしては、温度、光量、飽差、開花後の経過日数、及び積算温度等が設定され、外部変数r,sとしては、CO2濃度、光量、対象花房(第一花房であるか第二花房であるか)等が設定される。
図1に戻って、予測値生成器7は、探索処理を実行する第1導出部7a、第2導出部7b、及び第3導出部7cを有している。第1導出部7aは、上記の学習モデルを前提にして、連続したそれぞれの時刻tの潜在変数zを、外部から与えられた時刻tの外部変数uと、直前の時刻t-1の潜在変数zt-1とから、非線形関数を用いて順次導出する。例えば、非線形関数としてはDNN(Deep Neural Network)を用いて最適化された非線形関数を用いる。ここでは、下記式(1);
Figure 0007198474000001


によって表現されるマルコフ性を仮定した生成過程、すなわち、パラメータθによって表現された、潜在変数zt-1及び外部変数uから平均μ及び標準偏差σの正規分布(確率分布)N(z)を生成する生成過程Pθが想定される。より詳細には、第1導出部7aは、下記式(2);
Figure 0007198474000002


を用いて、潜在変数zを、平均μ及び標準偏差σの正規分布として導出する。上記式(2)中、NNは、DNNを用いて表現された非線形関数である。
第2導出部7bは、上記の学習モデルを前提にして、連続したそれぞれの時刻tの観測変数xを、外部から与えられた時刻tの外部変数sと、時刻tの潜在変数zとから、非線形関数を用いて順次導出する。例えば、非線形関数としてはDNNを用いて最適化された非線形関数を用いる。ここでは、下記式(3);
Figure 0007198474000003


によって表現されるマルコフ性を仮定した生成過程、すなわち、パラメータθによって表現された、潜在変数z及び外部変数sから平均μ及び標準偏差σの正規分布(確率分布)N(x)を生成する生成過程Pθが想定される。より詳細には、第2導出部7bは、下記式(4);
Figure 0007198474000004


を用いて、観測変数xを、平均μ及び標準偏差σの正規分布として導出する。上記式(4)中、NNは、DNNを用いて表現された非線形関数である。
第3導出部7cは、上記の学習モデルを前提にして、連続したそれぞれの時刻tの観測変数yを、外部から与えられた時刻tの外部変数rと、時刻tの潜在変数zとから、非線形関数を用いて順次導出する。例えば、非線形関数としてはDNNを用いて最適化された非線形関数を用いる。ここでは、下記式(5);
Figure 0007198474000005


によって表現されるマルコフ性を仮定した生成過程、すなわち、パラメータθによって表現された、潜在変数z及び外部変数rから平均μ及び標準偏差σの正規分布(確率分布)N(y)を生成する生成過程Pθが想定される。より詳細には、第3導出部7cは、下記式(6);
Figure 0007198474000006


を用いて、観測変数yを、平均μ及び標準偏差σの正規分布として導出する。上記式(6)中、NNは、DNNを用いて表現された非線形関数である。
本実施形態のモデリングシステム1では、予測値生成器7によって様々な外部変数データ系列を用いた探索処理が実行され適切な生育状態をモデル化する。そのモデルを用いてモデルベース強化学習システムを構築すれば、目標の生育状態となるように最適な制御内容(例えば、灌水のタイミング等)を獲得することができる。
次に、学習部5による機械学習によるモデル化の処理の詳細について説明する。
学習部5は、入力部3によって受け付けられた訓練データ系列を用いて、DNNで表現された非線形関数NN,NN,NNのパラメータを最適化する。モデル化に用いられる訓練データ系列は、各時刻t~t(mは自然数)において欠損値が含まれない外部変数u,s,r及び観測変数x,yのラベルデータ系列Dと、各時刻t~t(nは自然数)において観測変数xが欠損している外部変数u,s,r及び観測変数yのアンラベルデータ系列Dとを含んでいる。そして、学習部5は、ラベルデータ系列Dとアンラベルデータ系列Dとのそれぞれを対象に、変分ベイズ法の枠組みを勾配法で解く最適化手法(「Kingma, D.P., & Welling, M. : Auto-Encoding Variational Bayes, arXiv preprint, arXiv: 1312.6114(2013)」を参照)を用いて非線形関数NN,NN,NNのパラメータを最適化する。
詳細には、学習部5は、ラベルデータ系列Dに対し近似事後分布を用い、パラメータθ,φを最適化するELBO(Evidence Lower Bound)値をデータの周辺尤度から、下記式(7)を用いて計算する。
Figure 0007198474000007


上記(7)中、logpθ(y|z)は、訓練データ系列の観測変数yに関する潜在変数zの対数尤度であり、logpθ(x|y,z)は、訓練データ系列の観測変数xに関する潜在変数zの対数尤度であり、時刻tのqφ(z)は、1つ前の時刻t-1の潜在変数zt-1と、同じ時刻tの観測変数x,yから潜在変数zを導き出すパラメータφを有する認識モデル(近似事後確率分布)の式である。また、DKL(A||B)は、AとBとの間のKullback-Leibler情報量を示し、右辺の第1項及び第3項はそれぞれ、観測変数xに関する潜在変数zの対数尤度の期待値と観測変数yに関する潜在変数zの対数尤度の期待値との和、及び潜在変数zの近似事後確率分布と潜在変数zの事前確率分布との近似度を示すKullback-Leibler情報量の期待値を示している。
加えて、学習部5は、アンラベルデータ系列Dに対し近似事後分布を用い、パラメータθ,φを最適化するELBO値を、上記式(7)とは異なる下記式(8)を用いて計算する。
Figure 0007198474000008


上記(8)中、qφ(x|y)は、時刻tの観測変数yから同じ時刻tの観測変数xを導き出すパラメータφを有する認識モデル(近似事後確率分布)の式であり、H(A)は、Aのエントロピーを示す。つまり、ELBO値Lは、観測変数yから導き出される観測変数xの近似事後確率分布におけるELBO値Lの期待値と近似事後確率分布qφ(x|y)の期待値の和を示している。
さらに、学習部5は、ラベルデータ系列Dに対し計算したELBO値Lと、アンラベルデータ系列Dに対し計算したELBO値Lとを加算することにより、下記式(9);
Figure 0007198474000009


を用いて目的関数Jを計算する。上記式(9)中、右辺の第3項は観測変数xの周辺尤度の期待値である。そして、学習部5は、目的関数Jを最大化するように学習モデルのパラメータθ,φの最適化することによってモデル化の処理を実行する。なお、ELBO値L,Lがパラメータθ,φに関して微分可能なため、目的関数もパラメータθ,φに関して微分可能である。学習部5は、逆伝搬を介した確率的勾配降下法(Stochastic Gradient Descent)によってパラメータθ,φを最適化することができる。
以上説明した実施形態に係るモデリングシステム1によれば、外部変数uに基づいた潜在変数zの時間的な変化と、その変化に基づいた観測変数x,yの時間的な変化をモデリングすることにより、特定の現象における観測値x,yのシミュレーションに利用することができる。特に、2つの観測変数x,yを含んでモデリングされているので、2つの観測変数x,yのうちの片方の観測変数xの実測値が欠損しやすい状況下であっても、もう片方の実測値yを用いて学習モデルのパラメータを機械学習によって推定できる。その結果、モデリングの精度を維持することができる。
本実施形態では、潜在変数z、観測変数x,yを正規分布として導出している。このようにすれば、生物の連続的な状態等の自然現象を適切にモデリングすることができる。
また、学習モデルで用いられる非線形関数はニューラルネットワークを含んで表現されているので、生物成長等の非線形な現象を適切にモデリングすることができる。
また、モデリングシステム1には、非線形関数のパラメータθを、観測変数x,yの実測値を用いた機械学習により、予め最適化する学習部5を備えている。このような構成により、2つの観測変数x,yのうちの片方の観測変数xの実測値が欠損しやすい状況下であっても、もう片方の実測値yを用いてパラメータθを効率的に最適化することができる。
さらに、学習部5は、観測変数xの実測値が存在する時刻に対応するラベルデータ系列Dと観測変数xの実測値が存在しない時刻に対応するアンラベルデータ系列Dとで異なる演算式を用いてELBO値L,Lを計算し、それらを合計した値を目的関数として用いている。これにより、2つの観測変数x,yのうちの片方の観測変数xの実測値が欠損しやすい状況下であっても、もう片方の実測値yを用いてパラメータθを効率的に最適化することができる。
なお、本発明は、上述した実施形態の態様に限定されるものではない。
例えば、モデリングシステム1の予測値生成器7が用いる学習モデルは、様々なデータ系列の生成過程を反映したものが採用可能である。
上記実施形態のモデリングシステム1は、図5に示すような生成過程を有する学習モデルに対応したモデル化処理及び探索処理を実行してもよい。図5に示す生成過程は、図3に示す生成過程と比較して、状態モデルにおいて、潜在変数dを離散分布として導出する点が異なる。モデリングシステム1は、上述した実施形態と同様にして、学習部5がモデル化処理を実行し、予測値生成器7が探索処理を実行することができる。このような学習モデルに対応した処理を実行することで、生物の離散的な状態(例えば、生育段階)等の自然現象を適切にモデリングすることができる。
また、上記実施形態のモデリングシステム1は、図6に示すような生成過程を有する学習モデルに対応したモデル化処理及び探索処理を実行してもよい。図5に示す生成過程は、図3に示す生成過程と比較して、さらにもう1つの状態モデルが追加され、追加された状態モデルにおいて、潜在変数dを離散分布として導出する点が異なる。追加された状態モデルでは、時刻tにおける潜在変数dが、同じ時刻tにおける外部変数vと、1つ前の時刻t-1の潜在変数dt-1に基づいて生成される。また、観測モデルにおいては、時刻tの観測変数x,yが、それぞれ、同じ時刻tの潜在変数zに加えて、同じ時刻tの潜在変数dに基づいて生成される。モデリングシステム1は、上述した実施形態と同様にして、学習部5がモデル化処理を実行し、予測値生成器7が探索処理を実行することができる。このような学習モデルに対応した処理を実行することで、生物の離散的な状態(例えば、生育段階)と連続的な状態(例えば、水分状態)等を組み合わせた自然現象を適切にモデリングすることができる。
また、上記実施形態のモデリングシステム1においては、第1導出部7aが、外部変数uを用いないで、潜在変数zt-1のみから、潜在変数zを導出してもよいし、第2導出部7bが、外部変数sを用いないで、潜在変数zのみから、潜在変数xを導出してもよいし、第3導出部7cが、外部変数rを用いないで、潜在変数zのみから、潜在変数yを導出してもよい。同様に、図5あるいは図7に示す生成過程に対応する学習モデルが採用された場合も、いずれかあるいは全ての外部変数を用いないで各変数が導出されてもよい。
以下、本実施形態に係るモデリングシステム1における観測変数の推定精度について評価する。ここでは、図3に対応する学習モデルを欠損値の無いラベルデータ系列Dを用いてモデル化した場合(以下、「Cont-S」と示す。)、図3に対応する学習モデルを欠損値のあるアンラベルデータ系列Dを用いてモデル化した場合(以下、「Cont-SS」と示す。)、図5に対応する学習モデルを欠損値の無いラベルデータ系列Dを用いてモデル化した場合(以下、「Disc-S」と示す。)、図5に対応する学習モデルを欠損値のあるアンラベルデータ系列Dを用いてモデル化した場合(以下、「Disc-SS」と示す。)、図6に対応する学習モデルを欠損値の無いラベルデータ系列Dを用いてモデル化した場合(以下、「2L-S」と示す。)、及び、図6に対応する学習モデルを欠損値のあるアンラベルデータ系列Dを用いてモデル化した場合(以下、「2L-SS」と示す。)の評価結果を示した。
図7には、それぞれの場合での算出糖度の誤差の評価値MAE(Mean Absolute Error)、RMSE(Root Mean Square Error)、RAE(Relative Absolute Error)、RSE(Relative Square Error)を示している。このように、欠損値のあるデータ系列も用いてモデル化したCont-SSの場合は、欠損値の無いデータ系列のみを用いてモデル化したCont-Sに比較して、MAEが41%、RMSEが46%低下した。また、その他の生成過程を有する学習モデルについても、同様に、欠損値のあるデータ系列も用いてモデル化した場合のほうが、精度が向上していることが評価された。特に、Cont-SS、DiscSS、及び2L-SSの全てにおいて、RAE及びRSEが1未満となっており高精度が実現できている。
図8~10には、それぞれの場合での算出された糖度平均値の時間変化を糖度の実測値と比較して示している。これらの結果から、欠損値のあるデータ系列も用いてモデル化したCont-SS、Disc-SS、及び2L-SSの場合は、欠損値の無いデータ系列のみを用いてモデル化したCont-S、Disc-S、及び2L-Sに比較して、糖度の時間変化に追随できていることが分かった。このように、観測変数に欠損値が生じても相補的なモデル化処理によって潜在空間を適切に表現できており、少量の訓練データによっても高い表現力が維持された学習モデルをモデル化できていることが分かった。
1…モデリングシステム、3…入力部、5…学習部、7…予測値生成器、7a…第1導出部、7b…第2導出部、7c…第3導出部、d,z…潜在変数、r,s,u,v…外部変数、x,y…観測変数。

Claims (9)

  1. 複数の連続した時刻における直接観測できない変数である潜在変数を、直前の時刻の前記潜在変数から、第1の非線形関数を用いて順次導出する第1の導出部と、
    前記複数の連続した時刻における直接観測できる変数である第1の観測変数を、同一の時刻の前記潜在変数から、第2の非線形関数を用いて順次導出する第2の導出部と、
    前記複数の連続した時刻における直接観測できる変数である第2の観測変数を、同一の時刻の前記潜在変数から、第3の非線形関数を用いて順次導出する第3の導出部と、
    を備え、
    前記第1の非線形関数、前記第2の非線形関数、及び前記第3の非線形関数は、それぞれ、同一のパラメータによって表現された生成過程であり、
    前記同一のパラメータを、前記第1の観測変数の実測値及び前記第2の観測変数の実測値を用いた機械学習により、予め最適化し、前記第1の非線形関数、前記第2の非線形関数、及び前記第3の非線形関数を最適化する学習部をさらに備える、
    モデリングシステム。
  2. 前記第1の導出部は、外部から与えられた外部変数をさらに用いて前記潜在変数を順次導出する、
    請求項1記載のモデリングシステム。
  3. 前記第2の導出部は、外部から与えられた外部変数をさらに用いて前記第1の観測変数を順次導出し、
    前記第3の導出部は、外部から与えられた外部変数をさらに用いて前記第2の観測変数を順次導出する、
    請求項1又は2に記載のモデリングシステム。
  4. 前記潜在変数、前記第1の観測変数、及び前記第2の観測変数を、確率分布として導出する、
    請求項1~3のいずれか1項に記載のモデリングシステム。
  5. 前記潜在変数、前記第1の観測変数、及び前記第2の観測変数を、正規分布として導出する、
    請求項4記載のモデリングシステム。
  6. 前記潜在変数、前記第1の観測変数、及び前記第2の観測変数を、離散分布として導出する、
    請求項4記載のモデリングシステム。
  7. 前記第1~第3の非線形関数は、ニューラルネットワークを含んでいる、
    請求項1~6のいずれか1項に記載のモデリングシステム。
  8. 前記学習部は、前記第1の観測変数の実測値及び前記第2の観測変数の実測値を基にして、前記第1~第3の非線形関数に関するELBO値を計算し、前記ELBO値を目的関数とした機械学習により前記パラメータを最適化する、
    請求項1~7のいずれか1項に記載のモデリングシステム。
  9. 前記学習部は、前記第2の観測変数の実測値が存在する時刻と前記第2の観測変数の実測値が存在しない時刻とで異なる演算式を用いて前記ELBO値を計算し、複数の時刻で合計した前記ELBO値を前記目的関数として用いる、
    請求項に記載のモデリングシステム。
JP2018109495A 2018-06-07 2018-06-07 モデリングシステム Active JP7198474B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018109495A JP7198474B2 (ja) 2018-06-07 2018-06-07 モデリングシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018109495A JP7198474B2 (ja) 2018-06-07 2018-06-07 モデリングシステム

Publications (2)

Publication Number Publication Date
JP2019212159A JP2019212159A (ja) 2019-12-12
JP7198474B2 true JP7198474B2 (ja) 2023-01-04

Family

ID=68845332

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018109495A Active JP7198474B2 (ja) 2018-06-07 2018-06-07 モデリングシステム

Country Status (1)

Country Link
JP (1) JP7198474B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009217523A (ja) 2008-03-10 2009-09-24 Nippon Telegr & Teleph Corp <Ntt> 動画像処理方法、動画像処理装置および動画像処理プログラム
JP2009245236A (ja) 2008-03-31 2009-10-22 Institute Of Physical & Chemical Research 情報処理装置、情報処理方法、およびプログラム
WO2017019703A1 (en) 2015-07-27 2017-02-02 Google Inc. Predicting likelihoods of conditions being satisfied using recurrent neural networks

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009217523A (ja) 2008-03-10 2009-09-24 Nippon Telegr & Teleph Corp <Ntt> 動画像処理方法、動画像処理装置および動画像処理プログラム
JP2009245236A (ja) 2008-03-31 2009-10-22 Institute Of Physical & Chemical Research 情報処理装置、情報処理方法、およびプログラム
WO2017019703A1 (en) 2015-07-27 2017-02-02 Google Inc. Predicting likelihoods of conditions being satisfied using recurrent neural networks

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
AMOURA, K., et al.,"A STATE-SPACE NEURAL NETWORK FOR MODELING DYNAMICAL NONLINEAR SYSTEMS",Proceedings of the International Conference on Neural Computation Theory and Applications - NCTA [online],2011年10月24日,pp. 369-376,[retrieved on 2022-05-20], Retrieved from the Internet: <URL: https://www.scitepress.org/papers/2011/36805/36805.pdf>,<DOI: 10.5220/0003680503690376>
GOYAL, A., et al.,"Z-Forcing: Training Stochastic Recurrent Networks",Advances in Neural Information Processing Systems 30 (NIPS 2017) [online],2017年12月04日,pp. 6713-6723,[retrieved on 2022-05-20], Retrieved from the Internet: <URL: https://proceedings.neurips.cc/paper/2017/hash/900c563bfd2c48c16701acca83ad858a-Abstract.html>
飯塚 達哉ほか,完全制御型植物工場のための部分観測マルコフモデルを用いた植物生育モデリング,電子情報通信学会技術研究報告,2017年11月09日,Vol. 117, No. 310,pp. 41-46,0913-5685

Also Published As

Publication number Publication date
JP2019212159A (ja) 2019-12-12

Similar Documents

Publication Publication Date Title
JP7258965B2 (ja) ニューラルネットワークを使用する強化学習のための行動選択
Ward et al. Complexity is costly: a meta‐analysis of parametric and non‐parametric methods for short‐term population forecasting
JP6815708B2 (ja) インフルエンザ予測モデルの生成方法、装置及びコンピュータ可読記憶媒体
CN110263979B (zh) 基于强化学习模型预测样本标签的方法及装置
JP2020027370A (ja) 最適化装置、シミュレーションシステム及び最適化方法
US10783452B2 (en) Learning apparatus and method for learning a model corresponding to a function changing in time series
JP6176979B2 (ja) プロジェクト管理支援システム
WO2018130890A1 (en) Learning apparatus and method for bidirectional learning of predictive model based on data sequence
JP6718500B2 (ja) 生産システムにおける出力効率の最適化
Al Asheeri et al. Machine learning models for software cost estimation
AU2017283867A1 (en) Information processing device, method, and program
US20210248293A1 (en) Optimization device and optimization method
Adam et al. Scalable transformed additive signal decomposition by non-conjugate Gaussian process inference
JP6632538B2 (ja) 予測値整形システム、制御システム、予測値整形方法、制御方法、及び予測値整形プログラム
JP6977733B2 (ja) パラメータ最適化装置、パラメータ最適化方法、及びプログラム
JP2005004658A (ja) 変化点検出装置,変化点検出方法および変化点検出用プログラム
Guo Integrating genetic algorithm with ARIMA and reinforced random forest models to improve agriculture economy and yield forecasting
CN117540336A (zh) 时间序列预测方法、装置及电子设备
JP7198474B2 (ja) モデリングシステム
JP7114092B2 (ja) 画像データ加工装置、植物栽培システム及び画像データ加工方法
Chen et al. A Bayesian hierarchical approach to dual response surface modelling
Taslim et al. Comparative analysis of ARIMA and LSTM for predicting fluctuating time series data
CN103646407B (zh) 一种基于成分距离关系图的视频目标跟踪方法
US20140207715A1 (en) Data driven reduction of multi-scale models
Sedano et al. The application of a two-step AI model to an automated pneumatic drilling process

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210511

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220418

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221212

R150 Certificate of patent or registration of utility model

Ref document number: 7198474

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150