WO2022050426A1

WO2022050426A1 - 推定装置、推定方法及びプログラム

Info

Publication number: WO2022050426A1
Application number: PCT/JP2021/032874
Authority: WO
Inventors: 真史吉川
Original assignee: 株式会社 Preferred Networks
Priority date: 2020-09-07
Filing date: 2021-09-07
Publication date: 2022-03-10
Also published as: US20230206094A1; JPWO2022050426A1

Abstract

［課題］制御の最適化が可能となる。［解決手段］推定装置は、１又は複数のメモリと、１又は複数のプロセッサと、を備える。前記１又は複数のプロセッサは、少なくとも第１状態に関する情報を含む入力データを微分可能なモデルに入力して推定第２状態を算出し、第２状態と前記推定第２状態とに基づいて、前記第１状態から前記第２状態に遷移するパラメータを推定する、ように構成される。

Description

推定装置、推定方法及びプログラム

　本開示は、推定装置、推定方法及びプログラムに関する。

　今日、種々の目的において様々な物理現象のシミュレータが存在する。これらのシミュレータは、ある種のモデルを備え、このモデルの入出力に基づいて物理現象や制御を行った際の挙動等をシミュレーションする。しかしながら、モデル自体が微分不可能である場合がある。このような場合には、少し異なるパラメータを入力した場合に精度のよい結果を取得することが困難である。逆伝播可能なニューラルネットワークモデルを用いた例によれば、上記のようなパラメータの変化には対応することができるが、この結果が物理法則に則った制御値であるとは言いがたい。

R. T. Q. Chen, et.al., "Neural Ordinary Differential Equations," Dec. 14, 2019, arXiv:1806.07366, https://arxiv.org/abs/1806.07366 Shaojie Bai, et.al., "Deep Equilibrium Models", Sep. 3, 2019, arxiv: 1909.01377, https://arxiv.org/abs/1909.01377

　そこで、本開示では、物理現象を表す精度の高いモデルを備える推定装置を提供する。

　一実施形態によれば、推定装置は、１又は複数のメモリと、１又は複数のプロセッサと、を備える。前記１又は複数のプロセッサは、少なくとも第１状態に関する情報を含む入力データを微分可能なモデルに入力して推定第２状態を算出し、第２状態と前記推定第２状態とに基づいて、前記第１状態から前記第２状態に遷移するパラメータを推定する、ように構成される。

一実施形態に係る推定装置の概略を示すブロック図。一実施形態に係る推定装置の処理を示すフローチャート。一実施形態に係る推定装置のハードウェア実装例を示す図。

　以下、図面を参照して本発明の実施形態について説明する。図面及び実施形態の説明は一例として示すものであり、本発明を限定するものではない。以下、例としてプラントについて記載することがあるが、あくまで一例として記載しているだけであり、本開示の内容を限定するものではない。

　なお、本開示において、初期状態（第１状態）、最終状態（第２状態）という文言を用いるが、これは、演算の対象とする状態の初期と最終を意味してもよい。初期状態、最終状態とは、着目する物理現象等の観測を開始したタイミングにおける状態、観測を終了するタイミングにおける状態を示してもよいし、他の状態を示してもよい。この物理現象等の遷移状態のうち、着目する時間における初期状態、最終状態の意味であってもよい。すなわち、初期状態、最終状態とは、演算の対象とする期間における最初の状態と最後の状態を意味してもよい。この最初の状態と最後の状態は、状態が最初から最後へと、例えば時間的に遷移するのであれば、任意の２つのタイミングにおける状態としてもよい。以下の説明において、特に記載がない限り、最終状態と記載された場合には、入力された第２状態、又は、順伝播されて算出された推定第２状態とを文脈により読み分けることができることに留意されたい。

　（推定装置）
　図１には、一実施形態に係る推定装置の概略を示すブロック図である。推定装置１は、入力部１０と、記憶部１２と、推定部１４と、出力部１６と、を備える。この推定装置１は、例えば、現在の状態とパラメータを入力すると、将来の状態を推定して出力する。

　状態とは、一例として、制御の対象となる装置の状態を示す。より具体的な例として、推定の対象がプラントである場合には、プラントのある装置の内部に存在する物質の量、又は、当該物質の内部エネルギー等に関する情報を含む量であってもよい。

　パラメータとは、一例として、制御の対象となる装置等に入力する制御に関する値（以下、制御値とよぶ。）又は環境に関する値等である。例えば、プラントに関する推定装置１であれば、制御値は、制御可能である温度、湿度、圧力、電圧、電流、物質の濃度等の少なくとも１つに関する値である。このパラメータは、例えば、時系列のデータであってもよい。すなわち、パラメータは、例えば、推定の対象となる系における物理現象に何らかの影響を及ぼし得る値のうち、ユーザが制御できる値の全部又は一部である。制御には限られず、パラメータは、推定したいシステムに関して影響を及ぼしうる値であればよい。

　環境に関する値とは、一例として、制御の対象となる装置に関する情報を含んでもよい。より具体的には、環境に関する値は、制御の対象となる装置の体積、容積、形状に関する情報を含んでもよい。

　入力部１０は、種々の情報の入力を受け付ける。例えば、推定装置１は、入力部１０を介して、現在の状態に関するデータと、パラメータが入力される。また、別途教師データとなり得るデータとして、状態及びパラメータが、入力部１０を介して入力されてよい。例えば、望ましい状態が分かっている場合に、初期状態からどのようなパラメータを入力すれば当該望ましい状態になるかを推定したい場合、入力部１０を介してパラメータの初期値を入力する。パラメータの初期値は、上述のように時系列のデータであってもよく、この場合、パラメータの初期データを、入力部１０を介して入力する。

　記憶部１２は、例えば、入力されたデータ等を一時的に記憶する。この他、記憶部１２は、推定に用いるモデルに関するデータを格納してもよい。記憶部１２は、推定装置１がソフトウェアの処理をハードウェアにより具体的に実現するのであれば、このソフトウェアのプログラム、実行ファイル等を格納してもよい。また、記憶部１２は、推定結果を格納してもよい。

　推定部１４は、順伝播部１４０と、誤差算出部１４２と、逆伝播部１４４と、更新部１４６と、を備える。推定部１４は、物理モデルを用いて、入力データから推定結果を出力する。推定部１４は、例えば、ある時刻における状態とある時刻からのパラメータを物理モデルに入力し、将来の状態を推定する。物理モデルは、物理現象に基づいた物理方程式を解くモデルであり、微分可能に生成されたモデルである。また、推定部１４は、例えば、上記により推定された将来の状態に基づいて、望ましい状態となるようなパラメータを推定して出力する。

　順伝播部１４０は、物理モデルにおける順伝播処理を実行する。ここで、順伝播処理とは、例えば、時間に沿って順方向に微分方程式の数値解を求める処理である。より具体的には、順伝播部１４０は、与えられている物理系の微分方程式に基づいて初期値及びパラメータから逐次的にステップ（時刻）ごとの状態を取得する。順伝播部１４０は、例えば、物理モデルに状態と制御値（パラメータ）を入力し、制御値に指定された制御をした場合に状態がどのような遷移をするかを出力する。なお、物理モデルによっては、順伝播部１４０は、微分方程式に基づいた最終的な状態（最終状態：第２状態）だけを出力するものであってもよい。順伝播部１４０における処理は、物理モデルが示す数式が代数方程式や微分代数方程式である場合も含んでよい。例えば、代数方程式の場合の順伝播処理とは、時間遷移を行わず、ある制御値や対象となる装置の幾何学的な構造等をパラメータとして入力した場合に、定常状態として実現する状態を取得する処理である。例えば、微分代数方程式の場合の順伝播処理とは、時間に沿って順方向に微分代数方程式の数値解を求める処理である。

　誤差算出部１４２は、順伝播部１４０が出力した状態に関する誤差を算出する。誤差は、例えば、入力部１０を介して入力された最終的な状態と、順伝播部１４０が出力した最終的な状態と、を比較することにより算出される。また、繰り返し演算を行う場合には、誤差算出部１４２は、同じ時刻における、入力部１０を介して入力された状態と、逆伝播され、更新されたパラメータに基づいた状態と、を比較することにより算出する。

　逆伝播部１４４は、物理モデルにおける逆伝播処理を実行する。ここで、逆伝播処理とは、例えば、微分方程式と微分代数方程式の場合は時間を遡って誤差の初期状態とパラメータに対する微分を求める処理である。より具体的には、逆伝播部１４４は、誤差算出部１４２が算出した誤差に基づいて、少なくとも順伝播部１４０により出力された最終的な状態から時間を遡り、種々の値を取得する。逆伝播部１４４は、例えば、物理モデルに、初期状態と制御値とを入力し、パラメータを少し変更した場合にどのような状態になるかを出力する。この逆伝播処理は、微分可能、又は、必要な時刻において勾配が算出可能な物理モデルを用いて、誤差算出部１４２が状態から勾配を求めることにより実行される。

　更新部１４６は、逆伝播部１４４により逆伝播された結果に基づいて、パラメータを更新する。更新部１４６は、例えば、逆伝播部１４４から出力された誤差のパラメータによる微分に基づいて、より最適なパラメータに更新し、推定として出力する。なお、必要があれば、更新部１４６が制御値の更新をした後に、逆伝播を続行してもよい。また、別の例としては、順伝播からの処理を繰り返してもよい。

　出力部１６は、推定部１４が推定した結果を出力する。出力部１６は、ユーザインタフェースを介して推定結果をユーザへと出力してもよいし、出力インタフェースを介して外部のファイルサーバ等にデータを出力してもよい。また、出力部１６は、記憶部１２へとデータを格納してもよい。出力とは、このように、外部への出力はもちろん、内部への出力も含むものとする。

　図２は、本実施形態に係る推定装置１の処理を示すフローチャートである。このフローチャートを用いて推定装置１の処理の流れについて説明する。

　（代数方程式の場合）
　まず、入力部１０を介して推定装置１に必要となるデータを入力する（S100）。必要となるデータは、例えば、パラメータに関するデータである。パラメータは、例えば装置に関する量であってもよい。

　次に、順伝播部１４０は、物理モデルに基づいて入力されたデータを用いて順伝播処理を実行する（S102）。順伝播部１４０は、例えば、パラメータが与えられた場合に、代数方程式を満たす状態を算出する。代数方程式は、例えば以下の式で表される。

ここで、fは、物理系を表す関数、xを状態、θをパラメータとする。fは、(1)式に示すように、状態xとパラメータθを変数とする関数で表すことができる。状態x及びパラメータθは、例えばベクトルで表される。この代数方程式は、線形であっても良いし、非線形であっても良い。

　順伝播部１４０は、(1)式に基づいて物理モデル（代数方程式ソルバ）を用いることにより、状態の遷移を算出する。代数方程式ソルバは、例えば、繰り返し計算によって、(1)式を満たす、あるいは近似的に満たす状態を取得する。順伝播部１４０は、入力されたパラメータに基づく状態を取得する。順伝播部１４０は、逆伝播に用いる種々の方法に基づいて、必要な値を記憶部１２に格納する。

　次に、誤差算出部１４２は、順伝播部１４０が算出した状態と、入力された状態とを比較して、誤差を算出する（S104）。誤差算出部１４２は、例えば、順伝播部１４０が算出した最終状態（推定第２状態）と、入力された実際の最終状態（第２状態）とを比較して、以下のように誤差（ロスL）を算出する。

ここで、yは、入力された状態の値であり、mean()は、状態の成分の平均値を示す。(2)式のような２乗誤差であれば、後述するように、dL/dθの値を取得することが可能となり、与えられたθに対して、θを更新することにより誤差を小さくすることができる。誤差（ロス）は、この関数には限られず、例えば、適切なノルムといったθに対する勾配を取得できるものであればよい。

　次に、逆伝播部１４４は、誤差算出部１４２が算出した誤差を逆伝播する（S106）。誤差を、時間軸を遡って逆方向に伝播することにより、パラメータの更新を実行することが可能となる。

　次に、更新部１４６は、逆伝播された誤差に基づいて、パラメータθを更新する（S108）。例えば、(2)式に基づいてdL/dθを算出することにより、θに対するLの勾配を取得し、θ - ε dL/dθ等とすることにより、パラメータθを更新する。

　次に、推定装置１は、推定が終了したか否かを判断する（S110）。この判断は、例えば、更新されるθに対して望ましい最終状態を指定しておき、誤差が所定のしきい値よりも小さくなるタイミングで推定処理を終了としてもよい。別の例として、出力部１６がユーザインタフェースを介してユーザに状態を出力し、その出力を観察してユーザが推定終了か否かを選択してもよい。また、所定回数の順伝播と逆伝播を繰り返して出力してもよい。このように、推定の終了条件は、任意に定義することが可能である。

　推定が終了でないと判断した場合（S110：NO）、S104からの処理を繰り返す。また、別の例として、S102からの処理を繰り返してもよい。

　S108までの処理は、S110において推定の終了条件を満たすまで繰り返される。推定が終了であると判断される（S110：YES）、出力部１６は、推定結果を出力し、推定装置１は、処理を終了する。出力部１６は、パラメータを変更した場合、例えば、推定された状態とともに、取得したパラメータを出力してもよい。このように、推定装置１は、状態を推定するとともに、望ましいパラメータを、例えば、２乗誤差等を用いて最適化することもできる。物理モデルが精度のよい状態の推定をすることができる場合、このパラメータの推定も精度よく実行することが可能となる。

　以上のように、代数方程式で表される系の状態を推定する物理モデルをパラメータで微分可能に生成することにより、例えば、パラメータを変更した場合にも推定値の取得が可能となり、すなわち、パラメータを最適化することが可能となる。この結果、パラメータの精度のよい、かつ、物理法則に則った精度のよい推定を実行することが可能となる。

　（代数方程式の物理モデル）
　次に、代数方程式の物理モデルとその微分方法について説明する。

　上記のように、本実施形態における物理モデルは、微分可能であることにより、状態xが与えられた場合のパラメータθの推定値を取得する。状態xをベクトルとすると、状態xが満たす代数方程式は、例えば、(1)式の通りである。

　これに対する代数方程式のソルバ（物理モデル）は、(1)式を満たす状態xを求めるものと定義する。なお、ソルバは、近似的に求めるものも含む。

　代数方程式ソルバを微分可能にするとは、例えば、この物理モデルに入力されるパラメータθに対して微分可能にすることをいう。すなわち、この(1)式を満たすように求められた状態xがθで微分可能になるように物理モデルは生成される。このように表される物理モデルを微分可能にする方法について、例を挙げて説明する。

　物理モデルの生成、つまり代数方程式の数値計算には、例えば、ニュートン法、減速ニュートン法等のいくつかの手法を用いてもよい。例えば、ニュートン法を用いる場合には、物理モデルは、以下に示す更新式に基づいて状態を算出するモデルである。

ここでdf/dxはヤコビ行列である。この物理モデルを用いる場合には、順伝播部１４０は、最終的に取得される状態を記憶部１２に格納する。

　逆伝播では、Deep Equilibrium Modelの手法を用いても良い。この手法によれば、(1)式に基づいて、逆伝播で使われる微分の計算を実行する。

ここで∂f/∂x, ∂f/∂θはヤコビ行列である。この微分を使うことによって、最終的にdL/dθを求めることが可能となる。

　（微分方程式、微分代数方程式の場合）
　まず、入力部１０を介して推定装置１に必要となるデータを入力する（S100）。必要となるデータは、例えば、状態とパラメータに関するデータである。状態は、例えば、初期状態を少なくとも含む。また、状態として、最終状態を少なくとも含む実際の観測データを入力してもよく、これは、最適化に用いられる。パラメータは、例えば、時系列のデータであってもよい。一例として、パラメータは、ランダムに決定されたものを入力してもよい。以下、時刻t0～t1に関して着目し、時刻t0における状態x(t0)を初期状態とし、時刻t1における状態x(t1)を最終状態とする。

　次に、順伝播部１４０は、物理モデルに基づいて入力されたデータを用いて順伝播処理を実行する（S102）。順伝播部１４０は、例えば、状態に対して時系列のパラメータが与えられた場合に、どのような状態へと遷移するかを逐次的に算出する。パラメータが時系列のデータである場合には、順伝播部１４０は、パラメータにしたがい、刻々と遷移する状態を物理モデルに基づいて数値解を算出する。例えば、微分方程式の場合、順伝播部１４０は、以下の式で表される微分方程式に基づいて数値解を算出する。

ここで、fは、物理系を示す関数、xを状態、θをパラメータとする。fは、(1)式に示すように、状態xとパラメータθを変数とする関数で表すことができる。状態xは、例えば、ベクトルで表される。この微分方程式は、線形であってもよいし、非線形であってもよい。

　例えば、微分代数方程式の場合、順伝播部１４０は、以下の式で表される微分代数方程式に基づいて数値解を算出する。

ここで、fは、物理系を示す関数、xを状態、xドットを状態の時間微分（= dx/dt）、θをパラメータとする。fは、(6)式に示すように、状態xと状態の時間微分xドットとパラメータθが関係を満たす時に0になる。状態xは、例えば、ベクトルで表される。この微分方程式は、線形であってもよいし、非線形であってもよい。

　順伝播部１４０は、(5)式又は(6)式に基づいて物理モデル（微分方程式ソルバ・微分代数方程式ソルバ）を用いることにより、状態の遷移を算出する。微分方程式ソルバ・微分代数方程式ソルバは、例えば、上記の式にしたがった時刻ごとにおける微分係数を用いて、積分値を数値計算で算出することにより、状態xを取得する。順伝播部１４０は、例えば、入力されたパラメータの時系列と、入力された初期状態を用いて物理モデルを順伝播して、入力されたパラメータ及び初期状態（第１状態）に基づく最終状態（推定第２状態）を取得する。順伝播部１４０は、逆伝播に用いる種々の方法に基づいて、必要な値を記憶部１２に格納する。

　次に、誤差算出部１４２は、順伝播部１４０が算出した状態（推定第２状態）と、入力された状態（第２状態）とを比較して、誤差を算出する（S104）。誤差算出部１４２は、例えば、順伝播部１４０が算出した最終状態（推定第２状態）と、入力された実際の最終状態（第２状態）とを比較して、上述した(2)式により、誤差（ロスL）を算出する。具体的な算出方法は、上述した代数方程式の場合と同様である。もちろん、この場合でも、誤差（ロス）は、この関数には限られず、例えば、適切なノルムといったθに対する勾配を取得できるものであればよい。

　次に、逆伝播部１４４は、誤差算出部１４２が算出した誤差を逆伝播する（S106）。誤差を、時間軸を遡って逆方向に伝播することにより、時刻t0～t1における任意の時刻におけるパラメータの更新を実行することが可能となる。

　S108からS110までの処理も、上述の代数方程式の場合と同様である。

　以上のように、時間に関する微分方程式・微分代数方程式で表される系の状態を推定する物理モデルをパラメータで微分可能に生成することにより、例えば、パラメータを変更した場合にも推定値の取得が可能となり、すなわち、パラメータを最適化することが可能となる。この結果、パラメータの精度のよい、かつ、物理法則に則った精度のよい推定を実行することが可能となる。

　（微分方程式・微分代数方程式の物理モデル）
　次に、物理モデルについて説明する。以下では微分方程式の場合を説明するが、微分代数方程式の場合でも同様の微分計算方法を使用しても良い。

　上記のように、本実施形態における物理モデルは、微分可能であることにより、状態xが与えられた場合のパラメータθの推定値を取得する。状態xをベクトルとすると、状態xが満たす微分方程式は、例えば、(1)式の通りである。

　これに対する時刻t0～t1における微分方程式のソルバ（物理モデル）は、以下の積分を実行するものと定義することができる。

　この(7)式を微分可能にするとは、例えば、この物理モデルに入力されるパラメータθと初期状態x(t0)に対して積分結果x(t1; θ)を微分可能にすることをいう。すなわち、この(7)式がθで微分可能になるように物理モデルは生成される。このように表される物理モデルを微分可能にする方法について、いくつか例を挙げて説明する。

　（第１例）
　物理モデルの生成には、例えば、オイラー法、中点法、ルンゲ＝クッタ法等のいくつかの手法を用いてもよい。例えば、オイラー法を用いる場合には、物理モデルは、以下に示す式に基づいて状態を算出するモデルである。

この物理モデルを用いる場合には、順伝播部１４０は、時刻に対して逐次的に取得される状態について、演算の途中で得られたデータ（計算グラフに含まれる中間データ）と、各時刻における状態を記憶部１２に格納する。記憶部１２に記憶されているデータに基づき、各時刻の状態x(t)とパラメータθに関する勾配（微分値）を(9)式、(10)式に基づいて取得することができる。

この式において、時刻に対して順伝播とは逆向きに逐次的にそれぞれの勾配を取得することができる。時刻tにおけるx(t)とθについての勾配は、時刻t + Δtにおけるx(t)とθについての勾配を取得することにより求めることができる。

　df/dxは、記憶部１２に格納されている値により取得することが可能である。さらに、例えば、ロス関数が最終状態のみに依存するとすると、∂L/∂x(t1)が計算でき、また(∂L/∂θ) t1 = 0として、(9)式、(10)式に基づいて、逐次的に状態x(t)、パラメータθによる微分値を取得することが可能となる。すなわち、ロス関数Lの初期状態x(t0)、パラメータθについての勾配を取得することが可能である。このように、順伝播した途中経過を記憶部１２に記憶しておくことにより、物理モデルを微分可能とすることができる。

　なお、実際には、オイラー法では誤差が大きくなったり、解が望ましいものに収束しなかったりするが、上記の記憶部１２に全ての計算の経過を記憶する手法を用いれば、ルンゲ＝クッタ法等においても同様に計算を実行することが可能である。

　このように、微分方程式ソルバの計算グラフを誤差逆伝播することにより、ロス関数Lの状態x、パラメータθについての勾配を算出することが可能となる。なお、ロス関数が最終状態x(τ)のみではなく、途中状態に依存している場合でも、同様に誤差逆伝播することにより、勾配を算出することが可能である。

　（第２例）
　上記の方法では、常微分方程式を逆伝播するために、順伝播における計算グラフを記憶部１２に格納するため、大きなメモリが必要となる。これを回避するべく、Neural ODE（Ordinary Differential Equations）の手法を用いてもよい。

　この手法によれば、(7)式に基づいて、順伝播及び逆伝播の計算を実行する。順伝播を実行する場合には、(7)式を順方向に向かって計算し、逆伝播を実行する場合には、ロスに対する勾配を計算するための微分方程式を用意し、逆方向に向かって積分する。このように計算することにより、順方向の計算と、逆方向の計算を独立して実行することが可能となる。

　物理モデルの生成は、ロスLを(11)式のように定義し、このロスを最小化する最適化を実行する。

このロスに対して、(12)式のようなaを定義することにより、上記した計算グラフのデータを用いずに、すなわち、記憶部１２に計算グラフのデータを格納することなく時間について逆方向の計算を(13)式にしたがって実行することが可能となる。

ここで、(13)式、(15)式は、ロス関数L_ODEの状態x(t)による勾配(12)式、とパラメータθによる勾配(14)式を計算するための微分方程式になっており、(5)式と連立させて、適切な微分方程式ソルバによる積分を、t1からt0方向に実行する。この処理により、L_ODEの初期状態による微分∂L_ODE/∂x(t0)と、パラメータによる微分∂L_ODE/∂θを取得することが可能になる。

　（第３例）
　上記のNeural ODEを用いた方法では、記憶部１２において格納されるデータを、順伝播の計算グラフを格納する場合に比べて大幅に減少することが可能である。一方で、逆方向の計算は、aについて時間を逆方向に計算するため、数値的に不安定な計算になることがあり、必ずしも適切な計算ができるとは限らない。例えば、順方向における計算で定常状態に向かう現象になる場合に、同様の箇所で逆方向の計算をすると、解が発散する等の問題が発生し得る。そこで、以下に説明する形態においては、順方向で計算し積分した状態を、逆方向の計算で使うことにし、発散しないようにする。

　この手法によれば、順伝播を実行する場合には、(7)式を順方向に向かって計算する。第２例では、逆伝播の時に、(5)、式(13)、式(14)式を連立させて、微分方程式ソルバによる積分を、t1かt0方向に実行していたが、ここで(5)式の積分によって計算され、(13)式、(14)式の積分で使用されるx(t)を、順伝播の時に計算して記憶部１２に格納されたx(t)で代用する。このようにすることで、発散しない順伝播の時に計算された状態x(t)を逆伝播の時にしようすることができる。

　本手法によれば、順方向における計算のタイミングにおいては、計算グラフのデータを格納せず、状態xに関するデータを格納すればよいので、上記の計算グラフのデータよりもメモリ効率を改善することができる。さらに、入力データとして取得できるθの時系列と、順伝播処理により取得された状態xの時系列から勾配を求めるので、時間を遡ることにより発散する可能性がある計算を、順伝播の時の計算で代替することができ、解が発散することを抑制することができる。

　（第４例）
　上記の第３例においては、時刻t0～t1の間の状態xの時系列を記憶部１２に格納するものとしたが、これには限られない。例えば、所定の時間tstep（所定ステップ数）を用いて、時刻t1 - tstep～t1までの状態xの時系列を記憶部１２に格納してもよい。

　この場合、時刻t1 - tstepから時刻t1までの状態遷移に基づいて、第３例と同様(13)式、(15)式にしたがって逆伝播を実行することが可能である。逆伝播を時刻t1 - tstepよりも遡る必要がある場合には、時刻t0から順伝播処理を実行し、必要な状態を算出する。

　また、これには限られず、時刻t0から所定ステップごと（所定時刻ごと）に状態を記憶しておいてもよい。逆伝播において時刻t1 - tstepより前の状態のデータが必要な場合においては、格納されている状態のうち、直近の状態から順伝播を実行し、この順伝播された状態に基づいて逆伝播を実行してもよい。

　このように、本形態においては、上記の形態と比較して順伝播を実行するコストが必要となる可能性がある一方で、メモリの消費量を少なくすることができる。このため、解の安定性を担保するとともに、消費メモリ量の調整をすることができる。

　ここでの、微分方程式・微分代数方程式の、説明ではx(t0)の状態が与えられている場合にx(t1)を求め、L(x(t1))の微分を求めることを行なっていたが、t0, t1, t2というように、時間は複数あっても良い。x(t0)が与えられていて、誤差関数がL(x(t0), x(t1), x(t2))とそれぞれの時刻の状態に依存していたとしても、Lの初期状態x(t0)とパラメータθに関する微分がそれぞれの４つの例で可能である。

　本実施形態に係る物理モデルは、順伝播部１４０が各例に示すように順伝播を実行しつつ記憶部１２に適切なデータを格納し、誤差算出部１４２及び逆伝播部１４４が各例における誤差算出及び勾配算出を実行することにより逆伝播を実行する。

　更新部１４６は、このように求められた勾配の値から、時刻t0～t1の間の任意の時刻τについて、以下のようにパラメータを更新することが可能である。

ここで、εは、適切に任意に決定することが可能である。

　また、パラメータの更新方法は上記の方法でなくても良い、AdamやL-BFGS-Bなどの勾配を用いたパラメータ更新方法なら何でも良い。

　この順伝播、誤差算出、逆伝播、及び、パラメータ更新の処理は、図２の矢印及び点線矢印で示されるように、必要に応じて繰り返し実行してもよい。繰り返し演算をする場合、例えば、εを小さくすると、演算の繰り返し回数が増加するが、徐々に近い解に近づいて行くし、ある程度大きくすると、初期段階における収束は速いが、精度のよい解に収束するとは限らない。例えば、演算の初期段階においてεを大きくし、徐々に小さくしてもよい。

　上記の例での式で出てきた、関数fの微分が登場する項は、ニューラルネットワークで使われているような誤差逆伝播により求めても良い。

　上記の例での式で出てきた、関数fは内部で代数方程式を解く処理を行うものを選択しても良い。この場合の微分計算ではDeep Equilibrium Modelの手法を使っても良い。

　微分代数方程式の勾配の計算は、上記の例の計算方法とDeep Equilibrium Modelの手法を組み合わせても良い。例えば、第一例で微分代数方程式を数値的に解く場合に、順伝播では代数方程式を数値的に解く場合があるが、逆伝播では代数方程式のソルバの計算を誤差逆伝播する代わりに、Deep Equilibrium Modelによる以下の式による計算を使用することができる。

　（第５例）
　代数微分方程式により系が表される場合、誤差（ロス）の勾配を算出する方法は、後退微分法（BDF：Backward Differentiation Formulae）に基づいた方法としてもよい。(6)式がステップごとに成り立つことを用いると、ステップごとの代数方程式を解く問題に帰着することができる。より具体的には、過去の所定ステップ数sの状態xとパラメータθ を用いて、次のステップの状態を求めるための代数方程式を近似的に生成することができる。例えば、過去の所定ステップ数sと次のステップにおける状態についての(6)式を、以下のように書き換える。

　誤差の勾配dL/dx、dL/dθを、(18)式に示されるgを用いて以下のように変形する。

　(19)式、(20)式により、誤差の勾配を数値的に算出することが可能であるので、上記の各例と同様に、入力された各ステップの状態に対するパラメータを適切に設定することが可能となる。

　なお、上述の後退微分法においては、ステップの刻み幅は、任意としてもよい。例えば、所定値の刻み幅としてもよいし、可変の刻み幅としてもよい。

　上記においては、(6)式のように陰に微分方程式が表される場合に、BDFを用いることとしたが、これには限られない。例えば、(5)式のように陽に微分方程式が表される場合についても、同様に式を変形することにより、(19)式、(20)式を用いて誤差の勾配を取得することが可能である。

　以上のように、本実施形態に係る推定装置１によれば、例えば、現在の状態と将来の状態を入力すると、どのような制御値をすればよいかを出力することができる。物理モデルを微分可能にすることにより、上記のようにメモリ消費量と、安定性との平仄を適切に維持した上で、逆伝播を必要とする処理を実行することが可能となる。

　本実施形態に係る物理モデルは、例えば、蒸留塔、電気回路、発電所、工場、ダム等の制御に応用することが可能である。これらの制御に用いる物理モデルは、時間軸に沿って状態が遷移するものであるが、時間軸に沿って微分可能なもの以外にも適用することが可能である。例えば、隣接する粒子の状態に基づいて状態が決定される粒子のモデル等にも応用することができる。このように、本実施形態によれば、線形又は非線形な微分方程式で示される物理系について、精度が高く、かつ、物理法則に適した予測モデルを形成することが可能となる。

　また、応用する範囲は、物理系には限られず、微分方程式で定式化できるものに応用することが可能である。例えば、本実施形態に係るモデルは、経済、金融等の数理モデルにも応用することが可能である。

　また、別の応用例として、種々の制御における強化学習における方策の最適化に用いることも可能である。上記におけるロスL（例えば、(2)式、(11)式等）を報酬に置き換え、報酬のパラメータについての勾配を求めることにより、方策を最適化することに用いてもよい。

　上記の全ての訓練済モデルは、例えば、説明したように訓練した上で、さらに、一般的な手法により蒸留されたモデルを含む概念であってもよい。

　前述した実施形態における各装置（推定装置１）の一部又は全部は、ハードウェアで構成されていてもよいし、CPU（Central Processing Unit）、又はGPU（Graphics Processing Unit）等が実行するソフトウェア（プログラム）の情報処理で構成されてもよい。ソフトウェアの情報処理で構成される場合には、前述した実施形態における各装置の少なくとも一部の機能を実現するソフトウェアを、フレキシブルディスク、CD-ROM（Compact Disc-Read Only Memory）又はUSB（Universal Serial Bus）メモリ等の非一時的な記憶媒体（非一時的なコンピュータ可読媒体）に収納し、コンピュータに読み込ませることにより、ソフトウェアの情報処理を実行してもよい。また、通信ネットワークを介して当該ソフトウェアがダウンロードされてもよい。さらに、ソフトウェアがASIC（Application Specific Integrated Circuit）又はFPGA（Field Programmable Gate Array）等の回路に実装されることにより、情報処理がハードウェアにより実行されてもよい。

　ソフトウェアを収納する記憶媒体の種類は限定されるものではない。記憶媒体は、磁気ディスク、又は光ディスク等の着脱可能なものに限定されず、ハードディスク、又はメモリ等の固定型の記憶媒体であってもよい。また、記憶媒体は、コンピュータ内部に備えられてもよいし、コンピュータ外部に備えられてもよい。

　図３は、前述した実施形態における各装置（推定装置１）のハードウェア構成の一例を示すブロック図である。各装置は、一例として、プロセッサ７１と、主記憶装置７２（メモリ）と、補助記憶装置７３（メモリ）と、ネットワークインタフェース７４と、デバイスインタフェース７５と、を備え、これらがバス７６を介して接続されたコンピュータ７として実現されてもよい。

　図３のコンピュータ７は、各構成要素を一つ備えているが、同じ構成要素を複数備えていてもよい。また、図３では、１台のコンピュータ７が示されているが、ソフトウェアが複数台のコンピュータにインストールされて、当該複数台のコンピュータそれぞれがソフトウェアの同一の又は異なる一部の処理を実行してもよい。この場合、コンピュータそれぞれがネットワークインタフェース７４等を介して通信して処理を実行する分散コンピューティングの形態であってもよい。つまり、前述した実施形態における各装置（推定装置１）は、１又は複数の記憶装置に記憶された命令を１台又は複数台のコンピュータが実行することで機能を実現するシステムとして構成されてもよい。また、端末から送信された情報をクラウド上に設けられた１台又は複数台のコンピュータで処理し、この処理結果を端末に送信するような構成であってもよい。

　前述した実施形態における各装置（推定装置１）の各種演算は、１又は複数のプロセッサを用いて、又は、ネットワークを介した複数台のコンピュータを用いて、並列処理で実行されてもよい。また、各種演算が、プロセッサ内に複数ある演算コアに振り分けられて、並列処理で実行されてもよい。また、本開示の処理、手段等の一部又は全部は、ネットワークを介してコンピュータ７と通信可能なクラウド上に設けられたプロセッサ及び記憶装置の少なくとも一方により実行されてもよい。このように、前述した実施形態における各装置は、１台又は複数台のコンピュータによる並列コンピューティングの形態であってもよい。

　プロセッサ７１は、コンピュータの制御装置及び演算装置を含む電子回路（処理回路、Processing circuit、Processing circuitry、CPU、GPU、FPGA又はASIC等）であってもよい。また、プロセッサ７１は、専用の処理回路を含む半導体装置等であってもよい。プロセッサ７１は、電子論理素子を用いた電子回路に限定されるものではなく、光論理素子を用いた光回路により実現されてもよい。また、プロセッサ７１は、量子コンピューティングに基づく演算機能を含むものであってもよい。

　プロセッサ７１は、コンピュータ７の内部構成の各装置等から入力されたデータやソフトウェア（プログラム）に基づいて演算処理を行い、演算結果や制御信号を各装置等に出力することができる。プロセッサ７１は、コンピュータ７のOS（Operating System）や、アプリケーション等を実行することにより、コンピュータ７を構成する各構成要素を制御してもよい。

　前述した実施形態における各装置（推定装置１）は、１又は複数のプロセッサ７１により実現されてもよい。ここで、プロセッサ７１は、１チップ上に配置された１又は複数の電子回路を指してもよいし、２つ以上のチップあるいは２つ以上のデバイス上に配置された１又は複数の電子回路を指してもよい。複数の電子回路を用いる場合、各電子回路は有線又は無線により通信してもよい。

　主記憶装置７２は、プロセッサ７１が実行する命令及び各種データ等を記憶する記憶装置であり、主記憶装置７２に記憶された情報がプロセッサ７１により読み出される。補助記憶装置７３は、主記憶装置７２以外の記憶装置である。なお、これらの記憶装置は、電子情報を格納可能な任意の電子部品を意味するものとし、半導体のメモリでもよい。半導体のメモリは、揮発性メモリ、不揮発性メモリのいずれでもよい。前述した実施形態における各装置（推定装置１）において各種データを保存するための記憶装置は、主記憶装置７２又は補助記憶装置７３により実現されてもよく、プロセッサ７１に内蔵される内蔵メモリにより実現されてもよい。例えば、前述した実施形態における記憶部１２は、主記憶装置７２又は補助記憶装置７３により実現されてもよい。

　記憶装置（メモリ）１つに対して、複数のプロセッサが接続（結合）されてもよいし、単数のプロセッサが接続されてもよい。プロセッサ１つに対して、複数の記憶装置（メモリ）が接続（結合）されてもよい。前述した実施形態における各装置（推定装置１）が、少なくとも１つの記憶装置（メモリ）とこの少なくとも１つの記憶装置（メモリ）に接続（結合）される複数のプロセッサで構成される場合、複数のプロセッサのうち少なくとも１つのプロセッサが、少なくとも１つの記憶装置（メモリ）に接続（結合）される構成を含んでもよい。また、複数台のコンピュータに含まれる記憶装置（メモリ））とプロセッサによって、この構成が実現されてもよい。さらに、記憶装置（メモリ）がプロセッサと一体になっている構成（例えば、L1キャッシュ、L2キャッシュを含むキャッシュメモリ）を含んでもよい。

　ネットワークインタフェース７４は、無線又は有線により、通信ネットワーク８に接続するためのインタフェースである。ネットワークインタフェース７４は、既存の通信規格に適合したもの等、適切なインタフェースを用いればよい。ネットワークインタフェース７４により、通信ネットワーク８を介して接続された外部装置９Ａと情報のやり取りが行われてもよい。なお、通信ネットワーク８は、WAN（Wide Area Network）、LAN（Local Area Network）、PAN（Personal Area Network）等のいずれか、又は、それらの組み合わせであってよく、コンピュータ７と外部装置９Ａとの間で情報のやりとりが行われるものであればよい。WANの一例としてインターネット等があり、LANの一例としてIEEE802.11やイーサネット（登録商標）等があり、PANの一例としてBluetooth（登録商標）やNFC（Near Field Communication）等がある。

　デバイスインタフェース７５は、外部装置９Ｂと直接接続するUSB等のインタフェースである。

　外部装置９Ａは、コンピュータ７とネットワークを介して接続されている装置である。外部装置９Ｂは、コンピュータ７と直接接続されている装置である。

　外部装置９Ａ又は外部装置９Ｂは、一例として、入力装置であってもよい。入力装置は、例えば、カメラ、マイクロフォン、モーションキャプチャ、各種センサ等、キーボード、マウス、又は、タッチパネル等のデバイスであり、取得した情報をコンピュータ７に与える。また、パーソナルコンピュータ、タブレット端末、又は、スマートフォン等の入力部とメモリとプロセッサを備えるデバイスであってもよい。

　また、外部装置９Ａ又は外部装置９Ｂは、一例として、出力装置でもよい。出力装置は、例えば、LCD（Liquid Crystal Display）、CRT（Cathode Ray Tube）、PDP（Plasma Display Panel）、又は、有機EL（Electro Luminescence）パネル等の表示装置であってもよいし、音声等を出力するスピーカ等であってもよい。また、パーソナルコンピュータ、タブレット端末、又は、スマートフォン等の出力部とメモリとプロセッサを備えるデバイスであってもよい。

　また、外部装置９Ａ又は外部装置９Ｂは、記憶装置（メモリ）であってもよい。例えば、外部装置９Ａは、ネットワークストレージ等であってもよく、外部装置９Ｂは、HDD等のストレージであってもよい。

　また、外部装置９Ａ又は外部装置９Ｂは、前述した実施形態における各装置（推定装置１）の構成要素の一部の機能を有する装置でもよい。つまり、コンピュータ７は、外部装置９Ａ又は外部装置９Ｂの処理結果の一部又は全部を送信又は受信してもよい。

　本明細書（請求項を含む）において、「a、b及びcの少なくとも1つ（一方）」又は「a、b又はcの少なくとも1つ（一方）」の表現（同様な表現を含む）が用いられる場合は、a、b、c、a-b、a-c、b-c、又は、a-b-cのいずれかを含む。また、a-a、a-b-b、a-a-b-b-c-c等のように、いずれかの要素について複数のインスタンスを含んでもよい。さらに、a-b-c-dのようにdを有する等、列挙された要素（a、b及びc）以外の他の要素を加えることも含む。

　本明細書（請求項を含む）において、「データを入力として／データに基づいて／に従って／に応じて」等の表現（同様な表現を含む）が用いられる場合は、特に断りがない場合、各種データそのものを入力として用いる場合や、各種データに何らかの処理を行ったもの（例えば、ノイズ加算したもの、正規化したもの、各種データの中間表現等）を入力として用いる場合を含む。また「データに基づいて／に従って／に応じて」何らかの結果が得られる旨が記載されている場合、当該データのみに基づいて当該結果が得られる場合を含むとともに、当該データ以外の他のデータ、要因、条件、及び／又は状態等にも影響を受けて当該結果が得られる場合をも含み得る。また、「データを出力する」旨が記載されている場合、特に断りがない場合、各種データそのものを出力として用いる場合や、各種データに何らかの処理を行ったもの（例えば、ノイズ加算したもの、正規化したもの、各種データの中間表現等）を出力とする場合も含む。

　本明細書（請求項を含む）において、「接続される（connected）」及び「結合される（coupled）」との用語が用いられる場合は、直接的な接続／結合、間接的な接続／結合、電気的（electrically）な接続／結合、通信的（communicatively）な接続／結合、機能的（operatively）な接続／結合、物理的（physically）な接続／結合等のいずれをも含む非限定的な用語として意図される。当該用語は、当該用語が用いられた文脈に応じて適宜解釈されるべきであるが、意図的に或いは当然に排除されるのではない接続／結合形態は、当該用語に含まれるものして非限定的に解釈されるべきである。

　本明細書（請求項を含む）において、「AがBするよう構成される（A configured to B）」との表現が用いられる場合は、要素Aの物理的構造が、動作Bを実行可能な構成を有するとともに、要素Aの恒常的（permanent）又は一時的（temporary）な設定（setting/configuration）が、動作Bを実際に実行するように設定（configured/set）されていることを含んでよい。例えば、要素Aが汎用プロセッサである場合、当該プロセッサが動作Bを実行可能なハードウェア構成を有するとともに、恒常的（permanent）又は一時的（temporary）なプログラム（命令）の設定により、動作Bを実際に実行するように設定（configured）されていればよい。また、要素Aが専用プロセッサ又は専用演算回路等である場合、制御用命令及びデータが実際に付属しているか否かとは無関係に、当該プロセッサの回路的構造が動作Bを実際に実行するように構築（implemented）されていればよい。

　本明細書（請求項を含む）において、含有又は所有を意味する用語（例えば、「含む（comprising/including）」及び有する「（having）等）」が用いられる場合は、当該用語の目的語により示される対象物以外の物を含有又は所有する場合を含む、open-endedな用語として意図される。これらの含有又は所有を意味する用語の目的語が数量を指定しない又は単数を示唆する表現（a又はanを冠詞とする表現）である場合は、当該表現は特定の数に限定されないものとして解釈されるべきである。

　本明細書（請求項を含む）において、ある箇所において「１つ又は複数（one or more）」又は「少なくとも１つ（at least one）」等の表現が用いられ、他の箇所において数量を指定しない又は単数を示唆する表現（a又はanを冠詞とする表現）が用いられているとしても、後者の表現が「１つ」を意味することを意図しない。一般に、数量を指定しない又は単数を示唆する表現（a又はanを冠詞とする表現）は、必ずしも特定の数に限定されないものとして解釈されるべきである。

　本明細書において、ある実施例の有する特定の構成について特定の効果（advantage/result）が得られる旨が記載されている場合、別段の理由がない限り、当該構成を有する他の１つ又は複数の実施例についても当該効果が得られると理解されるべきである。但し当該効果の有無は、一般に種々の要因、条件、及び／又は状態等に依存し、当該構成により必ず当該効果が得られるものではないと理解されるべきである。当該効果は、種々の要因、条件、及び／又は状態等が満たされたときに実施例に記載の当該構成により得られるものに過ぎず、当該構成又は類似の構成を規定したクレームに係る発明において、当該効果が必ずしも得られるものではない。

　本明細書（請求項を含む）において、「最大化（maximize）」等の用語が用いられる場合は、グローバルな最大値を求めること、グローバルな最大値の近似値を求めること、ローカルな最大値を求めること、及びローカルな最大値の近似値を求めることを含み、当該用語が用いられた文脈に応じて適宜解釈されるべきである。また、これら最大値の近似値を確率的又はヒューリスティックに求めることを含む。同様に、「最小化（minimize）」等の用語が用いられる場合は、グローバルな最小値を求めること、グローバルな最小値の近似値を求めること、ローカルな最小値を求めること、及びローカルな最小値の近似値を求めることを含み、当該用語が用いられた文脈に応じて適宜解釈されるべきである。また、これら最小値の近似値を確率的又はヒューリスティックに求めることを含む。同様に、「最適化（optimize）」等の用語が用いられる場合は、グローバルな最適値を求めること、グローバルな最適値の近似値を求めること、ローカルな最適値を求めること、及びローカルな最適値の近似値を求めることを含み、当該用語が用いられた文脈に応じて適宜解釈されるべきである。また、これら最適値の近似値を確率的又はヒューリスティックに求めることを含む。

　本明細書（請求項を含む）において、複数のハードウェアが所定の処理を行う場合、各ハードウェアが協働して所定の処理を行ってもよいし、一部のハードウェアが所定の処理の全てを行ってもよい。また、一部のハードウェアが所定の処理の一部を行い、別のハードウェアが所定の処理の残りを行ってもよい。本明細書（請求項を含む）において、「１又は複数のハードウェアが第１の処理を行い、前記１又は複数のハードウェアが第２の処理を行う」等の表現が用いられている場合、第１の処理を行うハードウェアと第２の処理を行うハードウェアは同じものであってもよいし、異なるものであってもよい。つまり、第１の処理を行うハードウェア及び第２の処理を行うハードウェアが、前記１又は複数のハードウェアに含まれていればよい。なお、ハードウェアは、電子回路、又は、電子回路を含む装置等を含んでもよい。

　以上、本開示の実施形態について詳述したが、本開示は上記した個々の実施形態に限定されるものではない。特許請求の範囲に規定された内容及びその均等物から導き出される本発明の概念的な思想と趣旨を逸脱しない範囲において種々の追加、変更、置き換え及び部分的削除等が可能である。例えば、前述した全ての実施形態において、数値又は数式を説明に用いている場合は、一例として示したものであり、これらに限られるものではない。また、実施形態における各動作の順序は、一例として示したものであり、これらに限られるものではない。

１：推定装置、
１０：入力部、
１２：記憶部、
１４：推定部、
１４０：順伝播部、１４２：誤差算出部、１４４：逆伝播部、１４６：更新部、
１６：出力部

Claims

　１又は複数のメモリと、
　１又は複数のプロセッサと、
　を備え、
　前記１又は複数のプロセッサは、
　　少なくとも第１状態に関する情報を含む入力データを微分可能な物理モデルに入力して推定第２状態を算出し、
　　第２状態と前記推定第２状態とに基づいて、前記第１状態から前記第２状態に遷移するパラメータを推定する、
　ように構成される、
　推定装置。
　前記入力データは、パラメータに関する情報を含む、
　請求項１に記載の推定装置。
　前記１又は複数のプロセッサは、
　　前記第２状態と前記推定第２状態の誤差を用いて、前記物理モデルについて誤差逆伝播して、前記第１状態から前記第２状態に遷移するパラメータを推定する、
　ように構成される、
　請求項２に記載の推定装置。
　前記１又は複数のプロセッサは、
　　誤差逆伝播を実行して、前記パラメータを前記物理モデルに基づく勾配を用いて更新し、前記第１状態から前記第２状態に遷移するパラメータを推定する、
　ように構成される、
　請求項３に記載の推定装置。
　前記１又は複数のプロセッサは、
　　演算の途中経過を前記１又は複数のメモリに格納し、
　　格納された前記途中経過を用いて、誤差逆伝播を実行する、
　ように構成される、
　請求項４に記載の推定装置。
　前記１又は複数のプロセッサは、
　　前記第１状態と、前記第２状態と、を用いて誤差逆伝播を実行する、
　ように構成される、
　請求項４に記載の推定装置。
　前記物理モデルは、Neural ODE（Ordinary Differential Equations）の手法に基づいて生成されたモデルである、
　請求項６に記載の推定装置。
　前記１又は複数のプロセッサは、
　　前記第１状態の遷移状態のデータを前記１又は複数のメモリに格納し、
　　前記遷移状態を用いて、誤差逆伝播を実行する、
　ように構成される、
　請求項４に記載の推定装置。
　前記１又は複数のプロセッサは、
　　前記第１状態から前記第２状態に至る前記遷移状態のデータを前記１又は複数のメモリに格納する、
　ように構成される、
　請求項８に記載の推定装置。
　前記１又は複数のプロセッサは、
　　前記第１状態から前記第２状態に至る前記遷移状態のデータのうち、所定ステップにおけるデータを前記１又は複数のメモリに格納する、
　ように構成される、
　請求項８に記載の推定装置。
　前記物理モデルは、微分方程式により表された物理系の解を求める微分方程式ソルバである、
　請求項１から請求項１０のいずれかに記載の推定装置。
　前記第１状態、前記第２状態、前記推定第２状態は、それぞれ制御対象装置の状態であって、
　前記パラメータは、少なくとも、前記制御対象装置の制御、又は、前記制御対象装置の環境のいずれかに関する情報である、
　請求項１から請求項１１のいずれかに記載の推定装置。
　前記制御対象装置の状態は、前記制御対象装置の内部に存在する物質に関する情報である、
　請求項１２に記載の推定装置。
　前記物質に関する情報は、前記物質の量、又は、前記物質の内部エネルギーに関する情報である、
　請求項１３に記載の推定装置。
　前記パラメータは、少なくとも、前記制御対象装置における温度、湿度、圧力、電圧、電流、又は、物質の濃度のいずれか１つに関する情報である、
　請求項１２に記載の推定装置。
　前記パラメータは、少なくとも、前記制御対象装置の体積、容積、又は、形状のいずれか１つに関する情報である、
　請求項１２に記載の推定装置。
　前記制御対象装置は、プラントである、
　請求項１２から請求項１６のいずれかに記載の推定装置。
　１又は複数のプロセッサにより、
　　少なくとも第１状態に関する情報を含む入力データを微分可能な物理モデルに入力して推定第２状態を算出し、
　　第２状態と前記推定第２状態とに基づいて、前記第１状態から前記第２状態に遷移するパラメータを推定する、
　推定方法。
　１又は複数のプロセッサに、
　　少なくとも第１状態に関する情報を含む入力データを微分可能な物理モデルに入力して推定第２状態を算出することと、
　　第２状態と前記推定第２状態とに基づいて、前記第１状態から前記第２状態に遷移するパラメータを推定することと、
　を実行させるプログラム。