JP6919770B2 - パラメータ探索方法、パラメータ探索装置、及びパラメータ探索用プログラム - Google Patents
パラメータ探索方法、パラメータ探索装置、及びパラメータ探索用プログラム Download PDFInfo
- Publication number
- JP6919770B2 JP6919770B2 JP2020525317A JP2020525317A JP6919770B2 JP 6919770 B2 JP6919770 B2 JP 6919770B2 JP 2020525317 A JP2020525317 A JP 2020525317A JP 2020525317 A JP2020525317 A JP 2020525317A JP 6919770 B2 JP6919770 B2 JP 6919770B2
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- observation data
- model
- value
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8658—Optimising operation parameters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Complex Calculations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、分析条件であるパラメータ値を変更したときに観測値が変化する分析装置などのシステムにおいて、最適な又はそれに近いパラメータ値を探索するパラメータ探索方法、パラメータ探索装置、及びパラメータ探索用のコンピュータプログラムに関する。
例えば液体クロマトグラフ質量分析装置(LC−MS)では、質量分析装置に含まれるイオン源、各種のイオン輸送光学系、或いは、イオン検出器などにそれぞれ印加する電圧を変化させると、同じ試料に対する信号強度値が変化する。そのため、それら印加電圧をそれぞれパラメータとして測定感度ができるだけ高くなるように、各パラメータの値を調整する作業が測定に先立って行われる。そうした調整作業の際には、通常、一つのパラメータについてその値を所定の範囲で且つ所定のステップ幅で変化させながらそれぞれ測定を実行し、その各測定において得られる信号強度値を比較することで、最も高い信号強度を与える値を最適なパラメータ値として選択する方法が採られることが多い。
上述したように或るパラメータの最適値を探索する際には、できるだけ少ない測定回数で以て最適な値を探索できることが望ましい。何故なら、測定回数が多いと時間も手間も掛かるし、パラメータ探索のための測定に標準試料を用いる場合には、測定回数が多いと使用する標準試料の量も多くなるからである。
観測値が最も大きくなる(場合によっては最も小さくなる)パラメータの値を探索するような作業は、LC−MSに限らず、様々な分析装置、測定装置、計測装置、さらにはこうした装置を含む各種システムにおいて一般的に行われる。また、実際の測定や分析を行うものではなく、分子動力学などに基づくコンピュータシミュレーションを実行するシステムや、深層学習などの機械学習アルゴリズムをコンピュータ上で実行するシステムなど、様々な装置やシステムにおいても、同様のパラメータ探索が広く行われている。
上記問題は、一般化すれば、「繰返し実験において、できるだけ良好な観測値が得られるパラメータの値を探索する」という問題である。ここでいう良好な観測値とは、一般的には最大の観測値であるが、実験や観測の目的等によっては、SN比が最大である観測値、最小の観測値、などである場合もある。
一例として、図10(a)に示すように、或るパラメータ(例えば電圧)に関する異なる四つの値についての観測が終了しており、図中に黒丸点で示す四つの観測値が得られているものとする。いま、この四つの観測値よりもさらに高い観測値を得ることが期待できる次のパラメータ値、を探索したい場合を考える。
作業者が自らの判断により、次に設定すべきパラメータ値を選択する場合には、図10(b)に点線及び一点鎖線でそれぞれ示すように、どのような実験対象モデルを想定するのかによって次のパラメータ値の選択がばらつく(図中のA、B)ことが避けられない。
これに対し、パラメータ探索の一つの手法として広く知られているものとしてベイズ最適化(Bayesian Optimization)がある(特許文献1など参照)。ベイズ最適化法によれば、取得済みの観測データに基づいて、確率的に良い結果が期待できる次のパラメータ値(実験条件)を決定することができる。図10(c)は、上記四つの観測値からベイズ最適化法により実験対象のモデルを推定し、次に観測すべきパラメータ値を探索した結果を示す図である。図10(c)において、実線で示すカーブはベイズ最適化法により推定されたモデル関数の事後分布の平均値、斜線で塗りつぶした範囲はそのモデル関数事後分布の不確かさ(或いは分散)、「Next」と記載された縦の太実線は自動的に選択された次のパラメータ値を示している。
より詳しく述べると、ベイズ最適化法では実験対象のモデルがガウス過程に従うという仮定の下で、取得済みの観測データに基づいてモデル関数の事後分布の平均値と分散値とを計算する。そして、それら計算値を基に、真のものにより近づくようにモデルを改善することが期待される次の実験条件(パラメータ値)を決定する。そして、決定された実験条件の下で次の実験を行って新たな観測データを取得し、このデータを既に取得済みの観測データに加えてモデル関数の事後分布を再度推定する。こうした処理を繰り返すことで、より高い観測値が得られるパラメータ値を得ることができる。
図11はベイズ最適化を用いたパラメータ探索の一例を示す図であり、図11(a)は初期の四つの観測値(図10(a)と同じ)にさらに一つの観測値が加わった状態の図、図11(b)は初期の四つの観測値(図10(a)と同じ)にさらに七つの観測値が加わった状態の図である。図11において、黒丸点は観測値、実線のカーブは推定されたモデル関数事後分布の平均値、点線のカーブは真のモデル、斜線で塗りつぶした範囲はモデル関数事後分布の不確かさ、「Next」と記載された縦の太実線は自動的に選択された次のパラメータ値を示している。図11(b)に示すように、パラメータ値を変更しながら実験を繰り返していくと、観測値が最も高くなるパラメータ値の付近の範囲で優先的にパラメータ探索が行われるようになる。これにより、観測値が最も高くなる又はそれに近くなるようなパラメータ値を最終的に見つけることができる。
しかしながら、上述した一般的なベイズ最適化法では、観測点の数が少ない探索初期におけるモデル関数の事後分布の推定精度が低く、そのために効率的な探索が難しいという課題があった。この課題に対し、近年、ベイズ最適化法を改良したマルチタスクベイズ最適化(Multi-Task Bayesian Optimization)法が提案されている(非特許文献1参照)。マルチタスクベイズ最適化法では、観測対象である実験(以下、「対象実験」という)とそれに関連する実験(以下、「参照実験」という)においてそれぞれデータを取得済みであることを前提とし、対象実験による対象観測データと参照実験による参照観測データとに相関があるという仮定の下で対象実験のモデルを推定する。非特許文献1に示されているようにマルチタスクベイズ最適化では、観測点数が少ない探索初期の段階でも参照観測ータに基づいて対象実験のモデルをかなり高い精度で推定することができるため、特に探索初期における探索の効率を改善することができる、という利点がある。
スウェルスキー(K. Swersky)ほか2名、「 マルチタスク・ベイジアン・オプティマイゼイション(Multi-Task Bayesian Optimization)」、[online]、[2018年6月1日検索]、NIPS、2013、インターネット<https://papers.nips.cc/paper/5086-multi-task-bayesian-optimization.pdf>
スノーク(J. Snoek)ほか2名、「プラクティカル・ベイジアン・オプティマイゼイション・オブ・マシン・ラーニング・アルゴリズムズ(Practical Bayesian Optimization of Machine Learning Algorithms)」、NIPS, 2012
従来提案されているマルチタスクベイズ最適化法は、対照実験のモデルと参照実験のモデルとの相関が高いことを前提としている。これは例えば分析装置でいえば、対照実験を行う分析装置と参照実験を行う分析装置とが個体は異なるものの同じ機種の分析装置である、或いは機種は異なるものの同じ方式の分析装置である、といった場合を想定していることによる。しかしながら、実際には、相関が十分に高い対照観測データと参照観測データとを常に用意できるとは限らない。
いま一例として、図12中に太実線で示すガウス関数に従うモデルを原モデルとして、そのゲイン、標準偏差(σ)、及び平均値(μ)をそれぞれ変更した3種類のモデルを考える。これら3種類のモデルと原モデルとの相関係数はそれぞれ、1、0.96、及び0.36である。変更後のモデルの関数の形状はいずれも原モデルに類似しているものの、特に横軸方向、つまりはパラメータ値の変化の方向にシフトさせるようにモデルを変化させた場合(図12(c))、原モデルと変更後のモデルとの相関計数は大きく低下している。
本発明者らの検討によれば、上述したように相関が低い参照観測データと対象観測データとを用いてマルチタスクベイズ最適化を行うと、対象実験のモデルを正しく推定することができず、パラメータの探索効率が低下してしまう場合があることが分かった。この例を図13に示す。図13は、対象実験の真のモデルが参照実験の真のモデルに対してシフトしている場合にマルチタスクベイズ最適化を試行した結果を示す図である。図中、太点線は参照実験の真のモデル、太一点鎖線は対象実験の真のモデル、黒四角点は参照実験の観測点、黒丸点は対象実験の観測点、太実線は対象実験モデルの事後分布の平均値、斜線で示す範囲は対象実験モデルの事後分布の不確かさを示している。
図13(a)は対象観測データが1点である場合、図13(b)は対象観測データが5点に増加した場合の結果である。適切なパラメータ探索ができていれば、対象観測データの点数が増加すれば対象実験モデルの事後分布の不確かさは減少する筈である。ところが、この例では、正しいモデル推定ができていないために、誤って参照実験における最適条件の付近を優先的に探索してしまっており、対象実験による観測点が増加しても最適なパラメータ値が決まらない。このように従来のマルチタスクベイズ最適化法では、対照観測データと参照観測データとの相関が低いと、その参照観測データをモデル推定に有効に活用できなくなり、パラメータ探索効率の改善度合いが低下したり、最悪の場合、対象観測データのみを用いてパラメータ探索をする場合よりも探索効率が悪くなる場合さえある。
本発明は上記課題を解決するためになされたものであり、その目的とするところは、参照実験で得られたデータが対象実験で得られたデータに対してパラメータ空間において変化しており両者の相関が低い場合であっても、マルチタスクベイズ最適化法を用いて効率よく最適なパラメータを探索することができるパラメータ探索方法、装置、及びプログラムを提供することにある。
上記課題を解決するために成された本発明に係るパラメータ探索方法は、与えられたパラメータ値を条件として観測を行って観測値を出力する対象システムにおいて該観測値又は該観測値から求められる指標値が所定の状態となるようなパラメータ値を探索するパラメータ探索方法であって、
前記対象システムで観測された対象観測データと、該対象システムと関連する参照システムで観測された参照観測データと、に基づいて、前記対象システムのモデル関数の事後分布を推定するステップであり、パラメータ空間における前記対象観測データと前記参照観測データとの間の変動量を該両観測データに基づいて推定する変動量推定ステップを含み、その推定された変動量に相当する補正がなされたモデル関数の事後分布を推定するモデル推定ステップと、
前記モデル推定ステップで得られたモデル関数の事後分布に基づいて、次の観測の際の条件であるパラメータ値を決定するパラメータ決定ステップと、
前記決定されたパラメータ値を前記対象システムに設定し、該対象システムから対象観測データを取得するデータ取得ステップと、
を有し、前記モデル推定ステップ、前記パラメータ決定ステップ、及び前記データ取得ステップ、の処理を繰り返すことによって、より適切なパラメータ値を探索するものである。
前記対象システムで観測された対象観測データと、該対象システムと関連する参照システムで観測された参照観測データと、に基づいて、前記対象システムのモデル関数の事後分布を推定するステップであり、パラメータ空間における前記対象観測データと前記参照観測データとの間の変動量を該両観測データに基づいて推定する変動量推定ステップを含み、その推定された変動量に相当する補正がなされたモデル関数の事後分布を推定するモデル推定ステップと、
前記モデル推定ステップで得られたモデル関数の事後分布に基づいて、次の観測の際の条件であるパラメータ値を決定するパラメータ決定ステップと、
前記決定されたパラメータ値を前記対象システムに設定し、該対象システムから対象観測データを取得するデータ取得ステップと、
を有し、前記モデル推定ステップ、前記パラメータ決定ステップ、及び前記データ取得ステップ、の処理を繰り返すことによって、より適切なパラメータ値を探索するものである。
上記課題を解決するために成された本発明に係るパラメータ探索装置は、本発明に係るパラメータ探索方法を実施するための装置であり、与えられたパラメータ値を条件として観測を行って観測値を出力する対象システムにおいて該観測値又は該観測値から求められる指標値が所定の状態となるようなパラメータ値を探索するパラメータ探索装置であって、
前記対象システムで観測された対象観測データと、該対象システムと関連する参照システムで観測された参照観測データと、に基づいて、前記対象システムのモデル関数の事後分布を推定するものであり、パラメータ空間における前記対象観測データと前記参照観測データとの間の変動量を該両観測データに基づいて推定する変動量推定部を含み、その推定された変動量に相当する補正がなされたモデル関数の事後分布を推定するモデル推定部と、
前記モデル推定部により得られたモデル関数の事後分布に基づいて、次の観測の際の条件であるパラメータ値を決定するパラメータ決定部と、
前記決定されたパラメータ値を前記対象システムに設定し、該対象システムから対象観測データを取得するデータ取得部と、
前記モデル推定部、前記パラメータ決定部、及び前記データ取得部による処理を繰り返し実行するようにそれら各部を制御する制御部と、
を備えるものである。
前記対象システムで観測された対象観測データと、該対象システムと関連する参照システムで観測された参照観測データと、に基づいて、前記対象システムのモデル関数の事後分布を推定するものであり、パラメータ空間における前記対象観測データと前記参照観測データとの間の変動量を該両観測データに基づいて推定する変動量推定部を含み、その推定された変動量に相当する補正がなされたモデル関数の事後分布を推定するモデル推定部と、
前記モデル推定部により得られたモデル関数の事後分布に基づいて、次の観測の際の条件であるパラメータ値を決定するパラメータ決定部と、
前記決定されたパラメータ値を前記対象システムに設定し、該対象システムから対象観測データを取得するデータ取得部と、
前記モデル推定部、前記パラメータ決定部、及び前記データ取得部による処理を繰り返し実行するようにそれら各部を制御する制御部と、
を備えるものである。
上記課題を解決するために成された本発明に係るパラメータ探索用プログラムは、本発明に係るパラメータ探索方法をコンピュータ上で実行するためのコンピュータプログラムであり、与えられたパラメータ値を条件として観測を行って観測値を出力する対象システムにおいて該観測値又は該観測値から求められる指標値が所定の状態となるようなパラメータ値を探索するためのパラメータ探索用プログラムであって、コンピュータを、
前記対象システムで観測された対象観測データと、該対象システムと関連する参照システムで観測された参照観測データと、に基づいて、前記対象システムのモデル関数の事後分布を推定するものであり、パラメータ空間における前記対象観測データと前記参照観測データとの間の変動量を該両観測データに基づいて推定する変動量推定機能部を含み、その推定された変動量に相当する補正がなされたモデル関数の事後分布を推定するモデル推定機能部と、
前記モデル推定機能部により得られたモデル関数の事後分布に基づいて、次の観測の際の条件であるパラメータ値を決定するパラメータ決定機能部と、
前記決定されたパラメータ値を前記対象システムに設定し、該対象システムから対象観測データを取得するデータ取得機能部と、
前記モデル推定機能部、前記パラメータ決定機能部、及び前記データ取得機能部による処理を繰り返し実行するようにそれら各機能部を制御する制御機能部と、
して動作させるものである。
前記対象システムで観測された対象観測データと、該対象システムと関連する参照システムで観測された参照観測データと、に基づいて、前記対象システムのモデル関数の事後分布を推定するものであり、パラメータ空間における前記対象観測データと前記参照観測データとの間の変動量を該両観測データに基づいて推定する変動量推定機能部を含み、その推定された変動量に相当する補正がなされたモデル関数の事後分布を推定するモデル推定機能部と、
前記モデル推定機能部により得られたモデル関数の事後分布に基づいて、次の観測の際の条件であるパラメータ値を決定するパラメータ決定機能部と、
前記決定されたパラメータ値を前記対象システムに設定し、該対象システムから対象観測データを取得するデータ取得機能部と、
前記モデル推定機能部、前記パラメータ決定機能部、及び前記データ取得機能部による処理を繰り返し実行するようにそれら各機能部を制御する制御機能部と、
して動作させるものである。
本発明においてパラメータ値を探索する対象のシステムは、各種の分析装置や測定装置、計測装置、観察装置などの、物理的又は化学的な手法による測定や観察を行う装置やシステムを含むほか、分子動力学などに基づくシミュレーションや、深層学習などの機械学習アルゴリズムに基づく演算処理など、コンピュータ上での処理のみによって観測値を取得可能なシステムも含む。
また本発明に係るパラメータ探索用プログラムは、汎用パーソナルコンピュータ、より高性能なコンピュータ、又は、各種のシステムに組み込まれた専用のコンピュータ、などを動作させるプログラムである。こうしたプログラムは、CD−ROM、DVD−ROM、メモリカード、USBメモリ(ドングル)などの、非一時的な記録媒体に収録されてユーザに提供されるようにすることができる。或いは、インターネットなどの通信回線を介したデータ転送の形式で、ユーザに提供されるようにすることもできる。もちろん、ユーザがシステムを新規に購入する場合、該システムに含まれるコンピュータに本発明に係るログラムを予め組み込んでおくこともできる。
本発明に係るパラメータ探索方法において、パラメータ探索の基本的なアルゴリズムはマルチタスクベイズ最適化である。即ち、対象システムのモデル関数の事後分布を推定するために、その対象システムで観測された対象観測データのほかに、参照システムで観測された参照観測データを用いる。但し、与えられた参照観測データをそのままモデル関数の事後分布の推定に用いるのではなく、対象観測データと参照観測データとの間のパラメータ空間での変動量を、その両観測データに基づいて推定する。このパラメータ空間はパラメータの種類の数と同じ次元を持つ。したがって、パラメータが2種類であれば、パラメータ空間は2次元空間である。
対象観測データと参照観測データとの間の変動、つまりは対象システムのモデルと参照システムのモデルとの間の変動の態様としては、パラメータ空間における回転、シフト(移動)、伸縮、などが考えられる。これら全ての変動の態様についてモデル関数形状の変動を考慮しても構わないが、多くの場合、両データの間の相関の低下に大きく寄与するのはシフトであるため、変動の態様としてシフトのみを考慮すれば十分であることが多い。即ち、本発明の一態様として、前記変動量は、パラメータ空間における対象観測データと参照観測データとの間のシフト量であるものとするとよい。
変動量が上記シフト量であり、例えばパラメータ空間が1次元である場合、変動量推定ステップでは、その1次元方向のシフトのみを想定してシフト量を推定すればよい。変動量の推定方法としては、次の二つの方法のいずれかを採用すればよい。
即ち、一つの変動量推定方法は、対象観測データと、参照観測データと、で独立にそれぞれのシステムのモデル関数の事後分布を推定し、いずれか一方のモデル関数にパラメータ空間における異なる変動量を複数与えてそれぞれ両モデルの相関性を求め、最も高い相関性を示す変動量を推定値とする、という方法である。
この方法では、計算時間が掛かる、つまりは計算コストの高いモデル関数の事後分布の計算を2回のみに抑えることができるという利点がある。但し、モデル関数の事後分布を正確に求めるには或る程度のデータ点数が必要であるため、データ点数が少ない場合にはこの方法を採用しにくい。
他の一つの変動量推定方法は、対象観測データと参照観測データとのいずれか一方のデータにパラメータ空間における異なる変動量を複数与えてそれぞれモデル関数の事後分布を推定し、それぞれの事後分布の平均値モデルと観測データとの誤差が最も小さくなる変動量を推定値とする、という方法である。
この二番目の方法では一つ目の方法に比べると計算時間が掛かるものの、対象観測データ及び参照観測データの両方とモデル関数の誤差を基に変動値を推定するため、データ点数が少ない場合でも変動量を精度良く推定ができるという利点がある。
特に二番目の変動量推定方法では、モデル関数がガウス過程に従うとの前提で該モデル関数の事後分布を算出し、ガウス過程のハイパーパラメータを最尤推定した際に最大の尤度を示す変動量を推定値とする、という方法を採ることができる。
これによれば、ガウス過程のハイパーパラメータ最尤推定によるモデル関数の推定と、パラメータ空間での変動量の指標、例えば獲得関数の算出とを同時に行うため、計算時間を短縮することができる。
上記いずれの方法でも、妥当な変動量を推定することができる。変動量が推定されたならば、例えばその変動量を補正値として、対象観測データと参照観測データとに基づいて推定される対象システムのモデル関数の事後分布を補正する。したがって、このときに得られるモデル関数の事後分布は、対象観測データと参照観測データとの間の変動量を反映したものとなる。パラメータ決定ステップでは、上述したように得られた補正済みのモデル関数の事後分布に基づいて、次の観測の際の条件であるパラメータ値を決定する。
データ取得ステップでは、決定されたパラメータ値を対象システムにおける次の条件として設定し、該対象システムで観測される観測値を情報として含む対象観測データを取得する。これにより、対象観測データは増加する。そして、上述したモデル推定ステップ、パラメータ決定ステップ、及びデータ取得ステップにおける処理を、所定の終了条件を満たすまで繰り返し実行させることで、最適であると推定されるパラメータ値を取得する。この繰り返しの際に、モデル推定ステップでは対象観測データと参照観測データとの間の変動量が補正されたモデルが利用されるので、対象観測データと参照観測データとの相関が低い場合であっても、少ない繰返し回数で以て適切なパラメータ値を探索することができる。
なお、考慮すべき変動の要素が多いと、その要素毎に複数の変動量を設定していずれが適当かを推定する必要がある。それに対し上述したように変動の要素を相関の低下への寄与が最も大きいシフトに限定することで、変動量の補正についての十分な効果を確保しながら演算時間を短縮することができる。
本発明によれば、対象観測データと参照観測データとの変動量を補正することで両データの相関が実質的に大きくなり、モデル関数の事後分布の推定精度が向上する。これにより、特に対象観測データの数が少ない場合であっても、参照観測データを有効に利用して効率的にパラメータ探索を行うことができる。即ち、より少ない繰返し回数で以て最適又はそれに近い状態のパラメータ値を見つけることができる。
以下、本発明に係るパラメータ検索方法、並びに、該方法を実施するための装置及びコンピュータプログラムの一実施例を、添付の図面を参照しつつ説明する。
図1は、本実施例によるパラメータ探索装置の概略ブロック構成図である。
図1は、本実施例によるパラメータ探索装置の概略ブロック構成図である。
このパラメータ探索装置10は、機能ブロックとして、モデル推定部11、パラメータ決定部12、データ取得部13、及び繰返し制御部14、を備える。本発明の一実施例における対象システムに相当する分析システム20はパラメータ探索装置10には含まれず、与えられたパラメータ値を条件として所定の分析、例えば質量分析やクロマトグラフ分析を実行し、その分析結果を観測値として得るものである。例えば分析システム20が質量分析装置である場合、パラメータ値は例えば一つのイオン輸送光学素子に印加される電圧の値であり、観測値は標準試料に対する質量分析により得られた特定の質量電荷比における信号強度値である。もちろん、これは一例であり、分析システム20の分析手法はこれに限らず、また、後述するように別のシステムに置き換えることもできる。
モデル推定部11は、参照観測データと対象観測データとに基づいて、対象システムである分析システム20のモデル関数の事後分布を推定する。対象観測データは分析システム20で得られた観測値を含むデータであり、参照観測データは対象システムとは異なるものの、それに類似した参照システムで得られた観測値を含むデータである。
パラメータ決定部12は、推定された対象システムのモデル関数事後分布に基づいて、該対象システムにおいて次に観測する(つまりは分析する)際の条件であるパラメータ値を決定する。データ取得部13は、この決定されたパラメータ値を分析条件として分析システム20へと入力し、該分析システム20においてそのパラメータ値を条件とする所定の分析により得られた観測値を受け取る。
繰返し制御部14は、データ取得部13により取得された観測値及び設定されたパラメータ値を含む観測データを対象観測データに追加して、モデル推定部11、パラメータ決定部12、及びデータ取得部13が同じ処理を繰返し実行するようにそれら各部の動作を制御する。パラメータ探索装置10は、このフィードバックのルーチンを多数繰り返し実行することによって、最適な又はそれに近いパラメータ値を探索する。
なお、パラメータ探索装置10を構成する各部の機能は、例えばデジタルシグナルプロセッサを含むハードウェア回路で構成することも不可能でないが、実際には、その機能の一部又は分析システム20とのインターフェイス部分などを除く大部分を、コンピュータにインストールしたプログラムを該コンピュータにより実行することで実現するものとするとよい。こうしたプログラムは、CD−ROM、DVD−ROM、メモリカード、USBメモリ(ドングル)などの、非一時的な記録媒体に収録されてユーザに提供されるようにすることができる。或いは、インターネットなどの通信回線を介したデータ転送の形式で、ユーザに提供されるようにすることもできる。
以下、パラメータ探索を行う際の処理の流れと各部の動作を、図2に示したフローチャートを参照して詳しく説明する。
なお、以下の説明から明らかであるが、基本となる処理の手順は、非特許文献1等に開示されているマルチタスクベイズ最適化法のアルゴリズムである。
なお、以下の説明から明らかであるが、基本となる処理の手順は、非特許文献1等に開示されているマルチタスクベイズ最適化法のアルゴリズムである。
まず、モデル推定部11は、システムのモデル関数f(x)が例えばガウス過程に従うという仮定の下で、該モデル関数の事後分布を推定する。非特許文献2によれば、ガウス過程に従う関数f(x)は次の(1)式で示されるように、関数平均値m(x)と共分散行列k(x,x’)とによって表される関数であることが知られている。
f(x)〜GP(m(x),k(x,x’)) …(1)
f(x)〜GP(m(x),k(x,x’)) …(1)
上記共分散行列は、「二つの変数位置x、x’において出力f(x)、f(x’)がどの程度同じような挙動をとるか」を表す関数である。共分散行列は、通常、二つの変数位置x、x’が近いほど大きな値をとる連続的な単調関数で定義され、例えばRBFカーネルやMatern5/2カーネルなどが用いられる。RFBカーネルの例を(2)式に示す。
kRBF(x,x’)=θ0 exp(−||x−x’||2 /2θ1 2) …(2)
計算を簡略化する場合には、(1)式中の関数平均値モデルm(x)を0とすることもできるが、通常は、関数平均値モデルm(x)として観測データの平均値を用いるとよい。
kRBF(x,x’)=θ0 exp(−||x−x’||2 /2θ1 2) …(2)
計算を簡略化する場合には、(1)式中の関数平均値モデルm(x)を0とすることもできるが、通常は、関数平均値モデルm(x)として観測データの平均値を用いるとよい。
いまn個の観測データ(xn,yn)が取得済みであるとすると、モデル推定部11は、この観測データに基づいて、モデル関数の事後分布の平均値μ及び分散値σ2を求める(ステップS1)。平均値μ及び分散値σ2は、変量正規分布(Multivariate normal distribution)の公式より以下の(3)、(4)式で計算される。
μ(x;{xn,yn})=K(X,x)TK(X,X)-1(y−m(X)) …(3)
σ2(x;{xn,yn})=k(x,x)−K(X,x)TK(X,X)-1K(X,x) …(4)
ここでは、参照観測データと対象観測データとを共に利用するので、マルチタスクにおけるタスク間の共分散行列Kt(t、t’)を導入し、共分散関数を次のように拡張する。
Kmulti=((x,t),(x’,t’))=Kt(t、t’)[×]Kx(x,x’) …(5)
ここで、[×]はクロネッカー積を表す。
μ(x;{xn,yn})=K(X,x)TK(X,X)-1(y−m(X)) …(3)
σ2(x;{xn,yn})=k(x,x)−K(X,x)TK(X,X)-1K(X,x) …(4)
ここでは、参照観測データと対象観測データとを共に利用するので、マルチタスクにおけるタスク間の共分散行列Kt(t、t’)を導入し、共分散関数を次のように拡張する。
Kmulti=((x,t),(x’,t’))=Kt(t、t’)[×]Kx(x,x’) …(5)
ここで、[×]はクロネッカー積を表す。
上記(2)式などで表されるカーネル関数中のハイパーパラメータθは、モデル関数に即した妥当な値に設定する必要がある。そこで、ハイパーパラメータθは例えば、そのθが与えられたときのyの推定値の尤もらしさを表す尤度関数L(θ)が最大となるように、最尤推定により算出される。関数f(x)の対数尤度関数logL(θ)は、次の(6)式で表される。
logL(θ)=(−1/2)yTK(X,X)-1y−(1/2)log|K(X,X)|−(n/2)log2π …(6)
ここで、argmaxθL(θ)は一般的な最適化問題であり、例えば準ニュートン法のような勾配法で求めることができる。
logL(θ)=(−1/2)yTK(X,X)-1y−(1/2)log|K(X,X)|−(n/2)log2π …(6)
ここで、argmaxθL(θ)は一般的な最適化問題であり、例えば準ニュートン法のような勾配法で求めることができる。
パラメータ決定部12は、モデル推定部11からモデル関数f(x)の事後分布の平均関数値μ(x)と分散値σ2(x)とを受け取り、それらに基づいて評価のための獲得関数a(x)を計算する。そして、この獲得関数a(x)が最大となるパラメータ値xを見つけ、それを観測値の改善が期待できる次の分析条件のためのパラメータ値として出力する(ステップS2)。獲得関数a(x)としては、ベイズ最適化法において一般に用いられるProbability of Improvement(PI)、Expected Improvement(EI)、Upper Confidence Bound(UCB)などのいずれかを用いることができる。
一例として、Expected Improvementの式を(7)式に示す(非特許文献2参照)。
EI(x)=(μ(x)−f(x+))Φ(Z)+σ(x)φ(Z) if σ(x)>0,EI(x)=0 if σ(x)=0 …(7)
但し、Z=(μ(x)−f(x+))/σ(x)
f(x+)は観測データの最大値を表し、Φ(*)は標準正規分布の累積分布関数、φ(*)は標準正規分布を表す演算子である。Expected Improvementでは、関数f(x)の事後確率モデルの中の観測データの最大値を超える関数の期待値を算出しており、大域探索と局所探索とをバランスよく実施する関数として知られている。
EI(x)=(μ(x)−f(x+))Φ(Z)+σ(x)φ(Z) if σ(x)>0,EI(x)=0 if σ(x)=0 …(7)
但し、Z=(μ(x)−f(x+))/σ(x)
f(x+)は観測データの最大値を表し、Φ(*)は標準正規分布の累積分布関数、φ(*)は標準正規分布を表す演算子である。Expected Improvementでは、関数f(x)の事後確率モデルの中の観測データの最大値を超える関数の期待値を算出しており、大域探索と局所探索とをバランスよく実施する関数として知られている。
データ取得部13は、上述したようにパラメータ決定部12から与えられたパラメータ値を分析システム20における分析条件として設定し、それに対する観測値を取得する(ステップS3)。分析システム20は、分析・計測システムや制御システムといった実験系のシステムであるほか、分子動力学のようなシミュレーションのシステム、或いは、深層学習のような機械学習アルゴリズムを実行するシステムなど、入力されたパラメータ値の下で何らかの値を観測するシステムであればよい。
次に、繰返し制御部14は、予め決められた繰返しの終了条件が満たされるか否かを判定する(ステップS4)。繰返しの終了条件は、例えばルーチンの繰返し回数が予め設定された値に到達したとき、或いは、観測値が予め定められた目標に到達したとき(目標の範囲に入ったとき)、などとすればよい。そして、繰返し終了条件を未だ満たしていなければ、新たに得られた観測値とそのときのパラメータ値とを含む対象観測データを観測データに加えたうえでステップS4からステップS1へと戻り、上述したステップS1〜S3の処理を繰り返す。一方、繰返し終了条件を満たしていれば、最終的なパラメータ値を探索結果である最適値として出力し(ステップS5)、処理を終了する。
以上説明した内容は、一般的なマルチタスクベイズ最適化法で行われている処理と同じである。これに対し本実施例のパラメータ探索装置10において特徴的であるのは、参照観測データと対象観測データとの相関が低い場合に、モデル推定部11においてデータ補正が行われる点である。これについて、さらに図3〜図5を参照して詳しく説明する。図3は、本実施例のパラメータ探索装置におけるモデル推定部11の詳細な機能ブロック構成図である。
参照観測データと対象観測データとの相関が低い場合、タスク間のデータ(x,t)、(x’,t’)にそれぞれ対する出力f(x,t)と出力f(x’,t’)とが類似した挙動をとることが少ない。そのため、対象システムのモデル関数を推定するうえで参照観測データの有用性が低くなる。具体的には、共分散行列Kt(t,t’)を相関が強い共分散行列としてしまうと誤ったモデルを推定することになるし、一方、共分散行列Kt(t,t’)を相関が低い共分散行列としてしまうとマルチタスクが独立なタスクとして扱われ、実質的なマルチタスクでなくなる。
そこで、本実施例のパラメータ探索装置において、モデル推定部11は機能ブロックとして、変動量推定部111、補正処理部112、及び、補正済みモデル推定部113を備える。変動量推定部111は、パラメータ空間での回転、シフト、伸縮などの変動を計算上で与え、参照観測データと対象観測データの変動量を予測する。補正処理部112は予測される変動量だけ観測データを補正し、補正済みモデル推定部113は補正された観測データに基づいて上述したようにモデル推定を行う。
2種類のパラメータに対して観測値が得られるシステムに適用する場合を例に挙げて、具体的に説明する。図6は、横軸、縦軸にそれぞれ異なるパラメータ(Parameter 1、Parameter 2)をとり、それら2種類のパラメータの値の組合せに対する観測値をグレイスケール(実際にはカラースケール)で示した図である。これは、どのようなパラメータ値の下でどのような観測値が得られるかというシステムのモデルを表している。図6(b)は参照システムのモデルを示しており、ここでは規則的に分布している白丸点で示した16点の位置に対応するパラメータ値の組合せの下での観測値が参照観測データとして取得済みであるものとする。一方、図6(a)はパラメータ探索対象である対象システムのモデルを示しており、ランダムな3点の位置に対応するパラメータ値の組合せの下での観測値のみが取得済みであるものとする。この状態から、最適なパラメータ値の組合せを効率的に探索するのが、ここで与えられている命題である。
なお、図6(a)に示した対象システムのモデルは、図6(b)に示した参照システムのモデルにおける各参照観測データをParameter 1の方向(図6で横軸方向)に−1〜−4の範囲でずらすことで、対象システムと参照システムとの間の相関が低いモデルを人為的に作成したものである。結果として、対象システムのモデルは、参照システムのモデルをParameter 1の方向に−2だけずらしたものとなっている。
上記のような参照観測データ及び対象観測データが与えられた場合、変動量推定部111は、次の二つの方法のいずれかでパラメータ空間での変動量を推定することができる。
[第1の変動量推定方法]
この第1の変動量推定方法は、対象観測データと参照観測データとで独立にそれぞれのシステムのモデル関数の事後分布を推定し、予測される変動量をカバーするパラメータ範囲で一方のモデル関数に変動を与えた上で両モデル間の相関値を計算し、最も高い相関を示す変動量を推定値とする方法である。この方法における処理の流れを図4に示す。
この第1の変動量推定方法は、対象観測データと参照観測データとで独立にそれぞれのシステムのモデル関数の事後分布を推定し、予測される変動量をカバーするパラメータ範囲で一方のモデル関数に変動を与えた上で両モデル間の相関値を計算し、最も高い相関を示す変動量を推定値とする方法である。この方法における処理の流れを図4に示す。
まず、与えられた対象観測データと参照観測データとについてそれぞれ独立に、ガウス過程のハイパーパラメータ最尤推定を行ってモデル関数の事後分布を推定する(ステップS11)。次に、推定された参照システムのモデルに基づくデータを、Parameter 1及びParameter 2の方向にそれぞれ−5〜+5の範囲で1ずつシフトさせたシフトデータから成る変形モデルを生成する(ステップS12)。これにより、二つのパラメータのシフト量の組合せの総数だけ、参照システムの変形モデルが生成される。
そのあと、参照システムの各変形モデルと対象システムのモデルとの間の相関値を計算する(ステップS13)。この相関値としては例えば、同じパラメータ値の組合せにおける観測値同士の相関値の総和などを用いればよい。そして、得られた複数の相関値の中で最も大きな相関値を示すシフト量の組合せを、変動量の推定値として採用する(ステップS14)。こうして変動量が推定されたならば、補正処理部112はその変動量に基づいて対象観測データを補正し、補正済みモデル推定部113はその補正された対象観測データと参照観測データとに基づいて、上述したように対象システムのモデル関数を推定すればよい。
この方法では、変動量を1回求める際にモデル推定を2回のみ実行すればよい。通常、モデル推定のための計算量は多いため、モデル推定の回数が多いほど計算時間が長くなるが、モデル推定が2回で済むために計算量が少なくて済むという利点がある。
[第2の変動量推定方法]
第2の変動量推定方法は、対象観測データと参照観測データとのいずれか一方に異なる変動をいくつか与えた上でモデル関数の事後分布を推定し、その事後分布の平均値モデルと観測データとの誤差が一番小さくなる変動量を推定値とする方法である。この方法における処理の流れを図5に示す。
第2の変動量推定方法は、対象観測データと参照観測データとのいずれか一方に異なる変動をいくつか与えた上でモデル関数の事後分布を推定し、その事後分布の平均値モデルと観測データとの誤差が一番小さくなる変動量を推定値とする方法である。この方法における処理の流れを図5に示す。
まず、与えられた参照観測データを、Parameter 1及びParameter 2の二つの方向にそれぞれ−5〜+5の範囲で1ずつシフトさせた変形データを生成する(ステップS21)。これにより、二つのパラメータのシフト量の組合せの総数だけ、参照観測データに基づく変形データ群が生成される。そして、生成された各変形データと与えられた対象観測データとに基づいて、一般的なマルチタスクベイズ最適化法におけるガウス過程のハイパーパラメータ最尤推定を行って対象システムのモデル関数の事後分布を推定する(ステップS22)。即ち、この場合には、二つのパラメータのシフト量の組合せの総数の回数だけ、モデルを推定する必要がある。このモデル推定の際に最尤推定の尤度関数が得られるから、その尤度関数が最も大きくなるシフト量の組合せを求め、これを変動量の推定値として採用する(ステップS23)。
こうして変動量が推定されたならば、補正処理部112はその変動量に基づいて対象観測データを補正し、補正済みモデル推定部113はその補正された対象観測データと参照観測データとに基づいて上述したように対象システムのモデル関数を推定すればよい。
上記第2の変動量推定方法を用いて観測データの変動量を推定し、その変動を補正したうえでマルチタスクベイズ最適化法を実施して最適パラメータ値を求めたときの効果を図7に示す。図7において、横軸は探索回数(図2におけるステップS1〜S4のループの繰返し回数)、縦軸は求まるパラメータ値の下で得られる観測値の最大値を示しており、(a)はシフト量を補正しない場合(つまり従来のマルチタスクベイズ最適化法の場合)、(b)はシフト量を補正した場合(つまり本発明の一実施例による方法の場合)の結果である。この結果から、本発明の一実施例による方法では、参照システムと対象システムとの相関が低い場合(図7ではシフト幅が3Vや5Vの場合)であっても、少ない探索回数で以て最適なパラメータ値を探索できていることが分かる。
上記具体例では、モデル又はデータの変動として単純なシフトのみを想定していた。これは、図12でいえば、図12(c)に示したように平均値が原信号から変更された場合に相当する。但し、多くの場合、パラメータ空間は2次元以上の多次元であり、パラメータ空間での伸縮や回転等の変動も生じる。しかしながら、参照システムは対象システムと関連するものであり、それら両システムのモデルの相関性が低下する主たる要因はシフトであることから、変動としてシフトのみを考慮して補正を行ってもパラメータ探索の効率を上げるうえで効果は十分にある。
図8は図6と同様に参照システムと対象システムのモデルを表したものであるが、この例では、単純なシフトではなく、参照システムと対象システムとでモデル自体が異なるものとしている。図9は、図8に示したモデルについて一般的なベイズ最適化法、従来のマルチタスクベイズ最適化法(補正処理なし)、及び本発明の一実施例による方法(補正処理あり)を実施して最適パラメータ値を求めたときの効果を比較した結果である。但し、変動量推定方法は上記第2の変動量推定方法と同じであり、変動はシフトしか考慮していない。
図9から明らかであるように、本発明の一実施例による方法では探索回数が少ない状態でも最適パラメータが探索できている。このように、参照システムと対象システムとの間のモデルの変動がシフトだけでない場合でも、変動がシフトであるとみなして変動量の推定及びその補正を行うことで、パラメータ探索の効率改善が十分に可能であることが確認できる。
もちろん、参照システムと対象システムとの間のモデルの変動として回転や伸縮などを考慮しても構わないが、その変動要因を増やすほど上記ステップS12で生成すべき変形モデル又はステップS21で生成すべき変形データが多くなる。そのため、計算量が大幅に増加し計算時間が延びることになる。こうした負荷の増大に対しパラメータ探索の効率の改善の程度は小さいため、シフト以外の変動を考慮してもそれほど有効ではない。
図1に示した上記実施例において、分析システム20としては質量分析装置やクロマトグラフ装置など、様々な装置(システム)が想定されるが、特に効率的なパラメータ探索が必要とされるものの具体例として、タンデム型質量分析装置を用いたLC−MSやGC−MSにおけるMRM(多重反応モニタリング)測定の際のパラメータ最適化がある。MRM測定では、実測結果に基づいて高感度な測定が可能であるパラメータを探索するが、測定対象である試料をイオン化する部分のインターフェイスパラメータには、温度やガス流量など安定状態になるまでの待ち時間が必要なパラメータが多いうえに、化合物、移動相等の条件毎に最適なパラメータが異なるため、パラメータの探索に長い時間を要したり試料を多量に消費しまったりするという問題がある。このように、探索すべきパラメータの数が多く、しかも一つのパラメータを見つけるための測定に時間を要する場合に、本発明を用いると、少ない測定回数で以て効率的にパラメータを探索することができるので、時間削減と試料節約の効果が特に大きい。
また、上記実施例は本発明の一例にすぎず、本発明の趣旨の範囲で適宜変形、修正、追加等を行っても本願特許請求の範囲に包含されることは当然である。
例えば上述したように、本発明に係るパラメータ探索方法の対象となるシステムは分析システムに限らず、何らかのパラメータ条件の下で観測値が得られるシステム、或いは、得られた観測値からSN比、ダイナミックレンジ等の何らかの指標値が計算されるシステムであれば、どのようなシステムにも適用可能である。したがって、そのパラメータの種類も数値化できるものであれば、特に限定されない。
10…パラメータ探索装置
11…モデル推定部
111…変動量推定部
112…補正処理部
113…モデル推定部
12…パラメータ決定部
13…データ取得部
14…繰返し制御部
11…モデル推定部
111…変動量推定部
112…補正処理部
113…モデル推定部
12…パラメータ決定部
13…データ取得部
14…繰返し制御部
Claims (15)
- 与えられたパラメータ値を条件として観測を行って観測値を出力する対象システムにおいて該観測値又は該観測値から求められる指標値が所定の状態となるようなパラメータ値を探索するパラメータ探索方法であって、
前記対象システムで観測された対象観測データと、該対象システムと関連する参照システムで観測された参照観測データと、に基づいて、前記対象システムのモデル関数の事後分布を推定するステップであり、パラメータ空間における前記対象観測データと前記参照観測データとの間の変動量を該両観測データに基づいて推定する変動量推定ステップを含み、その推定された変動量に相当する補正がなされたモデル関数の事後分布を推定するモデル推定ステップと、
前記モデル推定ステップで得られたモデル関数の事後分布に基づいて、次の観測の際の条件であるパラメータ値を決定するパラメータ決定ステップと、
前記決定されたパラメータ値を前記対象システムに設定し、該対象システムから対象観測データを取得するデータ取得ステップと、
を有し、前記モデル推定ステップ、前記パラメータ決定ステップ、及び前記データ取得ステップ、の処理を繰り返すことによって、より適切なパラメータ値を探索する、パラメータ探索方法。 - 前記変動量は、パラメータ空間における対象観測データと参照観測データとの間のシフト量である、請求項1に記載のパラメータ探索方法。
- 前記変動量推定ステップでは、対象観測データと、参照観測データと、で独立にそれぞれのシステムのモデル関数の事後分布を推定し、いずれか一方のモデル関数にパラメータ空間における異なる変動量を複数与えてそれぞれ両モデルの相関性を求め、最も高い相関性を示す変動量を推定値とする、請求項1に記載のパラメータ探索方法。
- 前記変動量推定ステップでは、対象観測データと参照観測データとのいずれか一方のデータにパラメータ空間における異なる変動量を複数与えてそれぞれモデル関数の事後分布を推定し、それぞれの事後分布の平均値モデルと観測データとの誤差が最も小さくなる変動量を推定値とする、請求項1に記載のパラメータ探索方法。
- 前記変動量推定ステップでは、モデル関数がガウス過程に従うとの前提で該モデル関数の事後分布を算出し、ガウス過程のハイパーパラメータを最尤推定した際に最大の尤度を示す変動量を推定値とする、請求項4に記載のパラメータ探索方法。
- 与えられたパラメータ値を条件として観測を行って観測値を出力する対象システムにおいて該観測値又は該観測値から求められる指標値が所定の状態となるようなパラメータ値を探索するパラメータ探索装置であって、
前記対象システムで観測された対象観測データと、該対象システムと関連する参照システムで観測された参照観測データと、に基づいて、前記対象システムのモデル関数の事後分布を推定するものであり、パラメータ空間における前記対象観測データと前記参照観測データとの間の変動量を該両観測データに基づいて推定する変動量推定部を含み、その推定された変動量に相当する補正がなされたモデル関数の事後分布を推定するモデル推定部と、
前記モデル推定部により得られたモデル関数の事後分布に基づいて、次の観測の際の条件であるパラメータ値を決定するパラメータ決定部と、
前記決定されたパラメータ値を前記対象システムに設定し、該対象システムから対象観測データを取得するデータ取得部と、
前記モデル推定部、前記パラメータ決定部、及び前記データ取得部による処理を繰り返し実行するようにそれら各部を制御する制御部と、
を備える、パラメータ探索装置。 - 前記変動量は、パラメータ空間における対象観測データと参照観測データとの間のシフト量である、請求項6に記載のパラメータ探索装置。
- 前記変動量推定部は、対象観測データと、参照観測データと、で独立にそれぞれのシステムのモデル関数の事後分布を推定し、いずれか一方のモデル関数にパラメータ空間における異なる変動量を複数与えてそれぞれ両モデルの相関性を求め、最も高い相関性を示す変動量を推定値とする、請求項6に記載のパラメータ探索装置。
- 前記変動量推定部は、対象観測データと参照観測データとのいずれか一方のデータにパラメータ空間における異なる変動量を複数与えてそれぞれモデル関数の事後分布を推定し、それぞれの事後分布の平均値モデルと観測データとの誤差が最も小さくなる変動量を推定値とする、請求項6に記載のパラメータ探索装置。
- 前記変動量推定部は、モデル関数がガウス過程に従うとの前提で該モデル関数の事後分布を算出し、ガウス過程のハイパーパラメータを最尤推定した際に最大の尤度を示す変動量を推定値とする、請求項9に記載のパラメータ探索装置。
- 与えられたパラメータ値を条件として観測を行って観測値を出力する対象システムにおいて該観測値又は該観測値から求められる指標値が所定の状態となるようなパラメータ値を探索するためのパラメータ探索用プログラムであって、コンピュータを、
前記対象システムで観測された対象観測データと、該対象システムと関連する参照システムで観測された参照観測データと、に基づいて、前記対象システムのモデル関数の事後分布を推定するものであり、パラメータ空間における前記対象観測データと前記参照観測データとの間の変動量を該両観測データに基づいて推定する変動量推定機能部を含み、その推定された変動量に相当する補正がなされたモデル関数の事後分布を推定するモデル推定機能部と、
前記モデル推定機能部により得られたモデル関数の事後分布に基づいて、次の観測の際の条件であるパラメータ値を決定するパラメータ決定機能部と、
前記決定されたパラメータ値を前記対象システムに設定し、該対象システムから対象観測データを取得するデータ取得機能部と、
前記モデル推定機能部、前記パラメータ決定機能部、及び前記データ取得機能部による処理を繰り返し実行するようにそれら各機能部を制御する制御機能部と、
して動作させる、パラメータ探索用プログラム。 - 前記変動量は、パラメータ空間における対象観測データと参照観測データとの間のシフト量である、請求項11に記載のパラメータ探索用プログラム。
- 前記変動量推定機能部は、対象観測データと、参照観測データと、で独立にそれぞれのシステムのモデル関数の事後分布を推定し、いずれか一方のモデル関数にパラメータ空間における異なる変動量を複数与えてそれぞれ両モデルの相関性を求め、最も高い相関性を示す変動量を推定値とする、請求項11に記載のパラメータ探索用プログラム。
- 前記変動量推定機能部は、対象観測データと参照観測データとのいずれか一方のデータにパラメータ空間における異なる変動量を複数与えてそれぞれモデル関数の事後分布を推定し、それぞれの事後分布の平均値モデルと観測データとの誤差が最も小さくなる変動量を推定値とする、請求項11に記載のパラメータ探索用プログラム。
- 前記変動量推定機能部は、モデル関数がガウス過程に従うとの前提で該モデル関数の事後分布を算出し、ガウス過程のハイパーパラメータを最尤推定した際に最大の尤度を示す変動量を推定値とする、請求項14に記載のパラメータ探索用プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018116364 | 2018-06-19 | ||
JP2018116364 | 2018-06-19 | ||
PCT/JP2019/017373 WO2019244474A1 (ja) | 2018-06-19 | 2019-04-24 | パラメータ探索方法、パラメータ探索装置、及びパラメータ探索用プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019244474A1 JPWO2019244474A1 (ja) | 2020-10-22 |
JP6919770B2 true JP6919770B2 (ja) | 2021-08-18 |
Family
ID=68984008
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020525317A Active JP6919770B2 (ja) | 2018-06-19 | 2019-04-24 | パラメータ探索方法、パラメータ探索装置、及びパラメータ探索用プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20210089952A1 (ja) |
JP (1) | JP6919770B2 (ja) |
CN (1) | CN112154464B (ja) |
WO (1) | WO2019244474A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7450212B2 (ja) * | 2020-02-28 | 2024-03-15 | 日立造船株式会社 | 情報処理装置、制御システム、制御変数決定方法、および制御変数決定プログラム |
WO2021221130A1 (ja) * | 2020-05-01 | 2021-11-04 | 味の素株式会社 | タンパク質のリフォールディング条件の探索方法ならびにタンパク質のリフォールディング条件の探索を支援するための情報処理装置、情報処理方法およびプログラム |
JPWO2022131336A1 (ja) * | 2020-12-17 | 2022-06-23 | ||
CA3232628A1 (en) * | 2021-09-15 | 2023-03-23 | The Dun & Bradstreet Corporation | Interactive system to assist a user in building a machine learning model |
CN114757291B (zh) * | 2022-04-26 | 2023-05-23 | 国网四川省电力公司电力科学研究院 | 基于机器学习算法的单相故障识别优化方法、系统及设备 |
WO2024080012A1 (ja) * | 2022-10-12 | 2024-04-18 | 日本電気株式会社 | 情報処理装置、情報処理方法および記録媒体 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004046677A (ja) * | 2002-07-15 | 2004-02-12 | Matsushita Electric Ind Co Ltd | パラメータ推定装置、パラメータ推定プログラム及びパラメータ推定方法 |
EP1598751B1 (en) * | 2004-01-12 | 2014-06-25 | Honda Research Institute Europe GmbH | Estimation of distribution algorithm (EDA) |
WO2006087854A1 (ja) * | 2004-11-25 | 2006-08-24 | Sharp Kabushiki Kaisha | 情報分類装置、情報分類方法、情報分類プログラム、情報分類システム |
BR112015029806A2 (pt) * | 2013-05-30 | 2020-04-28 | President And Fellows Of Harvard College | sistemas e métodos para realizar otimização bayesiana |
CN103902819A (zh) * | 2014-03-21 | 2014-07-02 | 哈尔滨工程大学 | 基于变分滤波的粒子优化概率假设密度多目标跟踪方法 |
EP3188060B1 (en) * | 2014-08-27 | 2023-04-26 | Nec Corporation | Simulation device, simulation method, and memory medium |
WO2016082849A1 (en) * | 2014-11-27 | 2016-06-02 | Longsand Limited | Calculating posterior probability of classes with plurality of binary support vector machines |
CN106096646A (zh) * | 2016-06-07 | 2016-11-09 | 衢州学院 | 一种支持向量回归机模型选择方法 |
JP6709718B2 (ja) * | 2016-11-04 | 2020-06-17 | 日本電信電話株式会社 | 入力パラメータ探索装置、入力パラメータ探索方法、及び入力パラメータ探索プログラム |
CN107464017A (zh) * | 2017-08-01 | 2017-12-12 | 浙江大学 | 基于带时间差分贝叶斯网络的自适应软测量预测方法 |
CN107844627A (zh) * | 2017-09-25 | 2018-03-27 | 北京理工大学 | 一种仅输出时变结构模态参数贝叶斯估计方法 |
-
2019
- 2019-04-24 US US16/959,704 patent/US20210089952A1/en active Pending
- 2019-04-24 JP JP2020525317A patent/JP6919770B2/ja active Active
- 2019-04-24 WO PCT/JP2019/017373 patent/WO2019244474A1/ja active Application Filing
- 2019-04-24 CN CN201980033718.1A patent/CN112154464B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
US20210089952A1 (en) | 2021-03-25 |
CN112154464A (zh) | 2020-12-29 |
JPWO2019244474A1 (ja) | 2020-10-22 |
WO2019244474A1 (ja) | 2019-12-26 |
CN112154464B (zh) | 2024-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6919770B2 (ja) | パラメータ探索方法、パラメータ探索装置、及びパラメータ探索用プログラム | |
Fuhg et al. | State-of-the-art and comparative review of adaptive sampling methods for kriging | |
Song et al. | A general framework for multi-fidelity bayesian optimization with gaussian processes | |
Gábor et al. | Robust and efficient parameter estimation in dynamic models of biological systems | |
Godsi et al. | Interpolation of multidimensional diabatic potential energy matrices | |
US20170357905A1 (en) | Fast and accurate graphlet estimation | |
Verboven et al. | Sequential imputation for missing values | |
Johndrow et al. | Scalable MCMC for Bayes shrinkage priors | |
Kim et al. | Parameter subset selection and biased estimation for a class of ill-conditioned estimation problems | |
US20190129918A1 (en) | Method and apparatus for automatically determining optimal statistical model | |
Kim et al. | Mean squared error criterion for model-based design of experiments with subset selection | |
JP6484449B2 (ja) | 予測装置、予測方法および予測プログラム | |
CN115019128A (zh) | 图像生成模型训练方法、图像生成方法及相关装置 | |
JP4208079B2 (ja) | データベースサーバ、プログラム、記録媒体、及び制御方法 | |
CN114742228B (zh) | 一种基于神经网络和量子线路的混合计算方法及装置 | |
WO2019235608A1 (ja) | 分析装置、分析方法および記録媒体 | |
Leite et al. | An iterative process for building learning curves and predicting relative performance of classifiers | |
JP6324124B2 (ja) | 予測システム、予測方法、および予測プログラム | |
Hosein et al. | A Successive Quadratic Approximation Approach for Tuning Parameters in a Previously Proposed Regression Algorithm. | |
Palar et al. | Multiple metamodels for robustness estimation in multi-objective robust optimization | |
KR102319015B1 (ko) | 정밀 점유 지도 작성을 위한 적응형 커널 추론 방법 및 장치 | |
Fan et al. | D-Spline Performance Tuning Method Flexibly Responsive to Execution Time Perturbation | |
Dietze et al. | Reduced order model predictive control for parametrized parabolic partial differential equations | |
Yen et al. | An attention algorithm for solving large scale structured l 0-norm penalty estimation problems | |
US20210365838A1 (en) | Apparatus and method for machine learning based on monotonically increasing quantization resolution |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200407 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210622 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210705 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6919770 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |