JP5816387B1 - 非線形最適解探索システム - Google Patents

非線形最適解探索システム Download PDF

Info

Publication number
JP5816387B1
JP5816387B1 JP2015093324A JP2015093324A JP5816387B1 JP 5816387 B1 JP5816387 B1 JP 5816387B1 JP 2015093324 A JP2015093324 A JP 2015093324A JP 2015093324 A JP2015093324 A JP 2015093324A JP 5816387 B1 JP5816387 B1 JP 5816387B1
Authority
JP
Japan
Prior art keywords
search
critical point
function
value
step width
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015093324A
Other languages
English (en)
Other versions
JP2016212510A (ja
Inventor
徹 山里
徹 山里
Original Assignee
徹 山里
徹 山里
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 徹 山里, 徹 山里 filed Critical 徹 山里
Priority to JP2015093324A priority Critical patent/JP5816387B1/ja
Application granted granted Critical
Publication of JP5816387B1 publication Critical patent/JP5816387B1/ja
Priority to US15/136,314 priority patent/US20160321087A1/en
Publication of JP2016212510A publication Critical patent/JP2016212510A/ja
Priority to US16/687,079 priority patent/US11403524B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】各探索回における演算処理を最大限効率化することで、非線形最適解を導出するまでの速度を向する。【解決手段】放物線近似によって各探索回におけるステップ幅αを導出する直線探索法に基づいて、関数fの最小値ないしは最大値を求める探索手段として、初期値として任意の基準点x0を記憶手段に記憶する初期情報取得手段と、ある基準点から未知の臨界点を探索する探索回において、基準点から探索方向ベクトルdの方向に、0でない微小なスカラーである仮ステップ幅σだけ進んだ仮臨界点における関数の一階微分値f’σを求め、記憶手段に保持する仮臨界点保持手段と、基準点における関数の一階微分値f’及び一階微分値f’σ、仮ステップ幅σを用いて、未知の臨界点までのステップ幅αを近似的に導出し、未知の臨界点における関数の一階微分値f’αを近似的に導出し、記憶手段に保持する臨界点近似手段と、を有する。【選択図】図2

Description

本発明は、直線探索法に基づき、関数fの最小値ないしは最大値を求める探索処理を行なう処理プログラムを有し、この処理プログラムを用いてコンピュータを動作させることによって、非線形最適解の探索を行う非線形最適解探索システムに関するものである。
従来、非線形関数fの最適解x*を導出するための非線形最適解探索システムが提供されている。非線形最適解探索システムは、例えばオペレーションズ・リサーチや、構造計算、設計、シミュレーション、流体、熱、電磁波等の解析など、幅広い分野において活用されている。
このような非線形関数f(x)を解析する非線形最適解探索システムでは、反復法が適用されている。反復法は、xkを初期値x0から目的とする最適解x*が得られるまで段階的に変化させる方法である。反復法の各段階においては、ある方向を表す探索方向ベクトルdを求め、dに沿ってxを直線的に変化させた点xk+αdにおける関数値f(xk+αd)がその直線上の最小値又は最大値となるスカラーαを求め、xk+αdを次の段階の出発点xk+1とする手法がとられる。このαを求める手法を、直線探索という。
これまでの非線形最適解探索システムでは、反復法の各段階において、αを求めるために非線形関数f(x)やその微分値(勾配)の演算を複数回行うことが必要であった。上述するような分野における実際上の問題を解決する場合、これらの演算には膨大な処理時間が必要になる。そのため、反復法の各段階における演算量を減らし、処理にかかる時間を減少させる手段が待ち望まれていた。
特許文献1には、複数の増減係数を選択的に使用することで、ステップ幅αを変化させながら関数fの最小値(ないしは最大値)を含む区間を求める囲い込み手段と、前記区間における最小値(ないしは最大値)の導出を行う最小値探索手段(最大値探索手段)と、として機能する処理プログラムを保持したコンピュータを用いて、従来に比べ直線探索内で行われる反復を削減し、効率的に非線形最適解を探索する非線形最適解探索装置に関する技術が記載されている。
この発明によって、従来の囲い込み手段及び最小解探索手段を適用した非線形最適解探索システム比べて、より高速化された非線形最適解探索システムを提供することが可能となった。
特許第3845029号公報
ここで、非線形最適解探索システムにおける計算時間を定式化して説明する。共役勾配法を用いた非線形最適解探索システムの計算時間Tを、式(1)を用いて定式化する。ここで、φ1は共役勾配法における反復部分以外の計算時間を示す定数、Nは共役勾配法における反復回数、mkは共役勾配法の一回の反復(以下、探索回とする)における直線探索に必要となる関数fの演算ないしはその微分演算の回数(以下、演算量とする)、τはそれらの演算にかかる時間、φ2は直線探索において要求される他の計算に係る時間を示す。なお、大規模な最適化問題では、τはφ1やφ2に比べて極めて大きい。そのため、Tの縮減を考える上では、Nとmkのみを考慮すればよい。
探索方向ベクトルdkの全てが、関数fの正定値ヘッセ行列について共役であると仮定した場合、共役勾配法の理論上は、反復回数Nはxの次元数nと等しくなる。しかしながら、一般に探索方向ベクトルdkは正確に共役とはならず、fを十分に最小化するためにはN回を超える反復処理を行なう必要がある。そのため、通常、ある収束条件に基づいて反復処理を終了させている。各探索回で正確なステップ幅αkが導出されるならば、次の探索回k+1における正確な探索方向ベクトルdk+1が導出されることとなる。即ち、正確なステップ幅αkの導出が、反復回数Nを減少させることに繋がる。
しかし、ステップ幅αの精度を過度に追求した場合、各探索回における演算量mkを増大させることが必要となり、かえって処理にかかる計算時間Tを増やすこととなる。そのため、特にτが膨大になる大規模な非線形最適化問題において、ステップ幅αの精度を追求することで計算時間Tの縮減を目指すことは現実的ではない。
特許文献1には、従来の囲い込み法を用いた非線形最適化問題の処理方法に対して、囲い込みの効率を向上させることによってmkを減らし、処理速度を向上させる非線形最適化問題の処理方法が記載されている。しかしながら、特許文献1に記載の技術では、囲い込みの効率化は図れるものの、各探索回において、依然として複数回の関数またはその微分の演算が必要となっている。そのため、処理速度を向上させるためには、さらにmkを削減する必要がある。
以上の理由から、反復回数Nではなく、各探索回におけるmkを最小限度まで減らすことで、処理にかかる計算時間Tを減らすことを考える。mkを減らすことで処理速度を高速化する方法として、放物線近似に基づく直線探索を伴った勾配法による非線形最適化問題の処理方法(以下、従来の非線形最適化問題の処理方法)が知られている。
従来の非線形最適化問題の処理方法は、探索する直線上の関数値がステップ幅の二次関数になるとみなし、直線上の複数の点における関数値や微分値をもとに、関数値が最少または最大となる臨界点までのステップ幅をαとする方法である。この処理方法により、少ない演算量mkでαを導出することが可能となり、各探索回における演算量mkを大幅に削減しながら、処理速度を高速化した非線形最適化問題の処理方法が提供可能となった。
しかし、前記従来の非線形最適化問題の処理方法においても、各探索回において複数回の関数演算、微分演算が必要であり、その処理に係る計算時間Tを増大させる要因となっていた。そのため、更にmkを減らし、処理時間を高速化した非線形最適解探索システムが待ち望まれていた。
本発明は上記のような実状に鑑みてなされたものであり、各探索回における演算処理を最大限効率化することで、非線形最適解を導出するまでの速度を向上させた非線形解探索システムを提供することを課題とする。
上記課題を解決するために、本発明は、放物線近似によって各探索回におけるステップ幅αを導出する直線探索法に基づいて、既知の最先臨界点である基準点からその探索回における探索方向ベクトルdの方向にステップ幅α進むことによって、未知の臨界点を導出する処理を反復的に行い、関数fの最小値ないしは最大値を求める探索手段としてコンピュータを機能させる処理プログラムを記憶した記憶手段と、前記処理プログラムをコンピュータ動作させる制御手段と、を備え、前記制御手段に基づいて関数fにおける非線形最適解を探索する非線形最適解探索システムであって、前記探索手段は、初期値として任意の基準点x0を前記記憶手段に記憶する初期情報取得手段と、ある基準点から未知の臨界点を探索する探索回において、前記基準点から前記探索方向ベクトルdの方向に、0でない微小なスカラーである仮ステップ幅σだけ進んだ仮臨界点における関数の一階微分値f’σを求め、前記記憶手段に保持する仮臨界点保持手段と、前記基準点における関数の一階微分値f’及び前記一階微分値f’σ、仮ステップ幅σ、探索方向ベクトルdを用いて、前記未知の臨界点までのステップ幅αを近似的に導出し、該未知の臨界点における関数の一階微分値f’αを近似的に導出し、前記記憶手段に保持する臨界点近似手段と、を有することを特徴とする。
このような構成とすることで、各探索回中において一回の微分演算を行うだけで、臨界点の微分値f’αの良好な近似値を導出することができる。これにより、特に演算量の多くなる大規模な非線形最適化問題を処理する際において、各探索回におけるmkを削減し、従来に比べ計算時間Tを大幅に縮減することができる。
本発明の好ましい形態では、前記臨界点近似手段は、前記臨界点における一階微分値f’αの導出を、有限差分近似を用いて行うこと、を特徴とする。
本発明の好ましい形態では、前記臨界点近似手段における前記ステップ幅αは、前記探索方向ベクトルdの方向にα進んだときの関数値fαを放物線に近似したαの二次関数について、有限差分近似法を用いて二階微分値を近似することで導出されることを特徴とする。
本発明の好ましい形態では、前記臨界点近似手段は、前記二階微分値を用いて、前記臨界点における関数値の近似を行うこと、を特徴とする。
本発明の好ましい形態では、前記初期情報取得手段は、収束判定を行う為の収束判定残差ωを前記記憶手段に記憶し、前記探索手段は、前記収束判定残差ω及び前記一階微分値f’αを用いて収束判定ないしは否判定を行う判定手段を有し、否判定がなされた場合、前記仮臨界点保持手段及び前記近似手段は、導出した臨界点から次の臨界点を探索する探索回について処理を開始すること、を特徴とする。
本発明の好ましい形態では、前記探索手段は、各探索回において、前記臨界点近似手段で近似的に導出される近似値の一つ以上に対して、採択するか否かの判定を行い、前記近似値を採択しない場合には、その探索回において、前記近似値として導出された値を、直接的な演算により求めた直接演算値に置き換えること、を特徴とする。
このような構成とすることで、全ての近似値を採択して最適解を導出する場合に比べ、より安定な処理を達成することができる。
本発明の好ましい形態では、前記探索手段は、各探索回において導出される値を一つ以上用いて収束の有効性判定を行い、予め設定した条件に合致しない場合には、探索回を1回以上遡り、その探索回において前記臨界点近似手段で近似的に導出された近似値を、直接的な演算により求めた直接演算値に置き換えること、を特徴とする。
このような構成とすることで、前の探索回に起因する誤差の影響を低減することができ、より安定な処理を達成することができる。
本発明の好ましい形態では、前記探索手段は、勾配法を用いること、を特徴とする。
このような構成とすることで、勾配法を用いて関数fの最小値又は最大値を探索する非線形最適解探索システムを提供することができる。
本発明の好ましい形態では、前記探索手段は、準ニュートン法を用いること、を特徴とする。
このような構成とすることで、準ニュートン法を用いて関数fの最小値又は最大値を探索する非線形最適解探索システムを提供することができる。
本発明の好ましい形態では、前記探索手段は、少なくとも一回前の探索回までの演算値及び前記一階微分値f’σ、前記一階微分値f’αを前記記憶手段に保持すること、を特徴とする。
このような構成とすることで、反復処理を迅速に行うことが可能な非線形最適解探索システムを提供することができる。
本発明は、機械学習方法であって、請求項1〜9の何れかに記載の最適解探索システムを用いて、入力された教師信号に基づいて学習を行うこと、を特徴とする。
このような構成とすることで、各探索回において大量の教師データについて演算を行い最適解の探索を行うことで関数近似や分類等の学習を行う機械学習において、各探索回における演算の回数を最大限まで削減することが可能となり、学習速度を大幅に高速化した機械学習方法を提供することができる。
本発明は、ニューラルネットワークの学習方法であって、請求項1〜9の何れかに記載の最適解探索システムを用いて、出力信号及び入力された教師信号に基づく誤差関数の最小化による学習を行うこと、を特徴とする。
このような構成とすることで、大量の教師データについて演算を行い最適解の探索を行う必要があるニューラルネットワークの学習において、各探索回における演算の回数を最大限まで削減することで、学習速度を大幅に高速化したニューラルネットワークを構築することができる。
本発明は、放物線近似によってステップ幅αを導出する直線探索法に基づいて各探索回で判定を行い、既知の最先基準点から探索方向ベクトルdの方向にステップ幅α進むことによって、未知の臨界点を導出する処理を反復的に行い、関数fの最小値ないしは最大値を求める探索手段としてコンピュータを機能させる処理プログラムであって、前記探索手段は、任意の基準点x0を記憶手段に記憶する初期情報取得手段と、ある臨界点から未知の臨界点を探索する探索回において、該臨界点から探索方向ベクトルdの方向に、0でない微小なスカラーである仮ステップ幅σだけ進んだ仮臨界点における関数の一階微分値f’σを求め、記憶手段に保持させる仮臨界点保持手段と、該臨界点における関数値の一階微分値f’及び前記仮臨界点における一階微分値f’σ、仮ステップ幅σを用いて、該臨界点から未知の臨界点までのステップ幅αを近似し、該未知の臨界点における関数の一階微分値f’αを近似し、記憶手段に保持させる近似手段と、を有することを特徴とする。
本発明は機械学習方法であって、請求項12に記載の処理プログラムを用いて、入力された教師信号に基づいて学習を行うこと、を特徴とする。
本発明はニューラルネットワークの学習方法であって、請求項12に記載の処理プログラムを用いて、出力信号及び入力された教師信号に基づく誤差関数の最小化による学習を行うこと、を特徴とする。
本発明によって、各探索回における演算処理を最大限効率化することで、非線形最適解を導出するまでの速度を向上させた非線形解探索システムを提供することができる。
従来の非線形最適化問題の処理フローチャートである。 本発明の実施形態1に係る非線形最適化問題の処理フローチャートである。 本発明の実施形態1に係る非線形最適解探索システムのハードウェア構成である。 本発明の実施形態2に係る非線形最適解探索システムのハードウェア構成である。
<実施形態1>
以下、本発明の実施形態1について図1〜3を参照して説明する。以下実施形態の構成は例示であり、本発明は実施形態の構成に限定されない。なお、以下共役勾配法に本発明に係る直線探索の処理を適用して本発明の概要を説明するが、他の勾配法、準ニュートン法等、他の非線形最適化問題解法アルゴリズムに対しても本発明は適用可能であり、それらを利用した本発明に関る非線形最適解探索システムを構成しても構わない。
(1)共役勾配法の説明
まず、共役勾配法について説明する。以下、f(x)の最小化について説明するが、最大化を行う場合であっても同様の方法で処理を行なうことが可能である。本実施形態では、非線形最適化問題解法アルゴリズムとして、共役勾配法を用いて説明を行う。
共役勾配法における無制約最適化問題の最適解x*は、一般的に、式(2)について、式(3)で与えられる反復法を適用することで導出される。式(4)では、共役勾配法を用いて探索方向ベクトルdを与えている。ここでgk=∇f(xk)は、関数fの勾配である。非線形最適化問題において、目的関数は多変量関数であるのが一般的であり、xk、dkは多次元ベクトルである。そのため、本発明における微分とは、一次元での微分以外にも、多次領域上での微分、すなわち勾配を含むものである。例えば、f’(x)は∇f(x)を示す。なお、ステップ幅αkはスカラーである。
勾配法において、反復的に行われる処理の各段階を探索回、各探索回において探索の基準となる点を基準点とする。そして、前記基準点を含む一次元二次関数に最小値(最大化問題においては最大値)を与える臨界点の探索を探索回ごとに行いながら、最適解x*の導出を行う。初期の基準点は任意のx0で与えられ、x0を基準点として探索されるx1が、初めの臨界点となる。なお、本発明における臨界点とは、前記一次元二次関数における厳密な意味での臨界点を、近似的に求めた点を含むものである。
勾配法の各探索回kで導出された臨界点xk+1は、臨界点における関数fの微分値f’(xk+1)及び収束判定残差ωを用いて収束判定される。この収束判定によって収束と判定された場合には、その臨界点xk+1が最適解x*として導出される。否判定がなされた場合には、導出された臨界点xk+1を新たな基準点として、未知の臨界点xk+2を求める探索回k+1を開始する。収束判定は、どのような方法で行われてもよく、例えば微分値でなく関数値を用いて収束判定を行っても構わない。
なお、式(4)における共役勾配法での探索方向ベクトルdを導出する方法は、Fletcher-Reeves(FR)やHestenes-Stiefel(HS)、Polak-Ribiere(PR)、Dai-Yuan(DY)等いくつかのものあるが、本実施形態では具体例として、式(5)に示すFR法を用いることとする。
(2)従来の放物線近似に基づく直線探索
次いで、従来の放物線近似に基づく直線探索について説明する。なお、本実施形態では、放物線近似のアルゴリズムとして、放物線補間法を用いる。各探索回において正確なステップ幅αkが与えられれば、理論上理想的な方向に向かわせる正確なdk+1が与えられ、早く収束する(反復回数Nの削減)。しかし、現実の大規模最適化問題において、直線探索の精度を高めることは、あまりにも多くの関数や勾配の演算を繰り返すことになり却って計算時間Tの増加を招く為、現実的ではない(mkの増加)。そのため、ステップ幅αkを効率的に求める手法が一般的に行われている。
x+αdにおける関数値f(x+αd)は、式(6)のようにテーラー展開で近似できる。なお、f’(x)=∇f(x)は関数fの勾配であり、f’’(x)はヘッセ行列である。
式(6)の右辺は放物線、即ちαを独立変数とする1次元の2次関数である。また、この近似式より、f(x+αd)をαについて一階微分及び二階微分したものが、式(7)及び式(8)である。臨界点を求めるため、式(7)の左辺を0としてαについて解けば式(9)が得られる。式(9)でα*は、二次関数の臨界点までのステップ幅となる。
ここで、式(9)の分母におけるf’’(x)は直接演算することが難しく演算処理にかかる時間も膨大になる。そのため、任意の0でない微小な値を仮ステップ幅σとし、基準点x及び仮臨界点x+σdという異なる2に点において一階微分を求めることで、有限差分近似法によりdTf’’(x)dを近似する(式(10))。そして、式(10)を式(9)に代入してα*の近似値が導出される(式(11))。
fが二次の場合、f(x+αd)は正確にαについての放物線となっており、式(9)で求めるステップ幅α*は、正確に臨界点を示す値をとる。また、有限差分近似法を用いた場合であっても、放物線補間法を用いた直線探索では、一回のαの計算で、強いWolfe条件を満たすことが多い。そのため、ステップ幅αkを求める一回の演算で、各探索回における最適なステップ幅αk*が好適な精度で導出される。
(3)従来の非線形最適化問題の処理方法の説明
次いで、図1を用いて、従来の非線形最適化問題の処理方法を説明する。S1では、勾配法の初期化を行う。k=n=0における基準点x0及び、初期情報として、収束判定残差ω、任意の0でない微小な値σを入力し、n=0の探索回(臨界点xn+1の導出と、その評価)が開始される(S2)。S3では、f(x0)に微分演算を行うことよりf’(x0)が導出される。導出されたf’(x0)をFR法に適用して探索方向ベクトルd0を求める(S4)。
S5では、S4で求めた探索方向ベクトルdnを用いてf’(xn+σdn)を直接微分演算により求める。f’(xn+σdn)が求まったなら、放物線補間法及び有限差分近似法に基づいて未知の臨界点までのステップ幅αnの値を近似的に導出する(S6)。なおここで、仮ステップ幅σnは、より適切な値を探索回ごとに計算し、求めるように構成しても構わない。
これまでの処理により、αn、dnが求められたため、未知の臨界点は、xn+1= xnndnとして求められる(S7)。そして、xn+1における関数値f(xn+1)が直接関数演算により導出される。また、f(xn+1)を直接微分演算することで、xn+1における関数fの勾配f’(xn+1)が導出される(S8)。
S9では、S8において導出された臨界点xn+1における関数fの勾配f’(xn+1)を、収束判定残差ωを用いて判別する。収束したと判定された場合(S9でY)、xn+1が関数fの最適解x*となる(S10a)。否判定された場合(S9でN)、S10bにおいてnを一つ進めてS4に戻り、先ほど導出された臨界点xn+1を基準点として未知の臨界点xn+2導出する次の探索回を開始する。そして、S9における評価を、探索回を繰り返しながら、収束判定がなされるまで続ける。なお、S9における収束判定は、fの勾配に限らず、αやd等、他の値を用いて行ってもかまわない。
(4)本発明に関する非線形最適化問題の処理方法の説明
次いで、図2を用いて、本発明の実施形態1に関わる近似的直線探索及び、非線形最適化問題の処理方法について説明する。なお、前述した従来の非線形最適化問題の処理方法と重複する部分に関しては、その説明を省略する。S11〜S17までの処理は、図1に示すフローチャートにおける従来の処理方法S1〜S7と同様である。
図1に示す従来の非線形最適化問題の処理方法では、式(10)における有限差分近似法を適用したことから、xn+σdnの直接微分演算(S5)及び、xn+1の直接微分演算(S8)を行う必要がある。即ち、一回の探索回中で、2点についての直接微分演算を行う必要が生じる。
非線形最適化問題を解く際の計算時間Tは、反復回数Nと、各探索回で行われる微分演算及び関数演算の回数mkに依存している。そこで、S18において、本発明に関する直線探索を適用することで各探索回における直接微分演算の回数を削減し、処理にかかる計算時間Tをより減らした非線形最適化問題の処理方法を適用する。
仮にヘッセ行列Hを仮定すると、f’(x+αd)は、式(12)のように変形できる。なお、εは誤差項であるが、fが二次式で十分近似できるものとして以後の説明中では省略する。式(12)のαをσに置き換えることで、Hdは式(13)のように近似される。
更に、式(13)において近似されたHdを式(12)代入し,αをα*と置き換えることで、式(14)が得られる。これにより従来勾配の計算が必要であったf’(x+αd)の値が近似的に導出される。ここで、f’(x)は一回前の探索回で既に導出されており、f’(x+σd)はS15で導出されている。これにより、各探索回での臨界点の微分演算f’(x+αd)を、既に演算した値を用いて再帰的に導出することができる。f’(x+αd)について探索回を示す添え字kを加えたものを式(15)に、αについて探索回を示す添え字kを加えたものを式(16)に示す。
前述の通りf’(x)は前回の探索回で、また、f’(x+σd)は有限差分近似法を用いてステップ幅αを導出する際に計算されているため、単純な代入計算により、極めて容易にf’(x+αd)を導出することが可能である。これにより、一回の探索回中における直接微分演算を、f’(x+σd)の一回のみに減らすことができる。そのため、特に大規模な非線形最適化問題を処理するような場合において、その演算処理にかかる計算時間Tを大幅に削減することが可能となる。具体的には、従来の各探索回において少なくとも二回以上行われていた微分演算を、一回のみに削減することが可能である。ただし、n=0の探索回における一階微分値f’(x0)のみ、直接的な微分演算が必要となる。
S18において、f’(xn+1)が近似的に導出されたなら、従来と同様、収束の判別を行う(S20)。収束したと判定された場合(S20でY)、臨界点xn+1がfの最適解x*となる(S21a)。否判定された場合(S20でN)、nを一つ進めてS14に戻り(S21b)、先ほど導出された臨界点xn+1を基準点として未知の臨界点xn+2導出する次の探索回を開始する。S20での収束の判別は、fの勾配に限らず、f(xn+1)の関数値や、α、d等、他の値を用いて行ってもかまわない。
また、必要に応じて、S18及びS20の間等で、f(xn+1)の関数値についても近似的に導出するようにしてもよい(S19)。また、前述のようにその値を用いて収束の判定を行うようにしてもよい。これにより、f(xn+1)の直接的な関数演算によって生じる処理を減らし、一回の探索回中における演算処理にかかる時間を更に削減することが可能である。f(xn+1)(=f(xn+αndn))の関数値を近似演算で導出する方法は、式(6)おけるxをx+σdに、αをα-σに置き換えた式(17)を用いる。
式(17)におけるdTf’’(x+σd)dを近似するために、0でない微小な値μを与えることで、式(18)が導出される。ここで、μ=-σと置けば、式(19)が導出される。
この式(19)を式(17)に代入することにより、関数値f(xk+1)を近似することができる。なお、この式(19)の右辺は、αを近似演算するための式(10)と同じである。即ち、関数値f(xk+1)の値を直接的に関数演算することなく、αkを導出する段階で既に求めた値のみを用いて近似し、その演算量を削減することができる。
勿論、直接関数演算でf(x+αd)を求めるようにしても構わないが、探索回ごとの演算量が増加し、最適解x*を導出するまでの計算時間Tが増大することとなる。なお、処理プログラムの構成次第では、f’(xk+σdk)を導出するためにf(xk+σdk)が演算されているため、f(xkkdk)を近似するために、演算の回数が増えることがない。
なお、図2に示すフローチャートでは、本発明に関る非線形最適化問題の処理方法について探索回を繰り返す場合のみを例示したが、任意の条件で、別の処理方法に移行するように構成しても構わない。
ステップ幅α、f’(xkkdk)、f(xkkdk)等の近似的に導出した近似値を採択するか否かについて、予め設定した条件に基づき判定し、図2のフローチャートに現れていない処理を行なうようにしてもよい。例えば、ある探索回において、前記近似値を採択しないと判定した場合には、その探索回において、前記近似値を直接演算により求めた直接演算値に置き換えたり、他の導出方法により導出された値に置き換えたりすることが考えられる。
また、本発明に関る非線形最適化問題の処理方法並びに前記近似値採択の判定によって得られる何れかの値を一つ以上用いて収束の有効性判定を行い、図2のフローチャートに現れていない処理を行うようにしてもよい。0<αや0<f(xn+1)<f(xn)を条件として、最小値探索において放物線補間法による放物線が上に凸の場合や、f(xn+1)が収束していない場合等を判別し、別の処理を適用することが好ましい。ここで別の処理とは、例えば、近似的に導出していたαを別の方法で導出した値に置き換えたり、近似的に導出していたf’(xk+1)やf(xk+1)を、従来の非線形最適化問題の処理方法と同様に直接演算により求めた直接演算値と置き換えることが考えられる。また、探索方向ベクトルdについては、(式4)におけるk=0の場合の値に置き換えるようにしてもよい。
更に、これら値の置き換え処理を、ひとつ前の探索回または複数探索回遡る遡り処理を行なった上で適用して、その後、図2のフローチャートに現れる処理を再開するように構成することが、後述する理由から好ましい。また、前記近似値を採択するか否かの判定での結果やそこで求めた直接演算値を、遡りを行う判定基準として利用し、遡り処理及び置き換え処理を適用するように構成してもよい。
この遡り処理を行っても、本発明に関る非線形最適解の導出方法における実験ではその出現頻度は1割程度であり、残り9割は近似的に導出した近似値が採択され、演算量は大幅に少なくなる。従って、従来の非線形最適解の導出方法を単独で適用する場合に比べて全体的な演算量が大幅に削減されることにはほとんど変わりがなく、高速に最適解の導出を行うことが可能である。遡り処理を適用することにより、最適解の導出をより安定に実現することが可能となる。
(5)非線形最適解探索システムのハードウェア構成例
図3を用いて、本発明の実施形態1に係る、制御対象モデルデータにおける制御変数の最適化を行う非線形最適解探索システム1のハードウェア構成について説明する。この非線形最適解探索システム1は、前述した本発明に関する非線形最適化問題の処理方法を用いているものである。
非線形最適解探索システム1は、コンピュータ11と、CPU12と、入力装置13と、出力装置14と、メモリ15と、前記メモリ15内に記憶された処理プログラム16a及び処理データ16b、計測制御プログラム17a及び計測制御データ17b、解析プログラム18a及び解析データ18b、制御対象モデルデータ19、を備えている。ここで、CPU12やメモリ15が、入力装置13や出力装置14等とネットワークを介して接続された、分散的な配置になっていても構わない。
解析プログラム18aは、制御変数の変更などに応じて制御対象モデルデータ19の状態を模擬するシミュレータであり、モデルの形状データや、計算条件などを変更可能となっている。
この非線形最適解探索システム1は、入力装置13において式(2)の対象となる目的関数f(x)、初期制御変数x0、収束判定残差ωを入力し、メモリ15へ処理データ16bとして格納する。次に、メモリ15に格納された処理プログラム16aを実行する。処理プログラム16aは、制御変数の最適化処理を担っており、計測制御プログラム17aから受信した計測結果を用い、目的関数が最小ないしは最大となる制御変数の候補解を算出し、計測制御プログラム17aに対して制御対象変更指示信号を送信する。その信号を受信した計測制御プログラム17aは、その内容に基づき制御対象モデルデータ19の制御を更新して解析プログラム18aに解析指示を出す。解析プログラム18aは、計測制御プログラム17aに解析結果を返送する。以上を繰り返すことにより、制御対象モデルデータ19の最適な制御変数を取得することができる。
本発明の実施形態1によれば、制御対象モデルにおける制御データの最適化を行う為の処理プログラムが、本発明に関する非線形最適化問題の処理方法に基づく探索手段を備えることによって、その一回の探索回において行われる微分演算及び関数演算の回数を最大限減らしながら、最適解を導出することができる。これにより、従来に比べより高速化された制御シミュレーションや数値演算を行うことができる。
本発明に係る直線探索法では、従来の放物線補間法に基づく直線探索に遜色ない精度でステップ幅αを導出することが可能であり、特に大規模な非線形最適化問題を処理する際においては、その計算時間Tを大幅に削減することが可能である。
また、本発明に関する非線形最適化問題の処理方法では、各探索回の臨界点における関数値についても、近似的に導出することができる。これにより、従来直接的な関数演算が必要であった臨界点における関数値を、既に演算された値に基づいて再帰的に演算することが可能となり、その計算時間Tを大幅に削減することができる。
<実施形態2>
図4を用いて、本発明の実施形態2に係る、制御対象における制御変数の最適化を行う非線形最適解探索システム2のハードウェア構成について説明する。この非線形最適解探索システム2は、前述した本発明に関する非線形最適化問題の処理方法を用いているものである。なお、上述した実施形態1と基本的に同一の構成要素については、同一の符号を付してその説明を簡略化する。
非線形最適解探索システム2は、コンピュータ11と、CPU12と、入力装置13と、出力装置14と、メモリ15と、前記メモリ15内に記憶された処理プログラム16a及び処理データ16bと、を備えている。またCPU12には、計測結果を取得するためのI/F装置20及び計測制御装置21介して、制御対象22が接続されている。前記メモリ15は、上述の本発明に関する非線形最適化問題の処理方法に基づく探索手段を実行する、前記処理プログラム16aを格納している。ここで、CPU12やメモリ15が、入力装置13や出力装置14等とネットワークを介して接続された、分散的な配置になっていても構わない。
この非線形最適解探索システム2は、入力装置13において式(2)の対象となる目的関数f(x)、初期制御変数x0、収束判定残差ωを入力し、メモリ15へ処理データ16bとして格納する。次に、メモリ15に格納された処理プログラム16aを実行する。処理プログラム16aは、I/F装置20から受信した計測結果を用い、目的関数が最小ないしは最大となる制御変数の候補解を算出し、I/F装置20に対して制御対象変更指示信号を送信する。その信号をI/F装置20を介して受信した計測制御装置21は、その内容に基づき制御対象22の制御を更新し、再度計測を実施する。以上を繰り返すことより、制御対象19における最適な制御が実現される。
本発明の実施形態2によれば、処理プログラムが、本発明に関する非線形最適化問題の処理方法に基づく探索手段を備えることによって、その一回の探索回において行われる微分演算及び関数演算の回数を最大限減らしながら、最適解を導出することができる。これにより、従来に比べより高速化された機械制御を行うことができる。
本発明に係る直線探索法では、従来の放物線補間法に基づく直線探索に遜色ない精度でステップ幅αを導出することが可能であり、特に大規模な非線形最適化問題を処理する際においては、その計算時間Tを大幅に削減することが可能である。
また、本発明に関する非線形最適化問題の処理方法では、各探索回の臨界点における関数値についても、近似的に導出することができる。これにより、従来直接的な関数演算が必要であった臨界点における関数値を、既に演算された値に基づいて再帰的に演算することが可能となり、その計算時間Tを大幅に削減することができる。
従来に比べ大幅に処理速度を向上させたソルバーアルゴリズムや機械学習方法、教師有り人工ニューラルネットワークの学習方法等を提供することができる。
1 非線形最適解探索システム
11 コンピュータ
12 CPU
13 入力装置
14 出力装置
15 メモリ
16a 処理プログラム
16b 処理データ
17a 計測制御プログラム
17b 計測制御データ
18a 解析プログラム
18b 解析データ
19 制御対象モデルデータ
2 非線形最適解探索システム
20 I/F装置
21 計測制御装置
22 制御対象

Claims (14)

  1. 放物線近似によって各探索回におけるステップ幅αを導出する直線探索法に基づいて、既知の最先臨界点である基準点からその探索回における探索方向ベクトルdの方向にステップ幅α進むことによって、未知の臨界点を導出する処理を反復的に行い、関数fの最小値ないしは最大値を求める探索手段としてコンピュータを機能させる処理プログラムを記憶した記憶手段と、前記処理プログラムをコンピュータ動作させる制御手段と、を備え、前記制御手段に基づいて関数fにおける非線形最適解を探索する非線形最適解探索システムであって、
    前記探索手段は、初期値として任意の基準点x0を前記記憶手段に記憶する初期情報取得手段と、
    ある基準点から臨界点を探索する探索回において、前記基準点から前記探索方向ベクトルdの方向に、0でない微小なスカラーである仮ステップ幅σだけ進んだ仮臨界点における関数の一階微分値f’σを求め、前記記憶手段に保持する仮臨界点保持手段と、
    前記基準点における関数の一階微分値f’及び前記一階微分値f’σ、仮ステップ幅σ、探索方向ベクトルdを用いて、前記臨界点までのステップ幅αを近似的に導出し、前記臨界点における関数の一階微分値f’αを近似的に導出し、前記記憶手段に保持する臨界点近似手段と、を有することを特徴とする非線形最適解探索システム。
  2. 前記臨界点近似手段は、前記臨界点における一階微分値f’αの導出を、有限差分近似を用いて行うこと、を特徴とする請求項1に記載の非線形最適解探索システム。
  3. 前記臨界点近似手段における前記ステップ幅αは、前記探索方向ベクトルdの方向にα進んだときの関数値fαを放物線に近似したαの二次関数について、有限差分近似法を用いて二階微分値を近似することで導出されることを特徴とする請求項1又は請求項2に記載の非線形最適解探索システム。
  4. 前記臨界点近似手段は、前記二階微分値を用いて、前記臨界点における関数値fαを近似的に導出すること、を特徴とする請求項3に記載の最適解探索システム。
  5. 前記初期情報取得手段は、収束判定を行う為の収束判定残差ωを前記記憶手段に記憶し、
    前記探索手段は、前記収束判定残差ω及び前記一階微分値f’αを用いて収束の判定ないしは否判定を行う判定手段を有し、
    否判定がなされた場合、前記仮臨界点保持手段及び前記臨界点近似手段は、導出した臨界点を新たな基準点として、未知の臨界点を探索する探索回について処理を行なうこと、を特徴とする請求項1〜4の何れかに記載の最適解探索システム。
  6. 前記探索手段は、各探索回において、前記臨界点近似手段で近似的に導出される近似値の一つ以上に対して、採択するか否かの判定を行い、
    前記近似値を採択しない場合には、その探索回において、前記近似値として導出された値を、直接的な演算により求めた直接演算値に置き換えること、を特徴とする請求項1〜5の何れかに記載の最適解探索システム。
  7. 前記探索手段は、各探索回において導出される値を一つ以上用いて収束の有効性判定を行い、
    予め設定した条件に合致しない場合には、探索回を1回以上遡り、その探索回において前記臨界点近似手段で近似的に導出された近似値を、直接的な演算により求めた直接演算値に置き換えること、を特徴とする請求項1〜6の何れかに記載の最適解探索システム。
  8. 前記探索手段は、勾配法を用いること、を特徴とする請求項1〜7の何れかに記載の非線形最適解探索システム。
  9. 前記探索手段は、少なくとも一回前の探索回までの演算値及び前記一階微分値f’σ、前記一階微分値f’αを前記記憶手段に保持すること、を特徴とする請求項1〜8の何れかに記載の非線形最適解探索システム。
  10. 請求項1〜9の何れかに記載の最適解探索システムを用いて、入力された教師信号に基づいて学習を行うこと、を特徴とする機械学習方法。
  11. 請求項1〜9の何れかに記載の最適解探索システムを用いて、出力信号及び入力された教師信号に基づく誤差関数の最小化による学習を行うこと、を特徴とするニューラルネットワークの学習方法。
  12. 放物線近似によって各探索回におけるステップ幅αを導出する直線探索法に基づいて、既知の最先臨界点である基準点からその探索回における探索方向ベクトルdの方向にステップ幅α進むことによって、未知の臨界点を導出する処理を反復的に行い、関数fの最小値ないしは最大値を求める探索手段としてコンピュータを機能させる処理プログラムであって、
    前記探索手段は、初期値として任意の基準点x0を記憶手段に記憶する初期情報取得手段と、
    ある基準点から未知の臨界点を探索する探索回において、前記基準点から前記探索方向ベクトルdの方向に、0でない微小なスカラーである仮ステップ幅σだけ進んだ仮臨界点における関数の一階微分値f’σを求め、記憶手段に保持させる仮臨界点保持手段と、
    前記基準点における関数の一階微分値f’及び前記一階微分値f’σ、仮ステップ幅σを用いて、前記未知の臨界点までのステップ幅αを近似し、該未知の臨界点における関数の一階微分値f’αを近似し、記憶手段に保持させる臨界点近似手段と、を有することを特徴とする処理プログラム。
  13. 請求項12に記載の処理プログラムを用いて、入力された教師信号に基づいて学習を行うこと、を特徴とする機械学習方法。
  14. 請求項12に記載の処理プログラムを用いて、出力信号及び入力された教師信号に基づく誤差関数の最小化による学習を行うこと、を特徴とするニューラルネットワークの学習方法。
JP2015093324A 2015-04-30 2015-04-30 非線形最適解探索システム Active JP5816387B1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2015093324A JP5816387B1 (ja) 2015-04-30 2015-04-30 非線形最適解探索システム
US15/136,314 US20160321087A1 (en) 2015-04-30 2016-04-22 Methods of increasing processing speed in a processing system that performs a nonlinear optimization routine
US16/687,079 US11403524B2 (en) 2015-04-30 2019-11-18 Methods of increasing processing speed in a processing system that performs a nonlinear optimization routine

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015093324A JP5816387B1 (ja) 2015-04-30 2015-04-30 非線形最適解探索システム

Publications (2)

Publication Number Publication Date
JP5816387B1 true JP5816387B1 (ja) 2015-11-18
JP2016212510A JP2016212510A (ja) 2016-12-15

Family

ID=54602100

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015093324A Active JP5816387B1 (ja) 2015-04-30 2015-04-30 非線形最適解探索システム

Country Status (2)

Country Link
US (1) US20160321087A1 (ja)
JP (1) JP5816387B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021018683A (ja) * 2019-07-22 2021-02-15 富士通株式会社 情報処理プログラム、情報処理方法、及び情報処理装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7114497B2 (ja) * 2019-01-29 2022-08-08 日本電信電話株式会社 変数最適化装置、変数最適化方法、プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0554057A (ja) * 1991-08-22 1993-03-05 Hitachi Ltd 非線形最適化方法及びその装置
JP3845029B2 (ja) * 2002-02-22 2006-11-15 三菱電機株式会社 非線形最適解探索装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0554057A (ja) * 1991-08-22 1993-03-05 Hitachi Ltd 非線形最適化方法及びその装置
JP3845029B2 (ja) * 2002-02-22 2006-11-15 三菱電機株式会社 非線形最適解探索装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6015037175; 高木 英行 外2名: 'ニューラルネット学習における非線形最適化手法の効果' 電子情報通信学会論文誌 第J74-D-II巻,第4号, 19910425, pp.528-535, 社団法人電子情報通信学会 *
JPN6015037176; 山下 信雄: 'OR研究の最前線' 経営の科学 オペレーションズ・リサーチ 第55巻,第4号, 20100401, pp.243-247, 社団法人日本オペレーションズ・リサーチ学会 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021018683A (ja) * 2019-07-22 2021-02-15 富士通株式会社 情報処理プログラム、情報処理方法、及び情報処理装置
JP7318383B2 (ja) 2019-07-22 2023-08-01 富士通株式会社 情報処理プログラム、情報処理方法、及び情報処理装置

Also Published As

Publication number Publication date
JP2016212510A (ja) 2016-12-15
US20160321087A1 (en) 2016-11-03

Similar Documents

Publication Publication Date Title
Bonyadi et al. Analysis of stability, local convergence, and transformation sensitivity of a variant of the particle swarm optimization algorithm
JP6265931B2 (ja) システムの連続モデル予測制御のための方法およびシステムを制御するための連続モデル予測コントローラー
WO2015125714A1 (en) Method for solving convex quadratic program for convex set
CA3041221A1 (en) Simulation device, computer program, and simulation method
Foygel et al. Exact block-wise optimization in group lasso and sparse group lasso for linear regression
Platt et al. A systematic exploration of reservoir computing for forecasting complex spatiotemporal dynamics
US10635078B2 (en) Simulation system, simulation method, and simulation program
Yu et al. Complex dynamics in biological systems arising from multiple limit cycle bifurcation
JP7267966B2 (ja) 情報処理装置及び情報処理方法
JP2017084343A (ja) システムのモデル予測制御の方法およびモデル予測コントローラー
Benner et al. Reduced-order modeling and ROM-based optimization of batch chromatography
JP5816387B1 (ja) 非線形最適解探索システム
Collins et al. Petrov-Galerkin projection-based model reduction with an optimized test space
Shi et al. Physics-informed ConvNet: Learning physical field from a shallow neural network
Pilipovic et al. Parameter estimation in nonlinear multivariate stochastic differential equations based on splitting schemes
CN113435089A (zh) 一种基于高斯过程的板材折弯回弹预测方法
Othmani et al. A new structure and training procedure for multi-mother wavelet networks
JP6193823B2 (ja) 音源数推定装置、音源数推定方法および音源数推定プログラム
Noack et al. High-performance hybrid-global-deflated-local optimization with applications to active learning
Zhao et al. An effective model selection criterion for mixtures of Gaussian processes
Rahman et al. Convergence of the fast state estimation for power systems
CN112488319B (zh) 一种具有自适应配置生成器的调参方法和系统
Chau et al. SMCGen: Generating reconfigurable design for sequential Monte Carlo applications
CN110889396A (zh) 能源互联网扰动分类方法、装置、电子设备和存储介质
Ghiasi et al. Combining thermodynamics-based model of the centrifugal compressors and active machine learning for enhanced industrial design optimization

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150915

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150925

R150 Certificate of patent or registration of utility model

Ref document number: 5816387

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250