JP2008204437A - 固定型の長期及び適応型の短期メモリを有するニューラルネットワークコントローラ - Google Patents

固定型の長期及び適応型の短期メモリを有するニューラルネットワークコントローラ Download PDF

Info

Publication number
JP2008204437A
JP2008204437A JP2008004538A JP2008004538A JP2008204437A JP 2008204437 A JP2008204437 A JP 2008204437A JP 2008004538 A JP2008004538 A JP 2008004538A JP 2008004538 A JP2008004538 A JP 2008004538A JP 2008204437 A JP2008204437 A JP 2008204437A
Authority
JP
Japan
Prior art keywords
adaptive
neural network
output
nodes
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008004538A
Other languages
English (en)
Other versions
JP2008204437A5 (ja
JP5102046B2 (ja
Inventor
Danil V Prokhorov
ブイ.プロホロフ ダニル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Engineering and Manufacturing North America Inc
Original Assignee
Toyota Motor Engineering and Manufacturing North America Inc
Toyota Engineering and Manufacturing North America Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Engineering and Manufacturing North America Inc, Toyota Engineering and Manufacturing North America Inc filed Critical Toyota Motor Engineering and Manufacturing North America Inc
Publication of JP2008204437A publication Critical patent/JP2008204437A/ja
Publication of JP2008204437A5 publication Critical patent/JP2008204437A5/ja
Application granted granted Critical
Publication of JP5102046B2 publication Critical patent/JP5102046B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

【課題】ノードの相互接続の重みの変化に伴う悪影響を防止することにより、既知のコントローラの欠点を克服するリカレントニューラルネットワークを使用したコントローラの提供。
【解決手段】プラントの所望の状態及びプラントの実際の状態を表す少なくとも1つの外部入力信号と、プラントに対して制御信号として接続された出力と、を有する固定重み型リカレントニューラルネットワークを具備したプラント用のコントローラである。固定リカレントニューラルネットワークは、ノード間において固定重み型の相互接続を有するノードの組と、ノードの中の少なくとも1つからの出力を少なくとも1つのノードの入力に相互接続している少なくとも1つのフィードバック入力と、を含んでいる。これらのノードは、入力信号及びフィードバック信号の関数としてニューラルネットワークからの出力の値を総合的に判定している。
【選択図】図1

Description

(関連出願)
本出願は、2007年1月12日付けで出願された米国特許出願第11/622,766号の優先権を主張するものである。
本発明は、一般に、ニューラルネットワークを利用したコントローラに関するものである。
閉ループ方式によって(フィードバックを介して)制御されるプラント、即ち、システムの動作を制御するべくコントローラによって使用されるタイプのニューラルネットワークは、入力層、隠れ層、及び出力層を含んでいる。これらの層のそれぞれは、異なる機能を実行している。
入力層は、プラントの所望の動作を表す1つ又は複数の制御信号を受信している。但し、入力層はこれらの入力を処理しない。
逆に、出力層は、プラントの動作をターゲット値に向かって制御する1つ又は複数の出力信号をプラントに対して供給している。尚、出力層は、プラントに結合された少なくとも1つの制御出力を含んでいるが、任意選択により、プラントに結合された複数の出力を包含可能である。
隠れ層は、入力層からの信号に応答し、出力層から所望の出力信号を供給するべく、信号の処理を実行している。隠れ層は、重みの組によって相互接続された複数のノードを含んでいる。これらの重みは、隠れ層内のそれぞれのノードからの出力に対して入力値が具備する相対的な効果の程度を決定している。それぞれのノードは、そのノードに対する入力の加重和の非線形関数であるなんらかの数学的活性化関数を更に実装している。
いくつかのニューラルネットワークは、隠れ層内においてフィードバックを提供していないフィードフォワードニューラルネットワークであるが、その他のニューラルネットワークは、隠れ層内のノード間に、又はネットワークの出力及びその入力の間に、少なくとも1つのフィードバック信号を含んでいる。このようなフィードバック信号を有するニューラルネットワークは、リカレントニューラルネットワークと呼ばれている。このフィードバックは、リカレントニューラルネットワークの短期メモリを構成している。
ノードの相互接続間に重みを確立するべく、既知のニューラルネットワークは、トレーニング法を利用することにより、ノードの相互接続に対して重みを設定している。これらの既知のコントローラにおけるこのようなニューラルネットワークを利用したトレーニング法によれば、必然的に、トレーニング期間中において、ノードの相互接続間における重みが変化することになる。この結果、トレーニングの後に、ノードの相互接続間におけるオリジナルの重みの設定が失われてしまう。
ノード間における重みの初期設定は、通常、多くの場合にコンピュータシミュレーションを使用することにより、オフライントレーニングにおいて実行されている。このようなオフライントレーニングにより、コントローラ設計者は、プラントの様々な異なる動作条件をコントローラに対して適用可能である。従って、適切に設計(通常は、トレーニング)された場合には、このようなオフライントレーニングを通じて決定されたノードの相互接続の初期の重みは、様々な異なる動作条件下において良好に動作する能力を有するロバストなコントローラを結果的にもたらすことになる。従って、これらの重みは、コントローラの長期メモリを形成している。
但し、このようなオフライントレーニングは、閉ループシステムにとって平均的に良好であり、且つ、コントローラのロバスト性を表しているノードの相互接続用の重みの組を提供している。しかしながら、すべてのプラントは、例えば、環境の変動に起因して互いに多少異なっているため、コントローラの動作を最適化するべく、なんらかの適応性をコントローラに提供することが望ましい。従来、このような適応性は、最適なシステム性能を実現するべくノードの相互接続間における重みを変化させることによって実現されている。更には、このような重みの調節は、コントローラのリアルタイム又はオンライントレーニングの際に、即ち、制御対象の実際のプラントと関連したコントローラの使用を通じて実行されている。
しかしながら、オンライントレーニングの際のノードの相互接続の重みの調節に伴う基本的な欠点は、システムによって最初に設定された重みの値が、オフライントレーニングの際に失われるという点にある。これは、コントローラの長期メモリの破壊と等価である。更には、このようなノードの相互接続の重みの変化は、システムのロバスト性に悪影響を及ぼすと共に、コントローラの性能の低下と、極端な場合には、コントローラ機能の完全な消失を結果的にもたらす可能性がある。
本発明は、既知のコントローラに伴う前述の欠点のすべてを克服するリカレントニューラルネットワークを使用したコントローラを提供している。
要すれば、本発明のコントローラは、ニューラルネットワークの入力層に接続された少なくとも1つの外部入力信号と、プラントに対して制御信号として接続されたニューラルネットワークの出力層からの少なくとも1つの出力信号と、を具備した固定重み型リカレントニューラルネットワークを有している。例えば、プラントが自動車用の電子スロットル制御装置である場合には、入力信号は、スロットルバルブプレートのターゲット及び実際の位置の両方を表す信号を有することになり、コントローラからの出力信号は、電子スロットルをターゲット値に起動するべく接続されることになろう。
固定重み型ニューラルネットワークは、固定重み型の相互接続をノード間に具備したノードの組を含んでいる。少なくとも1つのフィードバック信号が少なくとも1つのノードの出力から少なくとも1つのノードの入力に対して供給されている。従って、このニューラルネットワークは、リカレントニューラルネットワークである。
実際に、固定重み型リカレントニューラルネットワークのノードの相互接続の重みは、オフライントレーニングにおいて決定されている。このようなトレーニングは、通常、高忠実度のコンピュータシミュレーションによって実行されているため、様々な異なるシミュレートされた動作条件において、固定型リカレントニューラルネットワークのロバスト性を確立可能である。
最適なシステム性能のためのコントローラの適応性を提供するべく、本発明のコントローラは、適応型ニューラルシステムを更に含んでいる。この適応型ニューラルシステムは、プラントのターゲット値と実際の値の間の差を表わしているプラントの状態を表す入力信号と、固定型リカレントニューラルネットワークの少なくとも1つのノードに接続されたフィードバック信号として結合された出力と、を受信している。又、適応型ニューラルシステムは、1つに相互接続された非線形数学関数を表す複数のノードをも含んでいる。但し、適応型ニューラルシステムは、固定重み型リカレントニューラルネットワークとは異なり、ノードの相互接続の重みを変化させることにより、システムの最適な性能を実現している。この結果、動作においては、適応型ニューラルシステムは、プラントの性能を最適化するべく、オンライントレーニングの最中及びその後に、固定重み型リカレントニューラルネットワークのフィードバック入力に対して訂正信号を生成している。
適応型ニューラルシステムは、任意の従来の構成を採用可能であるが、本発明の好適な実施例においては、プラントからのコスト信号に応答し、既定の範囲においてコスト値を予測するリカレント適応型クリティックを有している。次いで、同時摂動確率近似などの有限差分アルゴリズムにより、適応型クリティックからの予測値を利用し、フィードバック信号として固定重み型リカレントニューラルネットワークに対して訂正出力信号を生成している。
本発明のコントローラの基本的な利点は、適応型リカレントニューラルネットワークによって提供される訂正が、固定重み型リカレントニューラルネットワークの状態にのみ影響を及ぼし、重みには影響を及ぼさないという点にある。この結果、オフライントレーニングを通じて得られた固定重み型リカレントニューラルネットワークのロバスト性が、破壊されることなしに、維持されている。
添付の図面との関連において、以下の詳細な説明を参照することにより、本発明について十分に理解することができよう。添付の図面中のいくつかの図においては、類似の参照符号によって類似の部分を示している。
まず、図1を参照すれば、本発明のコントローラ10の好適な実施例のブロックダイアグラムが示されている。コントローラ10は、固定重み型リカレントニューラルネットワーク(Recurrent Neural Network:RNN)を含んでいる。一般的なRNN12は、入力層14、出力層16、及び隠れ層18を含んでいる。多くの場合に、少なくとも1つの隠れ層が必要とされており、フィードバックを有する非層型のニューラルネットワークも可能である。
従来の方式においては、入力層14は、プラント22の望ましい又はターゲット状態を表す入力信号を入力20上において受信している。例えば、プラント22が、自動車に使用されるタイプの電子スロットルを有している場合には、入力20上の信号は、自動車用のスロットルバルブプレートの望ましい位置を表す信号を有することができる。入力20上の別の信号は、スロットルバルブプレートの実際の位置を含んでいる。
同様に、出力層12は、その出力24上において、制御信号として信号をプラント22に供給している。尚、図1には、1つの出力24のみが示されているが、当然のことながら、RNN12は、いくつかの異なる出力24を具備可能であることを理解されたい。プラント22が電子スロットル制御装置を有する例においては、RNN12からの出力24上の出力信号は、スロットルの作動の程度を制御することになる。
更に図1を参照すれば、隠れ層18は、複数のノード26を含んでおり、このそれぞれは、そのノードに対する入力の加重和の非線形関数であるなんらかの数学的活性化関数を実装している。ノード26は、図示されているように、相互接続28によって相互接続されており、隠れ層18内のそれぞれのノードの相互接続には、既定の重みが割り当てられている。
少なくとも1つの、且つ、更に一般的には、いくつかのフィードバック相互接続30が、固定重み型ニューラルネットワーク12の隠れ層18内のノード26の中の少なくとも1つのものの出力から供給され、ノード26の中の少なくとも1つのものに対して入力信号Z-1として結合されている。
ノード相互接続28の重みは、通常、コンピュータシミュレーションを使用し、オフライントレーニングを通じて入手されている。このようなシミュレーションにより、設計者は、満足のゆくRNN12のロバスト性を得るべく、様々なシミュレートされた条件をRNNに対して適用可能である。nprKF(Kalmanフィルタ)法などの任意の従来の方法を使用することにより、固定重み型RNN12内のノードの相互接続の重みを最適化可能である。
RNN12の適切なオフライントレーニングの後に、RNN12は、プラント22の許容可能な動作を単独で提供することになる。しかしながら、すべてのプラント22は、同一のタイプであったとしても、相互に多少異なっているため、プラント22の最適な性能のためには、コントローラのなんらかの適応性が望ましい。この適応性を適応型ニューラルシステム(Adaptive Neural System:ANS)50によって提供している。
ANS50は、入力52上において、プラント22からコスト信号を受信している。入力52上の信号は、そのプラント状態におけるターゲット値と実際の値の間の差分を表している。理想的には、入力ライン52上のコスト値は、ゼロであり、これは、プラント22の実際の性能がその状態のターゲット値に対応していることを示している。この場合には、ANS50は、固定重み型RNN12の動作に対して影響を及ぼさない。
一方、そのプラント状態におけるターゲット値がその実際の値と異なっている場合には、ライン52上のANS50に対するコスト入力はノンゼロである。この場合には、適応型ANSは、後程更に詳細に説明する方式により、そのプラント状態のターゲット値とそのプラント状態が互いに等しいか又は略等しくなるようにプラント22の動作を調節するために、固定重み型RNN12からのライン24上の出力を変更するべく設計された訂正信号をその出力52上に生成することになる。
ANS50からの出力52は、フィードバック入力信号として固定重み型RNN内の1つ又は複数のノード26に対して結合されている。従って、ANSからの出力信号は、固定重み型RNN12の状態Zcrには影響を与えるが、RNN12のノード相互接続の重みを変化させることはない。この結果、適応型RNN50は、オフライントレーニングの際に得られた固定重み型RNN12のロバスト性に影響を与えることなしに、ANS50によって提供される適応性を通じてプラント22の動作の最適化を実現している。
次に、図2を参照すれば、ブロック50内においては、本発明の範囲を逸脱することなしに、任意のRNNを利用可能ではあるが、本発明の好適な一実施例においては、ANS50は、システム状態と関連した価値関数の推定値としてその出力62上においてJ値を予測するリカレント適合型クリティック60を含んでいる。基本的に、Jクリティックは、次のように近似される。
Figure 2008204437
実際には、無限に対する加算の実行は不可能であるため、前述の式を約分するγによって定義された有限な範囲を選択することにより、次のように、更に適度な範囲を選択している。
Figure 2008204437
リカレント適応型クリティック60は、複数の相互接続されたノードを具備したニューラルネットワークを有している。これらのノードの少なくともいくつかは、フィードバック信号をネットワーク内のその他のノードに供給しており、且つ、任意選択により、この適応型ニューラルネットワークは、固定重み型RNN12の1つ又は複数のノードからの入力信号と、閉ループシステムのその他の状態変数を受信している。但し、適応型クリティック60内のニューラルネットワークの動作を最適化するには、適応型クリティック60内の様々なノード相互接続の重みの適切な値を得るべく、適応型クリティック60にオンライントレーニングを適用する必要がある。
適応型クリティック60のオンライントレーニングには、その演算効率が良好である限り、任意の従来の方法を使用可能である。但し、本発明の好適な実施例においては、このようなオンライントレーニングのために、確率的メタ下降(SMD、Stochastic Meta−Descent)を利用している。反復的なSMDアルゴリズムは、2つの段階から構成されている。第1に、ローカル学習係数のベクトルpを、次のように更新している。
p(t)=diag(p(t−1))max(0.5,1+μdiag(v(t))▽(t))
v(t+1)=ηv(t)+diag(p(t))(▽(t)=ηCv(t))
ここで、ηは、忘却係数であり、μは、スカラーメタ学習係数であり、vは、補助ベクトルであり、Cv(t)は、曲率行列Cとvの積であり、▽は、WCと関連したJ(t)の導関数と時間ステップの短いウィンドウにおいて平均化されたクリティックの誤差J(t)−cost(t)−γJ(t+1)の積である。第2に、クリティックの重みの更新は、WC(t+1)=WC(t)−diag(p(t))▽(t)であり、ここで、WC=クリティックの重みベクトルである。
更に図2を参照すれば、適応型クリティック60からのライン62上におけるJ出力を有限差分アルゴリズム64によって処理することにより、固定重み型RNN12に対してライン52(図1)上に出力される訂正信号
Figure 2008204437
を得ている。任意の有限差分アルゴリズムを利用可能ではあるが、その単純性及び非常に低い演算要件に起因し、同時摂動確率近似(Simultaneous Perturbation Stochastic Approximation:SPSA)と呼ばれるアルゴリズムが好ましい。
SPSAの1つの形態においては、パラメータベクトル次元から独立した2つのコスト評価を使用することにより、それぞれの適応型パラメータの1回の更新を実行している。本発明においては、SPSAアルゴリズム64は、重みの更新ではなく、出力ライン52上においてノードの更新を提供している。具体的には、それぞれのSPSA更新は、次のように判定されている。
Figure 2008204437
ここで、Zcrは、その更新値
Figure 2008204437
を有するRNNコントローラの状態ベクトルであり、Δは、すべての更新段階において新しく生成される対称分散Bernoulliランダム変数のベクトルであり(例えば、Δiと表記されたΔのi番目のコンポーネントは、+1又は−1のいずれかである)、J±は、最小化対象のコスト関数であり、ここで、上付き文字「+」及び「−」は、Zcrの正及び負の摂動にそれぞれ対応しており、
Figure 2008204437
であって、cは、小さな摂動段階のサイズであり、aは学習係数である。この結果、SPSAアルゴリズム64は、次のように、zerの更新値を提供している。
Figure 2008204437
それぞれのSPSA更新は、適応型クリティック60からの2つの連続したJ値の演算を必要としている。この結果、1回のSPSA更新は、閉ループシステムのその他の時間ステップごとに一回ずつを上回っては実行されない。従って、動作の際には、SPSAアルゴリズム64を使用する正及び負の摂動は、システム性能を最適化するべく固定重み型RNN12に適切なフィードバック信号を供給するのに必要な値
Figure 2008204437
を最適化している。
参照符号50の適応型RNNとしては、その他のタイプを使用することも可能であるが、有限差分アルゴリズム64と共にリカレント適応型クリティックを使用する方法は、演算的に許容可能であり、且つ、十分なシステム性能を提供している。これは、有限差分アルゴリズム64としてSPSAアルゴリズムを利用する場合に、特に当て嵌まる。但し、この代わりに、本発明の精神又は範囲を逸脱することなしに、参照符号50の適応型RNNとして、異なるタイプを使用することも可能である。
以上の内容から、本発明は、相互にタンデム方式で動作する2つのニューラルネットワーク12及び60を利用したプラント用のコントローラを提供していることがわかる。固定型RNN12のノードの相互接続の重みが一定であるため、固定重み型RNN12のオフライントレーニングの利点が、そのオフライントレーニングに起因した全体的なロバスト性と共に、保持されている。
逆に、参照符号50の適応型RNNは、可変重みを有するノード相互接続を具備している。適応型RNNのノード相互接続の重みは、適応型RNNからの出力が固定RNN12の状態には影響を及ぼすが、重みには影響を及ぼさないように、オンライン又はリアルタイムトレーニングを通じて入手されている。従って、参照符号50の適応型RNNは、プラント状態のプラントターゲット値とその状態の実際のプラント値の間の差を極小化するべく十分な訂正フィードバック信号を固定重み型RNN12に供給可能であり、これにより、適応型RNNに対するコスト入力が極小化される。
本発明の説明は以上のとおりであるが、当業者には、添付の請求項の範囲によって定義されている本発明の精神を逸脱することなしに、この内容に対する多数の変更が明らかとなろう。
本発明の好適な実施例を示すブロックダイアグラムである。 本発明の好適な実施例を示すブロックダイアグラムである。

Claims (16)

  1. プラント用のコントローラにおいて、
    前記プラントの所望の状態を表す少なくとも1つの外部入力信号と、前記プラントに対して制御信号として接続された出力と、ノード間における固定重み型の相互接続を有する前記ノードの組と、前記ノードの少なくとも1つからの出力を少なくとも1つのノードの入力に相互接続する少なくとも1つのフィードバック入力と、を具備した固定重み型リカレントニューラルネットワークであって、前記ノードは、前記少なくとも1つの外部入力信号及び前記少なくとも1つのフィードバック入力の1つ又は複数の値の関数として前記固定重み型リカレントニューラルネットワークの出力の値を集合的に判定している、固定重み型リカレントニューラルネットワークと、
    コスト入力と、出力と、ノード間における可変重み型の相互接続を有する複数の前記ノードと、を具備した適応型ニューラルシステムであって、前記適応型ニューラルシステムの出力は、前記固定重み型リカレントニューラルネットワークの少なくとも1つのフィードバック入力に結合されており、これにより、前記固定重み型リカレントニューラルネットワークの短期メモリを変化させる、適応型ニューラルシステムと、
    を有するコントローラ。
  2. 前記適応型ニューラルシステムは、リカレントニューラルネットワークを有する、請求項1記載の発明。
  3. 前記適応型ニューラルシステムは、前記コスト入力に接続された少なくとも1つの入力と、有限差分プロセッサに接続された出力と、を具備した適応型クリティックを有しており、前記有限差分プロセッサの出力は、前記適応型ニューラルシステムからの前記出力を形成している、請求項1記載の発明。
  4. 前記有限差分プロセッサは、同時摂動確率近似を利用している、請求項3記載の発明。
  5. 前記適応型ニューラルシステムは、入力信号として前記固定重み型ニューラルネットワークから少なくとも1つのノード出力信号を受信している、請求項1記載の発明。
  6. 前記適応型クリティックは、前記有限差分プロセッサによって使用されるコストパラメータの予測値を生成している、請求項3記載の発明。
  7. 前記適応型クリティックのノード間における重みをリアルタイム動作において調節する手段を有する、請求項1記載の発明。
  8. 前記調節手段は、前記ノードの重みに対して確率的メタ下降最適化を実行する手段を有する、請求項7記載の発明。
  9. プラント用のコントローラにおいて、
    前記プラントの所望の状態を表す少なくとも1つの外部入力信号と、前記プラントに対して制御信号として接続された出力と、ノード間における固定重み型の相互接続を有する前記ノードの組と、を具備した固定重み型リカレントニューラルネットワークであって、前記ノードは、短期メモリを有しており、前記重みは、長期メモリを有しており、前記ノード及び前記重みの両方が固定重み型リカレントニューラルネットワークを定義している、固定重み型リカレントニューラルネットワークと、
    コスト入力と、出力と、ノード間において可変重み型の相互接続を有する複数の前記ノードと、を具備した適応型ニューラルシステムであって、前記適応型ニューラルシステムの出力は、前記固定重み型リカレントニューラルネットワークの少なくとも1つのフィードバック入力に結合されており、これにより、前記固定重み型リカレントニューラルネットワークの状態を変化させている、適応型ニューラルシステムと、
    を有するコントローラ。
  10. 前記適応型ニューラルシステムは、リカレントニューラルネットワークを有する、請求項9記載の発明。
  11. 前記適応型ニューラルシステムは、前記コスト信号に接続された少なくとも1つの入力と、有限差分プロセッサに接続された出力と、を具備した適応型クリティックを有しており、前記有限差分プロセッサの出力は、前記適応型ニューラルシステムからの前記出力を形成している、請求項9記載の発明。
  12. 前記有限差分プロセッサは、同時摂動確率近似を利用している、請求項11記載の発明。
  13. 前記適応型ニューラルシステムは、入力信号として前記固定重み型ニューラルネットワークから少なくとも1つの出力信号を受信している、請求項9記載の発明。
  14. 前記適応型クリティックは、前記有限差分プロセッサによって使用されるコストパラメータの予測を生成している、請求項11記載の発明。
  15. 前記ノード間における重みをリアルタイム動作において調節する手段を有する、請求項9記載の発明。
  16. 前記調節手段は、前記ノードの重みに対して確率的メタ下降最適化を実行する手段を有する、請求項15記載の発明。
JP2008004538A 2007-01-12 2008-01-11 プラントを制御するための装置 Expired - Fee Related JP5102046B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/622,766 US7647284B2 (en) 2007-01-12 2007-01-12 Fixed-weight recurrent neural network controller with fixed long-term and adaptive short-term memory
US11/622,766 2007-01-12

Publications (3)

Publication Number Publication Date
JP2008204437A true JP2008204437A (ja) 2008-09-04
JP2008204437A5 JP2008204437A5 (ja) 2010-02-25
JP5102046B2 JP5102046B2 (ja) 2012-12-19

Family

ID=39618523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008004538A Expired - Fee Related JP5102046B2 (ja) 2007-01-12 2008-01-11 プラントを制御するための装置

Country Status (2)

Country Link
US (1) US7647284B2 (ja)
JP (1) JP5102046B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021033951A (ja) * 2019-08-29 2021-03-01 国立大学法人広島大学 プロセス管理の支援装置、支援方法、支援プログラムおよび支援システム

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8538901B2 (en) * 2010-02-05 2013-09-17 Toyota Motor Engineering & Manufacturing North America, Inc. Method for approximation of optimal control for nonlinear discrete time systems
CN103489032B (zh) * 2013-09-27 2016-08-17 南京航空航天大学 基于粒子滤波的航空发动机气路部件健康诊断方法
KR102239714B1 (ko) 2014-07-24 2021-04-13 삼성전자주식회사 신경망 학습 방법 및 장치, 데이터 처리 장치
CN106471526B (zh) 2014-08-29 2019-03-08 谷歌有限责任公司 用于处理图像的方法和系统
CN104700828B (zh) * 2015-03-19 2018-01-12 清华大学 基于选择性注意原理的深度长短期记忆循环神经网络声学模型的构建方法
WO2017185347A1 (zh) * 2016-04-29 2017-11-02 北京中科寒武纪科技有限公司 用于执行循环神经网络和lstm运算的装置和方法
US11238334B2 (en) 2017-04-04 2022-02-01 Hailo Technologies Ltd. System and method of input alignment for efficient vector operations in an artificial neural network
US11544545B2 (en) 2017-04-04 2023-01-03 Hailo Technologies Ltd. Structured activation based sparsity in an artificial neural network
US11551028B2 (en) 2017-04-04 2023-01-10 Hailo Technologies Ltd. Structured weight based sparsity in an artificial neural network
US10387298B2 (en) 2017-04-04 2019-08-20 Hailo Technologies Ltd Artificial neural network incorporating emphasis and focus techniques
US11615297B2 (en) 2017-04-04 2023-03-28 Hailo Technologies Ltd. Structured weight based sparsity in an artificial neural network compiler
FI20196098A1 (fi) * 2017-05-19 2019-12-19 Curious Ai Oy Neuroverkkoon perustuva ratkaisu
CN109726797B (zh) * 2018-12-21 2019-11-19 北京中科寒武纪科技有限公司 数据处理方法、装置、计算机系统及存储介质
JP7365999B2 (ja) * 2019-12-24 2023-10-20 財團法人工業技術研究院 ニューラルネットワーク演算装置および方法
US11263077B1 (en) 2020-09-29 2022-03-01 Hailo Technologies Ltd. Neural network intermediate results safety mechanism in an artificial neural network processor
US11874900B2 (en) 2020-09-29 2024-01-16 Hailo Technologies Ltd. Cluster interlayer safety mechanism in an artificial neural network processor
US11221929B1 (en) 2020-09-29 2022-01-11 Hailo Technologies Ltd. Data stream fault detection mechanism in an artificial neural network processor
US11811421B2 (en) 2020-09-29 2023-11-07 Hailo Technologies Ltd. Weights safety mechanism in an artificial neural network processor
US11237894B1 (en) 2020-09-29 2022-02-01 Hailo Technologies Ltd. Layer control unit instruction addressing safety mechanism in an artificial neural network processor
CN114577204B (zh) * 2022-02-09 2024-01-02 中科禾华(扬州)光电科技有限公司 基于神经网络的捷联惯导系统抗干扰自对准方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04372044A (ja) * 1991-06-20 1992-12-25 Mitsubishi Electric Corp 制御方法およびその制御方法を用いた電力系統電圧−無効電力制御装置
JPH06175998A (ja) * 1992-12-07 1994-06-24 Nippon Telegr & Teleph Corp <Ntt> 時系列予測方法
JPH09245012A (ja) * 1996-03-08 1997-09-19 Mitsubishi Electric Corp 学習制御方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9600774D0 (en) * 1996-01-15 1996-03-20 British Telecomm Waveform synthesis
US5987444A (en) * 1997-09-23 1999-11-16 Lo; James Ting-Ho Robust neutral systems
EP0910023A2 (de) * 1997-10-17 1999-04-21 Siemens Aktiengesellschaft Verfahren und Anordnung zur neuronalen Modellierung eines dynamischen Systems mit nichtlinearem stochastischem Verhalten
US6516309B1 (en) * 1998-07-17 2003-02-04 Advanced Research & Technology Institute Method and apparatus for evolving a neural network
US6532454B1 (en) * 1998-09-24 2003-03-11 Paul J. Werbos Stable adaptive control using critic designs
US6882992B1 (en) * 1999-09-02 2005-04-19 Paul J. Werbos Neural networks for intelligent control
NZ503882A (en) 2000-04-10 2002-11-26 Univ Otago Artificial intelligence system comprising a neural network with an adaptive component arranged to aggregate rule nodes
AU2001295591A1 (en) * 2000-10-13 2002-04-22 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. A method for supervised teaching of a recurrent artificial neural network
IES20020063A2 (en) * 2001-01-31 2002-08-07 Predictions Dynamics Ltd Neutral network training
US6665651B2 (en) * 2001-07-18 2003-12-16 Colorado State University Research Foundation Control system and technique employing reinforcement learning having stability and learning phases
US7076350B2 (en) * 2003-12-19 2006-07-11 Lear Corporation Vehicle energy management system using prognostics

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04372044A (ja) * 1991-06-20 1992-12-25 Mitsubishi Electric Corp 制御方法およびその制御方法を用いた電力系統電圧−無効電力制御装置
JPH06175998A (ja) * 1992-12-07 1994-06-24 Nippon Telegr & Teleph Corp <Ntt> 時系列予測方法
JPH09245012A (ja) * 1996-03-08 1997-09-19 Mitsubishi Electric Corp 学習制御方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021033951A (ja) * 2019-08-29 2021-03-01 国立大学法人広島大学 プロセス管理の支援装置、支援方法、支援プログラムおよび支援システム
JP7466823B2 (ja) 2019-08-29 2024-04-15 国立大学法人広島大学 プロセス管理の支援装置、支援方法、支援プログラムおよび支援システム

Also Published As

Publication number Publication date
US7647284B2 (en) 2010-01-12
US20080172349A1 (en) 2008-07-17
JP5102046B2 (ja) 2012-12-19

Similar Documents

Publication Publication Date Title
JP5102046B2 (ja) プラントを制御するための装置
JP2008204437A5 (ja)
Anjum et al. Response surface methodology: A neural network approach
Jin et al. The improvements of BP neural network learning algorithm
US4912647A (en) Neural network training tool
US20100257866A1 (en) Method for computer-supported control and/or regulation of a technical system
JP2000510265A (ja) 予測、制御および最適化のための動的および定常状態プロセスをモデル化する方法および装置
Li et al. Neural-network-based distributed adaptive asymptotically consensus tracking control for nonlinear multiagent systems with input quantization and actuator faults
US4912654A (en) Neural networks learning method
KR20190018885A (ko) 중첩 신경망을 프루닝하는 방법 및 장치
US4912651A (en) Speeding learning in neural networks
US6768927B2 (en) Control system
US6738688B2 (en) Method of predicting carrying time in automatic warehouse system
JP2003256005A (ja) 制御方法および制御装置
CN116880191A (zh) 一种基于时序预测的过程工业生产系统的智能控制方法
CN112598107A (zh) 数据处理系统及其数据处理方法
LU505155B1 (en) Design method of damping controller based on power system, controller and power system
Mkrttchian et al. Application of neural network in sliding mode control
Mancini et al. Neural variable structure controller for telescope pointing and tracking improvement
JPH11506553A (ja) ダイナミックプロセスのモデル化装置
KR102400610B1 (ko) 평균제곱편차 분석기반의 적응형 학습률을 갖는 역전파 신경망 학습방법
CN111602146B (zh) 数据处理系统、数据处理方法和记录介质
CN113359452B (zh) 基于Barzilai Borwein智能学习算法的控制器设计方法、系统
US20230008014A1 (en) Data processing device, data-processing method and recording media
JP3412700B2 (ja) 神経回路網型パターン学習方法およびパターン処理装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100113

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120515

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120828

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120927

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees