JPH052403A - 最適化装置、費用を最小化する装置および観測系/制御系装置 - Google Patents
最適化装置、費用を最小化する装置および観測系/制御系装置Info
- Publication number
- JPH052403A JPH052403A JP3023739A JP2373991A JPH052403A JP H052403 A JPH052403 A JP H052403A JP 3023739 A JP3023739 A JP 3023739A JP 2373991 A JP2373991 A JP 2373991A JP H052403 A JPH052403 A JP H052403A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- matrix
- vector
- output
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000013598 vector Substances 0.000 claims abstract description 58
- 239000011159 matrix material Substances 0.000 claims abstract description 57
- 238000005259 measurement Methods 0.000 claims description 18
- 230000004044 response Effects 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 2
- 238000000034 method Methods 0.000 abstract description 51
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 abstract description 35
- 230000008569 process Effects 0.000 abstract description 34
- 238000004422 calculation algorithm Methods 0.000 abstract description 33
- 230000009466 transformation Effects 0.000 abstract description 28
- 239000000446 fuel Substances 0.000 abstract description 10
- 238000004364 calculation method Methods 0.000 abstract description 8
- 238000012545 processing Methods 0.000 abstract description 7
- 230000002776 aggregation Effects 0.000 abstract 1
- 238000004220 aggregation Methods 0.000 abstract 1
- 230000003252 repetitive effect Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 27
- 230000009977 dual effect Effects 0.000 description 11
- 238000005457 optimization Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 230000015654 memory Effects 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 5
- 230000003068 static effect Effects 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000005309 stochastic process Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- RZVHIXYEVGDQDX-UHFFFAOYSA-N 9,10-anthraquinone Chemical group C1=CC=C2C(=O)C3=CC=CC=C3C(=O)C2=C1 RZVHIXYEVGDQDX-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000012993 chemical processing Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004836 empirical method Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000013509 system migration Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
(57)【要約】 (修正有)
【目的】 カルマーカーの方法とカルマン・フィルタと
の間の概念的かつ算定法上の類似点を利用して、確率的
LP(線形計画法)システムを制御するシステムによっ
て観測系の機能と最小時間制御系の機能とを扱うことを
可能とする。 【構成】 この制御システムは、カルマン・フィルタの
算定構造を有する要素を含み、その各入力は、他の算定
要素に所望の結果を分配するように、質的に制御され
る。確率システムのLP制御タスク用のコントローラに
おいて、前記の要素は、アフィンスケーリングアルゴリ
ズムで使用される双対ベクトル信号を展開する。その仮
想的なシステムでは、観測可能な出力がDx(k)cであ
り、その入力がOであり、測定雑音の共分散行列が、そ
の被制御システムの観測可能な出力の測定における雑音
を記述する共分散行列であり、推移行列がIであり、測
定可能なパラメータと観測可能な出力との間の関係を記
述する行列が、ATDx(k)である。
の間の概念的かつ算定法上の類似点を利用して、確率的
LP(線形計画法)システムを制御するシステムによっ
て観測系の機能と最小時間制御系の機能とを扱うことを
可能とする。 【構成】 この制御システムは、カルマン・フィルタの
算定構造を有する要素を含み、その各入力は、他の算定
要素に所望の結果を分配するように、質的に制御され
る。確率システムのLP制御タスク用のコントローラに
おいて、前記の要素は、アフィンスケーリングアルゴリ
ズムで使用される双対ベクトル信号を展開する。その仮
想的なシステムでは、観測可能な出力がDx(k)cであ
り、その入力がOであり、測定雑音の共分散行列が、そ
の被制御システムの観測可能な出力の測定における雑音
を記述する共分散行列であり、推移行列がIであり、測
定可能なパラメータと観測可能な出力との間の関係を記
述する行列が、ATDx(k)である。
Description
【0001】
【産業上の利用分野】本発明は、特殊な指定された遂行
基準を満たしたり、最大化したり、または最小化するた
めの確率過程または確率システムの制御に関する。特
に、資源割当費用の最適化基準のような、制御下の過程
またはシステムの選択された遂行基準を最適化する方法
および装置に関する。
基準を満たしたり、最大化したり、または最小化するた
めの確率過程または確率システムの制御に関する。特
に、資源割当費用の最適化基準のような、制御下の過程
またはシステムの選択された遂行基準を最適化する方法
および装置に関する。
【0002】
【従来の技術】●確率システム
システムの状態空間の概念によれば、所与のシステムま
たは過程の力学は、そのシステムまたは過程の「状態」
によって完全に記述することができる。例えば、電動機
の力学は、その回転軸の角度変位、角速度、角加速度に
よって十分詳細に記述することができる。これらの3つ
のパラメータの値の種々の組は、そのシステムの状態と
考えることができる。これらのパラメータは、(回転速
度計で測定される速度のように)直接的に測定可能であ
ったり、間接的に測定可能であったりするが、システム
の制御は、それらの測定を基にすることができる。しか
し、観測された測定値は、動作および測定における雑音
によって損なわれることがある。そのような雑音成分を
含むシステムは、一般に確率システムと称する。
たは過程の力学は、そのシステムまたは過程の「状態」
によって完全に記述することができる。例えば、電動機
の力学は、その回転軸の角度変位、角速度、角加速度に
よって十分詳細に記述することができる。これらの3つ
のパラメータの値の種々の組は、そのシステムの状態と
考えることができる。これらのパラメータは、(回転速
度計で測定される速度のように)直接的に測定可能であ
ったり、間接的に測定可能であったりするが、システム
の制御は、それらの測定を基にすることができる。しか
し、観測された測定値は、動作および測定における雑音
によって損なわれることがある。そのような雑音成分を
含むシステムは、一般に確率システムと称する。
【0003】確率システムは、観測系およびそれと別個
の観測系反応的制御系を備えた方式で制御することがで
きる。この概念は、観測系を用いることによって考察中
のシステムの状態をたどり、その観測された状態に基づ
いてシステムの出力を制御によって結果的に変えるよう
な制御信号計画をまとめ上げることである。この観測系
により、そのシステムの入力および出力の変換器によっ
て与えられる標本から、そのシステムのいろいろな状態
を推定する。例えば、化学処理の状態の観測では、化学
プラントの状態を表示するために、熱電対によって化学
プラントの異なる部分で温度を測定することができる。
の観測系反応的制御系を備えた方式で制御することがで
きる。この概念は、観測系を用いることによって考察中
のシステムの状態をたどり、その観測された状態に基づ
いてシステムの出力を制御によって結果的に変えるよう
な制御信号計画をまとめ上げることである。この観測系
により、そのシステムの入力および出力の変換器によっ
て与えられる標本から、そのシステムのいろいろな状態
を推定する。例えば、化学処理の状態の観測では、化学
プラントの状態を表示するために、熱電対によって化学
プラントの異なる部分で温度を測定することができる。
【0004】システムの確率的な面は、極めて現実的な
システムではシステムの状態の測定に不確定性が必然的
に伴うという事実から来るものである。これらの不確定
性は、一般に「測定雑音」と称する。また、動作環境に
よって引き起こされるシステムの擾乱も考えられる。こ
れらの擾乱は、そのシステムを記述するモデルの単なる
不正確さや不完全性から起こることもある。このような
擾乱は、一般に「プロセス雑音」または「システム雑
音」と称する。例としては、自動操縦装置に対する気圧
の急変がある。天候(およびその一要素である気圧)は
測定することも可能であるが、非常に複雑で余りにも多
くの変数の影響を受けるので、単に現実的にするため
に、気圧は「システム雑音」成分を持つと見なすことに
する。
システムではシステムの状態の測定に不確定性が必然的
に伴うという事実から来るものである。これらの不確定
性は、一般に「測定雑音」と称する。また、動作環境に
よって引き起こされるシステムの擾乱も考えられる。こ
れらの擾乱は、そのシステムを記述するモデルの単なる
不正確さや不完全性から起こることもある。このような
擾乱は、一般に「プロセス雑音」または「システム雑
音」と称する。例としては、自動操縦装置に対する気圧
の急変がある。天候(およびその一要素である気圧)は
測定することも可能であるが、非常に複雑で余りにも多
くの変数の影響を受けるので、単に現実的にするため
に、気圧は「システム雑音」成分を持つと見なすことに
する。
【0005】確率システムの観測を扱う場合、確率的観
測系としてカルマン・フィルタが用いられた(1960
年のA.S.M.E.会報「基礎工学ジャーナル(Journal of B
asicEngineering)」第82巻(p.35-p.45)のアール・
イー・カルマン(Kalman)による「線形濾過と予測の問題
に対する新方式(A New Approach to Linear Filtering
and Prediction Problems)」)。カルマン・フィルタ
は、その名が示すとおり、観測されたパラメータの確率
成分を濾し取って、それらのパラメータの予測値を出力
するものである。
測系としてカルマン・フィルタが用いられた(1960
年のA.S.M.E.会報「基礎工学ジャーナル(Journal of B
asicEngineering)」第82巻(p.35-p.45)のアール・
イー・カルマン(Kalman)による「線形濾過と予測の問題
に対する新方式(A New Approach to Linear Filtering
and Prediction Problems)」)。カルマン・フィルタ
は、その名が示すとおり、観測されたパラメータの確率
成分を濾し取って、それらのパラメータの予測値を出力
するものである。
【0006】確率制御問題を扱う(このような問題を分
析する場合)最も一般的な方法は、制御の対象となるシ
ステムまたはプロセスを表すために線形モデルを使用
し、2次評価基準を使用し、さらに観測雑音が正規分布
(ガウス分布)をなすものと仮定することである。2次
評価基準によって、実際の状態と所望の状態との差の2
乗の和を最小とする。このようにしてモデル化した制御
問題は、「最小燃料」問題と呼ばれる。この名称は、最
小のエネルギー消費量で終末状態(従って、所望の出
力)に到達する制御計画は常に2次評価基準の関数(費
用関数)であるという事実に由来する。また、このよう
な問題は、QP(2次計画法)問題としても特徴付けら
れる。
析する場合)最も一般的な方法は、制御の対象となるシ
ステムまたはプロセスを表すために線形モデルを使用
し、2次評価基準を使用し、さらに観測雑音が正規分布
(ガウス分布)をなすものと仮定することである。2次
評価基準によって、実際の状態と所望の状態との差の2
乗の和を最小とする。このようにしてモデル化した制御
問題は、「最小燃料」問題と呼ばれる。この名称は、最
小のエネルギー消費量で終末状態(従って、所望の出
力)に到達する制御計画は常に2次評価基準の関数(費
用関数)であるという事実に由来する。また、このよう
な問題は、QP(2次計画法)問題としても特徴付けら
れる。
【0007】確率過程の制御問題を扱う場合、「最小燃
料」のモデル化が最も一般的に用いられる方法であるの
は、1つには、「最小燃料」問題に対する最適な制御計
画が、観測系反応的制御系の内部で動的計画法(DP)
によって得られるからであろう。DP法は、例えば、1
984年プレンティス=ホール(Prentice-Hall)社発行
のアンストァ(Anstor)およびウィッテンマーク(Witte
nmark)による「コンピュータ制御システム(Computer-
Controlled Systems)」に説明されている。DPによる
最適化はカルマン・フィルタの最適化と同様の算定構造
を有する(例えば、前記のアンストァ他の参考文献のp.
274-p.275を参照)ことを示すことができるので、制御
中のプロセスまたはシステムのコントローラとしてカル
マン・フィルタを使用できることになる。換言すれば、
カルマン・フィルタを観測系用に設計・制作すれば、D
Pによって解決し得る問題、つまり費用関数が2次であ
る問題を扱う場合、その観測系反応的制御系に同様のハ
ードウェアまたはソフトウェアを使用することができ
る。これによって、全体的な制御システムをハードウェ
アまたはソフトウェア(即ち、蓄積プログラム制御プロ
セッサのソフトウェア)の何れで実現する場合でも、そ
の開発費用はかなり減少する。
料」のモデル化が最も一般的に用いられる方法であるの
は、1つには、「最小燃料」問題に対する最適な制御計
画が、観測系反応的制御系の内部で動的計画法(DP)
によって得られるからであろう。DP法は、例えば、1
984年プレンティス=ホール(Prentice-Hall)社発行
のアンストァ(Anstor)およびウィッテンマーク(Witte
nmark)による「コンピュータ制御システム(Computer-
Controlled Systems)」に説明されている。DPによる
最適化はカルマン・フィルタの最適化と同様の算定構造
を有する(例えば、前記のアンストァ他の参考文献のp.
274-p.275を参照)ことを示すことができるので、制御
中のプロセスまたはシステムのコントローラとしてカル
マン・フィルタを使用できることになる。換言すれば、
カルマン・フィルタを観測系用に設計・制作すれば、D
Pによって解決し得る問題、つまり費用関数が2次であ
る問題を扱う場合、その観測系反応的制御系に同様のハ
ードウェアまたはソフトウェアを使用することができ
る。これによって、全体的な制御システムをハードウェ
アまたはソフトウェア(即ち、蓄積プログラム制御プロ
セッサのソフトウェア)の何れで実現する場合でも、そ
の開発費用はかなり減少する。
【0008】図1は、確率システムの従来の技術の制御
構造を示す。同図には、制御中のシステムおよび制御装
置の表示を含む。「制御中のシステム」という象徴的な
表現は、雑音のないシステム10、プロセス雑音11、
および観測雑音12を包括する。プロセス雑音11は、
システム10に与えられ、観測雑音は、加算器14によ
ってシステム10の出力に加えられ、その結果がシステ
ムの観測可能な出力13を形成する。
構造を示す。同図には、制御中のシステムおよび制御装
置の表示を含む。「制御中のシステム」という象徴的な
表現は、雑音のないシステム10、プロセス雑音11、
および観測雑音12を包括する。プロセス雑音11は、
システム10に与えられ、観測雑音は、加算器14によ
ってシステム10の出力に加えられ、その結果がシステ
ムの観測可能な出力13を形成する。
【0009】観測系20は、出力13に応答して、シス
テム10の状態の推定値を展開する。これが、カルマン
・フィルタである。カルマン・フィルタによって展開さ
れた推定値は、システム10について前に選択された評
価基準を改善するための制御信号を展開する観測系反応
的制御系30に与えられる。最終的に、それらの制御信
号をシステム10に与えて、それが前記評価基準を改善
する方向に向かうようにする。
テム10の状態の推定値を展開する。これが、カルマン
・フィルタである。カルマン・フィルタによって展開さ
れた推定値は、システム10について前に選択された評
価基準を改善するための制御信号を展開する観測系反応
的制御系30に与えられる。最終的に、それらの制御信
号をシステム10に与えて、それが前記評価基準を改善
する方向に向かうようにする。
【0010】システム10は、単純なサーボ・モータ・
システムでもよいが、さらに複雑なシステムでもよい。
また、システム10は、そのエネルギーの使用の最適化
を望む化学プラント、燃料消費の最適化を望む航空会
社、伝送容量を効率的に利用することを望む通信企業な
どの場合もある。
システムでもよいが、さらに複雑なシステムでもよい。
また、システム10は、そのエネルギーの使用の最適化
を望む化学プラント、燃料消費の最適化を望む航空会
社、伝送容量を効率的に利用することを望む通信企業な
どの場合もある。
【0011】次に、従来技術のカルマン・フィルタの処
理を数学的に詳細に示す。数学的に扱うことにより、制
御過程のより正確な記述が可能となり、そうすること
で、従来技術の装置の数学的根拠の基本的な理解が得ら
れ、図1の詳細な説明に役立ち、さらに本発明の詳細な
説明の補足となる。
理を数学的に詳細に示す。数学的に扱うことにより、制
御過程のより正確な記述が可能となり、そうすること
で、従来技術の装置の数学的根拠の基本的な理解が得ら
れ、図1の詳細な説明に役立ち、さらに本発明の詳細な
説明の補足となる。
【0012】●カルマン・フィルタ
一般にm個の入力とn個の出力とを有し、多変数確率
的、離散的で、かつ時間的に不変なシステムは、
的、離散的で、かつ時間的に不変なシステムは、
【数1】
【数2】
によって表すことができる。ここで、z
(t)は、n次元の状態ベクトルF
は、n×n状態推移行列G
は、n×m入力行列H
は、k×n出力行列u
(t)は、m次元の制御入力ベクトルv
(t)は、n次元のシステム雑音y
(t)は、k次元の測定出力e
(t)は、k次元の測定雑音である。
雑音成分v(t)およびe(t)は、0の期待値
(E[v(t)]=0かつE[e(t)]=0)な
らびに共分散行列Q(次数n×n)およびR(次数
k×k)をそれぞれ有する独立したガウス分布であると
仮定するほうが、多くの用途に対し理にかなう。
(E[v(t)]=0かつE[e(t)]=0)な
らびに共分散行列Q(次数n×n)およびR(次数
k×k)をそれぞれ有する独立したガウス分布であると
仮定するほうが、多くの用途に対し理にかなう。
【0013】前記の式において、ベクトルz(t+
1)は、n個の成分を有し、その各成分は、システム1
0の観測可能な属性の1つを表し、温度、圧力、重さ、
加速度などである。それらの成分を1つのグループとし
て見れば、ベクトルz(t+1)によって、時刻t+
1におけるシステム10の状態が表される。ベクトル
u(t)およびy(t)は、それぞれシステムの入
力および出力である。つまり、ベクトルu(t)は、
時刻tにおいてシステム10に印加される入力信号の集
合であり、ベクトルy(t)は、時刻tに線13上の
現れる出力信号の集合である。行列Fには、システム
の入出力関係が記述される。入力および雑音がない場
合、行列Fには、システムの時刻tにおける状態、即
ちz(t)から時刻t+1の状態、即ちz(t+1)
への変動が記述される。行列Gには、z(t)のい
ろいろな成分に対する入力信号の影響が記述され、行列
Hには、システムの観測可能なパラメータと実際の出
力y(t)との関係が記述される。
1)は、n個の成分を有し、その各成分は、システム1
0の観測可能な属性の1つを表し、温度、圧力、重さ、
加速度などである。それらの成分を1つのグループとし
て見れば、ベクトルz(t+1)によって、時刻t+
1におけるシステム10の状態が表される。ベクトル
u(t)およびy(t)は、それぞれシステムの入
力および出力である。つまり、ベクトルu(t)は、
時刻tにおいてシステム10に印加される入力信号の集
合であり、ベクトルy(t)は、時刻tに線13上の
現れる出力信号の集合である。行列Fには、システム
の入出力関係が記述される。入力および雑音がない場
合、行列Fには、システムの時刻tにおける状態、即
ちz(t)から時刻t+1の状態、即ちz(t+1)
への変動が記述される。行列Gには、z(t)のい
ろいろな成分に対する入力信号の影響が記述され、行列
Hには、システムの観測可能なパラメータと実際の出
力y(t)との関係が記述される。
【0014】前記の表現を用いてカルマン・フィルタ2
0を使用することによって、雑音成分11、12が存在
するシステム10の状態を評価することができる。カル
マン・フィルタが、システム10の状態z(t)の最
小分散推定値を与える(即ち、ノルム‖z(t)−
z^(t)‖2を最小にする)ことを示すことができ
る。
0を使用することによって、雑音成分11、12が存在
するシステム10の状態を評価することができる。カル
マン・フィルタが、システム10の状態z(t)の最
小分散推定値を与える(即ち、ノルム‖z(t)−
z^(t)‖2を最小にする)ことを示すことができ
る。
【0015】既知のカルマン・フィルタの処理を要約し
ながら、次の式において、時刻t1におけるzの推定
値を示すために、時刻t2まで構成され時刻t2を含む測
定値を利用することによって得られるz^(t1/
t2)を使用する。
ながら、次の式において、時刻t1におけるzの推定
値を示すために、時刻t2まで構成され時刻t2を含む測
定値を利用することによって得られるz^(t1/
t2)を使用する。
【0016】カルマン・フィルタについてフィルタ処理
を開始するために、時刻t=0において、行列F、
H、G、R、Qの値をフィルタに設定し、状態
の推定値z^(0/0)を理にかなった値(または
0)に設定し、P(0/0)をmIに設定する。こ
こで、mは正の大きな実数であり、Iは単位行列であ
る。以降、カルマン・フィルタ過程は、次のように進行
する。 1.時刻t−1における前の推定値に基づいて時刻tに
おける状態を予測する。
を開始するために、時刻t=0において、行列F、
H、G、R、Qの値をフィルタに設定し、状態
の推定値z^(0/0)を理にかなった値(または
0)に設定し、P(0/0)をmIに設定する。こ
こで、mは正の大きな実数であり、Iは単位行列であ
る。以降、カルマン・フィルタ過程は、次のように進行
する。 1.時刻t−1における前の推定値に基づいて時刻tに
おける状態を予測する。
【数3】
2.次式を評価することにより、その予測した状態の共
分散を推定する。
分散を推定する。
【数4】
3.次のカルマン利得行列を計算する。
【数5】
4.観測される出力y(t)を測定する。
5.予測および観測した出力によって、濾過された状態
を推定する。
を推定する。
【数6】
6.濾過された状態の共分散を推定する。
【数7】
7.次の分岐を実行することにより、反復を継続するか
どうかを判断する。
どうかを判断する。
【数8】
前記の処理によって状態が一度、推定されると、動的計
画法の技法によって最小エネルギー問題が解決される。
画法の技法によって最小エネルギー問題が解決される。
【0017】前記のカルマン式濾過手順は、ブロック2
0の内部に示した回路を有する図1のシステムにおいて
実行することができる。ブロック20の内部では、観測
可能な出力y(t)が、メモリ(M)21に格納さ
れ、入力u(t)が、メモリ(M)22に格納され
る。メモリ21、22は、y(t)およびu(t)
の最新の標本を選択された数だけ格納する。格納される
標本の数は、そのフィルタによって展開される推定値の
根拠となる「履歴」の期間を決定することにより、カル
マン・フィルタに影響を及ぼす。この期間は、「制御範
囲(control horizon)」とも呼ばれる。これらの標本
は、試験と制御のブロック23(制御経路は図1に図示
せず)の制御下でアクセスされ、プロセッサ(PRO
C)24、25に与えられる。つまり、回収された入力
標本は、プロセッサ24に与えられ、回収され観測され
た出力標本は、プロセッサ25に与えられる。先に示し
たように、カルマン・フィルタ20では、システム10
を特徴付ける情報が「オフ・ライン」で受信され、その
情報は、(そこに格納される情報に対応して)F、
H、GQ、Rと記されたメモリ・ブロックに格
納される。プロセッサ24は、式(2a)を表す信号を
展開し、プロセッサ26は、式(2b)を表す信号を展
開し、プロセッサ27は、式(2c)を表す信号を展開
し、プロセッサ25は、式(2d)を表す信号を展開
し、プロセッサ28は、式(2e)を表す信号を展開す
る。レジスタ(REG)31および32は、信号P(t
−1/t−1)、信号z^(t/t−1)を生成する
ように1標本分の遅延を与え、それらの出力をプロセッ
サ24、26にそれぞれ渡す。ブロック23の制御の下
で、レジスタ(REG)31、32の信号は、メモリ2
1、22(および中間のすべての処理)の信号と結合し
て、システム10の状態の推定値を形成する。制御ブロ
ック23が、繰り返しを止めることができると式(2
f)によって判断すると、ゲート(GATE)33は、
システム10の推定値出力がカルマン・フィルタ20を
出るのを許す。次に、フィルタ20の推定されたシステ
ム状態が制御系30に印加され、システム10の動作に
影響を与える制御システムが展開される。
0の内部に示した回路を有する図1のシステムにおいて
実行することができる。ブロック20の内部では、観測
可能な出力y(t)が、メモリ(M)21に格納さ
れ、入力u(t)が、メモリ(M)22に格納され
る。メモリ21、22は、y(t)およびu(t)
の最新の標本を選択された数だけ格納する。格納される
標本の数は、そのフィルタによって展開される推定値の
根拠となる「履歴」の期間を決定することにより、カル
マン・フィルタに影響を及ぼす。この期間は、「制御範
囲(control horizon)」とも呼ばれる。これらの標本
は、試験と制御のブロック23(制御経路は図1に図示
せず)の制御下でアクセスされ、プロセッサ(PRO
C)24、25に与えられる。つまり、回収された入力
標本は、プロセッサ24に与えられ、回収され観測され
た出力標本は、プロセッサ25に与えられる。先に示し
たように、カルマン・フィルタ20では、システム10
を特徴付ける情報が「オフ・ライン」で受信され、その
情報は、(そこに格納される情報に対応して)F、
H、GQ、Rと記されたメモリ・ブロックに格
納される。プロセッサ24は、式(2a)を表す信号を
展開し、プロセッサ26は、式(2b)を表す信号を展
開し、プロセッサ27は、式(2c)を表す信号を展開
し、プロセッサ25は、式(2d)を表す信号を展開
し、プロセッサ28は、式(2e)を表す信号を展開す
る。レジスタ(REG)31および32は、信号P(t
−1/t−1)、信号z^(t/t−1)を生成する
ように1標本分の遅延を与え、それらの出力をプロセッ
サ24、26にそれぞれ渡す。ブロック23の制御の下
で、レジスタ(REG)31、32の信号は、メモリ2
1、22(および中間のすべての処理)の信号と結合し
て、システム10の状態の推定値を形成する。制御ブロ
ック23が、繰り返しを止めることができると式(2
f)によって判断すると、ゲート(GATE)33は、
システム10の推定値出力がカルマン・フィルタ20を
出るのを許す。次に、フィルタ20の推定されたシステ
ム状態が制御系30に印加され、システム10の動作に
影響を与える制御システムが展開される。
【0018】図1のカルマン・フィルタは種々の方法で
実現することができる。2つの主な方法としては、専用
のハードウェアによるものと、プログラム制御の汎用プ
ロセッサ・ハードウェアによるものがある。汎用プロセ
ッサが安価で高速であることから、最近では、後者の方
法が経済的になった。
実現することができる。2つの主な方法としては、専用
のハードウェアによるものと、プログラム制御の汎用プ
ロセッサ・ハードウェアによるものがある。汎用プロセ
ッサが安価で高速であることから、最近では、後者の方
法が経済的になった。
【0019】図1の大部分のプロセッサで必要とされる
計算は、実に単純である。唯一の例外は、式(2c)に
相当する信号を生成するプロセッサ27である。それに
は、逆行列の算出ルーチンが必要であるが、そのような
ルーチンは当分野では容易に利用可能である。
計算は、実に単純である。唯一の例外は、式(2c)に
相当する信号を生成するプロセッサ27である。それに
は、逆行列の算出ルーチンが必要であるが、そのような
ルーチンは当分野では容易に利用可能である。
【0020】●制御系30
先に指摘したように、観測系反応的制御系30は、しば
しば動的計画法によって実現される。さらに完全な説明
を当分野で得ることができるが、その動作の概要を以下
に述べる。動的計画法の技法に従ってシステム10を制
御する信号を得ることは、以下のように進められる。制
御下のシステムが駆動信号に応じて1つの状態から他の
状態に移ることは既知であるから、各状態は、その駆動
信号の値によって、多数の他の状態に通じることにな
る。そこで、目的は、システムを所与の初期状態から中
間的な状態を経て目標の状態に最小の費用で移すことで
ある。
しば動的計画法によって実現される。さらに完全な説明
を当分野で得ることができるが、その動作の概要を以下
に述べる。動的計画法の技法に従ってシステム10を制
御する信号を得ることは、以下のように進められる。制
御下のシステムが駆動信号に応じて1つの状態から他の
状態に移ることは既知であるから、各状態は、その駆動
信号の値によって、多数の他の状態に通じることにな
る。そこで、目的は、システムを所与の初期状態から中
間的な状態を経て目標の状態に最小の費用で移すことで
ある。
【0021】これは、システムの初期状態以降からのす
べての状態への移行の費用を推定し、それらの費用を記
録することによって達成される。これには、システムが
直接到達できる状態だけでなく、他の状態を介さなけれ
ば到達できない状態も含まれる。以降は、目標の状態に
達する最適経路は、逆方向に進むことによって決定す
る。即ち、手順は、目標の状態から開始して、最低の
(格納されている)費用を有する状態へと導くリンクを
選択することである。その選択された状態から、さらに
逆向きに進み、システムの所与の初期状態へと繰り返し
遡って経路が識別される。前記の処理に対する数式が計
算されると、制御信号に対する閉形式表現は、カルマン
・フィルタのそれと同一の構造を持つ。
べての状態への移行の費用を推定し、それらの費用を記
録することによって達成される。これには、システムが
直接到達できる状態だけでなく、他の状態を介さなけれ
ば到達できない状態も含まれる。以降は、目標の状態に
達する最適経路は、逆方向に進むことによって決定す
る。即ち、手順は、目標の状態から開始して、最低の
(格納されている)費用を有する状態へと導くリンクを
選択することである。その選択された状態から、さらに
逆向きに進み、システムの所与の初期状態へと繰り返し
遡って経路が識別される。前記の処理に対する数式が計
算されると、制御信号に対する閉形式表現は、カルマン
・フィルタのそれと同一の構造を持つ。
【0022】●カルマーカー(Karmarkar)アルゴリズ
ム 近年、雑音のない制御システムに関連して、線形制約条
件を有するシステムにおける制御問題の解決に大きな改
善が見られた。1988年5月10日発行の米国特許第
4,744,028号にカルマーカーによって開示された「内
点」の発明によって、当分野の研究に拍車がかかった。
具体的には、これらのLP(線形計画法)問題は、cTx の最小化Ax =bへの従属 かつx≧0 によって定義される。但し、Aは、システムの制約係
数であり、xは、制御下のシステムの動作を最適化す
るように変更されるシステムのパラメータを表し、b
は、それらのパラメータの値の制限を表し、cは、費
用係数を表す。カルマーカーの考察(1988年5月1
0日発行のヴァンダベイ(Vanderbei)による米国特許
第4,744,026号)にならうアフィン変換LPアルゴリズ
ムは、次のように要約することができる。
ム 近年、雑音のない制御システムに関連して、線形制約条
件を有するシステムにおける制御問題の解決に大きな改
善が見られた。1988年5月10日発行の米国特許第
4,744,028号にカルマーカーによって開示された「内
点」の発明によって、当分野の研究に拍車がかかった。
具体的には、これらのLP(線形計画法)問題は、cTx の最小化Ax =bへの従属 かつx≧0 によって定義される。但し、Aは、システムの制約係
数であり、xは、制御下のシステムの動作を最適化す
るように変更されるシステムのパラメータを表し、b
は、それらのパラメータの値の制限を表し、cは、費
用係数を表す。カルマーカーの考察(1988年5月1
0日発行のヴァンダベイ(Vanderbei)による米国特許
第4,744,026号)にならうアフィン変換LPアルゴリズ
ムは、次のように要約することができる。
【0023】Ax=bなる関係は、多次元空間に
おけるポリトープ(polytope)と見ることができる。
x(k)が、アフィン変換アルゴリズムの反復kにお
けるポリトープ内部の内点(即ち、LP問題の可能解)
であるとき、Dx(k)は、x(k)の成分を含む対角
行列であり、x(k)から新たな可能点x(k+
1)へのシステムの移行を指示する変換ベクトルcp
(k)は、式(3a)によって与えられ、新たな可能点
は、式(3b)によって与えられる。
おけるポリトープ(polytope)と見ることができる。
x(k)が、アフィン変換アルゴリズムの反復kにお
けるポリトープ内部の内点(即ち、LP問題の可能解)
であるとき、Dx(k)は、x(k)の成分を含む対角
行列であり、x(k)から新たな可能点x(k+
1)へのシステムの移行を指示する変換ベクトルcp
(k)は、式(3a)によって与えられ、新たな可能点
は、式(3b)によって与えられる。
【数9】
【数10】
ベクトルeiは、i番目の単位ベクトルで、そのi番
目の成分が1である以外すべて0からなるベクトルであ
る。パラメータαは、0と0.1との間のスカラーであ
り、ベクトルr(k)は、縮小費用ベクトルと称し、
ベクトルw(k)は、双対ベクトルと称する。また、
式(3e)および式(3b)は、次のように書くことも
可能である。
目の成分が1である以外すべて0からなるベクトルであ
る。パラメータαは、0と0.1との間のスカラーであ
り、ベクトルr(k)は、縮小費用ベクトルと称し、
ベクトルw(k)は、双対ベクトルと称する。また、
式(3e)および式(3b)は、次のように書くことも
可能である。
【数11】
新たな可能点が評価されるアフィン変換アルゴリズムの
各反復ごとに、さらに反復が必要かどうかを判断するた
めに検査が行われる。必要であれば、新たに展開された
x(k+1)が新たなx(k)となり、処理が繰り
返される。さらに反復する必要がないと判断された場
合、x(k)の値が、制御されているシステムに送ら
れる。最終的に、反復が終了すると、制御下のシステム
のパラメータが、受信されたx(k)によって示唆さ
れる値に設定され、これによってシステムの動作結果が
最適化される。反復を終了するための検査条件は、次式
のとおりである。
各反復ごとに、さらに反復が必要かどうかを判断するた
めに検査が行われる。必要であれば、新たに展開された
x(k+1)が新たなx(k)となり、処理が繰り
返される。さらに反復する必要がないと判断された場
合、x(k)の値が、制御されているシステムに送ら
れる。最終的に、反復が終了すると、制御下のシステム
のパラメータが、受信されたx(k)によって示唆さ
れる値に設定され、これによってシステムの動作結果が
最適化される。反復を終了するための検査条件は、次式
のとおりである。
【数12】
【0024】図1のカルマン・フィルタの内部で実行さ
れる反復処理のように、前記のアフィン変換アルゴリズ
ムは、式(3)および式(4)に相当する信号を生成す
る処理を繰り返し行うモジュールで実現することができ
る。さらに詳細には、アフィン変換プロセッサは、
A、cおよびbの情報を格納するモジュール(図
1においてFの情報を受信するメモリ・モジュールに
幾分類似している)と所与の情報に基づいて動作する処
理モジュールによって実現されることもある。処理モジ
ュールの中には、(式3dの)w(k)の値を評価す
るモジュール、生成されたw(k)に応じてγ(式4
a)を評価するモジュール、生成されたw(k)に応
じてx(k+1)の値を生成するモジュール、図1の
回路23のような検査モジュール、およびゲート(GA
TE)33と同様のゲートが含まれる。前記の説明には
幾分不正確な点がある。勿論、それは、w(k)の評
価には逆行列(AD2 x(k)AT)-1の生成が伴うの
で、w(k)の評価は全然単純ではないという点であ
る。しかし、そのようなモジュールも入手可能である。
例えば、1987年9月4日出願の「前提条件付き共役
傾斜システムの最適化(Preconditioned Conjugate Gra
dient System Optimization)」と題する米国特許出願
第07/094631号に説明がある。
れる反復処理のように、前記のアフィン変換アルゴリズ
ムは、式(3)および式(4)に相当する信号を生成す
る処理を繰り返し行うモジュールで実現することができ
る。さらに詳細には、アフィン変換プロセッサは、
A、cおよびbの情報を格納するモジュール(図
1においてFの情報を受信するメモリ・モジュールに
幾分類似している)と所与の情報に基づいて動作する処
理モジュールによって実現されることもある。処理モジ
ュールの中には、(式3dの)w(k)の値を評価す
るモジュール、生成されたw(k)に応じてγ(式4
a)を評価するモジュール、生成されたw(k)に応
じてx(k+1)の値を生成するモジュール、図1の
回路23のような検査モジュール、およびゲート(GA
TE)33と同様のゲートが含まれる。前記の説明には
幾分不正確な点がある。勿論、それは、w(k)の評
価には逆行列(AD2 x(k)AT)-1の生成が伴うの
で、w(k)の評価は全然単純ではないという点であ
る。しかし、そのようなモジュールも入手可能である。
例えば、1987年9月4日出願の「前提条件付き共役
傾斜システムの最適化(Preconditioned Conjugate Gra
dient System Optimization)」と題する米国特許出願
第07/094631号に説明がある。
【0025】
【発明が解決しようとする課題】前記のように、観測系
の課題だけでなく制御系の課題を解決するためにも「最
小燃料」問題によってカルマン・フィルタの技法を使用
できるようになるので、確率システムにおける制御課題
の最も適切な公式化は、「最小燃料」問題としてであ
る。この方法も大規模なシステムに適用するには依然と
して困難である。問題の規模が増大すると、可能な状態
の数が急速に増加する。結果的にすべての費用を格納す
ることが必要となるため、計算装置が過負荷となる。
の課題だけでなく制御系の課題を解決するためにも「最
小燃料」問題によってカルマン・フィルタの技法を使用
できるようになるので、確率システムにおける制御課題
の最も適切な公式化は、「最小燃料」問題としてであ
る。この方法も大規模なシステムに適用するには依然と
して困難である。問題の規模が増大すると、可能な状態
の数が急速に増加する。結果的にすべての費用を格納す
ることが必要となるため、計算装置が過負荷となる。
【0026】もう1つの難点は、2次評価基準以外の評
価基準を選択すると、通常のカルマン・フィルタの観測
系と制御系との間の平行関係が失われることである。こ
れは、重大な難点である。なぜなら、産業分野には、2
次費用関数でモデル化するには不都合なだけでなく、そ
うすべきでない制御問題が数多くあるからである。例え
ば、「最小時間」問題が、そのような制御問題の一種類
を形成している。目的が燃料、即ちエネルギーの維持に
ある「最小エネルギー」問題と異なり、「最小時間」問
題の目的は、制御下のシステムの所望の終末状態に可能
な最小時間で到達することである。「最小時間」問題の
典型的な例は、軍用ミサイルの飛行制御である。概し
て、ミサイルにとっては燃料を維持することより最小可
能時間で標的に達することの方が重要である。
価基準を選択すると、通常のカルマン・フィルタの観測
系と制御系との間の平行関係が失われることである。こ
れは、重大な難点である。なぜなら、産業分野には、2
次費用関数でモデル化するには不都合なだけでなく、そ
うすべきでない制御問題が数多くあるからである。例え
ば、「最小時間」問題が、そのような制御問題の一種類
を形成している。目的が燃料、即ちエネルギーの維持に
ある「最小エネルギー」問題と異なり、「最小時間」問
題の目的は、制御下のシステムの所望の終末状態に可能
な最小時間で到達することである。「最小時間」問題の
典型的な例は、軍用ミサイルの飛行制御である。概し
て、ミサイルにとっては燃料を維持することより最小可
能時間で標的に達することの方が重要である。
【0027】線形計画方におけるこれらの難点と前記の
産物とに照らした場合、カルマン・フィルタを制御系と
して使用できるということだけで、別の確率LP問題を
強いてQP形式に当てはめることは殆ど無意味である。
そのようにすることは、計算に煩わされ、最善には及ば
ない結果を得ることになる。むしろ、制御系の設計に対
し、LPに固有のより単純な性質を直接利用する計算上
効率的な方法を発見する方が適切であると思われる。特
に、カルマン・フィルタの利用におけるカルマーカー・
アルゴリズムによって提示される洞察結果を利用し、ま
たその逆を行うことが適切であろう。
産物とに照らした場合、カルマン・フィルタを制御系と
して使用できるということだけで、別の確率LP問題を
強いてQP形式に当てはめることは殆ど無意味である。
そのようにすることは、計算に煩わされ、最善には及ば
ない結果を得ることになる。むしろ、制御系の設計に対
し、LPに固有のより単純な性質を直接利用する計算上
効率的な方法を発見する方が適切であると思われる。特
に、カルマン・フィルタの利用におけるカルマーカー・
アルゴリズムによって提示される洞察結果を利用し、ま
たその逆を行うことが適切であろう。
【0028】
【課題を解決するための手段】本発明は、確率システム
のために観測系の機能および最小時間制御系の機能を扱
うことができる制御システムを開発することによって、
1989年5月10日発行の米国特許第4,744,028号に
説明されているようなカルマーカーの方法とカルマン・
フィルタとの間の概念的かつ計算的な類似性を利用する
ものである。
のために観測系の機能および最小時間制御系の機能を扱
うことができる制御システムを開発することによって、
1989年5月10日発行の米国特許第4,744,028号に
説明されているようなカルマーカーの方法とカルマン・
フィルタとの間の概念的かつ計算的な類似性を利用する
ものである。
【0029】このシステムは、カルマン・フィルタの計
算構造を有する要素を含むが、この要素の各入力は、所
望の結果を残りの計算要素に分配するように質的に制御
される。確率LP制御用の制御系として、本システム
は、内点アフィン変換アルゴリズムに従って反復計算を
行う。カルマン・フィルタ構造の要素においては、処理
目的が次のような仮想的なシステムの状態を評価するこ
とであるかのように要素に情報を印加することによっ
て、アフィン変換アルゴリズムの「双対ベクトル」が算
出される。その仮想的なシステムでは、観測可能な出力
がDx(k)cであり、その入力がOであり、システム
雑音の共分散行列が、制御下の確率LPシステムのシス
テム雑音に対応し、測定雑音の共分散行列が、制御下の
確率システムの測定雑音に対応し、推移行列がIであ
り、この仮想的システムの測定可能なパラメータと観測
可能な出力との間の関係を記述する行列が、ATD
x(k)である。
算構造を有する要素を含むが、この要素の各入力は、所
望の結果を残りの計算要素に分配するように質的に制御
される。確率LP制御用の制御系として、本システム
は、内点アフィン変換アルゴリズムに従って反復計算を
行う。カルマン・フィルタ構造の要素においては、処理
目的が次のような仮想的なシステムの状態を評価するこ
とであるかのように要素に情報を印加することによっ
て、アフィン変換アルゴリズムの「双対ベクトル」が算
出される。その仮想的なシステムでは、観測可能な出力
がDx(k)cであり、その入力がOであり、システム
雑音の共分散行列が、制御下の確率LPシステムのシス
テム雑音に対応し、測定雑音の共分散行列が、制御下の
確率システムの測定雑音に対応し、推移行列がIであ
り、この仮想的システムの測定可能なパラメータと観測
可能な出力との間の関係を記述する行列が、ATD
x(k)である。
【0030】
【実施例】カルマン・フィルタが状態の推定値を展開す
る過程を注意深く観察すると、それとアフィン変換アル
ゴリズムとの間に興味深い類似性が数多く見られる。具
体的には、アフィン変換アルゴリズムでは、式(3d)
のw(k)の値が最小2乗解であることを示すことが
できる。従って、双対ベクトルw(k)の展開値が、
‖(ADx(k))Tw(k)−Dx(k)c‖2を最
小にする値である。同様に、z(t)が真の状態ベク
トルで、z^(t)が濾過された状態ベクトルである
場合、カルマン・フィルタ構造z^(t)における状
態ベクトル推定値が、状態ベクトルz(t)の最小2
乗推定値であることを示すことができる。つまり、z
^(t)の展開値が、‖z(t)−z^(t)‖2
を最小にするものである。
る過程を注意深く観察すると、それとアフィン変換アル
ゴリズムとの間に興味深い類似性が数多く見られる。具
体的には、アフィン変換アルゴリズムでは、式(3d)
のw(k)の値が最小2乗解であることを示すことが
できる。従って、双対ベクトルw(k)の展開値が、
‖(ADx(k))Tw(k)−Dx(k)c‖2を最
小にする値である。同様に、z(t)が真の状態ベク
トルで、z^(t)が濾過された状態ベクトルである
場合、カルマン・フィルタ構造z^(t)における状
態ベクトル推定値が、状態ベクトルz(t)の最小2
乗推定値であることを示すことができる。つまり、z
^(t)の展開値が、‖z(t)−z^(t)‖2
を最小にするものである。
【0031】疑問:双対ベクトルw(k)が、確か
に、ある仮想的なシステムの状態ベクトルの推定値であ
ると仮定した場合、アフィン変換の繰り返しの度にw
(k)をカルマン・フィルタによって評価することは可
能か?まず気付くことは、アフィン変換アルゴリズムの
各繰り返しにおいて、w(k)の値は、未知ではある
が、固有で、一定であることである。これをカルマン・
フィルタ環境に適用すれば、w(k)が仮想的なシス
テムの状態(z)に対応するならば、それは静的な状
態でなければならないことになる。換言すれば、その状
態推移行列FがIに等しく、かつ入力(u)が0
である仮想的システムに作用するカルマン・フィルタか
らは、カルマン・フィルタのすべての反復時tにおい
て、式(2a)の仮想的システムの状態ベクトルw
(t)が一定である、即ち w(t)=w(t−1) (5a) であるようなw(k)を得ることができる。また、式
(4)は、次のように書くことも可能である。
に、ある仮想的なシステムの状態ベクトルの推定値であ
ると仮定した場合、アフィン変換の繰り返しの度にw
(k)をカルマン・フィルタによって評価することは可
能か?まず気付くことは、アフィン変換アルゴリズムの
各繰り返しにおいて、w(k)の値は、未知ではある
が、固有で、一定であることである。これをカルマン・
フィルタ環境に適用すれば、w(k)が仮想的なシス
テムの状態(z)に対応するならば、それは静的な状
態でなければならないことになる。換言すれば、その状
態推移行列FがIに等しく、かつ入力(u)が0
である仮想的システムに作用するカルマン・フィルタか
らは、カルマン・フィルタのすべての反復時tにおい
て、式(2a)の仮想的システムの状態ベクトルw
(t)が一定である、即ち w(t)=w(t−1) (5a) であるようなw(k)を得ることができる。また、式
(4)は、次のように書くことも可能である。
【数13】
この形式において、次のような変数の置換を行った場
合、式(5b)は、式(1b)に相当する。
合、式(5b)は、式(1b)に相当する。
【数14】
これらの置換を適切に行えば、2つの技法の間の概念的
かつ計算的な種々の平行関係を明らかにすることができ
る。 ●動作環境 カルマン・フィルタ(カルマン・システム)は、確率的
環境で作用するが、アフィン変換アルゴリズム(アフィ
ン・システム)は、本質的に決定的な枠組みの中で作用
する。 ●幾何学的解釈 アフィン・システムは、式(5b)の度に、加重費用ベ
クトル(目的関数の加重勾配Dx(k)c)を加重制約
集合ADの零空間の上に投影する。カルマン・シス
テムは、式(1b)の度に、状態ベクトルの全集合に及
ぶ超平面の上に測定ベクトルy(t)を投影する。図
2に、この対応の図式的な表現を掲げる。 ●測定(観測) カルマン・システムは、それが作用する確率システムの
状態を、システムの雑音を含む出力y(t)の測定に
よって評価する。アフィン・システムは、費用関数の加
重勾配Dx(k)cから情報を引き出す。cは一定な
ので、唯一の変数は、Dx(k)、またはx(k)自体
であり、これには本質的にすべての情報が含まれてい
る。 ●最適推定値 カルマン・システムは、観測値から、最小分散的意味に
おいてシステムの状態z(t)を算出する。アフィン
・システムも、(現在の可能な内点xである)観測値
から、最小2乗的意味において双対ベクトルw(k)
を算出する。 ●情報源 カルマン・システムおよびアフィン・システムは、共に
予測・修正機構として考えることができる。つまり、こ
れらのシステムは、ある点で開始し、現在利用できる情
報から次の点を予測することにより、最適状態に向かっ
て段階的に推移する。カルマン・システムに関する限
り、状態の次の推定値は、次式(式2d参照)のように
定義される「残差」に基づく。 w´(t)=y(t)−Hz^(t) (7) アフィン・システムについては、推移の次の方向は、
「縮小費用ベクトル」に基づくが、これは、変換された
空間において次のように定義される。
かつ計算的な種々の平行関係を明らかにすることができ
る。 ●動作環境 カルマン・フィルタ(カルマン・システム)は、確率的
環境で作用するが、アフィン変換アルゴリズム(アフィ
ン・システム)は、本質的に決定的な枠組みの中で作用
する。 ●幾何学的解釈 アフィン・システムは、式(5b)の度に、加重費用ベ
クトル(目的関数の加重勾配Dx(k)c)を加重制約
集合ADの零空間の上に投影する。カルマン・シス
テムは、式(1b)の度に、状態ベクトルの全集合に及
ぶ超平面の上に測定ベクトルy(t)を投影する。図
2に、この対応の図式的な表現を掲げる。 ●測定(観測) カルマン・システムは、それが作用する確率システムの
状態を、システムの雑音を含む出力y(t)の測定に
よって評価する。アフィン・システムは、費用関数の加
重勾配Dx(k)cから情報を引き出す。cは一定な
ので、唯一の変数は、Dx(k)、またはx(k)自体
であり、これには本質的にすべての情報が含まれてい
る。 ●最適推定値 カルマン・システムは、観測値から、最小分散的意味に
おいてシステムの状態z(t)を算出する。アフィン
・システムも、(現在の可能な内点xである)観測値
から、最小2乗的意味において双対ベクトルw(k)
を算出する。 ●情報源 カルマン・システムおよびアフィン・システムは、共に
予測・修正機構として考えることができる。つまり、こ
れらのシステムは、ある点で開始し、現在利用できる情
報から次の点を予測することにより、最適状態に向かっ
て段階的に推移する。カルマン・システムに関する限
り、状態の次の推定値は、次式(式2d参照)のように
定義される「残差」に基づく。 w´(t)=y(t)−Hz^(t) (7) アフィン・システムについては、推移の次の方向は、
「縮小費用ベクトル」に基づくが、これは、変換された
空間において次のように定義される。
【数15】
●最適基準
カルマン・システムに対して、最適条件は、残差のゼロ
平均および残差ベクトルと観測ベクトルとの間の統計的
直交(統計的独立)によって与えられる。同様に、アフ
ィン・システムに対する最適条件は、ゼロに等しいか、
それ以上の縮小費用(双対可能性)および縮小費用ベク
トルと現在の内点ベクトルとの間の幾何学的直交(相補
的スラックネス)である。
平均および残差ベクトルと観測ベクトルとの間の統計的
直交(統計的独立)によって与えられる。同様に、アフ
ィン・システムに対する最適条件は、ゼロに等しいか、
それ以上の縮小費用(双対可能性)および縮小費用ベク
トルと現在の内点ベクトルとの間の幾何学的直交(相補
的スラックネス)である。
【0032】簡単に言えば、入力が適切であれば、カル
マン・フィルタによって展開される濾過された状態ベク
トルは、アフィン変換アルゴリズムの双対ベクトルに等
しい。
マン・フィルタによって展開される濾過された状態ベク
トルは、アフィン変換アルゴリズムの双対ベクトルに等
しい。
【0033】前記の発見に照らして、カルマン・フィル
タの支援によってアフィン変換LPアルゴリズム(線形
制約条件および線形費用関数)を実行することができ
る。図3は、この実施例のブロック図を表す。
タの支援によってアフィン変換LPアルゴリズム(線形
制約条件および線形費用関数)を実行することができ
る。図3は、この実施例のブロック図を表す。
【0034】図3において、その動作が最適化される予
定のシステムをブロック40で示す。図1のように、シ
ステム40は、動作中に資源を利用し、そのような資源
の利用にともなう費用によって特徴付けられる商業用ま
たは工業用のシステムの場合もある。勿論、その目的
は、システム40に特有の費用関数に従って、その費用
を削減することである。
定のシステムをブロック40で示す。図1のように、シ
ステム40は、動作中に資源を利用し、そのような資源
の利用にともなう費用によって特徴付けられる商業用ま
たは工業用のシステムの場合もある。勿論、その目的
は、システム40に特有の費用関数に従って、その費用
を削減することである。
【0035】アフィン変換アルゴリズムおよび図3に示
した構造によれば、システム40にコマンドを送る制御
系は、フィードフォワード制御系である。これは、現在
の状態に基づくシステム40の制御を可能にするフィー
ドバック経路を持っていない。勿論、カルマーカーによ
って発明された内点法は初期の可能な開始点を必要とす
るので、初期の可能な開始点として役立つようにシステ
ムの現在の動作点を制御系に供給してもよい。これによ
って、最適化用の制御信号を生成する計算が速まる可能
性がある。従って、図3の実施例は、フィードフォワー
ド的に制御される非確率的なシステムに関係付けられた
LP問題に対するアフィン変換最適化アルゴリズムを単
に実現したものである。
した構造によれば、システム40にコマンドを送る制御
系は、フィードフォワード制御系である。これは、現在
の状態に基づくシステム40の制御を可能にするフィー
ドバック経路を持っていない。勿論、カルマーカーによ
って発明された内点法は初期の可能な開始点を必要とす
るので、初期の可能な開始点として役立つようにシステ
ムの現在の動作点を制御系に供給してもよい。これによ
って、最適化用の制御信号を生成する計算が速まる可能
性がある。従って、図3の実施例は、フィードフォワー
ド的に制御される非確率的なシステムに関係付けられた
LP問題に対するアフィン変換最適化アルゴリズムを単
に実現したものである。
【0036】図3において、システム40のLPアフィ
ン変換アルゴリズム制御系は、ブロック60およびブロ
ック51〜56からなる。さらに具体的には、図3のブ
ロック60は、式(3d)に相当する双対ベクトルw
(k)を生成する。ブロック51は、w(k)、
A、Dx(k)、およびcの値を基にγの値を式(4
a)に従って計算する。プロセッサ52は、w
(k)、γ、c、A、およびDx(k)に応じて、次
の値x(k+1)を式(4b)によって生成する。ま
た、プロセッサ52は、このx(k+1)という新し
い値に対する対角行列に費用ベクトルcを乗じたもの
を生成し、次の繰り返しのために、その値をブロック6
0への入力としてレジスタ56に格納する。ブロック5
3は、w(k)、c、A、およびDx(k)の値に基
づいて式(4c)の検査を行い、ブロック60、51、
52、56を含む繰り返しを継続するかどうかを判断す
る。ブロック53において、それ以上繰り返す必要がな
いと判断した場合、ベクトルxの値がシステム40に
印加できるように、ゲートがイネーブルとなる。
ン変換アルゴリズム制御系は、ブロック60およびブロ
ック51〜56からなる。さらに具体的には、図3のブ
ロック60は、式(3d)に相当する双対ベクトルw
(k)を生成する。ブロック51は、w(k)、
A、Dx(k)、およびcの値を基にγの値を式(4
a)に従って計算する。プロセッサ52は、w
(k)、γ、c、A、およびDx(k)に応じて、次
の値x(k+1)を式(4b)によって生成する。ま
た、プロセッサ52は、このx(k+1)という新し
い値に対する対角行列に費用ベクトルcを乗じたもの
を生成し、次の繰り返しのために、その値をブロック6
0への入力としてレジスタ56に格納する。ブロック5
3は、w(k)、c、A、およびDx(k)の値に基
づいて式(4c)の検査を行い、ブロック60、51、
52、56を含む繰り返しを継続するかどうかを判断す
る。ブロック53において、それ以上繰り返す必要がな
いと判断した場合、ベクトルxの値がシステム40に
印加できるように、ゲートがイネーブルとなる。
【0037】本発明の原理によれば、ブロック60にお
いて、図1で説明したフィルタと構造が同一のカルマン
・フィルタについてw(k)なる双対ベクトルが生成
される。相違点は、カルマン・フィルタが仮想的なシス
テムの状態を評価するように作られることである。つま
り、さらに具体的には、図3のカルマン・フィルタに印
加される信号が異なる点である。詳細には、R行列を
維持するブロックへの入力は、ηIであるが、ここで
ηは、(計算の安定性を保証するために)0の近くで選
択された定数である。Q行列を維持するブロックへの
入力は、0である。H行列を維持するブロックへの
入力は、AT x(k)Dに相当する行列であり、F行
列を維持するブロックへの入力は、Iである。また、
G行列を維持するブロックへの入力が0であるか、ま
たは図1の入力信号u(t)を受け取るメモリへの入
力が0である(または前記の両者が0である)場合、図
1の観測された出力信号y(t)を受信するメモリへ
の入力は、Dx(k)cである。
いて、図1で説明したフィルタと構造が同一のカルマン
・フィルタについてw(k)なる双対ベクトルが生成
される。相違点は、カルマン・フィルタが仮想的なシス
テムの状態を評価するように作られることである。つま
り、さらに具体的には、図3のカルマン・フィルタに印
加される信号が異なる点である。詳細には、R行列を
維持するブロックへの入力は、ηIであるが、ここで
ηは、(計算の安定性を保証するために)0の近くで選
択された定数である。Q行列を維持するブロックへの
入力は、0である。H行列を維持するブロックへの
入力は、AT x(k)Dに相当する行列であり、F行
列を維持するブロックへの入力は、Iである。また、
G行列を維持するブロックへの入力が0であるか、ま
たは図1の入力信号u(t)を受け取るメモリへの入
力が0である(または前記の両者が0である)場合、図
1の観測された出力信号y(t)を受信するメモリへ
の入力は、Dx(k)cである。
【0038】カルマン・フィルタを購入し、それに先に
指定した信号を加えることも可能である。しかし、図3
の構成に関しては、「完全な」カルマン・フィルタを使
用する必要がないことに理解を要する。入力の数が少な
い(0またはI)ので、図3のブロック60のプロセッ
サの多くは、無しで済ますことができ、複雑さが軽減さ
れる。異なった見方をすれば、G=0、Q=
0、u=0、F=Iのとき、(2a)から
(2f)までの式は、かなり簡単化することができる。
指定した信号を加えることも可能である。しかし、図3
の構成に関しては、「完全な」カルマン・フィルタを使
用する必要がないことに理解を要する。入力の数が少な
い(0またはI)ので、図3のブロック60のプロセッ
サの多くは、無しで済ますことができ、複雑さが軽減さ
れる。異なった見方をすれば、G=0、Q=
0、u=0、F=Iのとき、(2a)から
(2f)までの式は、かなり簡単化することができる。
【0039】以上において、線形計画法の最適化問題を
解決するべくアフィン変換アルゴリズムを実現するため
に、入力に適切な変更をした従来のカルマン・フィルタ
の使用を説明した。費用関数が確率的な最適化問題に対
しても同様の結果が得られる。これは、1988年8月
28日に出願した特許出願第237,264号、および198
8年8月29から9月2日に日本の東京で行われた「線
形制約条件を有する凸の非線形費用関数を最適化するた
めの新たなカルマーカー式アルゴリズム」と題する第1
3回国際数学シンポジュームにおける発表において、Q
P(2次計画法)問題をアフィン変換を用いて解くアル
ゴリズムが、開示されている。このQPアルゴリズム
は、次のように要約することができる。
解決するべくアフィン変換アルゴリズムを実現するため
に、入力に適切な変更をした従来のカルマン・フィルタ
の使用を説明した。費用関数が確率的な最適化問題に対
しても同様の結果が得られる。これは、1988年8月
28日に出願した特許出願第237,264号、および198
8年8月29から9月2日に日本の東京で行われた「線
形制約条件を有する凸の非線形費用関数を最適化するた
めの新たなカルマーカー式アルゴリズム」と題する第1
3回国際数学シンポジュームにおける発表において、Q
P(2次計画法)問題をアフィン変換を用いて解くアル
ゴリズムが、開示されている。このQPアルゴリズム
は、次のように要約することができる。
【0040】「最小燃料」問題は、制約条件の集合Ax
=b
に従う1/2xTΩx−cTx
を最小にするQP問題として、述べることができる。こ
こで、x≧0で、Ωは正の定符号行列または正の半定
符号行列であり、さらにc、AおよびbはLP問
題の場合と同じである。問題がこのように記述される
と、QPアルゴリズムは、次のように進行する。 1.各繰り返しkにおいて、可能な解x(k)が既知
であれば、
こで、x≧0で、Ωは正の定符号行列または正の半定
符号行列であり、さらにc、AおよびbはLP問
題の場合と同じである。問題がこのように記述される
と、QPアルゴリズムは、次のように進行する。 1.各繰り返しkにおいて、可能な解x(k)が既知
であれば、
【数16】
を用いることによって、減少方向を算出する。ここで、T
=(Ω+Dx(k) -2) (9b)Dx(k)
はx(k)の成分を含む対角行列である。
2.α=min(α1,α2)を計算する。ここで、
【数17】
βは、0と1の間で選択された数である。
3.次の変換を行う。x
(k+1)=x(k)−αδxp
4.εを選択された小さい正の数として、
【数18】
であれば終了し、それ以外は、k=k+1としてステッ
プ1に進む。
プ1に進む。
【0041】再び、式(9a)のδxpは、次のよう
に書ける。
に書ける。
【数19】
さらに、これによって、このカルマンの反復処理のため
のQPアルゴリズムに相当する状態空間式を公式化する
ことができる。前記において、行列Lは、T =LLT であるような行列である。前記のように、状態w
(k)がカルマンの繰り返しtの内部で一定である、つ
まり w(t)=w(t−1) (11a) である仮想的なシステムで動作中のカルマン・フィルタ
の濾過された状態推定値から、アフィン変換アルゴリズ
ムの各繰り返しkに対し、双対ベクトルw(k)を得
ることができる。仮想的なシステムの状態は、アフィン
変換アルゴリズムの双対ベクトルに対応する。これは、
次の関数が真であるからである。
のQPアルゴリズムに相当する状態空間式を公式化する
ことができる。前記において、行列Lは、T =LLT であるような行列である。前記のように、状態w
(k)がカルマンの繰り返しtの内部で一定である、つ
まり w(t)=w(t−1) (11a) である仮想的なシステムで動作中のカルマン・フィルタ
の濾過された状態推定値から、アフィン変換アルゴリズ
ムの各繰り返しkに対し、双対ベクトルw(k)を得
ることができる。仮想的なシステムの状態は、アフィン
変換アルゴリズムの双対ベクトルに対応する。これは、
次の関数が真であるからである。
【数20】
式(9b)によって示されるように、TがDx(k)の
関数であるため、アフィン変換アルゴリズムの反復処理
の度に(つまり、kが増加するにつれて)、gおよび
Tは、共に変化することに注意を要する。従って、置
換によって、次のようにする。
関数であるため、アフィン変換アルゴリズムの反復処理
の度に(つまり、kが増加するにつれて)、gおよび
Tは、共に変化することに注意を要する。従って、置
換によって、次のようにする。
【数21】
η→計算の安定性を保証するために、正の小さい数に置
換する。 (14f)QPアルゴリズムは、カルマン・フィ
ルタ問題として記述できる。
換する。 (14f)QPアルゴリズムは、カルマン・フィ
ルタ問題として記述できる。
【0042】先に既に指摘したように、式(2c)で表
されたステップの逆行列生成ルーチンが必要である。同
様のルーチンが、T、LおよびL-1を得るにも同
様のルーチンが使用できるので、カルマン・フィルタを
使用するQPの実施には特別なルーチンは全く必要な
い。簡単に言えば、図3に示した制御系は、費用関数が
線形なシステム40の最適化に適用することができ、図
4に示した制御系は、費用関数が2次のシステム40の
最適化に適用することができる。
されたステップの逆行列生成ルーチンが必要である。同
様のルーチンが、T、LおよびL-1を得るにも同
様のルーチンが使用できるので、カルマン・フィルタを
使用するQPの実施には特別なルーチンは全く必要な
い。簡単に言えば、図3に示した制御系は、費用関数が
線形なシステム40の最適化に適用することができ、図
4に示した制御系は、費用関数が2次のシステム40の
最適化に適用することができる。
【0043】図3および図4の実施例は、フィードフォ
ワード制御構造を背景とするカルマン・フィルタによっ
て、(それぞれLPおよびQPに対する)アフィン変換
アルゴリズムを実現している。しかし、既に述べたよう
に、システムが静的でないために、フィードバック・ル
ープで制御するのが最も良いシステムもある。勿論、シ
ステムが静的であるとか変化しているという概念は、相
対的なものである。システムによっては、十分静的で、
LP問題を数式化して解くことができ、さらにその解が
十分長い期間に渡って本質的に有効であるものもある。
しかし、その他のシステムでは、制御下のシステムが、
制御信号の生成に要する時間に関連して頻繁に変化した
り、理解できないように変化する。これらのシステムを
ここでは変化的または確率的と称する。システムの変動
は、実際には、制御下のシステムにおける基本的な制約
関係の変化、制約条件の限界に関する変化、またはそれ
らの両方である。換言すれば、A、cおよびbを
表すパラメータが、時々そのシステムにおいて変化する
ので、各変化について、その最適状態に対する新たな解
を見つける必要がある。
ワード制御構造を背景とするカルマン・フィルタによっ
て、(それぞれLPおよびQPに対する)アフィン変換
アルゴリズムを実現している。しかし、既に述べたよう
に、システムが静的でないために、フィードバック・ル
ープで制御するのが最も良いシステムもある。勿論、シ
ステムが静的であるとか変化しているという概念は、相
対的なものである。システムによっては、十分静的で、
LP問題を数式化して解くことができ、さらにその解が
十分長い期間に渡って本質的に有効であるものもある。
しかし、その他のシステムでは、制御下のシステムが、
制御信号の生成に要する時間に関連して頻繁に変化した
り、理解できないように変化する。これらのシステムを
ここでは変化的または確率的と称する。システムの変動
は、実際には、制御下のシステムにおける基本的な制約
関係の変化、制約条件の限界に関する変化、またはそれ
らの両方である。換言すれば、A、cおよびbを
表すパラメータが、時々そのシステムにおいて変化する
ので、各変化について、その最適状態に対する新たな解
を見つける必要がある。
【0044】そのシステムの必要条件と制約条件に関す
る情報を観測系/制御系に供給するための通信路を設定
できるという点で、Abの要素は、観測可能であ
る。例えば、これは、チェーン店では、自動化された在
庫制御システムを含むこともある。この観測可能な情報
は、確率的でも良い。観測可能な要素には、雑音なしに
観測できるものも一部あるが、そのほかは「雑音性」で
ある。観測が、正確に記録されても時々変化する傾向が
あること、および観測が確率成分を有すると仮定した方
が良い結果が達成されることが分かっている場合、その
観測は「雑音性」であると考えられる。その他の観測可
能な要素も、システムの要求が柔軟であることを利用者
が観測系/制御系に知らせるという点で、確率成分を有
することがある。
る情報を観測系/制御系に供給するための通信路を設定
できるという点で、Abの要素は、観測可能であ
る。例えば、これは、チェーン店では、自動化された在
庫制御システムを含むこともある。この観測可能な情報
は、確率的でも良い。観測可能な要素には、雑音なしに
観測できるものも一部あるが、そのほかは「雑音性」で
ある。観測が、正確に記録されても時々変化する傾向が
あること、および観測が確率成分を有すると仮定した方
が良い結果が達成されることが分かっている場合、その
観測は「雑音性」であると考えられる。その他の観測可
能な要素も、システムの要求が柔軟であることを利用者
が観測系/制御系に知らせるという点で、確率成分を有
することがある。
【0045】さらに、制御系に供給される費用情報も時
々変化することがあり、さらに事実に、費用情報は確率
成分を持ち得ることも周知でありうる。例えば、特定の
供給元からのオイルの費用は、需要および地政学的条件
と共にゆっくり変化することもあるが、オイル・タンカ
ーが通過しなければならない天気の関数である確率成分
を有することもある。従って、「実生活の」制御システ
ムでは、異なる種類の確率過程に遭遇する可能性があ
る。
々変化することがあり、さらに事実に、費用情報は確率
成分を持ち得ることも周知でありうる。例えば、特定の
供給元からのオイルの費用は、需要および地政学的条件
と共にゆっくり変化することもあるが、オイル・タンカ
ーが通過しなければならない天気の関数である確率成分
を有することもある。従って、「実生活の」制御システ
ムでは、異なる種類の確率過程に遭遇する可能性があ
る。
【0046】以下において、2つの状況に取り組む。即
ち、第1に、A、b、cの要素の状態が既知であ
るが、その状態が恒常的でないことも既知である場合、
そして第2に、A、bおよびcの要素の状態が与
えられていないか、または正確に既知であり、さらに、
それが推定されなければならない場合である。何れの場
合も、システム雑音およびA、b、cの測定雑音
を記述するのに共分散行列を使用することができる。
ち、第1に、A、b、cの要素の状態が既知であ
るが、その状態が恒常的でないことも既知である場合、
そして第2に、A、bおよびcの要素の状態が与
えられていないか、または正確に既知であり、さらに、
それが推定されなければならない場合である。何れの場
合も、システム雑音およびA、b、cの測定雑音
を記述するのに共分散行列を使用することができる。
【0047】システムの状態が分かっていない場合、そ
の状況は、図1に関連して述べたものに類似している。
観測された状態は、A、b、cの推定値を与える
ために、観測系によって評価される。観測関数が実行さ
れると、2つの状況が同一になる、即ちA、b、
cに対する値が既知で、さらにA、b、cが共
分散行列Q、Rについて雑音性があることが既知で
ある。
の状況は、図1に関連して述べたものに類似している。
観測された状態は、A、b、cの推定値を与える
ために、観測系によって評価される。観測関数が実行さ
れると、2つの状況が同一になる、即ちA、b、
cに対する値が既知で、さらにA、b、cが共
分散行列Q、Rについて雑音性があることが既知で
ある。
【0048】本発明の原理によれば、図3の実施例のカ
ルマン・フィルタに確率情報を供給することによって、
共分散行列の情報が都合良く制御系で利用される。図5
は、図3の制御系に対するこれらの変更した入力を示
す。
ルマン・フィルタに確率情報を供給することによって、
共分散行列の情報が都合良く制御系で利用される。図5
は、図3の制御系に対するこれらの変更した入力を示
す。
【0049】図6は、制御下のシステムがシステムのパ
ラメータに関する情報を与える完全なフィードバック構
造を表す。具体的には、図6には、制御下のシステムに
応じて動作するモデル化モジュール25が含まれてい
る。ある意味で、モジュール25は、制御下のシステム
の出力を観測し、得た情報を所望の形式に調節する観測
系である。モデル化モジュールの出力は、測定雑音およ
びシステム雑音、即ち共分散行列R、Qを記述する
確率情報だけでなく、A、b、cの情報もそうで
ある。制御系30は、A、b、cの情報を受信
し、さらに本発明の原理によれば、Q、Rの情報も
受信する。制御系30によって生成された制御信号は、
前記のようにQ、Rの信号によって影響される。
ラメータに関する情報を与える完全なフィードバック構
造を表す。具体的には、図6には、制御下のシステムに
応じて動作するモデル化モジュール25が含まれてい
る。ある意味で、モジュール25は、制御下のシステム
の出力を観測し、得た情報を所望の形式に調節する観測
系である。モデル化モジュールの出力は、測定雑音およ
びシステム雑音、即ち共分散行列R、Qを記述する
確率情報だけでなく、A、b、cの情報もそうで
ある。制御系30は、A、b、cの情報を受信
し、さらに本発明の原理によれば、Q、Rの情報も
受信する。制御系30によって生成された制御信号は、
前記のようにQ、Rの信号によって影響される。
【0050】先に示したように、モデル化ブロック25
の機能は、LPシステム(A、b、c)によって
制御下のシステムの適切なモデルを生成することであ
る。これを行う手段は、周知である。この分野における
良い参考文献は、1983年にバン・ノストランド・ア
ンド・レインホールド社によって出版されたシンハ(Si
nha)およびクスズタによる「動的システムのモデル化
と識別(Modeling andIdentification of Dynamic syst
ems)」と題する本である。
の機能は、LPシステム(A、b、c)によって
制御下のシステムの適切なモデルを生成することであ
る。これを行う手段は、周知である。この分野における
良い参考文献は、1983年にバン・ノストランド・ア
ンド・レインホールド社によって出版されたシンハ(Si
nha)およびクスズタによる「動的システムのモデル化
と識別(Modeling andIdentification of Dynamic syst
ems)」と題する本である。
【0051】●ハードウェアの実現
図3の制御系は、カルマン・フィルタおよび多数の追加
要素を含むように示してある。制御系を実現にあたりカ
ルマン・フィルタは購入することを前提としているが、
図1から図5により、フィルタをゼロから作ることを可
能にするに十分な情報が与えられる。つまり、前記のよ
うに、カルマン・フィルタの各プロセッサは、それが果
たすべき特定の計算的機能のために、作っても良く、ま
たはそうする代わりに、各プロセッサを、付随するメモ
リと蓄積プログラム制御を備えたマイクロプロセッサの
ような汎用の処理要素で実現することもできる。同じこ
とは、図3の制御系に含まれるカルマン・フィルタの外
部のプロセッサにも当てはまる。
要素を含むように示してある。制御系を実現にあたりカ
ルマン・フィルタは購入することを前提としているが、
図1から図5により、フィルタをゼロから作ることを可
能にするに十分な情報が与えられる。つまり、前記のよ
うに、カルマン・フィルタの各プロセッサは、それが果
たすべき特定の計算的機能のために、作っても良く、ま
たはそうする代わりに、各プロセッサを、付随するメモ
リと蓄積プログラム制御を備えたマイクロプロセッサの
ような汎用の処理要素で実現することもできる。同じこ
とは、図3の制御系に含まれるカルマン・フィルタの外
部のプロセッサにも当てはまる。
【0052】しかし、図3全体の制御系を単一の汎用コ
ンピュータでプログラム制御の下で実現することがで
き、さらに、そのプロセッサに次の内容をできるように
するスイッチ機能をプログラム制御に持たせることがで
きる。 A.図1の構造に必要なような観測機能を実施する普通
のカルマン・フィルタの実行、 B.LP問題を解くためにアフィン変換アルゴリズムの
残りと共に、式(6)の度ごとにカルマン・フィルタ機
能の実行、または、 C.QP問題を解くためにアフィン変換アルゴリズムの
残りと共に、式(14)の度ごとにカルマン・フィルタ
機能の実行。
ンピュータでプログラム制御の下で実現することがで
き、さらに、そのプロセッサに次の内容をできるように
するスイッチ機能をプログラム制御に持たせることがで
きる。 A.図1の構造に必要なような観測機能を実施する普通
のカルマン・フィルタの実行、 B.LP問題を解くためにアフィン変換アルゴリズムの
残りと共に、式(6)の度ごとにカルマン・フィルタ機
能の実行、または、 C.QP問題を解くためにアフィン変換アルゴリズムの
残りと共に、式(14)の度ごとにカルマン・フィルタ
機能の実行。
【0053】前記のような汎用プロセッサを制御する過
程を図7に流れ図の形で示す。最初のステップ(30
1)は、式(1a)および(1b)によって表されるよ
うな線形の離散時間状態空間表現のように制御されるべ
きシステムまたは過程をモデル化することである。これ
は、システムの力学または経験的方法によって行うこと
ができる。前記のように、そのようなモデル化の方法は
周知である。勿論、このモデル化の処理は、制御の直接
的な処理ではなく、制御処理に対する述語である「オフ
・ライン」のステップである。モデル化の部分が終了す
ると、そのモデルを記述する情報が、式(式2aおよび
2e)に従ってカルマン・フィルタに設定される。する
と、フィルタは、ステップ302において、制御(信号
303)下のシステムの出力信号に応じてシステムの状
態の推定値を生成する。システム状態の推定値は、処理
312において、LPモデル表現に変換される。処理3
12に続き、判断処理305によって、最小時間(30
6)と最小エネルギー(307)のうちの何れの制御計
画を採用するかを判断し、展開された状態を処理308
または処理309の何れかに適用する。処理308で
は、式(6)のLPベースの制御系が実施され、処理3
09では、式(14)のQPベースの制御系が実施され
る。
程を図7に流れ図の形で示す。最初のステップ(30
1)は、式(1a)および(1b)によって表されるよ
うな線形の離散時間状態空間表現のように制御されるべ
きシステムまたは過程をモデル化することである。これ
は、システムの力学または経験的方法によって行うこと
ができる。前記のように、そのようなモデル化の方法は
周知である。勿論、このモデル化の処理は、制御の直接
的な処理ではなく、制御処理に対する述語である「オフ
・ライン」のステップである。モデル化の部分が終了す
ると、そのモデルを記述する情報が、式(式2aおよび
2e)に従ってカルマン・フィルタに設定される。する
と、フィルタは、ステップ302において、制御(信号
303)下のシステムの出力信号に応じてシステムの状
態の推定値を生成する。システム状態の推定値は、処理
312において、LPモデル表現に変換される。処理3
12に続き、判断処理305によって、最小時間(30
6)と最小エネルギー(307)のうちの何れの制御計
画を採用するかを判断し、展開された状態を処理308
または処理309の何れかに適用する。処理308で
は、式(6)のLPベースの制御系が実施され、処理3
09では、式(14)のQPベースの制御系が実施され
る。
【0054】図8に、本発明の原理に従う統合された三
位一体の観測系/制御系システムを基に構成した確率L
P解答機を例示する。
位一体の観測系/制御系システムを基に構成した確率L
P解答機を例示する。
【0055】ブロック401は、制御されるシステムま
たは過程である。ブロック402および412は、シス
テムの入力および出力に相当する電気信号をそれぞれ発
生する適切なエネルギー変換器を備えている。これらの
電気信号は、実際はしばしばアナログであるため、これ
らの信号をデジタル・コンピュータにすぐ使えるように
するアナログ/デジタル変換器のブロック403を備え
ている。信号線404により、このデジタル・データを
デジタル・コンピュータである要素405に運ぶ。
たは過程である。ブロック402および412は、シス
テムの入力および出力に相当する電気信号をそれぞれ発
生する適切なエネルギー変換器を備えている。これらの
電気信号は、実際はしばしばアナログであるため、これ
らの信号をデジタル・コンピュータにすぐ使えるように
するアナログ/デジタル変換器のブロック403を備え
ている。信号線404により、このデジタル・データを
デジタル・コンピュータである要素405に運ぶ。
【0056】データが到達すると、コンピュータ405
は、そのメモリにある共通ソフトウェア406における
適切なパラメータを設定することにより、カルマン・フ
ィルタを呼び出し、そのシステムの状態を推定する。ソ
フトウェア406におけるパラメータを設定すること
は、図3および図4に示したようにカルマン・フィルタ
に適切な入力を印加することと同じである。コンピュー
タ405によって推定された状態に関する情報は、人的
に監視できるように、コンピュータの操作卓上に表示さ
れる。また、操作卓は、行うべき制御動作の種類(最小
時間または最小エネルギー)に関する入力、および選択
された制御計画の展開に使用される相当するパラメータ
(所望の出力、制御範囲、所望の出力目標からの逸脱に
対する罰則、制御入力に関する制限など)をコンピュー
タ405に与えるためにも使用される。一度この情報が
コンピュータ405に与えられると、共通ソフトウェア
406における適切なパラメータが設定され、選択され
た制御計画に関して記述された処理が実行され、適切な
制御信号410が、デジタル・データの形式で生成され
る。次に、このデータは、デジタル/アナログ変換器4
12によってアナログ信号411に変換される。これら
のアナログ信号は、制御されるべきシステムまたは過程
に実際の入力を与えるために、対応する動作機構412
(例えば、化学反応装置の弁)を駆動する。
は、そのメモリにある共通ソフトウェア406における
適切なパラメータを設定することにより、カルマン・フ
ィルタを呼び出し、そのシステムの状態を推定する。ソ
フトウェア406におけるパラメータを設定すること
は、図3および図4に示したようにカルマン・フィルタ
に適切な入力を印加することと同じである。コンピュー
タ405によって推定された状態に関する情報は、人的
に監視できるように、コンピュータの操作卓上に表示さ
れる。また、操作卓は、行うべき制御動作の種類(最小
時間または最小エネルギー)に関する入力、および選択
された制御計画の展開に使用される相当するパラメータ
(所望の出力、制御範囲、所望の出力目標からの逸脱に
対する罰則、制御入力に関する制限など)をコンピュー
タ405に与えるためにも使用される。一度この情報が
コンピュータ405に与えられると、共通ソフトウェア
406における適切なパラメータが設定され、選択され
た制御計画に関して記述された処理が実行され、適切な
制御信号410が、デジタル・データの形式で生成され
る。次に、このデータは、デジタル/アナログ変換器4
12によってアナログ信号411に変換される。これら
のアナログ信号は、制御されるべきシステムまたは過程
に実際の入力を与えるために、対応する動作機構412
(例えば、化学反応装置の弁)を駆動する。
【0057】以上の説明は、本発明の一実施例に関する
もので、この技術分野の当業者であれば、本発明の種々
の変形例が考えられるが、それらはいずれも本発明の技
術的範囲に包含される。
もので、この技術分野の当業者であれば、本発明の種々
の変形例が考えられるが、それらはいずれも本発明の技
術的範囲に包含される。
【0058】尚、本明細書において横倍角の文字は行列
またはベクトルを表す。また、
またはベクトルを表す。また、
【数22】
をz^(t)のように表す。
【0059】
【発明の効果】以上述べたように、本発明によれば、カ
ルマーカー(Karmarkar)の方法とカルマン・フィルタ
(Kalman filter)との間の概念的かつ算定法上の類似
点を利用して、確率的LP(線形計画法)システムを制
御するシステムによって観測系の機能と最小時間制御系
の機能とを扱うことが可能となる。
ルマーカー(Karmarkar)の方法とカルマン・フィルタ
(Kalman filter)との間の概念的かつ算定法上の類似
点を利用して、確率的LP(線形計画法)システムを制
御するシステムによって観測系の機能と最小時間制御系
の機能とを扱うことが可能となる。
【図1】確率的環境にあるシステムの制御に一般に使用
される観測系/制御系機構のブロック図である。
される観測系/制御系機構のブロック図である。
【図2】カルマン・フィルタ、アフィン変換アルゴリズ
ム、およびこれらの計算上の類似性の幾何学的解釈を例
示する図である。
ム、およびこれらの計算上の類似性の幾何学的解釈を例
示する図である。
【図3】その動作が線形費用関数によって最適化される
システムのフィード・フォワード・カルマン・フィルタ
・ベースの制御系のブロック図である。
システムのフィード・フォワード・カルマン・フィルタ
・ベースの制御系のブロック図である。
【図4】その動作が2次費用関数によって最適化される
システムのフィード・フォワード・カルマン・フィルタ
・ベースの制御系のブロック図である。
システムのフィード・フォワード・カルマン・フィルタ
・ベースの制御系のブロック図である。
【図5】確率LP制御システムのためのフィード・フォ
ワード・カルマン・フィルタ・ベースの制御系のブロッ
ク図である。
ワード・カルマン・フィルタ・ベースの制御系のブロッ
ク図である。
【図6】確率LP制御システムのためにカルマン・フィ
ルタ・ベースの制御系を使用するフィードバック構造の
ブロック図である。
ルタ・ベースの制御系を使用するフィードバック構造の
ブロック図である。
【図7】一般のシステムまたは処理のモデル化および制
御を説明する流れ図である。
御を説明する流れ図である。
【図8】三位一体の観測系/制御系装置のブロック図で
ある。
ある。
10 システム
14 加算器
20 観測系
23 検査と制御
24〜28 プロセッサ(PROC)
30 制御系
31、32 レジスタ(REG)
33 ゲート(GATE)
─────────────────────────────────────────────────────
フロントページの続き
(72)発明者 シユウ−チヤーン フアン
アメリカ合衆国 27615 ノース カロラ
イナ、ローリー、ジエリソン コート
316
(72)発明者 サラート シー プセンピユラ
アメリカ合衆国 08527 ニユージヤージ
イ、ジヤクソン、ダーリア コート 1207
(72)発明者 ロメシユ セイガル
アメリカ合衆国 48103 ミシガン、アン
ナーバー、パークリツジ ドライブ 2640
(72)発明者 ラクシユマン ピー シンハ
アメリカ合衆国 08816 ニユージヤージ
イ、イースト ブランズウイツク、ペルハ
ム プレイス 31
Claims (7)
- 【請求項1】 フィルタ、結合器、およびプロセッサを
備え、前記フィルタが、第1、第2、第3、第4の入力
ポート、および出力ポートを備え、前記フィルタが、前
記出力ポートにおいて、その観測可能な出力が前記第1
入力ポートに印加される入力信号に相当するシステムの
状態の推定値を生成し、その出力行列が、前記の観測可
能な出力を前記システムの現在の状態に関係つけるもの
であり、前記第2入力ポートへの入力信号に相当し、前
記の観測可能な出力の測定における測定雑音に関する共
分散行列の情報が、前記第3入力への入力信号に対応
し、前記システムのシステム雑音に関する共分散行列の
情報が、第4入力への入力信号に対応し、前記結合器
が、前記フィルタの前記出力ポート、前記装置の第1入
力ポート、および前記装置の第2入力ポートに応じて動
作し、前記装置の前記第1入力ポートが、行列Aを表
す信号要素の集合を受信し、前記装置の前記第2入力ポ
ートが、ベクトルcを表す信号の集合を受信し、ここ
で、wを前記フィルタの前記出力ポートにおける信号
とし、ATwを行列ATのベクトルwによる積で
あるとした場合、前記第1の結合器が、c−AT
wに比例する出力信号γを生成し、前記プロセッサ
が、前記フィルタの前記出力ポート、前記装置の前記第
1入力ポート、前記装置の前記第2入力ポート、および
信号γに応じて、前記のγ、A、c、および現在の
制御信号候補x(k)に基づいて交代用の制御信号候
補x(k)を生成し、さらにkを整数として増加し、
さらに、Dx(k)が対角線上にx(k)の値を有する
対角線行列を表す場合、信号Dx(k)、信号Dx(k)
c、および信号ATDx(k)を生成する手段と、
前記信号Dx(k)cを前記フィルタの前記第1入力ポ
ートに印加し、前記信号ATDx(k)を前記フィルタ
の前記第2入力ポートに印加し、行列Rを表す信号要
素の集合を前記第3入力ポートに印加し、行列Qを表
す信号要素の集合を前記第4入力ポートに印加する手段
と、前記信号Dx(k)を前記装置の出力ポートに印加す
る手段とを備えたことを特徴とする最適化装置。 - 【請求項2】 前記装置が、制御可能な確率システムの
制御ポートに印加される制御信号の集合によって動作費
用が制御される前記確率システムをさらに備え、前記装
置の前記出力ポートにおいて生成される前記信号x
(k)に反応する前記制御可能なシステムの前記制御ポ
ートを有し、前記装置に印加されるA行列入力信号
が、前記の制御可能な確率システムがその下で動作する
制約係数の集合に相応し、前記装置に印加されるc入
力信号が、前記制御可能な確率システムの動作費用に適
用可能な費用係数に相応し、前記装置に印加されるR
行列信号が、前記制御可能な確率システムの観測可能な
出力の測定における測定雑音に関する共分散情報に相応
するようになっていて、さらに前記装置に印加される
Q行列信号が、前記制御可能な確率システムのシステ
ム雑音に関する共分散情報に相応することを特徴とする
請求項1の装置。 - 【請求項3】 前記制御可能な確率システムの観測可能
な出力に応じて前記A入力信号の値を決定する観測系
をさらに備えたことを特徴とする請求項2の装置。 - 【請求項4】 所与のシステムの動作費用cTxを
最小にする制御信号を生成するする装置において、c
が、前記所与のシステムに対する費用係数信号のベクト
ルであり、xが、前記動作費用に影響を及ぼす前記所
与のシステムの制御可能なパラメータのベクトルであ
り、前記所与のシステムがAx=bによって特徴
付けられ、Aが、制約条件信号の行列であり、b
が、制約条件限度のベクトルであり、さらにA、
b、cからなる集合の少なくとも1つの元が、シス
テムの共分散行列Qおよび観測雑音共分散行列Rに
ついて確率的であり、前記装置が、kを反復指数として
第2のシステムの状態w(k)を評価するプロセッサ
を備え、このプロセッサが、前記第2のシステムの観測
可能な出力を前記プロセッサに印加するための第1入力
ポートと、前記第2のシステムの前記状態を前記第2の
システムの前記観測可能な出力に関係付ける情報を前記
プロセッサに印加するための第2入力ポートと、前記第
2のシステムのシステム雑音情報を前記プロセッサに印
加するための第3入力ポートと、前記第2のシステムの
観測雑音情報を前記プロセッサに印加するための第4入
力ポートとを有し、ここでDx(k)が所与のベクトル
x(k)の要素を対角線上に有する対角行列であると
した場合、前記プロセッサが、前記第1入力ポートにお
いてDx(k)cに相当する信号を受信し、前記第2入
力ポートにおいてATDx(k)に相当する信号を受信
し、前記第3入力ポートにおいて前記Q共分散行列に
相当する信号を受信し、前記第4入力ポートにおいて前
記R共分散行列に相当する信号を受信し、さらに前記
装置が、定数γの信号を形成するために、前記プロセッ
サで生成したw(k)、前記のc、A、および
Dx(k)を結合する手段と、次の反復のために新たな所
与のベクトルx(k)を形成するために、前記の生成
されたγ信号、前記のx(k)、Dx(k)、c、お
よびAを結合する手段と、前記の次の反復を禁止する
べきかどうかを判断し、前記の結合する手段によって最
後に生成された前記所与のベクトルx(k)を前記装
置の出力ポートに印加するために、前記プロセッサによ
って生成された前記w(k)を検査する手段とをさら
に備えたことを特徴とする費用を最小化する装置。 - 【請求項5】 前記装置が、前記所与のシステムの観測
値の集合に基づいてA、b、cの前記集合の中の
確率的なものの値を評価する観測系をさらに備えたこと
を特徴とする請求項4の装置。 - 【請求項6】 前記観測系が、カルマン・フィルタであ
ることを特徴とする請求項5の装置。 - 【請求項7】 所与のシステムの動作費用cTxを
最小にする制御信号を生成する観測系/制御系装置にお
いて、cが、前記所与のシステムに対する費用係数信
号のベクトルであり、xが、前記動作費用に影響を与
える前記所与のシステムの制御可能なパラメータのベク
トルであり、前記所与のシステムが、Ax=bに
よって特徴付けられ、Aが、制約条件信号の行列であ
り、bが、制約条件限度のベクトルであり、前記装置
が、カルマン・フィルタを備え、前記のA、b、お
よびcによって表されるような所与のシステムの動作
状態の推定値を、前記所与のシステムの観測可能な出力
に応じて、生成する観測系と、前記観測系に応答する制
御系とを備え、前記制御系が、2のシステムの観測可能
な出力、前記第2のシステムの伝達関数、前記第2のシ
ステムのシステム雑音に関する共分散情報、および前記
第2のシステムの前記観測可能な出力の測定における雑
音に関する共分散情報に基づいて前記第2のシステムの
状態wを評価するフィルタを備え、前記フィルタに印
加される前記の観測可能な出力がDzに相当し、前記
第2のシステムの前記状態を前記第2のシステムの前記
観測可能な出力に関係付ける伝達関数がDzATであ
り、Dzが、ベクトルzの要素を対角線上に有する
対角線行列であり、システム雑音の共分散情報が、前記
所与のシステムのシステム雑音共分散情報Qに相当
し、さらに測定雑音共分散情報が、前記所与のシステム
の測定雑音共分散情報Rに相当し、さらに前記制御系
が、前記w、前記c、前記R、前記Q、および
前記Aに応じて、0と1.0との間で定数γおよびα
を生成する手段と、ベクトルz´を形成するために前
記のz、D、c、A、γおよびαを結合する手
段と、a)z´をzに割り当て、b)前記観測可能
な出力を生成し、c)前記観測可能な出力を前記第2の
カルマン・フィルタに印可する手段と、前記の印可する
手段が前記観測可能な出力を前記第2のカルマン・フィ
ルタに入力するのを何時止めるか、また前記z´が前
記制御可能なパラメータxに何時割り当てられるかを
決定するために、前記第2のカルマン・フィルタによっ
て生成される前記状態wを検査する手段と、前記制御
可能なパラメータxを前記所与のシステムに送信する
手段とを備えたことを特徴とする費用を最小化する観測
系/制御系装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US47125390A | 1990-01-26 | 1990-01-26 | |
US471253 | 1990-01-26 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH052403A true JPH052403A (ja) | 1993-01-08 |
Family
ID=23870879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3023739A Pending JPH052403A (ja) | 1990-01-26 | 1991-01-25 | 最適化装置、費用を最小化する装置および観測系/制御系装置 |
Country Status (2)
Country | Link |
---|---|
EP (1) | EP0439935A3 (ja) |
JP (1) | JPH052403A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8315734B2 (en) | 2006-04-04 | 2012-11-20 | Samsung Electronics Co., Ltd. | Robot and method and medium for localizing the same by using calculated covariance |
JP2014229157A (ja) * | 2013-05-24 | 2014-12-08 | 日本電信電話株式会社 | 遅延補償装置、方法、プログラム及び記録媒体 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5583774A (en) * | 1994-06-16 | 1996-12-10 | Litton Systems, Inc. | Assured-integrity monitored-extrapolation navigation apparatus |
US5747750A (en) * | 1994-08-31 | 1998-05-05 | Exxon Production Research Company | Single well system for mapping sources of acoustic energy |
US20040102937A1 (en) * | 2002-11-21 | 2004-05-27 | Honeywell International Inc. | Energy forecasting using model parameter estimation |
US7328074B2 (en) * | 2002-12-02 | 2008-02-05 | United Technologies Corporation | Real-time quadratic programming for control of dynamical systems |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07104715B2 (ja) * | 1984-01-18 | 1995-11-13 | 株式会社日立製作所 | パラメ−タの同定方法 |
US4744026A (en) * | 1986-04-11 | 1988-05-10 | American Telephone And Telegraph Company, At&T Bell Laboratories | Methods and apparatus for efficient resource allocation |
-
1990
- 1990-12-13 EP EP19900313600 patent/EP0439935A3/en not_active Withdrawn
-
1991
- 1991-01-25 JP JP3023739A patent/JPH052403A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8315734B2 (en) | 2006-04-04 | 2012-11-20 | Samsung Electronics Co., Ltd. | Robot and method and medium for localizing the same by using calculated covariance |
JP2014229157A (ja) * | 2013-05-24 | 2014-12-08 | 日本電信電話株式会社 | 遅延補償装置、方法、プログラム及び記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
EP0439935A3 (en) | 1992-04-15 |
EP0439935A2 (en) | 1991-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH052404A (ja) | 最適化装置、費用を最小化する装置および観測系/制御系装置 | |
Marchetti et al. | A dual modifier-adaptation approach for real-time optimization | |
Peng et al. | A parameter optimization method for radial basis function type models | |
Athans | The role and use of the stochastic linear-quadratic-Gaussian problem in control system design | |
Wong et al. | Identification of linear discrete time systems using the instrumental variable method | |
Viegas et al. | Discrete-time distributed Kalman filter design for formations of autonomous vehicles | |
Agarwal | Combining neural and conventional paradigms for modelling, prediction and control | |
US6801810B1 (en) | Method and device for state estimation | |
Andrieu et al. | Online expectation-maximization type algorithms for parameter estimation in general state space models | |
Buşoniu et al. | Approximate dynamic programming with a fuzzy parameterization | |
US20230333518A1 (en) | Adjustment system, adjustment method, and adjustment program | |
Calderón et al. | Koopman operator-based model predictive control with recursive online update | |
Lázaro-Gredilla et al. | A Bayesian approach to tracking with kernel recursive least-squares | |
De Cock et al. | Subspace identification methods | |
US20050027494A1 (en) | Accurate linear parameter estimation with noisy inputs | |
Ridderbusch et al. | Learning ODE models with qualitative structure using Gaussian processes | |
JPH052403A (ja) | 最適化装置、費用を最小化する装置および観測系/制御系装置 | |
Che et al. | Correcting discount-factor mismatch in on-policy policy gradient methods | |
Woodley et al. | Subspace based direct adaptive ℋ︁∞ control | |
Lubenova | Stable adaptive algorithm for simultaneous estimation of time-varying parameters and state variables in aerobic bioprocesses | |
JP2023003177A (ja) | 推論プログラム、推論方法および情報処理装置 | |
Koivisto | A practical approach to model based neural network control | |
Wu et al. | Attitude estimation based on robust information cubature quaternion filter | |
Trommer et al. | Adaptive Meta-Learning-Based KKL Observer Design for Nonlinear Dynamical Systems | |
Wolff et al. | Gaussian Process-Based Nonlinear Moving Horizon Estimation |