JP7019037B2 - システムを制御する装置及び方法 - Google Patents

システムを制御する装置及び方法 Download PDF

Info

Publication number
JP7019037B2
JP7019037B2 JP2020518554A JP2020518554A JP7019037B2 JP 7019037 B2 JP7019037 B2 JP 7019037B2 JP 2020518554 A JP2020518554 A JP 2020518554A JP 2020518554 A JP2020518554 A JP 2020518554A JP 7019037 B2 JP7019037 B2 JP 7019037B2
Authority
JP
Japan
Prior art keywords
distribution
state
student
model
uncertainty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020518554A
Other languages
English (en)
Other versions
JP2020535562A5 (ja
JP2020535562A (ja
Inventor
バーントープ、カール
ディ・カイラノ、ステファノ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JP2020535562A publication Critical patent/JP2020535562A/ja
Publication of JP2020535562A5 publication Critical patent/JP2020535562A5/ja
Application granted granted Critical
Publication of JP7019037B2 publication Critical patent/JP7019037B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/048Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S19/00Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
    • G01S19/01Satellite radio beacon positioning systems transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S19/00Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
    • G01S19/38Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system
    • G01S19/39Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system the satellite radio beacon positioning system transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO
    • G01S19/42Determining position
    • G01S19/48Determining position by combining or switching between position solutions derived from the satellite radio beacon positioning system and position solutions derived from a further system
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/41Servomotor, servo controller till figures
    • G05B2219/41146Kalman filter
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/02Computing arrangements based on specific mathematical models using fuzzy logic
    • G06N7/023Learning or tuning the parameters of a fuzzy system
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0248Filters characterised by a particular frequency response or filtering method
    • H03H17/0255Filters based on statistics
    • H03H17/0257KALMAN filters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Feedback Control In General (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)

Description

本発明は、システムの制御に関し、より詳細には、不確実性を有するシステムダイナミクスのモデルを用いてシステムを制御することに関する。
多くの高度な制御技術が、制御システムによってリアルタイムに解くことができる最適化問題として定式化されている。システムのダイナミクスを記述するモデルのタイプに基づいて、いくつかのシステムは、一般に、線形システム又は非線形システムと称される。例えば、線形システムは、線形演算子の使用に基づいたシステムのモデルである。線形システムは、典型的には、非線形の場合よりもはるかに単純である特徴及び特性を呈し、自動制御理論、信号処理、及び電気通信において重要な応用を見出している。例えば、ワイヤレス通信システムの伝播媒体は、多くの場合、線形システムによってモデル化することができ、路上走行車両の運動は、運転者及び/又は制御システムに対する或る特定の条件下で線形システムによって記述することができる。
モデルベース制御の性能は、最適制御計算において用いられる予測モデルの品質に必然的に依存する。一方で、多くの応用において、制御される側のシステムのモデルは、部分的に未知であるか又は不確実である。このような事例において、不確実なモデルに制御を適用すると、性能が最適化されない、又は、制御されるシステムが不安定になる可能性がある。
カルマンフィルター(KF)は、線形状態空間モデルにおける状態推定のための標準的なツールである。状態は、動的システムの物理的変数、例えば、位置、速度、方位、これらの組み合わせ、又は流動に関することができるが、モデルがブラックボックス推定モデルを用いて得られた場合非物理的なものとすることもできる。KFは、最小分散という点で最良の線形不偏フィルターであり、ガウス雑音の場合、最適なベイズフィルターである。KFは、状態推定値の平均及び分散を伝播させるリアルタイム再帰方法であり、状態推定値は、既知のガウス雑音の場合、システムの全確率分布を推定するのに必要な情報量、すなわち十分な統計量である。KFの従来の定式化は、雑音プロセスがガウス分布であり、既知の平均及び共分散を有することを前提としており、これは、非常に限定的なものとなる可能性がある。
モデル不確実性及び生じ得るデータ外れ値は、KFの性能に影響を与え、多くの実用事例において、モデルパラメータは未知であるか、又は少なくとも不確実である。例えば、慣性検知及び/又はGPSが用いられるナビゲーションシステムでは、雑音統計値は、多くの場合、事前に求めることができない時間依存性を有する。他の例としては、近似された非線形モデルにおける線形化誤差、環境依存センサ統計値、及び、ガウス分布のテールにおける確率質量が低いためにガウス分布が十分にハンドリングできない、低信頼度のセンサにおける外れ値が原因で、雑音統計値が変動する。雑音パラメータは、モデルの種々の部分の信頼度を決定するので、したがって、フィルター性能にとって特に重要なものである。しかしながら、雑音パラメータを手動で調節することは、実用的にはよく行われるが、困難で時間が掛かり、労力を伴う作業となる可能性がある。
雑音パラメータ推定に対して厳密な手法を実現することができないので、近似方法が考案されている。例えば、特許文献1に記述されている方法は、動的システムの状態及び測定雑音の関連付けられた分散を推定するために、分散推定器と組み合わされたKFを開示している。しかしながら、この方法は、外れ値の影響を受けやすく、限定するものではないが、GPS/慣性検知ベース推定システムにおいて一般的には用いられる。
他の手法は、モデルの不確実性のパラメータ、例えば雑音の平均及び分散を含めるように状態ベクトルを拡張することに基づいている。しかしながら、このような手法は、状態ベクトルが必要とするよりも大きいので、不必要に複雑な推定問題をもたらす。さらに、このような手法は、パラメータの動的展開のモデルを導入することに依存しており、これは現実には未知の領域である。
米国特許第7209938号
したがって、不確実性を含むシステムのダイナミクスのモデルを用いたシステムのモデルベース制御が必要とされている。
典型的には、システムのモデルは、2つのモデル(方程式)を含む。第1のモデルは、システム状態をシステムの以前の状態及びシステムへの入力に関係付けるシステムの運動モデルである。運動モデルは、典型的には、運動モデルの不確実性を表す雑音又は擾乱を含む。この不確実性は、本明細書においてプロセス雑音と称される。第2のモデルは、システム状態にシステムの利用可能な測定値を関係付ける測定モデルである。同様に、測定モデルは、測定雑音、及び/又は、本明細書において測定雑音と称される他の不確実性を含む。
運動モデルの例は、xk+1=Ax+wであり、ここで、wは、プロセス雑音である。また、測定モデルの例は、y=Cx+eであり、ここで、eは、測定雑音である。
加えて、システム状態は、本明細書において状態不確実性と称する不確実性も受ける。とりわけ、プロセス雑音及び測定雑音は、状態不確実性を引き起こすが、しかし、状態不確実性は、プロセス雑音及び測定雑音とは異なる。具体的には、状態不確実性は、状態の値に対して内部のものである一方で、プロセス雑音及び測定雑音は、状態に対する外乱である。
プロセス雑音及び測定雑音が既知である場合、すなわち、プロセス雑音及び測定雑音の分布の形状及びパラメータが既知である場合、種々の技法により、システム状態及び状態不確実性の双方を推定することが可能になる。システム状態及び状態不確実性の双方は、多くの制御応用にとって重要である。例えば、システム状態は、制御目的を達成するためにシステムへの制御入力を求めるのに用いることができる一方で、状態不確実性は、制御の実現可能性を確実にするために制御入力を調整するのに用いることができる。
例えば、プロセス雑音及び測定雑音の分布がガウス分布であり、プロセス雑音及び測定雑音についてのガウス分布の平均及び分散が既知である場合、カルマンフィルターを用いて、システム状態及び状態不確実性の双方を推定することができる。一方で、プロセス雑音及び測定値のうちの少なくとも一方についてのガウス分布の分散が未知である場合、カルマンフィルターは、適用可能ではない。そのために、多くの制御応用にとって、プロセス雑音及び測定雑音の分布の確率パラメータを知ることは有益である。
いくつかの実施形態は、未知の確率パラメータを、平均期待値を用いて表すことが可能であるという理解に基づいている。一方で、多くの状況において、確率パラメータは経時的に変化し、平均期待値を用いることは、確率パラメータの一定値を有する結果をもたらすことになり、これは、準最適である可能性がある。
そのために、プロセス雑音及び測定雑音のうちの少なくとも一方又は組み合わせの分布の確率パラメータを、時間の関数として推定するシステム及び方法が必要とされている。
いくつかの実施形態は、分布の確率パラメータが未知である場合、分布がガウス分布であると仮定とすることが合理的であるという認識に基づいている。この仮定は、例えば、大数の法則によって正当化される。例えば、加速度計は、固定サンプリングレートにおいて測定される場合、ガウス確率分布に類似する高周波数雑音成分を有する。
いくつかの実施形態は、ガウス分布の未知の確率パラメータ、例えば平均及び分散を推定することが可能であるという別の認識に基づいている。例えば、ガウス分布の対称性に起因して、ガウス分布の分散は、データサンプルの分散の平均を用いて推定することができる。
一方で、いくつかの実施形態は、プロセス雑音及び/又は測定雑音のガウス分布の分散が未知である場合、プロセス雑音及び/又は測定雑音の実際の分布がガウス分布であるときでも、プロセス雑音及び/又は測定雑音の分布は、スチューデントのt分布(student-t distribution)にするべきであるという理解に基づいている。これは、スチューデントのt分布がガウス分布の未知の分散の不確実性をより良好に捉えることができるためである。しかしながら、不都合なことに、スチューデントのt分布は、多くの制御方法の場合に対してうまく適合しない。すなわち、システム状態がスチューデントのt分布を用いて表される場合、制御方法を考案するときにいくつかの仮定が損なわれることになる。例えば、多くの制御システム、例えば線形二次ガウスコントローラ(LQG)は、安定性の保証を提供するため、プロセス雑音及び測定雑音のガウス仮定に依存している。
そのために、いくつかの実施形態は、ガウス分布とスチューデントのt分布との間のいくつかの変換を実行して、プロセスのガウス性及びガウス性の不確実性の双方を捉える。このような変換により、スチューデントのt分布を考慮するように設計されていない種々の制御方法においてガウス分布の不確実性を考慮することが可能になる。例えば、1つの実施形態は、ガウス雑音の平均及び分散の初期推定値を求め、それにより、ガウス分布にスチューデントのt分布のパラメータを当てはめる。別の実施形態は、反復的に、スチューデントのt分布のパラメータ、すなわち、平均、スケール(scale)、及び自由度を推定し、スチューデントのt分布にガウス分布を当てはめる。このようにして行った結果、ガウス雑音仮定と整合するが、依然としてガウス分布の平均及び分散において不確実性を考慮する必要が生じる。
時間が進行するにつれて、スチューデントのt分布は、ガウス分布に近似する。1つの実施形態は、この同化を回避することが有益であり得るという理解に基づいている。したがって、この実施形態は、スチューデントのt分布及びガウス分布が互いに十分に近いが、厳密には同じではないように、スチューデントのt分布のパラメータを制限する。
いくつかの実施形態は、各時間ステップにおける動的システムの状態を、KFと同様の解析表現によって更新することができるという理解に基づいている。
他の実施形態は、パラメータを、測定値と、測定値の状態推定値との差異によって更新することができるということを理解している。1つの実施形態は、測定値と、測定値の状態推定値との差異を、状態推定値の不確実性を用いて重み付けし、状態推定値の知識が不確実であることを更に考慮する。
更に他の実施形態は、測定値が、雑音依存性を有するシステムである動的システムの擾乱に関する情報を含む事例において、動的モデルの状態を予測することは、以前の時間ステップからの測定値を用いて行うことができるということを理解している。以前の測定値を用いて状態を予測することは、保持することができるパラメータの更新につながるが、依然として雑音依存性に関する情報を統合するということも理解される。例えば、このような方法は、運転者からの操舵入力が車両の運動のモデルへの入力であり、車両の速度に影響を与える自動車応用には有益である。操舵入力は厳密には既知ではなく、車両のハンドルに取り付けられた雑音を有するセンサによって測定される。加速度測定値等の慣性測定値が用いられる場合も同様に、車両の測定値のモデルは、運転者からの操舵入力を含む。それゆえ、操舵入力に関する情報は、車両の測定モデルに含まれる。
したがって、1つの実施形態は、システムの運動モデルに影響を与えるセンサ及びシステムの測定モデルに影響を与えるセンサは、多くの場合、時間変動するオフセット及びセンサ測定値の分散の知識の不確実性によって影響を受けるという理解に基づいている。別の実施形態は、決定論的部分及び確率論的部分の組み合わせによってセンサをモデル化することができ、確率論的部分は、未知の平均及び分散を有するガウス分布によってモデル化されるということに基づいている。種々の実施形態は、ガウス分布の平均及び分散を用いて、センサ測定値のオフセット及び分散をモデル化することができるということを理解している。したがって、1つの実施形態では、センサは、ガウス分布の平均及び分散を求めることによって較正される。
したがって、1つの実施形態は、システムを制御する装置であって、プロセス雑音を受けるシステムの運動モデルと、測定雑音を受けるシステムの測定モデルとを含むシステムのモデルを記憶するメモリであって、プロセス雑音及び測定雑音のうちの一方又は組み合わせは、未知の確率パラメータを有するシステムのモデルの不確実性を形成するようになっており、システムのモデルの不確実性は、未知の確率パラメータを有するシステムの状態不確実性を引き起こすものである、メモリと、信号を測定してシステム状態を示す測定値のシーケンスを生成するセンサと、プロセッサであって、運動モデル、測定モデル、及びシステム状態の測定値のうちの少なくとも1つ又は組み合わせを用いて、モデルの不確実性を表す第1のスチューデントのt分布及びシステムの状態不確実性を表す第2のスチューデントのt分布を推定することであって、推定は、終了条件が満たされるまで反復して実行されることと、第2のスチューデントのt分布に、状態不確実性を表すガウス分布を当てはめることとを行う、プロセッサと、コントローラであって、ガウス分布によって表される状態不確実性を有するシステムのモデルを用いて、システムへの制御入力を求めることと、制御入力に従ってシステムを制御することとを行う、コントローラとを備える、装置を開示する。
別の実施形態は、システムを制御する方法であって、方法は、方法を実施する記憶された命令に結合されたプロセッサを使用し、命令は、プロセッサによって実行されると、方法のステップを実行し、ステップは、プロセス雑音を受けるシステムの運動モデルと、測定雑音を受けるシステムの測定モデルとを含むシステムのモデルを索出するステップであって、プロセス雑音及び測定雑音のうちの一方又は組み合わせは、未知の確率パラメータを有するシステムのモデルの不確実性を形成するようになっており、システムのモデルの不確実性は、未知の確率パラメータを有するシステムの状態不確実性を引き起こすものである、ステップと、システム状態を示す測定値のシーケンスを受信するステップと、運動モデル、測定モデル、及びシステム状態の測定値のうちの少なくとも1つ又は組み合わせを用いて、モデルの不確実性を表す第1のスチューデントのt分布及びシステムの状態不確実性を表す第2のスチューデントのt分布を推定するステップであって、推定は、終了条件が満たされるまで反復して実行される、ステップと、第2のスチューデントのt分布に、状態不確実性を表すガウス分布を当てはめるステップと、ガウス分布によって表される状態不確実性を有するシステムのモデルを用いて、システムへの制御入力を求めるステップと、制御入力に従ってシステムを制御するステップとを含む、方法を開示する。
更に別の実施形態は、方法を実行するためにプロセッサによって実行可能なプログラムを具現化した非一時的コンピューター可読記憶媒体であって、方法は、プロセス雑音を受けるシステムの運動モデルと、測定雑音を受けるシステムの測定モデルとを含むシステムのモデルを索出するステップであって、プロセス雑音及び測定雑音のうちの一方又は組み合わせは、未知の確率パラメータを有するシステムのモデルの不確実性を形成するようになっており、システムのモデルの不確実性は、未知の確率パラメータを有するシステムの状態不確実性を引き起こすものであるステップと、システム状態を示す測定値のシーケンスを受信するステップと、運動モデル、測定モデル、及びシステム状態の測定値のうちの少なくとも1つ又は組み合わせを用いて、モデルの不確実性を表す第1のスチューデントのt分布及びシステムの状態不確実性を表す第2のスチューデントのt分布を推定するステップであって、推定は、終了条件が満たされるまで反復して実行されるステップと、第2のスチューデントのt分布に、状態不確実性を表すガウス分布を当てはめるステップと、ガウス分布によって表される状態不確実性を有するシステムのモデルを用いて、システムへの制御入力を求めるステップと、制御入力に従ってシステムを制御するステップとを含む、非一時的コンピューター可読記憶媒体を開示する。
いくつかの実施形態による原理を示す図である。 ガウス分布の図である。 スチューデントのt分布が、異なる自由度の場合にいかに変動するのかの図である。 いくつかの実施形態による、ガウス分布が、確率パラメータにおける不確実性をハンドリングするようにいかに良好に適合されていないかの図である。 いくつかの実施形態による、スチューデントのt分布が、確率パラメータにおける不確実性をハンドリングするようにいかに適合されているのかの図である。 本発明の1つの実施形態による、システム状態及びシステムの確率パラメータを同時に推定し、システムを制御する方法のフローチャートである。 1つの実施形態による、初期推定値を求める例示的な一実施態様のフローチャートである。 いくつかの実施形態による、システムを制御する装置のブロック図である。 システム状態を更新する方法の1つの反復のフローチャートである。 本発明のいくつかの実施形態による、確率パラメータ及びシステム状態を求めることの図である。 本発明のいくつかの実施形態による、確率パラメータ及びシステム状態を求めることの図である。 本発明のいくつかの実施形態によって利用されるいくつかの原理に従って求められる異なる運動の概略図である。 本発明のいくつかの実施形態によって利用されるいくつかの原理に従って求められる異なる運動及び関連付けられた確率分布の概略図である。 センサのセンサ測定値が、典型的には、時間とともにいかに変動するのかの図である。 センサのセンサオフセットが、センサの配置とともにいかに変動するのかの図である。 センサのセンサ分散が、センサの配置とともにいかに変動するのかの図である。 本発明の1つの実施形態による、システム状態とシステムのセンサ状態とを同時に推定することによってシステムを制御する方法のフローチャートである。 センサ状態の実現可能空間を規定する確率分布関数を示すグラフである。 パーティクルを反復して更新する1つの実施形態による、パーティクルを更新する方法の1つの反復のブロック図を示している。 1つの実施形態による制御システムの全体ブロック図である。 1つの実施形態によるセンサ状態推定器の全体構造を示す図である。
典型的には、システムのモデルは、2つのモデル(方程式)を含む。第1のモデルは、システム状態をシステムの以前の状態及びシステムへの入力に関係付けるシステムの運動モデルである。このモデルは、例えば、道路上を走行する運動モデルとすることができ、システム状態は、速度及び進行方向速度(heading rate)を含み、システムへの入力は、運転者の操舵角である。運動モデルは、典型的には、運動モデルの不確実性を表す雑音又は擾乱を含む。例えば、擾乱は、車両の運転者がいかに挙動するかの不確実性を表すことができる。この不確実性は、本明細書においてプロセス雑音と称される。第2のモデルは、システム状態にシステムの利用可能な測定値を関係付ける測定モデルである。例えば、測定値は、車両の速度に加速度測定値を関係付ける加速度計とすることができる。同様に、測定モデルは、測定雑音、及び/又は、本明細書において測定雑音と称される他の不確実性を含む。例えば、加速度計は、種々の雑音源、例えば、加速度計のコンポーネントにおける機械的振動に起因した測定値における雑音を有する。
運動モデルの例は、xk+1=A+wであり、ここで、wは、プロセス雑音であり、xは、状態である。また、測定モデルの例は、y=C+eであり、ここで、eは、測定雑音である。
運動モデル及び測定値における不確実性は、状態の知識の不確実性を同様にもたらし、これは、一般に、プロセス及び/又は測定雑音と同じ雑音ではない。
図1Aは、いくつかの実施形態によって用いられるカルマンフィルター(KF)の概略図を示している。KFは、線形状態空間モデルにおける状態推定のためのツールであり、雑音源が既知でありガウス性である場合に最適な推定器であり、この事例において、状態推定値もガウス分布である。KFは、ガウス分布の平均及び分散を推定する。なぜならば、平均及び分散は、ガウス分布を記述するのに必要な2つの数量(十分統計量)であるためである。
図1Bは、図1AのKFを用いる際にいくつかの実施形態によって用いられるガウス分布110bのスケッチを示している。ガウス分布110bは、分布の平均120bに中心が合わせられ、分散130bは、分布の散らばり具合(spread)(幅)を示すものである。図1Aに戻って参照すると、KFは、状態の初期知識110aから開始して、状態の平均及びその分散111aを求める。その後、KFは、システムのモデルを用いて、次の時間ステップに対する状態及び分散を予測し(120a)、状態の更新された平均及び分散121aを得る。その後、KFは、更新ステップ140aにおいてシステムの測定モデルを用いて測定値130aを使用し、状態の更新された平均及び分散141aを求める。その後、出力150aが得られ、この手順は、次の時間ステップ160aについて繰り返される。
図1Cは、スチューデントのt分布における変動する自由度についての、ガウス分布とスチューデントのt分布との間の差異を示すグラフを示している。ガウス分布の平均120b及び分散130bは、その形状を記述するのに十分なものである。スチューデントのt分布は、平均、スケール、及び自由度という3つのパラメータを必要とする。スケールは、自由度に依存する関数を用いて拡縮される(scaled)分散である。例えば、図1Cは、3つの異なる自由度を有する3つのスチューデントのt分布の形状を示している。自由度の数が小さい場合、スチューデントのt分布130cは、ガウス分布を平らに滑らかにしたものである。一方で、自由度の数が増加するにつれて、スチューデントのt分布は、ガウス分布により類似していく(120c及び110c)。
システム状態及び状態不確実性の双方は、多くの制御応用にとって重要である。例えば、システム状態は、制御目的を達成するためにシステムへの制御入力を求めるのに用いることができる一方で、状態不確実性は、制御の実現可能性を確実にするために制御入力を調整するのに用いることができる。
プロセス雑音及び測定雑音の分布がガウス分布であり、プロセス雑音及び測定雑音についてガウス分布の平均及び分散が既知である場合、KFを用いて、システム状態及び状態不確実性の双方を推定することができる。一方で、プロセス雑音及び測定値のうちの少なくとも一方についてのガウス分布の分散が未知である場合、KFは、適用可能ではない。そのために、多くの制御応用にとって、プロセス雑音及び測定雑音の分布の確率パラメータを知ることは有益である。例えば、ガウス雑音の場合、確率パラメータは、雑音が由来するガウス分布の平均及び分散を含む。
いくつかの実施形態は、分布の確率パラメータが未知である場合、分布がガウス分布であると仮定とすることが合理的であるという認識に基づいている。例えば、この仮定は、大数の法則によって正当化される。例えば、加速度計は、固定サンプリングレートにおいて測定される場合、ガウス確率分布に類似する高周波数雑音成分を有する。
いくつかの実施形態は、ガウス分布の未知の確率パラメータ、例えば平均及び分散を推定することが可能であるという別の認識に基づいている。例えば、ガウス分布の対称性に起因して、ガウス分布の分散は、データサンプルの分散の平均を用いて推定することができる。一方で、いくつかの実施形態は、プロセス雑音及び/又は測定雑音のガウス分布の分散が未知である場合、プロセス雑音及び/又は測定雑音の実際の分布がガウス分布であるときでも、プロセス雑音及び/又は測定雑音の分布は、スチューデントのt分布にするべきであるという理解に基づいている。これは、スチューデントのt分布がガウス分布の未知の分散の不確実性をより良好に捉えることができるためである。
図1Dは、ガウス分布110d及び測定値120dを示しており、ここで、ガウス分布110dの確率パラメータは未知であり、測定値120dは、110dから生じる。測定値120dは、110dの中心には近くないが、無視できない生起確率を有する。一方で、測定値120dは、ガウス分布130dから生じたものとしてモデル化されており、この場合、測定値は、130dの確率パラメータの現在の推定値に関して0に近い確率を有し、結果として、状態推定器が、状態推定値と、120dに関連付けられた分布140dとを誤って移動させるに至る。
図1Eは、ガウス分布110d及び測定値120dを示しており、ここで、ガウス分布110dの確率パラメータは未知であり、測定値120dは、110dから生じる。測定値120dは、110dの中心には近くないが、無視できない生起確率を有する。一方で、推定器において、測定値120dは、スチューデントのt分布130eから生じたものとしてモデル化されており、この場合、測定値は、スチューデントのt分布130eのテールが測定値120dを包含するので非0の確率を有し、結果として、状態推定器が、状態推定値と、分布140eとをより良好に移動させるに至る。
しかしながら、不都合なことに、スチューデントのt分布は、多くの制御方法の場合に良好に適合しない。すなわち、システム状態がスチューデントのt分布を用いて表される場合、制御方法を考案するときにいくつかの仮定が違反されることになる。例えば、多くの制御システム、例えば線形二次ガウスコントローラ(LQG)は、プロセス雑音及び測定雑音のガウス仮定に依拠して、安定性の保証を提供する。
そのために、いくつかの実施形態は、ガウス分布とスチューデントのt分布との間のいくつかの変換を実行して、プロセスのガウス性及びガウス性の不確実性の双方を捉える。このような変換により、スチューデントのt分布を考慮するように設計されていない種々の制御方法においてガウス分布の不確実性を考慮することが可能になる。
例えば、1つの実施形態は、ガウス雑音の平均及び分散の初期推定値を求め、それにより、ガウス分布にスチューデントのt分布のパラメータを当てはめる。別の実施形態は、反復的に、スチューデントのt分布のパラメータ、すなわち、平均、スケール、及び自由度を推定し、スチューデントのt分布にガウス分布を当てはめる。このようにして行った結果、ガウス雑音仮定と整合するが、依然としてガウス分布の平均及び分散における不確実性を考慮することがもたらされる。
図2Aは、プロセス雑音を受けるシステムの運動モデルと、測定雑音を受けるシステムの測定モデルとを含むシステムのモデルに従ってシステムを制御する方法のフローチャートを示しており、プロセス雑音及び測定雑音のうちの一方又は組み合わせは、未知の確率パラメータを有するシステムのモデルの不確実性を形成するようになっており、システムのモデルの不確実性は、未知の確率パラメータを有するシステムの状態不確実性を引き起こすものである。例えば、未知の確率パラメータは、ガウス分布の平均及び分散とすることができる。例えば、質量等の、システムのパラメータを、統計的平均及び分散を有するガウス分布としてモデル化することができる。
そのために、方法は、モデルの不確実性を表す第1のガウス分布の平均及び分散の初期推定値を求めて(210a)、第1のガウス分布の平均及び分散215aを生成する。その後、方法は、平均及び分散215aを用いて、平均及び分散の初期値を有するガウス分布に第1のスチューデントのt分布を当てはめ、モデルの不確実性を表す第1のスチューデントのt分布の平均、スケール、及び自由度の初期値を求める。1つの実施形態では、スチューデントのt分布の平均は、ガウス分布の平均と同じである。別の実施形態では、スケールは、ガウス分布のモーメントをスチューデントのt分布にマッチングさせることによって得られる。別の実施形態では、当てはめは、モーメントマッチング、及び/又は、分布同士の間の差異を測定するコスト関数を最適化することによって行われる。
その後、方法は、第1のスチューデントのt分布の初期推定値225aを用いて、状態不確実性を表す第2のスチューデントのt分布の平均、スケール、及び自由度235aの初期値を求める(230a)。1つの実施形態では、この求めることは、第1のスチューデントのt分布のパラメータをシステムの運動モデルを通して伝播させることによって行われる。
その後、方法は、測定値236aを用いて、システム状態、第1のスチューデントのt分布のパラメータ、及び第2のスチューデントのt分布のパラメータ245aの反復的更新240aを、終了条件が満たされるまで実行し、更新されたパラメータ245aは、更新された第1のスチューデントのt分布及び更新された第2のスチューデントのt分布ももたらす。
終了条件が満たされると、方法は、第2のスチューデントのt分布に、状態不確実性を表すガウス分布を当てはめて(250a)、第2のガウス分布の平均及び分散255aを生成する。その後、方法は、第2のガウス分布の平均及び分散255aを用いて、制御入力265aを求め(260a)、制御入力265aに従ってシステムを制御する(270a)。
いくつかの実施形態では、第2のスチューデントのt分布の初期値は、第1のスチューデントのt分布の初期値に等しい。状態の初期不確実性がモデル自体の初期不確実性から変化すると信じる理由がまったく又はほとんどない場合、このような初期値を選ぶことは有利であり得る。一方で、1つの実施形態では、初期値は異なる。例えば、1つの実施形態は、システムのモデル及び第1のスチューデントのt分布の初期値の関数であるように、第2のスチューデントのt分布の初期値を求める。これは、例えば、第1のスチューデントのt分布の初期値が事前に求められており、第1のスチューデントの分布の初期値が求められてからシステム状態が変化したと信じる理由がある場合に、価値がある可能性がある。別の実施形態では、第2のスチューデントのt分布の初期値は、第1のスチューデントのt分布の初期値に等しいが、第2のスチューデントのt分布の最終値は、第1のスチューデントのt分布の最終値と異なる。これは、一般に、システムの運動モデル及びシステムの測定モデルが、2つのモデルによって導入されるそれぞれの変化が相殺されるようにモデル化されない限り当てはまる。
図2Bは、種々の実施形態による210aの例示の一実施態様のフローチャートを示している。まず、方法210aは、データ収集を通して、又は、メモリからデータを受信することによって、システムの履歴測定値を得る(210b)。その後、方法は、システムのモデル219bを用いて、履歴測定値のアベレージ値を求め(220b)、履歴測定値に状態を関係付けるシステムのモデルに従って平均の初期推定値を生成する。その後、方法は、履歴測定値のアベレージ分散、及び測定値に状態を関係付けるモデルを用いて分散の初期推定値を求める(230b)。
図2Cは、いくつかの実施形態による、システムを制御する装置210cのブロック図を示している。装置は、プロセス雑音を受けるシステムの運動モデル221cと、測定雑音を受けるシステムの測定モデル222cとを含むシステムのモデルを記憶するメモリ220cを備え、プロセス雑音及び測定雑音のうちの一方又は組み合わせは、未知の確率パラメータを有するシステムのモデルの不確実性を形成するようになっている。システムのモデルの不確実性は、未知の確率パラメータを有するシステムの状態不確実性223cを引き起こすものである。
装置210cは、信号を測定してシステム状態を示す測定値のシーケンスを生成するセンサ250cと、状態不確実性を表すガウス分布235cを推定するプロセッサ230cと、ガウス分布235cによって表される状態不確実性を有するシステムのモデルを用いてシステムへの制御入力を求め、制御入力に従ってシステムを制御するコントローラ240cとを同様に備える。コントローラ240cは、種々の制御方法、例えばモデル予測制御を用いてシステムを制御し、モデル予測制御は、多くの場合、根本にあるガウス雑音仮定を用いて、システムのモデルを使用し、異なる制御コマンドに起因したシステムの予測を行う。別の可能な制御方法は、LQG制御であり、これも、根本にあるガウス仮定に依拠する。実施形態は、これらの方法に限定されないことが理解される。
プロセッサ230cは、モデルの不確実性を表す第1のスチューデントのt分布及びシステムの状態不確実性を表す第2のスチューデントのt分布に基づいて、ガウス分布235cを求める。例えば、プロセッサは、運動モデル、測定モデル、及びシステム状態の測定値のうちの少なくとも1つ又は組み合わせを用いて第1の及び/又は第2のスチューデントのt分布を推定する。いくつかの実施形態では、推定は、終了条件が満たされるまで反復的に実行される。終了条件の例として、利用可能な計算時間限度が満たされたこと、所定の反復数に達したこと、及び、2つの連続した更新同士の間の差異が所定の閾値を下回ったことが挙げられる。終了条件を満たすと、プロセッサは、第2のスチューデントのt分布に、状態不確実性を表すガウス分布を当てはめる。
このように、いくつかの実施形態は、ガウス分布とスチューデントのt分布との間のいくつかの変換を実行して、プロセスのガウス性及びガウス性の不確実性の双方を捉える。このような変換により、スチューデントのt分布を考慮するように設計されていない種々の制御方法においてガウス分布の不確実性を考慮することが可能になる。
いくつかの実施形態では、自由度の初期値は、状態次元の次元よりも大きい正の有限整数値として選択される。他の実施形態では、自由度は、状態次元及び測定値次元の総和よりも大きい。別の実施形態では、自由度の求められた初期値が用いられて、第1のスチューデントのt分布の平均及びスケールが求められる。例えば、この実施形態は、第1のガウス分布の初期分散を、初期自由度のアフィン関数によって除算したものとして初期スケールを求める。
図1Cに戻って参照すると、自由度の値は、スチューデントのt分布のテールを特徴付けるものであり、したがって、ガウス性の擾乱のパラメータにおける不確実性に対する感度を特徴付けるものである。いくつかの実施形態は、システムのモデルに対して作用する擾乱は、いくつかの要因に起因するという理解に基づいている。例えば、モデルのパラメータ自体とシステムへの入力との双方が不確実であり得る。そのような環境において、擾乱モデルは、いくつかの擾乱を一括りにまとめる。
したがって、1つの実施形態は、モデルの不確実性のレベルを推定し、モデル内の不確実性のレベルの関数として自由度の初期値を選択する。
自由度が増すにつれて、スチューデントのt分布は、ガウス分布に近似する。1つの実施形態は、この同化を回避することが有益であり得るという理解に基づいている。したがって、この実施形態は、スチューデントのt分布及びガウス分布が互いに十分に近いが、厳密には同じではないように、スチューデントのt分布のパラメータを制限する。例えば、1つの実施形態は、反復更新240aにおいて終了閾値が満たされた後、有限数の自由度を求める。
スチューデントのt分布へのガウス分布の当てはめ、及びその逆は、いくつかの方法において行うことができる。1つの実施形態は、モーメントマッチング及び類似度最適化のうちの一方又は組み合わせとして、第2のスチューデントのt分布への第2のガウス分布の当てはめ(250a)を求める。例えば、1つの実施形態は、自由度のアフィン関数を用いてスケールを除算することによって、スチューデントのt分布のスケールにガウス分布の分散をマッチングさせることによって、当てはめを求める。別の実施形態では、当てはめは、分布同士の間の差異を測定するコスト関数を最適化することによって行われる。コスト関数は、推定されたスチューデントのt分布とガウス分布との間の差異とするものを含む、いくつかの方法において選ぶことができる。
図3Aは、本発明の実施形態による、システム状態、第1のスチューデントのt分布のパラメータ、及び第2のスチューデントのt分布のパラメータを更新する方法240aの1つの反復のフローチャートを示している。方法は、運動モデルを用いて、システム状態の以前の推定、第1のスチューデントのt分布の以前の値、及び第2のスチューデントのt分布の以前の値に基づいて、システム状態、第1のスチューデントのt分布の現在の値、及び第2のスチューデントのt分布の現在の値を推定する(350a)。その後、方法は、システムの測定値を受信する(360a)。測定値365a及び測定モデル345aを用いて、方法は、推定された値355aに基づいて、システム状態の現在の推定、第1のスチューデントのt分布の現在の値、及び第2のスチューデントのt分布の現在の値を更新する(370a)。
時として、確率パラメータは、時間変動するものである。例えば、慣性検知及び/又はGPSが用いられるナビゲーションシステムにおいて、雑音統計値は、多くの場合、事前には求めることができない時間依存性を有する。他の例は、近似された非線形モデルにおける線形化誤差に起因した変動する雑音統計値であり、別の例は、環境依存センサ統計値である。
したがって、いくつかの実施形態は、更新すること240a、第2のガウス分布を当てはめること250a、制御入力を求めること260a、及び制御すること270aは、異なる時間ステップにおいて実行される必要がある場合があるという理解に基づいている。そのために、1つの実施形態は、異なる制御ステップについて、更新すること240a、第2のガウス分布を当てはめること250a、制御入力を求めること260a、及び制御すること270aを反復する。このように行うことにより、時間変動確率パラメータを求めることが可能になる。
いくつかの実施形態では、システム状態は、システム状態の運動のモデルに従って、時間的に動的に展開する。システムの運動のモデル及びシステムへの入力のモデルを慎重に選べば、システム状態の運動は、車両の状態によって完全に求められる確率パラメータに依存しない1つの部分、及びシステムへの雑音に依存する1つの不確実部分として記述することができる。いくつかの実施形態では、現在の時間ステップの状態に未来の時間ステップにおける状態を関係付けるシステムは、xk+1=A+wとして記述され、ここで、wは、プロセス雑音であり、xは、状態である。測定モデルの一例は、y=C+eであり、ここで、eは、測定雑音である。1つの実施形態では、モデルは、代わりに、xk+1=Ax+u+wとして記述され、ここで、uは、システムへの決定論的入力であり、及び/又は、測定モデルについても類似である。状態は、位置又は速度等の物理的状態、又は非物理的状態を記述することができる。モデルは、力及び質量バランス等の物理的モデル化から得ることもできるし、システム同定モデル及びブラックボックスモデルから得ることもできる。別の実施形態では、元のシステムモデルは、xk+1=f(x,u)+g(x,u)wであり、これは非線形であり、測定値についても類似である。一方で、非線形モデルは、ダイナミクスの数学的線形化を通して、又は、統計的線形技法等の他の技法によって、線形システムに変換することができる。
いくつかの実施形態では、状態及び確率パラメータは、確率的方法によって得られる。確率密度関数(PDF)の観点から、定義θ:={μ,Σ}とし、ここで、パラメータは、第1のガウス分布の平均及び分散であるものとすると、動的システムは、p(xk+1|x,u,θ)と記述することができる。いくつかの実施形態は、システム状態及び確率パラメータを求めることは、測定値並びに運動のモデル及び測定値のモデルを所与として、システム全体のPDFを求めることによって行うことができるという理解に依拠している。例えば、既知の平均及び未知の分散の事例において、PDFを求めるために、いくつかの実施形態は、PDFを、以下のように状態のPDF及びパラメータのPDFの積として求める。
Figure 0007019037000001
ここで、Stは、スチューデントのt分布であり、iWは、逆ウィシャート分布(inverse-Wishart distribution)である。
いくつかの実施形態は、各時間ステップにおける動的システムの状態を、KFと同様の解析表現によって更新することができるという理解に基づいている。
他の実施形態は、パラメータを、測定値と、測定値の状態推定値との差異によって更新することができるということを理解している。1つの実施形態は、測定値と、測定値の状態推定値との差異を、状態推定値の不確実性を用いて重み付けし、状態推定値の知識が不確実であることを更に考慮する。
例えば、1つの実施形態は、運動モデルを用いて推定することを、
Figure 0007019037000002
として求め、ここで、
Figure 0007019037000003
は、第1のスチューデントのt分布のプロセス雑音の推定されたスケールであり、Pk+1|kは、第2のスチューデントのt分布の推定されたスケールである。未知のプロセス雑音と測定雑音との間に依存関係がある場合、1つの実施形態は、代わりに、次の状態を推定するときの現在の測定値を考慮することによって運動モデルを推定することを実行する。
1つの実施形態では、測定値を用いて第2のスチューデントのt分布を更新することは、推定された状態の重み付けされた差異と、測定値と測定モデルとの間の差異との組み合わせによって行われ、ここで、重み付けは、第2のスチューデントのt分布のスケールと、第1のスチューデントのt分布の推定されたスケールとの組み合わせによって求められる。
別の実施形態では、第1のスチューデントのt分布を更新することは、推定された平均、及び、状態の推定された平均と更新された平均との重み付けされた差異の組み合わせとして平均を更新することによって行われる。代替的又は付加的に、更新することは、測定値と、測定モデルに基づく推定された測定値との間の差異として行われる。いくつかの実施形態は、測定値と、現在の推定されたスケールを用いた測定値の状態推定値との差異の組み合わせによってスケールを更新する。
他の実施形態は、パラメータを、測定値と、測定値の状態推定値との差異によって更新することができるということを理解している。1つの実施形態は、測定値と、測定値の状態推定値との差異を、状態推定値の不確実性を用いて重み付けし、状態推定値の知識が不確実であることを更に考慮する。
第2のスチューデントのt分布に関連した自由度を更新することにおいて、1つの実施形態は、以前の自由度と正の値との組み合わせとして自由度を更新して、自由度を増加させる。別の実施形態では、自由度の推定において、自由度は、1より小さい値を用いて拡縮されて、自由度が過度に高速に増大しないことが確実になる。このように行うことにより、スチューデントのt分布がガウス分布に過度に高速に収束しないことが確実になる。
別の実施形態では、第1のスチューデントのt分布に関連した自由度を更新することにおいて、1つの実施形態は、以前の自由度と正の値との組み合わせとして自由度を更新して、自由度を増加させる。別の実施形態では、自由度の推定において、自由度は、1より小さい値を用いて拡縮されて、自由度が過度に高速に増大しないことが確実になる。このように行うことにより、スチューデントのt分布がガウス分布に過度に高速に収束しないことが確実になる。
1つの実施形態では、スチューデントのt分布を反復更新することにおいて、及び、異なる制御ステップについてスチューデントのt分布を更新することにおいて、自由度は、各反復又は各制御ステップにおいて、第1のスチューデントのt分布及び第2のスチューデントのt分布の自由度のうちの最小のものとして選ばれる。このように行うことにより、自由度が有限に留まることが確実になり、このことにより、方法が確率パラメータにおける不確実性を考慮することが確実になる。
1つの実施形態は、システムの運動モデルに影響を与えるセンサ及びシステムの測定モデルに影響を与えるセンサは、多くの場合、時間変動するオフセット及びセンサ測定値の分散の知識の不確実性によって影響を受けるという理解に基づいている。別の実施形態は、決定論的部分及び確率論的部分の組み合わせによってセンサをモデル化することができ、確率論的部分は、未知の平均及び分散を有するガウス分布によってモデル化されるということに基づいている。種々の実施形態は、ガウス分布の平均及び分散を用いて、センサ測定値のオフセット及び分散をモデル化することができるということを理解している。したがって、1つの実施形態では、センサは、ガウス分布の平均及び分散を求めることによって較正される。
いくつかの実施形態は、第1のスチューデントのt分布の確率パラメータ及び車両の状態を同時に、すなわち、第2のスチューデントのt分布を同時に考慮することによって、確率パラメータを正確に推定することができるということを認める。1つの実施形態では、この数量は、数量の組み合わせが測定値ベクトルを説明する尤度に確率を割り当てることによって推定される。
例えば、図4Aは、車両が初期状態410を有するシナリオを示している。確率パラメータの1つのセット及びシステムへの入力について、車両は、運動411aに従い、最終的には、車両運動に影響を与える第1のスチューデントのt分布の確率パラメータにおける不確実性に起因した、結果としての不確実性431aを有する430aに至る。モデルの不確実性の分散により、車両の状態が最大でも或る特定のエリア420までのみ既知であり得ることがもたらされる。一方で、車両の最終状態430aは、エリア420内に良好に存在するので、確率パラメータと車両の初期状態とのこの特定の組み合わせには、良好な組み合わせである確率が高く与えられる。
図4Bは、運動モデルに影響を与える第1のスチューデントのt分布の確率パラメータの別のセットを有する同じ初期状態410を有する車両を示している。システムへの入力が同じである場合、車両410は、ここでは、運動411bに従い、車両が、最終的には、状態の第2のスチューデントのt分布の結果としての不確実性431bを有する状態430bに至る。一方で、車両の最終状態430bは、測定モデルに影響を与える測定雑音の或る特定のエリア内に存在していない。それゆえ、初期状態及び確率パラメータのこの特定の組み合わせには、良好な組み合わせである確率が低く割り当てられる。
図4Cは、本発明の種々の実施形態によって利用されるいくつかの原理に従って求められる異なる運動の概略図を示している。車両は、道路境界440cを有する道路上で現在の状態410にあることが推定され、ここで、現在の状態410の推定値は、本発明の他の実施形態に従って以前の反復中に求められている。線419c及び429cは、運動モデルに影響を与える確率パラメータの2つの異なるセットを用いて求められた2つの異なる運動であり、これらの線は、車両の2つの可能な状態420c及び430cに至る。グレーエリア411cは、測定モデルに影響を与える測定雑音の不確実性の推定値、すなわち、以前の反復中に求められた測定モデルに影響を与える推定された測定雑音から求められた、運動が生じる可能性が高い可能なエリアを示す。運動419cのみが不確実性領域の内側にある。それゆえ、運動429cの結果としてもたらされる状態420c、及び運動429cに関連付けられた確率パラメータには、良好な組み合わせである確率が低く与えられる。
図4Dに示すように、車両の運動は、車両の状態にわたるPDF412dの形態においてモデル化することができ、PDF412dの初期条件409dは、本発明の他の実施形態によって以前の反復中に求められている。本発明の実施形態のうちのいくつかでは、運動は、第1に、初期状態から最終状態までの運動の分布を求めることであって、異なる運動が、その特定の運動に属する運動モデルに影響を与える第1のスチューデントのt分布の確率パラメータに従って初期化されることと、第2に、第1のスチューデントのtの分布に従った異なる運動が、測定モデルにおいてモデル化されたセンサによって測定される運動にいかに合致するのかを求めることと、第3に、異なる運動が検知システムによって検知された真の運動といかに合致するのかを求めることと整合するパラメータを求めることとによって計算される。例証するために、図4Dは、プロセス雑音の2つの異なるパラメータがそれぞれ状態420c及び430cにまで至り、車両の運動のPDF412dがそれぞれの運動のいずれとも合致する状況を示している。一方で、異なる運動が、測定モデルに影響を与える測定雑音に依存する、測定値のPDF411cといかに合致するのかを求めた後、状態420cと合致しないPDF431dが確立される。いくつかの実施形態では、PDF431dは、以前の反復における推定値とセンサからの測定値との組み合わせによって求められる。本発明のいくつかの特定の実施形態では、結果として得られるPDF431dは、方法の別の反復の基礎を形成する。
いくつかの実施形態は、センサを用いた測定値は、システムの測定モデルに常に影響を与えるとは限らないが、付加的又は代替的に、センサ測定値がシステムの運動モデルにも影響を与えるという理解に基づいている。例えば、このような理解は、自動車応用において重要である可能性があり、自動車応用では、運転者又は車両のコントローラからの操舵入力が、車両の速度に影響を与える、車両の運動のモデルへの入力である。操舵入力は、厳密には既知ではなく、車両のハンドルに取り付けられた雑音を含むセンサによって測定される。加速度測定値等の慣性測定値が用いられる場合も同様に、車両の測定値のモデルは、運転者からの操舵入力を含む。それゆえ、操舵入力に関する情報は、車両の測定モデルに含まれる。さらに、センサの構造又はセンサにおける位置合わせ不良に起因して、センサは、多くの場合、時間変動オフセット及び測定値変動を引き起こす傾向にある。加えて、いくつかのセンサ較正を事前に、例えば車両内に搭載されるときに実行することができる一方で、加速度計等のいくつかのセンサは、事前に求められたものとは異なる実効雑音レベルを有する可能性がある。その理由は、センサ雑音が、温度、経年数、及び車両内でセンサが配置された場所等の複数の要因に依存するためである。例えば、センサが配置される位置が高所になるほど、センサ内の見かけの雑音に影響を与える、懸架システムからの擾乱が大きくなる。
図5Aは、センサ状態に依存して、システムのセンサの測定値510が典型的には時間とともにいかに変動するのかの図を示している。本明細書において用いられる場合、センサ状態は、システムの運動のセンサ読み値を示す少なくとも1つのパラメータを含む。センサ状態のパラメータの例は、較正誤差、オフセット、温度依存性、白色雑音強度、ランダムウォークバイアス、スケール誤差、利得誤差、及び分散のうちの1つ又は組み合わせを含む。センサ状態の時間変動のモデルは、一般に未知であり、内在的な要因及び外在的な要因の双方に依存し、センサ状態を規定する種々のパラメータが互いに依存する可能性がある。
例えば、車両の回転速度を測定するジャイロスコープセンサのセンサ状態は、環境の温度、センサ素子自体の温度、センサと車両との位置合わせ、スケール誤差、又はセンサの回路内の周期的挙動等の複数の要因に依存する。本明細書において用いられる場合、車両は、客車、バス、又はローバー等の任意のタイプの装輪車両とすることができる。本明細書において用いられる場合、センサは、車両の運動に関係付けられるエンティティを測定する任意のタイプの検知デバイスとすることができる。例えば、センサは、加速度計、ジャイロスコープ、全地球測位システム受信機、車輪角(wheel angle)を測定するセンサ、又はホイールエンコーダーとすることができる。多くの場合、センサ読み値510は、一定部分520と、低速時間変動部分540と、車両の運動に関連して変動する部分530とからなる。
図5Bは、車両のセンサのセンサオフセットが、典型的には、センサの配置とともにいかに変動するのかの図を示している。図5Bは、ハンドル510bと車輪530bとの間の相互作用の構造の概略図を示している。ステアリングコラムは、運転者がハンドルを操舵するのに役立つ電動パワーステアリングシステム520bを装備している。また、ステアリングコラム上には、車輪の角度を測定するセンサがある。センサがハンドルに近接して配置されるのか(511b)又は車輪に近接して配置され、したがって直接車輪角度を測定するのか(521b)に応じて、ハンドル510bと車輪530bとの間の機械的構造は動的に依存し、ギヤボックス及び他の機械部品を伴うので、異なるオフセットが得られる。
システム測定値の分散も、時間変動するものであり、また、センサがシステム内で配置される場所に大きく依存する。図5Cは、車両のセンサのセンサ分散が、典型的には、センサの配置とともにいかに変動するのかの図を示している。例えば、加速度計510cを車両の質量中心520cに対してより高所に配置することにより、加速度計が路面530cの起伏又は車両内の懸架システム540c等の外部要因に起因して変動も検知するようになる。これにより、センサが、内在的なセンサ変動とは異なる実効的な分散を有するようになり、この分散は、考慮されていない場合推定誤差をもたらす。
したがって、1つの実施形態は、システムの運動モデルに影響を与えるセンサ及びシステムの測定モデルに影響を与えるセンサは、多くの場合、時間変動するオフセット及びセンサ測定値の分散の知識の不確実性によって影響を受けるという理解に基づいている。別の実施形態は、決定論的部分及び確率論的部分の組み合わせによってセンサをモデル化することができ、確率論的部分は、未知の平均及び分散を有するガウス分布によってモデル化されるということに基づいている。種々の実施形態は、ガウス分布の平均及び分散を用いて、センサ測定値のオフセット及び分散をモデル化することができるということを理解している。したがって、1つの実施形態では、センサは、ガウス分布の平均及び分散を求めることによって較正される。
センサ状態の時間展開は未知であるので、したがって、センサ状態の運動のいずれのモデルも未知であり、検証することができない。
そのために、1つの実施形態は、センサ状態の運動の時間展開が未知であるが、この未知の部分は典型的には低速に時間変動するので、センサ状態は、代わりに、運動モデル及び付加的又は代替的には測定モデルに作用する確率的擾乱(stochastic disturbances)として扱うべきであるということを認識している。すなわち、センサ状態を明示的に求めるのではなく、センサ状態の分布が代わりに求められ、したがって、センサ状態の運動モデルの必要性が回避される。
本発明の1つの実施形態は、センサ状態を求めることは複雑でありモデルにとっては追跡不可能である効果に依存するものの、センサの挙動は、センサのオフセット及びセンサの分散を表すパラメータにおいて簡潔に記述することができるということを理解している。例えば、図5Aに戻ると、一定部分510及び低速時間変動部分540は、センサのオフセットとみなすことができ、一方で、部分530は、センサのセンサ雑音から到来する追加擾乱を有するシステムの運動に依存する。
センサオフセットの知識は、制御、例えば、車両のエレクトロニックスタビリティ(electronic stability:横滑り防止)制御の際に有用であり、この場合、横加速度、進行方向速度、及び車輪の操舵角が車両を制御するのに用いられる。オフセットの知識がない場合、車両のコントローラは、誤りを含む車両モデルに基づいて車両への制御入力を決定することになる。
センサ測定値の分散の知識も、制御の際に有用である。例えば、分散は、センサ読み値をどの程度信頼するのかを判断し、センサ測定値の変動の大きさに関連して制御入力を調整するのに用いることができる。
そのために、いくつかの実施形態は、センサ内のオフセットを確率分布の統計的平均値として含めることができ、確率分布はセンサ状態が記述される確率的擾乱を規定し、センサ雑音は、確率分布の平均値周囲のセンサ測定値の変動として含めることができるという理解に基づいている。更に他の実施形態は、確率分布としてのセンサのモデル化を、システムの運動モデル及びシステム状態の測定モデルにおいて用いることができるという理解に基づいている。他の実施形態では、センサ状態の平均及び分散は、スチューデントのt分布に変換されて、確率パラメータの不確実性が考慮される。
図6aは、本発明の1つの実施形態による、システム状態、例えば、システムの速度及び進行方向速度と、システムのセンサ状態とを同時に推定することによってシステムを制御する方法のフローチャートを示している。1つの実施形態は、通常であれば決定論的擾乱とみなされる、少なくとも1つのセンサの未知のセンサ状態を、車両の運動のモデルに作用する確率的擾乱とみなすことができるという認識に基づいている。図4Dによれば、確率的擾乱の性質により、システムが、異なる可能な運動、したがって異なる可能な状態を有するようになる。例えば、運動モデルへの入力は、車両の雑音を含むセンサによって測定される。
そのために、この実施形態は、センサ状態と、パーティクル611aを有するシステム状態とを表す(610a)。パーティクルは、システム状態を含み、これは、測定された状態とすることもできるし、同時推定の以前の反復中に求められた状態とすることもできる。付加的又は代替的に、パーティクルは、システム状態の平均、自由度、及びスケール、並びに、センサ状態の実現可能空間を規定する確率的擾乱の平均、オフセット、及びスケール、センサの雑音を含む。センサ状態を確率論的に、すなわち、平均、自由度、及びスケールを用いて表すことにより、確率的擾乱を、車両の運動に対するスチューデントのt分布とみなすことが可能になる。そのために、この実施形態は、センサ特性のパラメータ、平均、自由度、及びスケールによって規定された運動モデル609aへの入力として、センサ状態の実現可能空間の平均を用いるとともに、同時推定においてセンサ状態の平均を用いる。他の実施形態では、測定値のセンサ状態が運動モデルに影響を与える場合、1つの実施形態は、推定された状態と測定された状態との加重差と組み合わせて、センサ状態の実現可能空間の平均を用いる。
図6Bは、センサ状態の実現可能空間600bを規定する確率分布関数640bを示すグラフを示している。関数640bの形状は、事前に求めることができる。例えば、センサ状態の分布がガウス分布である場合、分布640bの形状は、「ガウスハット」形状である。形状が固定される場合、平均610b及び分散630bが分布640b、及びセンサ状態を含めることができる実現可能空間600bを規定する。いくつかの実施形態では、実現可能空間600bは、平均、自由度、及びスケールによって規定される。
分布640bによれば、値620bが正しいセンサ状態である確率は、650bの確率よりも高い。このような表現により、センサ状態の平均及び分散を更新して(660b)、センサ状態の更新された実現可能空間を規定する更新された分布645bを生成することが可能になる。この実施形態は、センサ状態の平均及び分散の更新は、後続する反復において用いられるセンサ状態のパラメータの値に影響し、これはなぜならば、このようなパラメータは、更新された分布の基礎を形成するためであるという観察に基づいている。
そのために、方法は、センサ状態の平均、スケール、及び自由度を含むパーティクルを更新して(620a)、更新されたパーティクル621aを生成する。例えば、この実施形態は、パーティクルの実現可能空間の確率パラメータを用いて推定された状態と、センサ状態を含むことができる測定モデル608aに従って車両状態の測定値から求められた、測定されたセンサ状態619aの平均及びスケールとの間の差異を用いて、パーティクルの平均及びスケールを反復して更新する。
次に、方法は、センサ状態の実現可能空間のスチューデントのt分布に、センサ状態の実現可能空間を表すガウス分布を当てはめて(630a)、センサ状態の平均及び分散631aを生成する。
1つの実施態様では、方法は、測定される状態を中心とした測定モデルの確率分布を用いて、車両状態及びセンサ状態の確率分布を求める。測定モデルの確率分布は、事前に、例えば、以前の時点の間に求められたセンサ状態の値を用いて求めることができる。次に、方法は、車両状態及びセンサ状態の確率分布上への、パーティクル内の平均の配置に従って真のセンサ状態を表すパーティクルの確率を求め、真のセンサ状態をより良好に表すようにパーティクルを調整する。このような確率及び調整は、出力631aを求める際に関数629aによって用いられる。
図6Cは、パーティクルを反復して更新する1つの実施形態による、パーティクルを更新する方法の1つの反復620aのブロック図を示している。方法は、車両のプロセッサを用いて実施することができる。方法は、車両の運動のモデルにおいて用いられることになる可能なパラメータの実現可能空間を求めて(610c)、確率パラメータ615c、すなわち、平均、スケール、及び自由度を含むスチューデントのt分布を生成する。車両の運動のモデル605cは、運動モデルに影響を与えるセンサ状態における不確実性に起因した車両の運動に対する不確実性を含む。方法は、車両の運動のモデル605c及びシステムへの入力617cを用いて、車両の運動に影響を与えるスチューデントのt分布に起因して生じる可能な状態625cを推定する(620c)。
次に、方法は、状態を測定する(630c)。例えば、方法は、センサ状態に依存するような車両状態を測定する。方法は、測定値を、車両状態及び少なくとも1つのセンサのセンサ状態を関係付ける測定値のモデルにマッピングして、測定値、車両状態、及びセンサ状態の間の関係635cを生成する。方法は、測定モデル635cに従って車両の測定された状態を結果としてもたらす、パーティクルについてセンサ状態の統計的平均としてセンサのオフセットを求める(640c)。方法は、推定された状態と測定値との間の差異として、付加的又は代替的に、推定された状態と、未知のセンサ状態が存在しないと仮定した状態をもたらす運動モデルの決定論的部分との間の差として、センサ状態からもたらされる測定されたセンサ状態のスケールも求める(640c)。センサ状態の求められた平均及びスケール645cは、測定された車両状態を結果としてもたらす測定されたセンサ状態の平均及び以前の反復中に求められた平均を用いたパーティクルにおけるセンサ状態の統計的平均の組み合わせとしてオフセットを更新するのに用いられる(650c)。同様に、方法は、測定されたセンサ状態のスケールと、以前の反復中に求められたスケールとの組み合わせを用いて、パーティクルにおけるセンサ状態のスケールを更新する(650c)。
1つの実施形態では、測定値のサブセットが既知の分散及びオフセット、すなわち、既知のパラメータを有し、これらは、事前に又は何らかの他の方法によって求められている。その事例において、既知の分散及びオフセットを有する測定値を用いて、未知のパラメータを有するセンサのセンサ特性の平均及びスケールの推定値を改善することができ、これは、既知のパラメータを有するセンサを用いて車両状態の部分を推定することによって行われる。1つの実施形態では、既知のパラメータを有するセンサの平均及び分散は、センサ状態を求める際に用いられる前に、他の実施形態に従って平均、自由度、及びスケールに変換される。
図7Aは、制御システム699の全体ブロック図を示している。メモリ及び/又はシステムの種々のタイプのセンサに動作的に接続された1つ又はいくつかのプロセッサを用いて、制御システム699の異なるコンポーネントを実装することができる。制御システム699は、システム700の内部にあるものとすることができ、制御システム699の異なるコンポーネントの実装は、一般に、システムのタイプに依存する。
制御システム699は、システムの少なくともいくつかの部分の運動に関する情報を測定する検知システム730を備えることができる。検知システム730は、外部ソースから検知情報729を受信することもできる。
制御システム699は、センサ状態、例えば730内のセンサの状態のパラメータを求めるセンサ状態推定器740も含む。本発明のいくつかの実施形態では、センサ状態推定器は、以前の反復中に求められたシステム状態及びセンサ状態の確率パラメータから、システム状態及びセンサ状態を表す確率パラメータを反復して求める。
センサ状態推定器740は、検知システムからの情報731を用いる。センサ状態推定器740は、システム制御ユニット760からシステム運動に関する情報761も受信することができる。情報は、システム状態を含むことができ、マシンに直接又はリモートに接続されたハードウェア又はソフトウェアのいずれかから受信される。
例えば、センサ状態推定器は、オフセット値、オフセットの確実性レベル、及び測定値の雑音の分散、又はこれらの組み合わせを含むセンサ状態741を出力することができる。制御システム699は、センサ状態情報741を用いるシステムコントローラ760も備える。例えば、システムが路上走行車両である場合、1つの実施形態では、オフセットは、車両のダイナミクスのモデルを利用する先進運転支援システム(ADAS:advanced driver-assistance system)において用いられ、これは、センサのオフセットの状態に依存する。このような事例において、車両コントローラ760は、スタンドアローンコンポーネント、又は自律運転機能を可能にする車両コントローラの組み合わせを含むことができる。センサ状態を記述するオフセット及び分散を、車両の推定器790、例えば状態推定器への入力として用いることができる。
図7Bは、本発明の1つの実施形態による、センサ状態推定器740の全体構造を示している。センサ状態推定器740は、センサ状態推定器740のモジュールを実行する少なくとも1つのプロセッサ770を備える。プロセッサ770は、状態及びパラメータの統計値781並びにシステム情報782、例えば運動モデル及び測定値モデルを記憶するメモリ780に接続され(771)、運動モデルは、運動の決定論的コンポーネント及び運動の確率論的コンポーネントの組み合わせを含み、運動の決定論的コンポーネントは、センサ状態に依存せず、時間の関数としてシステムの運動を規定し、運動の確率論的コンポーネントは、センサ状態を含み、システムの運動の擾乱を規定し、車両の測定モデルは、センサ状態に依存しない測定モデルの決定論的コンポーネントと、センサ状態を含む測定モデルの確率論的コンポーネントとの組み合わせを含む。メモリ780は、限定するものではないが、センサ状態の値、システムの各計算された状態の値、及びシステムの各状態に至る運動を含む推定器の内部情報も記憶する(783)。いくつかの実施形態では、システムについての情報は、システム761及び検知731から受信された情報に基づいて更新される(771)。
本発明の上記で説明した実施形態は、多数の方法のうちの任意のもので実施することができる。例えば、実施形態は、ハードウェア、ソフトウェア又はそれらの組み合わせを用いて実施することができる。ソフトウェアで実施される場合、ソフトウェアコードは、単一のコンピューターに設けられるのか又は複数のコンピューター間に分散されるのかにかかわらず、任意の適したプロセッサ又はプロセッサの集合体において実行することができる。そのようなプロセッサは、1つ以上のプロセッサを集積回路部品に有する集積回路として実装することができる。ただし、プロセッサは、任意の適したフォーマットの回路類を用いて実装することができる。
また、本明細書において略述された様々な方法又はプロセスは、様々なオペレーティングシステム又はプラットフォームのうちの任意の1つを用いる1つ以上のプロセッサ上で実行可能なソフトウェアとしてコード化することができる。加えて、そのようなソフトウェアは、複数の適したプログラミング言語及び/又はプログラミングツール若しくはスクリプティングツールのうちの任意のものを用いて記述することができ、実行可能機械語コード、又はフレームワーク若しくは仮想機械上で実行される中間コードとしてコンパイルすることもできる。通常、プログラムモジュールの機能は、様々な実施形態において所望に応じて組み合わせることもできるし、分散させることもできる。
さらに、本発明の実施形態は、方法として具現化することができ、この方法の一例が提供されている。この方法の一部として実行される動作は、任意の適した方法で順序付けることができる。したがって、例示したものと異なる順序で動作が実行される実施形態を構築することができ、この順序は、いくつかの動作が例示の実施形態では順次的な動作として示されていても、それらの動作を同時に実行することを含むことができる。

Claims (19)

  1. システムを制御する装置であって、
    プロセス雑音を受ける前記システムの運動モデルと、測定雑音を受ける前記システムの測定モデルとを含む前記システムのモデルを記憶するメモリであって、前記プロセス雑音及び前記測定雑音のうちの一方又は組み合わせは、未知の確率パラメータを有する前記システムの前記モデルの不確実性を形成するようになっており、前記システムの前記モデルの不確実性は、未知の確率パラメータを有する前記システムの状態不確実性を引き起こすものである、メモリと、
    信号を測定して前記システムの状態を示す測定値のシーケンスを生成するセンサと、
    プロセッサであって、
    前記運動モデル、前記測定モデル、及び前記システムの状態の前記測定値のうちの少なくとも1つ又は組み合わせを用いて、前記モデルの不確実性を表す第1のスチューデントのt分布及び前記システムの状態不確実性を表す第2のスチューデントのt分布を推定することであって、前記推定は、終了条件が満たされるまで反復して実行されることと、
    前記第2のスチューデントのt分布に、前記状態不確実性を表すガウス分布を当てはめることによって、前記ガウス分布の平均及び分散を生成することと、
    を行う、プロセッサと、
    コントローラであって、
    前記ガウス分布によって表される状態不確実性を有する前記システムの前記モデルを用いて、前記システムへの制御入力を求めることと、
    前記制御入力に従って前記システムを制御することと、
    を行う、コントローラと、
    を備え、
    前記第1のスチューデントのt分布及び前記第2のスチューデントのt分布の同時推定の反復を実行する前記プロセッサは、
    前記運動モデルを用いて、前記システムの状態の以前の推定、前記第1のスチューデントのt分布の以前の値、及び前記第2のスチューデントのt分布の以前の値に基づいて、前記システムの状態、前記第1のスチューデントのt分布の現在の値、及び前記第2のスチューデントのt分布の現在の値を推定し、
    前記測定値の現在の値を受信することに応答して、前記測定値及び前記測定モデルを用いて、前記システムの状態の前記現在の推定、前記第1のスチューデントのt分布の前記現在の値、及び前記第2のスチューデントのt分布の前記現在の値を更新する、装置。
  2. 前記第1のスチューデントのt分布の初期値及び前記第2のスチューデントのt分布の初期値を求める前記プロセッサは、
    前記モデルの不確実性を表すガウス分布の平均及び分散の初期推定値を求め、
    前記モデルの不確実性を表す前記ガウス分布に前記第1のスチューデントのt分布を当てはめて、前記第1のスチューデントのt分布の平均、スケール、及び自由度の初期値を生成し、
    前記第1のスチューデントのt分布の平均、スケール、及び自由度の初期値に基づいて、前記第2のスチューデントのt分布の平均、スケール、及び自由度の初期値を推定する、
    ように構成される、請求項1に記載の装置。
  3. 前記第2のスチューデントのt分布の前記初期値は、前記第1のスチューデントのt分布の前記初期値に等しいが、前記終了条件を満たすと、前記第2のスチューデントのt分布の最終値は、前記第1のスチューデントのt分布の最終値と異なる、請求項2に記載の装置。
  4. 前記モデルの不確実性を表すガウス分布の平均の初期推定値は、前記測定値の履歴における平均値を用いて求められ、前記モデルの不確実性を表すガウス分布の分散の初期推定値は、或る期間に渡って前記センサによって測定された前記測定値の分散を用いて求められる、請求項2に記載の装置。
  5. 前記プロセッサは、
    前記第1のスチューデントのt分布の自由度の前記初期値を求め、なお、自由度の前記初期値は、システムの状態の次元よりも大きい正の有限値であり、
    前記求められた自由度の初期値について、前記第1のスチューデントのt分布の平均及びスケールの前記初期値を求める、
    ように構成される、請求項2に記載の装置。
  6. 前記プロセッサは、
    前記モデルの不確実性のレベルを推定し、
    前記モデルの不確実性のレベルの関数として、自由度の前記初期値を選択する、
    ように更に構成される、請求項5に記載の装置。
  7. 前記第2のスチューデントのt分布の自由度は、前記終了条件が満たされた後、有限であり、前記プロセッサは、モーメントマッチング及び類似度最適化のうちの一方又は組み合わせを用いて、前記第2のスチューデントのt分布に第2のガウス分布を当てはめることによって、第2のガウス分布の平均及び分散を生成する、請求項1に記載の装置。
  8. 前記有限の自由度は、前記第1のスチューデントのt分布及び前記第2のスチューデントのt分布のうちの最小の自由度として選択される、請求項7に記載の装置。
  9. 自由度は、有限数に収束する、請求項7に記載の装置。
  10. 前記プロセッサは、制御ステップごとに、前記第1のスチューデントのt分布及び前記第2のスチューデントのt分布、並びに前記状態不確実性を表す前記ガウス分布を更新する、請求項1に記載の装置。
  11. 前記制御されるシステムは、車両であり、前記装置は、前記ガウス分布によって表される前記車両の前記状態不確実性に基づいて前記車両を制御するようになっている、請求項1に記載の装置。
  12. 前記システムの前記運動モデル及び前記システムの前記測定モデルは、前記車両の運動における前記センサの較正の状態の不確実性によって引き起こされる擾乱を受け、前記プロセッサは、
    確率分布によって規定される前記センサの較正の前記状態の実現可能空間をサンプリングして、前記センサの較正のサンプリングされた状態のセットを生成し、
    較正のサンプリングされた状態ごとに、前記運動モデルを用いて、前記車両の現在の状態の推定値を推定し、前記車両の推定された状態のセットを生成し、
    前記車両の推定された状態ごとに、前記測定モデルに前記車両の前記測定値及び前記推定された状態を挿入することによって、前記センサの較正の推定された状態を推定し、
    較正の前記サンプリングされた状態と、較正の対応する推定された状態との間の差異に基づいて求められた重みを用いて重み付けされた較正の前記サンプリングされた状態の関数に基づいて、前記メモリに記憶された前記センサの較正の前記状態の前記確率分布の平均及び分散を更新し、
    前記センサの較正の前記状態の前記更新された確率分布を用いて前記ガウス分布を求める、
    ように構成される、請求項11に記載の装置。
  13. 前記センサの較正の前記状態の前記更新された確率分布の平均は、前記センサのオフセットであり、前記センサの較正の前記状態の前記更新された確率分布の分散は、前記センサの分散である、請求項12に記載の装置。
  14. システムを制御する方法であって、前記方法は、前記方法を実施する記憶された命令に結合されたプロセッサを使用し、前記命令は、前記プロセッサによって実行されると、前記方法のステップを実行し、前記ステップは、
    プロセス雑音を受ける前記システムの運動モデルと、測定雑音を受ける前記システムの測定モデルとを含む前記システムのモデルを索出するステップであって、前記プロセス雑音及び前記測定雑音のうちの一方又は組み合わせは、未知の確率パラメータを有する前記システムの前記モデルの不確実性を形成するようになっており、前記システムの前記モデルの不確実性は、未知の確率パラメータを有する前記システムの状態不確実性を引き起こすものである、ステップと、
    前記システムの状態を示す測定値のシーケンスを受信するステップと、
    前記運動モデル、前記測定モデル、及び前記システムの状態の前記測定値のうちの少なくとも1つ又は組み合わせを用いて、前記モデルの不確実性を表す第1のスチューデントのt分布及び前記システムの前記状態不確実性を表す第2のスチューデントのt分布を推定するステップであって、前記推定は、終了条件が満たされるまで反復して実行される、ステップと、
    前記第2のスチューデントのt分布に、記状態不確実性を表すガウス分布を当てはめることによって、前記ガウス分布の平均及び分散を生成するステップと、
    前記ガウス分布によって表される状態不確実性を有する前記システムの前記モデルを用いて、前記システムへの制御入力を求めるステップと、
    前記制御入力に従って前記システムを制御するステップと、
    を含み、
    前記方法には、前記第1のスチューデントのt分布及び前記第2のスチューデントのt分布の同時推定の反復を実行するステップが伴い、前記実行するステップは、
    前記運動モデルを用いて、前記システムの状態の以前の推定、前記第1のスチューデントのt分布の以前の値、及び前記第2のスチューデントのt分布の以前の値に基づいて、前記システムの状態、前記第1のスチューデントのt分布の現在の値、及び前記第2のスチューデントのt分布の現在の値を推定するステップと、
    前記測定値の現在の値を受信することに応答して、前記測定値及び前記測定モデルを用いて、前記システムの状態の前記現在の推定、前記第1のスチューデントのt分布の前記現在の値、及び前記第2のスチューデントのt分布の前記現在の値を更新するステップと、
    を含む、方法。
  15. 前記モデルの不確実性を表すガウス分布の平均及び分散の初期推定値を求めるステップと、
    前記モデルの不確実性を表す前記ガウス分布に前記第1のスチューデントのt分布を当てはめて、前記第1のスチューデントのt分布の平均、スケール、及び自由度の初期値を生成するステップと、
    前記第1のスチューデントのt分布の平均、スケール、及び自由度の初期値に基づいて、前記第2のスチューデントのt分布の平均、スケール、及び自由度の初期値を推定するステップと、
    を更に含む、請求項14に記載の方法。
  16. 前記第2のスチューデントのt分布の前記初期値は、前記第1のスチューデントのt分布の前記初期値に等しいが、前記終了条件を満たすと、前記第2のスチューデントのt分布の最終値は、前記第1のスチューデントのt分布の最終値と異なる、請求項15に記載の方法。
  17. 前記制御されるシステムは、車両であり、前記システムを制御する装置は、前記ガウス分布によって表される前記車両の前記状態不確実性に基づいて前記車両を制御するようになっている、請求項14に記載の方法。
  18. 前記システムの前記運動モデル及び前記システムの前記測定モデルは、前記車両の運動におけるセンサの較正の状態の不確実性によって引き起こされる擾乱を受け、前記方法は、
    確率分布によって規定される前記センサの較正の前記状態の実現可能空間をサンプリングして、前記センサの較正のサンプリングされた状態のセットを生成するステップと、
    較正のサンプリングされた状態ごとに、前記運動モデルを用いて、前記車両の現在の状態の推定値を推定し、前記車両の推定された状態のセットを生成するステップと、
    前記車両の推定された状態ごとに、前記測定モデルに前記車両の前記測定値及び前記推定された状態を挿入することによって、前記センサの較正の推定された状態を推定するステップと、
    較正の前記サンプリングされた状態と、較正の対応する推定された状態との間の差異に基づいて求められた重みを用いて重み付けされた較正の前記サンプリングされた状態の関数に基づいて、メモリに記憶された前記センサの較正の前記状態の前記確率分布の平均及び分散を更新するステップと、
    前記センサの較正の前記状態の前記更新された確率分布を用いて前記ガウス分布を求めるステップと、
    を更に含む、請求項17に記載の方法。
  19. 方法を実行するためにプロセッサによって実行可能なプログラムを具現化した非一時的コンピューター可読記憶媒体であって、前記方法は、
    プロセス雑音を受けるシステムの運動モデルと、測定雑音を受ける前記システムの測定モデルとを含む前記システムのモデルを索出するステップであって、前記プロセス雑音及び前記測定雑音のうちの一方又は組み合わせは、未知の確率パラメータを有する前記システムの前記モデルの不確実性を形成するようになっており、前記システムの前記モデルの不確実性は、未知の確率パラメータを有する前記システムの状態不確実性を引き起こすものであるステップと、
    前記システムの状態を示す測定値のシーケンスを受信するステップと、
    前記運動モデル、前記測定モデル、及び前記システムの状態の前記測定値のうちの少なくとも1つ又は組み合わせを用いて、前記モデルの不確実性を表す第1のスチューデントのt分布及び前記システムの前記状態不確実性を表す第2のスチューデントのt分布を推定するステップであって、前記推定は、終了条件が満たされるまで反復して実行されるステップと、
    前記第2のスチューデントのt分布に、記状態不確実性を表すガウス分布を当てはめることによって、前記ガウス分布の平均及び分散を生成するステップと、
    前記ガウス分布によって表される状態不確実性を有する前記システムの前記モデルを用いて、前記システムへの制御入力を求めるステップと、
    前記制御入力に従って前記システムを制御するステップと、
    を含み、
    前記方法には、前記第1のスチューデントのt分布及び前記第2のスチューデントのt分布の同時推定の反復を実行するステップが伴い、前記実行するステップは、
    前記運動モデルを用いて、前記システムの状態の以前の推定、前記第1のスチューデントのt分布の以前の値、及び前記第2のスチューデントのt分布の以前の値に基づいて、前記システムの状態、前記第1のスチューデントのt分布の現在の値、及び前記第2のスチューデントのt分布の現在の値を推定するステップと、
    前記測定値の現在の値を受信するステップに応答して、前記測定値及び前記測定モデルを用いて、前記システムの状態の前記現在の推定、前記第1のスチューデントのt分布の前記現在の値、及び前記第2のスチューデントのt分布の前記現在の値を更新するステップと、
    を含む、非一時的コンピューター可読記憶媒体。
JP2020518554A 2017-12-18 2018-05-23 システムを制御する装置及び方法 Active JP7019037B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/845,134 US11501193B2 (en) 2017-12-18 2017-12-18 Model-based control under uncertainty
US15/845,134 2017-12-18
PCT/JP2018/020626 WO2019123682A1 (en) 2017-12-18 2018-05-23 Apparatus and method for controlling system

Publications (3)

Publication Number Publication Date
JP2020535562A JP2020535562A (ja) 2020-12-03
JP2020535562A5 JP2020535562A5 (ja) 2021-01-21
JP7019037B2 true JP7019037B2 (ja) 2022-02-14

Family

ID=62904540

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020518554A Active JP7019037B2 (ja) 2017-12-18 2018-05-23 システムを制御する装置及び方法

Country Status (5)

Country Link
US (1) US11501193B2 (ja)
EP (1) EP3526646B1 (ja)
JP (1) JP7019037B2 (ja)
CN (1) CN111480126B (ja)
WO (1) WO2019123682A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102017110548A1 (de) * 2017-05-15 2018-11-15 Trw Automotive Gmbh Verfahren zum Detektieren von sich am Lenkrad befindlichen Händen
US11383727B2 (en) * 2018-03-19 2022-07-12 Qualcomm Incorporated Vehicle operation based on vehicular measurement data processing
WO2020188120A1 (en) * 2019-03-21 2020-09-24 Five AI Limited Depth extraction
TW202125343A (zh) * 2019-12-30 2021-07-01 瑞昱半導體股份有限公司 時間序列預測方法及相關的時間序列預測電路
CN111262556B (zh) * 2020-01-16 2023-09-08 自然资源部第二海洋研究所 一种同时估计未知高斯测量噪声统计量的多目标跟踪方法
US11753023B2 (en) * 2020-01-19 2023-09-12 Mitsubishi Electric Research Laboratories, Inc. Adaptive control of autonomous or semi-autonomous vehicle
CN111251301B (zh) * 2020-02-27 2022-09-16 云南电网有限责任公司电力科学研究院 输电线路检修机器人操作臂的运动规划方法
US11327449B2 (en) * 2020-05-29 2022-05-10 Mitsubishi Electric Research Laboratories, Inc. Nonlinear optimization for stochastic predictive vehicle control
CN111780785A (zh) * 2020-07-20 2020-10-16 武汉中海庭数据技术有限公司 车载memsimu零偏自标定方法及系统
CN112990256A (zh) * 2020-12-29 2021-06-18 北京电子工程总体研究所 多传感器噪声计算方法及信息融合方法、存储介质及设备
US11679759B2 (en) * 2021-01-27 2023-06-20 Mitsubishi Electric Research Laboratories, Inc. System and method for adaptive control of vehicle dynamics
US11932262B2 (en) * 2021-07-01 2024-03-19 Mitsubishi Electric Research Laboratories, Inc. Stochastic nonlinear predictive controller and method based on uncertainty propagation by Gaussian-assumed density filters
CN113591020B (zh) * 2021-07-23 2024-03-01 江南大学 一种基于轴对称盒空间滤波的非线性系统状态估计方法
US20230278197A1 (en) * 2022-03-01 2023-09-07 Mitsubishi Electric Research Laboratories, Inc. System and Method for Robust Robotic Manipulation using Chance Constrained Optimization
US20230288886A1 (en) * 2022-03-12 2023-09-14 Mitsubishi Electric Research Laboratories, Inc. Model-Based Control with Uncertain Motion Model
US20240004085A1 (en) * 2022-06-30 2024-01-04 Mitsubishi Electric Research Laboratories, Inc. System and Method for Controlling a Device using a Compound Probabilistic Filter

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8583470B1 (en) 2010-11-02 2013-11-12 Mindjet Llc Participant utility extraction for prediction market based on region of difference between probability functions
JP2019513613A (ja) 2016-07-13 2019-05-30 三菱電機株式会社 車両を制御する方法、システム、及び非一時的コンピューター可読メモリ

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6738682B1 (en) 2001-09-13 2004-05-18 Advances Micro Devices, Inc. Method and apparatus for scheduling based on state estimation uncertainties
US7209938B2 (en) 2001-12-17 2007-04-24 Lockheed Martin Corporation Kalman filter with adaptive measurement variance estimator
US20050114023A1 (en) * 2003-11-26 2005-05-26 Williamson Walton R. Fault-tolerant system, apparatus and method
US7180443B1 (en) 2005-03-16 2007-02-20 Lockheed Martin Corporation Reduced state estimator for systems with physically bounded parameters
US20080159074A1 (en) * 2006-12-27 2008-07-03 Magnitude Spas System and method for quality control of noisy data
EP2273327A1 (en) 2009-06-24 2011-01-12 ABB Research Ltd. Estimating initial states of a system model for controlling an industrial process
CN103020348B (zh) 2012-12-07 2015-06-03 上海电机学院 利用多个传感器对动态系统进行跟踪的方法及装置
US10026015B2 (en) 2014-04-01 2018-07-17 Case Western Reserve University Imaging control to facilitate tracking objects and/or perform real-time intervention
US10281897B2 (en) * 2015-06-02 2019-05-07 Mitsubishi Electric Research Laboratories, Inc. Model predictive control with uncertainties
US10963540B2 (en) * 2016-06-02 2021-03-30 Brown University Physics informed learning machine
CN106355003B (zh) * 2016-08-26 2018-01-30 中国地质大学(武汉) 基于t分布的马尔科夫链蒙特卡洛自动历史拟合方法及系统
CN106683122B (zh) * 2016-12-16 2020-02-04 华南理工大学 一种基于高斯混合模型和变分贝叶斯的粒子滤波方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8583470B1 (en) 2010-11-02 2013-11-12 Mindjet Llc Participant utility extraction for prediction market based on region of difference between probability functions
JP2019513613A (ja) 2016-07-13 2019-05-30 三菱電機株式会社 車両を制御する方法、システム、及び非一時的コンピューター可読メモリ

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Yulong HUANG ET AL,A Novel Robust Student's t-Based Kalman Filter,IEEE Transactions on Aerospace and Electronic Systems,米国,IEEE,2017年06月,Vol. 53, Issue 3,p. 1545-1554

Also Published As

Publication number Publication date
US20190188592A1 (en) 2019-06-20
WO2019123682A1 (en) 2019-06-27
US11501193B2 (en) 2022-11-15
EP3526646B1 (en) 2021-07-21
CN111480126A (zh) 2020-07-31
JP2020535562A (ja) 2020-12-03
EP3526646A1 (en) 2019-08-21
CN111480126B (zh) 2022-05-31

Similar Documents

Publication Publication Date Title
JP7019037B2 (ja) システムを制御する装置及び方法
CN111527382B (zh) 用于控制车辆的系统及方法
JP6576578B2 (ja) 車両を制御する方法、システム、及び非一時的コンピューター可読メモリ
US11254315B2 (en) Friction adaptive vehicle control
EP2028504B1 (en) Method and device for calibrating a magnetic sensor
JP2023546540A (ja) 不確実システムの確率的モデル予測制御
Hashlamon A new adaptive extended Kalman filter for a class of nonlinear systems
US11827293B2 (en) Real-time estimation of achievable angle, velocity, and acceleration capabilities of steering actuator
KR101390776B1 (ko) 퍼지 확장 칼만 필터를 이용한 위치인식 장치, 방법 및 이동로봇
US11474486B2 (en) Model-based control with uncertain motion model
US11679759B2 (en) System and method for adaptive control of vehicle dynamics
CN116893658A (zh) 控制机器人设备的方法、控制装置、计算机程序和介质
JP7278502B2 (ja) タイヤの摩擦曲線を判定するためのシステムおよび方法
US11809193B2 (en) Data-driven control for autonomous driving
CN114076964A (zh) 用于借助于卡尔曼滤波器确定至少一个系统状态的方法
CN111090281A (zh) 一种基于改进粒子滤波算法估算移动机器人精确方位的方法和装置
Grebe A Study of Observability-Aware Trajectory Optimization
CN113157552A (zh) 用于验证软件的方法
CN116691677A (zh) 车辆驾驶控制方法、装置、车辆及存储介质
CN117168434A (zh) 一种基于gps和双目视觉定位系统的自适应图优化方法
CN116736843A (zh) 自动驾驶车辆的控制方法、装置、设备及介质
De Silva et al. Automated tuning of the nonlinear complementary filter for an Attitude Heading Reference observer

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200330

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210608

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210708

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220201

R150 Certificate of patent or registration of utility model

Ref document number: 7019037

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150