JP2016158485A - 列車を所定の位置範囲に停止させるためのシステムおよび方法 - Google Patents

列車を所定の位置範囲に停止させるためのシステムおよび方法 Download PDF

Info

Publication number
JP2016158485A
JP2016158485A JP2016021642A JP2016021642A JP2016158485A JP 2016158485 A JP2016158485 A JP 2016158485A JP 2016021642 A JP2016021642 A JP 2016021642A JP 2016021642 A JP2016021642 A JP 2016021642A JP 2016158485 A JP2016158485 A JP 2016158485A
Authority
JP
Japan
Prior art keywords
train
parameter
estimate
series
stimulus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016021642A
Other languages
English (en)
Other versions
JP2016158485A5 (ja
Inventor
ステファノ・ディ・カイラノ
Di Cairano Stefano
ソーラブ・ハグハイアット
Haghighat Sohrab
ヨンファン・チェン
Yong-Fang Cheng
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JP2016158485A publication Critical patent/JP2016158485A/ja
Publication of JP2016158485A5 publication Critical patent/JP2016158485A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B61RAILWAYS
    • B61LGUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
    • B61L3/00Devices along the route for controlling devices on the vehicle or train, e.g. to release brake or to operate a warning signal
    • B61L3/02Devices along the route for controlling devices on the vehicle or train, e.g. to release brake or to operate a warning signal at selected places along the route, e.g. intermittent control simultaneous mechanical and electrical control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B61RAILWAYS
    • B61LGUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
    • B61L27/00Central railway traffic control systems; Trackside control; Communication systems specially adapted therefor
    • B61L27/04Automatic systems, e.g. controlled by train; Change-over to manual control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B61RAILWAYS
    • B61LGUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
    • B61L15/00Indicators provided on the vehicle or train for signalling purposes
    • B61L15/0062On-board target speed calculation or supervision
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B61RAILWAYS
    • B61LGUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
    • B61L15/00Indicators provided on the vehicle or train for signalling purposes
    • B61L15/0072On-board train data handling

Landscapes

  • Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Feedback Control In General (AREA)
  • Electric Propulsion And Braking For Vehicles (AREA)

Abstract

【課題】列車動態パラメータの推定を必要とする性能目標を最適化しながら、列車を所定位置範囲に停止させるための方法及びシステムの提供。
【解決手段】列車の状態を測定し取り込み、その後、パラメーター推定器において、列車の予測された状態と列車の測定された状態x206との比較に基づいて、未知のパラメーターの推定値201と、未知のパラメーターの信頼性212とを更新する。刺激入力シーケンス基準発生器が、列車の動作を取り込み、システムパラメーターの現在の推定値と、列車の測定された状態と、列車の運転に関する1組の制約とに基づいて、一連の刺激202入力を求める。モデル予測制御(MPC)装置が、制御指向コスト関数と、1組の制約と、一連の刺激入力と、未知のパラメーターの推定値と、未知のパラメーターの推定値の信頼性とを受信し、列車のトラクション−ブレーキアクチュエーター220のためのコマンド入力u211を生成する。
【選択図】図2

Description

この発明は、包括的には、所定の位置範囲に列車を自動的に停止させることに関し、より詳細には、不確定システムの識別及び制御が同時に実行される二重制御に関する。
この出願は、引用することにより本明細書の一部をなすものとする、Di Cairano他による2014年5月23日に出願された米国特許出願第14/285,811号「Automatic Train Stop Control System」(関連出願)に関連する。その特許出願では、走行中の列車の状態に関する実現可能エリアを形成するために、列車の速度を制約することによって、列車が所定の位置において停止する。
定位置停止制御装置(TASC:Train Automatic Stopping Controller:列車自動停止制御装置)は、自動列車運転(ATO:Automatic Train Operation)システムの不可欠な部分である。TASCは、自動制動を実行して、列車を所定の位置範囲に停止させる。ATOシステムは、列車ドアがプラットフォームドアと位置合わせされる必要がある列車システムの場合に特に重要である。関連出願及び非特許文献1を参照されたい。
しかしながら、列車の過渡性能、すなわち、所与の位置までの軌道は、列車をモデル化するために用いられる動的制約に関する不確定性によって悪影響を及ぼされる可能性がある。これらの不確定性は、列車質量、ブレーキアクチュエーター時定数、及び線路摩擦に起因すると考えることができる。数多くの応用形態において、経費を要する運行停止時間、時間を要する作業性質、そして質量及び線路摩擦のような特定のパラメーターが列車の運転中に変化するということ等の数多くの要因に起因して、前もって(オフラインで)不確定性を推定することは不可能である。
それゆえ、パラメーター推定は、オンラインで(リアルタイムに)、かつ閉ループにおいて、すなわち、ATOシステムが動作している間に実行されるべきである。動的システムの閉ループ推定にとっての大きな課題は、制御問題の目標と、識別問題又は学習問題とも呼ばれる、パラメーター推定問題の目標とが対立することを含む。
制御目標は、入力外乱及び出力外乱を排除することによって動的システム挙動を調節すること、及び動的システム制約を満たすことである。識別目標は、動的システムパラメーターの実際の値を求めることであり、これは、動的システムの実際の挙動と予想される挙動とを比較することによって行われる。これは、システムが外乱にいかに反応するかを解析することに相当する。
それゆえ、外乱の影響を解消する制御に関する措置が、識別を更に難しくする。一方、動的システムを刺激し、パラメーター推定を改善するために、外乱を無制御に作用させると、外乱がシステムの挙動を所望の挙動から著しく変化させている場合があり、回復が不可能である場合があるので、後に制御を適用するのを更に難しくする。
例えば、TASCは、トラクション作用及びブレーキ作用によって摩擦及び質量のような不確定パラメーターを補償することができるので、列車は、列車パラメーターの正確な推定の有無にかかわらず、所望の場所に正確に停止する。したがって、列車を表す動的システムは、予想されるものに近い挙動を示し、推定アルゴリズムは、列車の所望の挙動と、実際の挙動との間に大きな違いを認めない。それゆえ、推定アルゴリズムが未知のパラメーターを推定するのは難しい。一方、列車挙動が所望の挙動及び予想される挙動に近い場合であっても、これは、ブレーキ及びトラクションに及ぼすTASCの大きな作用によって達成される場合があるので、結果として無用なエネルギー消費と、急加減速(jerk)とが生じ、乗り心地が損なわれる。
一方、しばらく制御することなく列車動的システムを動作させる結果として、予想される挙動と、実際の挙動との間に違いが生じる場合があり、後に良好な推定がもたらされる場合があるが、制御が再び関与するとき、列車挙動が所望の挙動からあまりにもかけ離れすぎて所望の挙動を回復できない場合があるか、又は回復するのに過大な量のエネルギーと、急加減速とを被る場合がある。
最後に、一般的に、外乱がランダムであり、制御されない性質であることに起因して、外乱が、パラメーターを正確に推定できるようにするのに十分な列車挙動への影響を引き起こすという保証はない。すなわち、外乱が列車システムを持続的に刺激することは保証されない。
それゆえ、モデルをリアルタイムに絶えず更新することによって、実際の列車システムパラメーターを推測して最小限の急加減速、エネルギー又は時間のような性能指標を改善しながら、列車を所定の位置範囲内に正確に停止させることが望ましい。このために、
(i)システムパラメーターの正確かつ迅速な推定
(ii)パラメーターが正確に推定される前を含む、システム制約の実現、及び
(iii)性能基準最適化
を達成する、推定及び制御を組み合わせたシステム及び方法が必要とされている。
システムパラメーター推定、制約実現及び性能最適化を確実にするために、二重の目標を有するモデル予測制御(MPC)を設計することができる。関連出願である米国特許出願第14/285,811号、非特許文献2、非特許文献3、非特許文献4、非特許文献5、非特許文献6及び非特許文献7を参照されたい。
パラメーター推定の性能は或る程度、システムに及ぼす外部からの措置の影響が十分に明らかであるか否か、すなわち、システムが持続的に刺激され、十分な情報が測定されるか否かによって決まる。したがって、システムパラメーターの迅速な推定を得るために、システム刺激及び制御目標最適化をトレードオフするように、二重MPCの措置が選択される。調節と識別との間のそのような所望のトレードオフを達成するために、最適化コスト関数Jを以下のように表すことができる。
Figure 2016158485
ただし、Jは制御指向コストJの一次結合であり、ψ(U)は、一連の入力Uを適用することに起因する残存不確定性(逆に言うと、得られた情報)であり、γは、制御目標及び学習目標をトレードオフする推定誤差の重み関数である。システム制約を課してコスト関数(1)を最適化する結果として、制御装置がシステムを刺激してシステムパラメーターを推定するのに必要とされる情報を測定しながら、システムを調節する入力を生成するアクティブ学習モデルがもたらされる。
重み関数は、未知のパラメーターの推定値に信頼性がないとき、調節より学習を優先すべきである。より多くの情報が得られ、未知のパラメーターの推定値の信頼性が高くなるとき、関数γの値を小さくすることによって、学習より制御が優先されるべきである。
可能な定義、すなわち、ψ(U)は以下のものを含む。
Figure 2016158485
ただし、Pは未知のパラメーターの共分散行列であり、traceはPの主対角線上の要素の和を返し、Rは未知のパラメーターの情報行列(R=P−1)であり、Γは学習計画対象期間であり、νは未知のパラメーターの数であり、det及びexpはそれぞれ行列式及び指数である。
残念なことに、(2a〜2d)における全ての指標は決定変数Uに関して非凸である。これは、従来の凸制御問題を、大域的最適への収束を保証することができない非凸非線形計画問題に変化させる。さらに、重み関数γは、制御入力Uに著しい影響を及ぼす。基準生成問題を凸問題に変換できることが知られている。例えば、Rathousky他は、Γステップ学習計画対象期間にわたって基準生成最適化を実施することに基づく手法を使用し、Γステップ学習計画対象期間はΓ−1個の先行する入力ステップを含み、その後に単一のステップのみを使用する。
非特許文献6は、システムパラメーターについての情報の指標として、
Figure 2016158485
を使用する。その関数は、モデル予測コスト関数を拡張するために用いられる。しかしながら、その情報指標の非凸性によって導入される問題を回避するために、1ステップ学習計画対象期間にわたって項の最小化が考慮される。その方法は、生成された基準がシステムパラメーターを学習するだけの十分な刺激を与えることを重みパラメーターγが保証するのに必要な条件も提供する。1ステップ学習計画対象期間の適用はシステム全体の性能を最適化するのを妨げる。したがって、一般的に、より長い計画対象期間が必要になる。
別の方法は、二次コスト関数を用いる静的線形システムのための動的計画法に基づいて、同時に推定及び制御するための近似解を提供する。非特許文献8を参照されたい。近似解はシステム性能を改善することができるが、ATOシステムのような動的システムに容易に適用することはできず、かなりの計算を必要とするので、ATOにおいて実行するのに、あまりにも時間がかかる場合があるか、又はあまりにも費用がかかるハードウェアを必要とする場合がある。
Di Cairano他著、「Soft-landing control by control invariance and receding horizon control」、American Control Conference (ACC), pp. 784-789, 2014 Genceli他著、「New approach to constrained predictive control with simultaneous model identification」、AIChE Journal, vol. 42, no. 10, pp. 2857-2868, 1996 Marafioti他著、「Persistently exciting model predictive control using FIR models」、International Conference Cybernetics and Informatics, no. 2009, pp. 1-10, 2010 Rathousky他著、「MPC-based approximate dual controller by information matrix maximization」、International Journal of Adaptive Control and Signal Processing, vol. 27, no. 11, pp. 974-999, 2013 Heirung他著、「An MPC approach to dual control」、10th International Symposium on Dynamics and Control of Process Systems (DYCOPS), 2013 Heirung他著、「An adaptive model predictive dual controller」、Adaptation and Learning in Control and Signal Processing, vol. 11, no. 1, pp. 62-67, 2013 Weiss他著、「Robust dual control MPC with guaranteed constraint satisfaction」、Proceedings of IEEE Conference on Decision and Control, Los Angeles, CA, December 2014 Lobo他著、「Policies for simultaneous estimation and optimization」、Proceedings of the American Control Conference, June 1999
この発明の実施の形態は、特定の性能指標を最適化しながら、列車を所定の位置に停止させるためのシステム及び方法を提供し、その性能指標は列車パラメーターの推定を必要とする。
その方法は、不確定システムの識別及び制御が同時に実行される二重制御を使用する。
その方法は、制御不変セットを用いて、ソフトランディング(soft landing)制約と、未知のパラメーターを推定する制約付き再帰的最小二乗手順とを実施する。
刺激入力シーケンス基準発生器が、システムに十分な刺激を与えるために、それゆえ、未知のパラメーターの推定を改善するために繰返し決定される基準入力シーケンスを生成する。刺激入力シーケンス基準発生器は、単一の非凸問題を緩和させる一連の凸問題を解くことによって基準入力シーケンスを計算する。
システム性能を最適化するコマンド入力の選択は、1より大きい計画対象期間によって制約付き有限計画対象期間最適制御問題を解くことによって実行される。ただし、制約は、制御不変セット制約を含む。未知のパラメーターのパラメーター推定の収束を確実にするために、有限計画対象期間最適制御問題のコスト関数に、コマンド入力シーケンスと基準入力シーケンスとの間の違いを考慮に入れる付加項を含む。
有限計画対象期間最適制御問題は、モデル予測制御(MPC)において解かれる。したがって、MPCは、刺激入力シーケンスと、未知のパラメーターの現在の推定値とを用いて、システム入力u(k)、すなわち、コマンド入力を求め、その結果として、例えば、列車トラクション及びブレーキへのコマンドが生成される。刺激入力からの入力の偏差を最小化する、コスト関数内の付加項に起因して、MPCは、パラメーター推定を改善するために必要とされる刺激を与える。
不確定列車動態に入力が適用された後に、パラメーター推定器において、列車状態情報及び入力情報を用いて、未知のパラメーターの推定値を更新する。
この発明の実施の形態によるソフトランディングコーン内の軌道の概略図である。 この発明の実施の形態による、列車を所定の位置に停止させるための方法及びシステムのブロック図である。 この発明の実施の形態による制御装置のブロック図である。 この発明の実施の形態による、列車を所定の位置範囲に停止させるための方法及びシステムの動作のブロック図である。 この発明の実施の形態による、パラメーターの演算のブロック図である。 この発明の実施の形態による、刺激入力シーケンス基準発生器の動作のブロック図である。 この発明の実施の形態による、制御装置機能の動作のブロック図である。
図2に示されるように、この発明の実施の形態は、実際の列車動態パラメーターの推定を必要とする性能目標を最適化しながら、列車200を所定の位置範囲に停止させるための方法及びシステムを提供する。その方法は、二重制御のために2ステップモデル予測制御(MPC)を用いる。
背景部分において説明されたような従来の1ステップ定式化において、学習目標及び制御目標を組み合わせて、式(1)における最適コスト関数のような、拡張された最適化問題を形成する。
この発明の実施の形態による2ステップ定式化では、刺激入力202を生成する問題が最初に解かれる。この後、制御装置215において制御問題が解かれ、刺激入力生成問題を解くことを考慮に入れるように変更される。
不確定列車動態の記述
この発明は、外乱ポリトピック線形差分包含(dpLDI:disturbed polytopic linear difference inclusion)システムと表すことができる不確定列車システムを検討する。
列車の動態のモデルは
Figure 2016158485
である。ただし、
Figure 2016158485
はそれぞれ、列車動態を表すモデルのための状態、コマンド入力及び外乱ベクトルである。列車動態を表すモデルのための状態、コマンド入力及び外乱ベクトルは関連出願の場合と同じである。
図2に示されるように、コマンド入力u211は、電気モーター、発電機及び空気圧ブレーキのような、トラクション−ブレーキアクチュエーター220に送られるコマンドである。行列A、Bは状態行列及び入力行列であり、それらの行列は、未知のパラメーターθを用いて、1組の状態行列及び入力行列(A,B)の凸結合として表すことができる。外乱は、未知のパラメーターηを用いて、1組の外乱ベクトル(w)の凸結合として表すことができる。
以下で式(7)の形で不確定システムを表すための手順の詳細が関連出願において記述されており、すなわち、
Figure 2016158485
であり、ただし、θは凸結合の係数であり、システム動態のための未知のパラメーターを表し、ηは凸結合の係数であり、外乱ベクトルのための未知のパラメーターであり、
Figure 2016158485
を満たす。
パラメーターθ、ηの値は未知であるので、モデルの推定値を用いることができる。
Figure 2016158485
ただし、
Figure 2016158485
はシステム動態のための未知のパラメーターの推定値であり、
Figure 2016158485
は外乱ベクトルのための未知のパラメーターの推定値である。
パラメーターの推定値、それゆえ、モデルの推定値は、推定アルゴリズムが列車の運転についてのより多くの情報を入手するにつれて変化する。
システム制約及びソフトランディングコーン
TASCは、列車運転に関する幾つかの制約を実施することが必要な場合がある。これらの制約は、最大速度及び最小速度並びに最大加速度及び最小加速度、アクチュエーターにおける力の範囲等を含む。特定の1組の制約がソフトランディングコーンである。
TASC問題のためのソフトランディングコーンは、許容される列車位置−列車速度の組み合わせを規定する1組の制約であり、常に実施される場合には、ソフトランディングコーンは、列車が所望の位置範囲εtgtにおいて停止するのを保証する。TASC問題のためのソフトランディングコーン及び不確定列車パラメーター下の制御不変セットの計算が関連出願において記述されている。
図1は、ソフトランディングコーン101を実施する、列車速度νと、停止位置103の所望の範囲104の中心からの距離dとによって表される軌道102の一例を示す。関連出願において記述されているように、列車運転制約及びソフトランディングコーンから、制御不変セットと呼ばれる付加的な1組の制約が計算される。例えば、制御不変制約の結果として、式(3)の状態とコマンド入力との間に以下の形の制約を生成することができる。
Figure 2016158485
制御不変セットの制約は、その制約が満たされた場合に、列車運転制約及びソフトランディングコーン制約が満たされるような制約である。さらに、TASCは、制御不変セット制約を満たすブレーキコントロール及びトラクションコントロールの選択を常に見つけることができ、それゆえ、停止が所望の位置範囲内で正確に行われる。この発明の特定の実施の形態では、式(7)の制約は、列車の運転に関する付加的な制約も含むことができる。
定位置停止制御のための2ステップ二重制御MPC
図2は、この発明の実施の形態による、パラメーター推定システム及び方法を用いる二重制御のプロセス及び構造を示す。刺激入力シーケンス基準発生器(基準発生器)205が、入力として、列車200の現在の状態x206と、列車の不確定モデル204、例えば、式(4)における行列及びベクトル(A,B,w)と、未知のパラメーターの現在の推定値201、例えば、パラメーター推定器213によって生成される
Figure 2016158485
及び
Figure 2016158485
とを取り込む。
基準発生器は、一連の刺激入力(Uexc)202を求める。制御装置215は、不確定モデル204と、未知のパラメーター201の推定値と、状態206と、例えば、式(7)によって記述される形の制約203とを受信する。また、制御装置215は、一連の刺激入力202と、制御指向コスト関数210と、パラメーター推定器213によって生成されるパラメーター推定値信頼性212とを受信し、トラクション−ブレーキアクチュエーター220に適用されることになる措置を表す、列車に対するコマンド入力u211を生成する。
コマンド入力211は、パラメーター推定213にも与えられ、パラメーター推定は、状態206とともにコマンド入力を用いて、列車の予想される動きを比較し、結果として列車の予想される未来の状態を生成する。パラメーター推定器は、列車の予想される未来の状態を、未来の時点における列車206の状態と比較し、未知のパラメーターの推定値を調整する。
図3は、制御装置215の動作を示す。図2のブロック204からの不確定モデル301と、未知のパラメーターの推定値201とを用いて、例えば、(5)、(6)の場合のような、列車モデルの現在の推定値302を求める。210からの与えられた制御指向コスト関数311と、与えられた一連の刺激202と、パラメーター推定値信頼性212とを用いて、現在のコスト関数312を求める。
コマンド計算331において、列車モデルの現在の推定値302と、現在のコスト関数312と、現在の状態206と、203からの制約321とを用いて、一連の未来の列車コマンド入力を得る。コマンド選択341は、列車コマンド入力211として、未来の一連のコマンドの時間要素の最初の要素を選択する。
図4は、反復して実行される一連の措置に関する方法を示す。
最初に、状態206、及び以前に予測された未来の状態から、過去状態過去パラメーター推定値及びコマンド入力211に基づいて、パラメーター推定値201が更新され(401)、パラメーター推定値信頼性212が生成される。
その後、ブロック402において、パラメーター推定値201及び不確定モデル204を用いて、一連の刺激入力202が生成される。
その後、ブロック403において、一連の刺激入力202と、不確定モデル204と、パラメーター推定値201と、パラメーター推定値信頼性212と、制御指向コスト関数210と、制約203と、状態206とを用いて、制御問題が構築される。
最後に、制御問題が解かれ、コマンド入力211が求められ(404)、トラクション−ブレーキアクチュエーター220に適用される。状態206のための新たな値が入手可能であるとき、そのサイクルが繰り返される。
本明細書において記述される方法ステップは、マイクロプロセッサ、フィールドプログラマブルアレイ、デジタルシグナルプロセッサ又はカスタムハードウェアにおいて実行することができる。
パラメーター推定器
図5に示されるように、パラメーター推定器213は、システムモデル推定値(6a)、(6b)を得るために、最新データを用いて、未知のパラメーターの現在の推定値を調整する。システム状態(206)及びコマンド入力(211)の測定から、ブロック501に関して、リグレッサーの形でシステムを記述する。
Figure 2016158485
ただし、kは時間ステップのインデックスであり、リグレッサー行列Mは
Figure 2016158485
であり、は転置を表し、
Figure 2016158485
はパラメーターベクトルである。
その後、
Figure 2016158485
によって、推定共分散の推定値と、精度とを更新する(502)。ただし、αは、未知のパラメーターの推定値が以前に推定された値にどの程度依存することになるかに関連する正のフィルタリング定数であり、より古い推定値への依存度がより低いことが望ましいときに低い。
制約(6b)が存在することに起因して、制約付き最適化問題を解いて、
Figure 2016158485
のように未知のパラメーターの更新された推定値を計算する(503)。ただし、
Figure 2016158485
は未知のパラメーターの更新された推定値である。
未知のパラメーターの推定値とともに、推定値の信頼性γが計算され(504)、その値は非負の値であり、未知のパラメーターの推定値が信頼できると考えられるほど小さく、0は未知のパラメーターの推定値がパラメーターの正しい値に確かに等しいことを意味する。この発明の幾つかの実施の形態では、推定値信頼性は、
Figure 2016158485
のように計算され、代替的には、
Figure 2016158485
のように、又は
Figure 2016158485
のように計算される。
刺激入力シーケンス基準発生器
学習計画対象期間Γにわたる情報行列最小固有値の変化を通して測定される刺激の予測される持続性の観点から、入力シーケンスに起因する不確定性の減少を定量化する。
Figure 2016158485
式(12)は、一連の刺激入力を計算する際に最適化目的関数として用いられる。
未知のパラメーターの推定値は、条件λmin(RΓ−R)>0が学習計画対象期間Γ∈Zにわたって満たされるときに真値に収束する。ただし、Zは1組の正の整数である。情報行列Rは
Figure 2016158485
である。
基準発生器205は、
Figure 2016158485
を解くことによって、刺激入力202を求める。ただし、刺激入力シーケンスは、
Figure 2016158485
である。
ソフトランディングコーンに基づいて、列車動態と、不変セット制約(14)とを考えることによって、刺激入力が実現可能であることが確実になる。
式(8)はUに関して非凸であるので、(8)を含む最適化問題をそのまま解くことは、大量の計算を必要とし、実際の列車運転中には不可能である場合もある。
したがって、この発明が実現することは、情報行列Rijのインデックスをコマンド入力の二次関数として表すことができることである。
Figure 2016158485
この発明がもう1つ実現することは、新たな変数
Figure 2016158485
とともに式(15)にUUを代入し、
Figure 2016158485
を階数1の半正値行列とすることによって、式(14)が
Figure 2016158485
のように再定式化されることである。ただし、不等式制約AU−b≦0は(14)の
Figure 2016158485
及び
Figure 2016158485
を一群の制約にまとめる。
式(13)において、問題を解くのを難しくする唯一の制約は、行列Vの階数に関する制約であり、この制約は階数1制約rank(V)=1である。しかしながら、そのような制約は、反復内側ループ外側ループ分解によって間接的に実施できると理解される。詳細には、外側ループはスカラー二分探索を実行し、内側ループは、外側ループからの二分パラメーターの現在の値を用いて、一連の重み付け核ノルム最適化問題を解くことによって、行列の階数に関する制約を伴う緩和問題を解く。
この方法では、パラメーターδ、δ∈R及びhmax∈Zを用いて、結果の所望の精度、すなわち、より小さなδ、δ∈R及びより高精度のhmax∈Zを求める。
図6は、この発明において実現される手法を示しており、その手法は以下のステップを有する。最初に、ブロック601において、
Figure 2016158485
を解く。ただし、その式は、階数1制約が取り除かれた(15a)の緩和バージョンである。
(16)の解に基づいて、変数
Figure 2016158485
を初期化する。
ここで、ρmin及びρmaxはλmin(RΓ−R)に関する下限及び上限を表す。その後、ブロック602において、λmin(RΓ−R)固有値の下限及び上限が終了条件
Figure 2016158485
を満たす場合には、
Figure 2016158485
が設定される。代わりに、
Figure 2016158485
である場合には、以下の動作を反復する。
最初にブロック603において、外側ループ変数ρを更新し、内側ループの変数を初期化する。
Figure 2016158485
その後、ブロック604において、
Figure 2016158485
を解く。その式は核ノルムの重み付け最小化と一致する凸最適化問題である。(17)の解に基づいて、ブロック605において、
Figure 2016158485
を更新する。
Figure 2016158485
になるまで、又はh=hmax若しくは(17)が実現不可能になり、内側ループを終了するまで(ブロック606)、(19)を解き、(20)によって更新し続ける。ただし、σ(V)はVの第iの特異値を表す。
ブロック607において、後続の外側ループ更新のために異なる事例に基づいて上限及び下限を更新する。第1の事例では、階数1解を見つけており、ρmin←ρを設定し、一方、第2の事例及び第3の事例では、解を見つけられなかったので、ρmax←ρを設定する。
制御装置
図7に示されるのは、列車のためのコマンド入力の計算である。ただし、kは時間ステップインデックスである。
最初に、ブロック701において、401から得られた未知のパラメーターの現在の推定値
Figure 2016158485
から、列車動態302の現在の推定値が
Figure 2016158485
のように得られる。
次に、ブロック702において、402から計算された刺激入力シーケンスUexc(k)から、401から計算された推定値γ(k)の信頼性から、そして、Pcost、Qcost、Rcostが重み行列であり、Nが予測計画対象期間であり、iが予測インデックスである、
Figure 2016158485
のような制御指向コスト関数Jから、
Figure 2016158485
のようにコスト関数が構成され、そのコスト関数は、制御目標Jと、刺激入力シーケンス基準発生器によって得られたコマンドに近いコマンドを適用する付加的な学習目標とを含む。(23)における学習目標は、一連の刺激入力の成分と一連のコマンド入力の成分との間の差の二乗ノルムの和を最小化することである。
その後、予測モデル701及びコスト関数702と、制約203と、現在の状態206とから、
Figure 2016158485
のように制御問題が構成される(703)。ただし、U=[u…uN−1]であり、それを数値的に解くことによって、列車へのコマンド入力211が、u(k)=uとして計算される。
本書において開発された特定の構成に起因して、式(7)における制約は線形制約であり、(21)は線形であり、式(23)においてJに加えられる項は二次項であるので、(22)の場合のように制御指向コスト関数Jが二次関数であるとき、制約付き二次計画法のための手順を解くことによって(24)の解を求めることができる。
考案された二重制御方法の異なる実施の形態は、異なるパラメーター推定器220を使用することができる。一実施の形態は、再帰的最小二乗(RLS)フィルタに、又は制約付きRLSフィルタに基づくことができる。

Claims (13)

  1. 列車を所定の位置範囲に停止させるためのシステムであって、
    前記列車の予測された状態と前記列車の測定された状態との比較に基づいて、未知のパラメーターのパラメーター推定値と、該未知のパラメーターの該推定値の信頼性とを更新するように構成されるパラメーター推定器と、
    前記列車の動態を取り込むように構成され、システムパラメーターの現在の推定値と、前記列車の前記測定された状態と、前記列車の運転に関する1組の制約とに基づいて一連の刺激入力を求める、刺激入力シーケンス基準発生器と、
    制御指向コスト関数と、1組の制約と、前記一連の刺激入力と、前記未知のパラメーターの前記推定値と、前記未知のパラメーターの前記推定値の前記信頼性とを受信し、前記列車のトラクション−ブレーキアクチュエーターのための入力コマンドを求めるように構成されるモデル予測制御装置(MPC)と、
    を備える、システム。
  2. 前記パラメーター推定器は、前記列車の前記動態の全ての取り得る値を表す1組の既知の線形モデルの凸結合の係数である前記未知のパラメーターを推定する、請求項1に記載のシステム。
  3. 前記パラメーター推定器は、前記パラメーター推定値の信頼性を決定する、請求項1に記載のシステム。
  4. 前記パラメーター推定値の前記信頼性は、前記列車の前記測定された状態と、前記パラメーター推定値による前記列車の前記予測された状態との間の差から求められる、請求項1に記載のシステム。
  5. 前記未知のパラメーターの前記推定値の前記信頼性は、前記パラメーター推定値による推定誤差の予想される共分散の関数から求められる、請求項1に記載のシステム。
  6. 前記一連の刺激入力は、システム情報行列の指標を増加させることによって求められる、請求項1に記載のシステム。
  7. 前記システム情報行列の最小固有値を最大化することによって、前記一連の刺激入力を求める、請求項6に記載のシステム。
  8. 前記システム情報行列の前記最小固有値の前記最大化は、凸最適化問題における前記システム情報行列の階数に関する制約を課して、前記凸最適化問題を解くことによって解かれる、請求項7に記載のシステム。
  9. 前記刺激入力シーケンス基準発生器は、反復内側ループ外側ループ分解を用いて凸最適化問題における前記システム情報行列の階数に関する制約を課して前記凸最適化問題を解き、前記外側ループはスカラー二分探索を実行し、前記内側ループは、前記外側ループからの二分パラメーターの現在の値を用いて、一連の重み付けられた核ノルム最適化問題を解くことによって、前記システム情報行列の前記階数に関する制約を課して緩和問題を解く、請求項7に記載のシステム。
  10. 前記MPCは、前記パラメーター推定値と、制御指向コスト関数から構成されるコスト関数と、前記パラメーター推定値の信頼性によって重み付けされた学習指向項とを用いて前記列車の前記動態の推定値から、未来の計画対象期間に沿って制御問題を構成し、前記制御問題の解から前記入力コマンドを求める、請求項1に記載のシステム。
  11. 前記学習指向項は、前記一連の刺激入力の関数である、請求項10に記載のシステム。
  12. 前記一連の刺激の前記関数は、前記一連の刺激入力の成分と一連の前記コマンド入力の成分との間の差の二乗ノルムの和である、請求項11に記載のシステム。
  13. 列車を所定の位置範囲に停止させるための方法であって、
    前記列車の測定された状態を取り込むステップと、
    パラメーター推定器において、前記列車の予測された状態と該列車の前記測定された状態との比較に基づいて、未知のパラメーターの推定値と、該未知のパラメーターの該推定値の信頼性とを更新するステップと、
    刺激入力シーケンス基準発生器において、前記列車の動態を取り込み、システムパラメーターの現在の推定値と、前記列車の前記測定された状態と、前記列車の運転に関する1組の制約とに基づいて一連の刺激入力を求めるステップと、
    モデル予測制御(MPC)において、制御指向コスト関数と、1組の制約と、前記一連の刺激入力と、前記未知のパラメーターの前記推定値と、前記未知のパラメーターの前記推定値の前記信頼性とを受信し、前記列車のトラクション−ブレーキアクチュエーターのための入力コマンドを求めるステップと、
    を含む、方法。
JP2016021642A 2015-02-23 2016-02-08 列車を所定の位置範囲に停止させるためのシステムおよび方法 Pending JP2016158485A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/628,387 2015-02-23
US14/628,387 US9499183B2 (en) 2015-02-23 2015-02-23 System and method for stopping trains using simultaneous parameter estimation

Publications (2)

Publication Number Publication Date
JP2016158485A true JP2016158485A (ja) 2016-09-01
JP2016158485A5 JP2016158485A5 (ja) 2019-01-24

Family

ID=56689755

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016021642A Pending JP2016158485A (ja) 2015-02-23 2016-02-08 列車を所定の位置範囲に停止させるためのシステムおよび方法

Country Status (2)

Country Link
US (1) US9499183B2 (ja)
JP (1) JP2016158485A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018073395A (ja) * 2016-11-01 2018-05-10 三菱電機株式会社 マルチエージェント制御システムおよび方法
JP2020128170A (ja) * 2019-02-08 2020-08-27 ナブテスコオートモーティブ株式会社 車両、車両の制動方法、エアブレーキシステムの制御方法、および、エアブレーキシステムの制御装置
WO2023281893A1 (ja) * 2021-07-09 2023-01-12 株式会社日立製作所 制御システムおよび制御方法

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10279823B2 (en) * 2016-08-08 2019-05-07 General Electric Company System for controlling or monitoring a vehicle system along a route
US10532754B2 (en) * 2016-10-31 2020-01-14 Ge Global Sourcing Llc System for controlling or monitoring a vehicle system along a route
CN106707764B (zh) * 2017-02-27 2019-10-22 华东交通大学 基于多级切换的动车组制动过程rbf模型参考自适应控制方法
US20190057180A1 (en) * 2017-08-18 2019-02-21 International Business Machines Corporation System and method for design optimization using augmented reality
CN108873691A (zh) * 2017-11-13 2018-11-23 华东交通大学 高速列车广义预测调优控制方法
DE102018111984A1 (de) * 2018-05-18 2019-11-21 Knorr-Bremse Systeme für Schienenfahrzeuge GmbH Kollisionsvermeidung für ein Fahrzeug und Verfahren hierzu
CA3101582C (en) 2018-06-08 2023-10-03 Thales Canada Inc. Controller, system and method for vehicle control
US10858017B2 (en) 2018-07-31 2020-12-08 Donglei Fan Method of controlling vehicle to perform soft landing, and related controller and system
CN109835372A (zh) * 2019-02-03 2019-06-04 湖南工业大学 一种铁路运输列车稳定性的主动容错控制方法
US11787453B2 (en) 2019-09-05 2023-10-17 Progress Rail Services Corporation Maintenance of distributed train control systems using machine learning
US20220371450A1 (en) * 2019-10-25 2022-11-24 Zf Friedrichshafen Ag Model-Based Predictive Regulation of an Electric Machine in a Drivetrain of a Motor Vehicle
US20220402508A1 (en) * 2019-11-14 2022-12-22 Zf Friedrichshafen Ag Model Predictive Control of Multiple Components of a Motor Vehicle
US11579575B2 (en) * 2019-12-03 2023-02-14 Baidu Usa Llc Inverse reinforcement learning with model predictive control
US20210263527A1 (en) * 2020-02-24 2021-08-26 Thales Canada Inc. Controller, control system and method for vehicle control
CN113442970B (zh) * 2020-03-27 2022-08-09 比亚迪股份有限公司 列车跳跃控制方法、装置和列车
CN113885317A (zh) * 2020-07-02 2022-01-04 苏州艾吉威机器人有限公司 一种路径跟踪控制方法、系统及计算机可读存储介质
CN115257882B (zh) * 2022-07-27 2023-07-18 交控科技股份有限公司 列车ato精确停车方法、设备、存储介质
CN116395006B (zh) * 2023-05-15 2024-03-08 北京交通大学 一种面向虚拟编组列车同步进站控制方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58214456A (ja) * 1982-06-08 1983-12-13 株式会社日立製作所 車両自動運転装置
JP2002271918A (ja) * 2001-03-13 2002-09-20 Toshiba Corp 自動列車運転装置
JP2010104084A (ja) * 2008-10-21 2010-05-06 Toshiba Corp 列車制御装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040172175A1 (en) * 2003-02-27 2004-09-02 Julich Paul M. System and method for dispatching by exception
US8332247B1 (en) * 1997-06-12 2012-12-11 G. William Bailey Methods and systems for optimizing network travel costs
FR2856645B1 (fr) * 2003-06-27 2005-08-26 Alstom Dispositif et procede de commande de trains, notamment du type ertms
JP5043839B2 (ja) * 2005-07-11 2012-10-10 ブルックス オートメーション インコーポレイテッド 予知保全用インテリジェント状態監視及び障害診断システム
WO2008002310A1 (en) * 2006-06-27 2008-01-03 Ata Engineering, Inc. Methods and apparatus for modal parameter estimation
ITTO20060735A1 (it) * 2006-10-13 2008-04-14 St Microelectronics Srl Sistema e metodo di controllo autoadattativo di un freno elettromeccanico
US8131732B2 (en) * 2008-06-03 2012-03-06 Nec Laboratories America, Inc. Recommender system with fast matrix factorization using infinite dimensions
US8478463B2 (en) * 2008-09-09 2013-07-02 Wabtec Holding Corp. Train control method and system
US20100241296A1 (en) * 2009-02-12 2010-09-23 Ansaldo Sts Usa, Inc. System and Method for Controlling Braking of a Train
JP5364530B2 (ja) * 2009-10-09 2013-12-11 株式会社日立製作所 設備状態監視方法、監視システム及び監視プログラム
JP2013545081A (ja) * 2010-10-08 2013-12-19 ロールス−ロイス・コーポレーション 駆動列内の故障状態を、トルク振動データを用いて検出するシステムおよび方法
US9513630B2 (en) * 2010-11-17 2016-12-06 General Electric Company Methods and systems for data communications
US8832000B2 (en) * 2011-06-07 2014-09-09 The Trustees Of Columbia University In The City Of New York Systems, device, and methods for parameter optimization
DE102011089653A1 (de) * 2011-12-22 2013-06-27 Siemens Aktiengesellschaft Verfahren und Anordnung zum Überwachen eines Bremssystems einer Bremsanordnung eines Schienenfahrzeugs
JP5926097B2 (ja) * 2012-03-30 2016-05-25 日本信号株式会社 列車制御装置
US8838302B2 (en) * 2012-12-28 2014-09-16 General Electric Company System and method for asynchronously controlling a vehicle system
US20140358339A1 (en) * 2013-05-31 2014-12-04 General Electric Company System And Method For Controlling De-Rating Of Propulsion-Generating Vehicles In A Vehicle System

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58214456A (ja) * 1982-06-08 1983-12-13 株式会社日立製作所 車両自動運転装置
JP2002271918A (ja) * 2001-03-13 2002-09-20 Toshiba Corp 自動列車運転装置
JP2010104084A (ja) * 2008-10-21 2010-05-06 Toshiba Corp 列車制御装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018073395A (ja) * 2016-11-01 2018-05-10 三菱電機株式会社 マルチエージェント制御システムおよび方法
JP2020128170A (ja) * 2019-02-08 2020-08-27 ナブテスコオートモーティブ株式会社 車両、車両の制動方法、エアブレーキシステムの制御方法、および、エアブレーキシステムの制御装置
JP7282538B2 (ja) 2019-02-08 2023-05-29 ナブテスコオートモーティブ株式会社 車両、車両の制動方法、エアブレーキシステムの制御方法、および、エアブレーキシステムの制御装置
WO2023281893A1 (ja) * 2021-07-09 2023-01-12 株式会社日立製作所 制御システムおよび制御方法

Also Published As

Publication number Publication date
US9499183B2 (en) 2016-11-22
US20160244077A1 (en) 2016-08-25

Similar Documents

Publication Publication Date Title
JP2016158485A (ja) 列車を所定の位置範囲に停止させるためのシステムおよび方法
Liu et al. Gaussian processes for learning and control: A tutorial with examples
Wang et al. Q-learning based fault estimation and fault tolerant iterative learning control for MIMO systems
KR102228503B1 (ko) 강화 학습을 이용한 환경 네비게이션
US20200293862A1 (en) Training action selection neural networks using off-policy actor critic reinforcement learning
Akametalu et al. Reachability-based safe learning with Gaussian processes
Sokolov et al. Complete stability analysis of a heuristic approximate dynamic programming control design
CN110471276B (zh) 用于为物理系统创建模型函数的装置
JP2016100009A (ja) 機械の動作を制御する方法、および機械の動作を反復的に制御する制御システム
Yan et al. Nonlinear model predictive control based on collective neurodynamic optimization
CN108051999A (zh) 基于深度强化学习的加速器束流轨道控制方法及系统
CN108427986A (zh) 一种生产线电机故障预测方法及装置
Redder et al. Deep reinforcement learning for scheduling in large-scale networked control systems
Inga et al. Online inverse linear-quadratic differential games applied to human behavior identification in shared control
US20200333795A1 (en) Method and apparatus for controlling movement of real object using intelligent agent trained in virtual environment
CN110673619B (zh) 一种飞行姿态的控制方法、装置、无人机和存储介质
EP4292945A1 (en) Hybrid online policy adaptation strategy for attitude pointing performance
Sehr et al. Stochastic model predictive control: Output-feedback, duality and guaranteed performance
Kamalapurkar et al. State following (StaF) kernel functions for function approximation part II: Adaptive dynamic programming
Tsiamis et al. Predictive Linear Online Tracking for Unknown Targets
Bahadorian et al. Robust time-varying model predictive control with application to mobile robot unmanned path tracking
Goedhart et al. Machine learning for flapping wing flight control
Chen et al. Including image-based perception in disturbance observer for warehouse drones
Emaletdinova et al. Algorithms of constructing a neural network model for a dynamic object of control and adjustment of PID controller parameters
Bonzanini et al. Perception-aware model predictive control for constrained control in unknown environments

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181204

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181204

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20181204

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20181227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190528

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190725

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20191029