JP2021526480A

JP2021526480A - 同一の所定の軌道を繰り返し追従する自動走行装置の制御方法とシステム

Info

Publication number: JP2021526480A
Application number: JP2021517108A
Authority: JP
Inventors: トン，ソン; ラングエン，ヴァン
Original assignee: Siemens Industry Software NV
Current assignee: Siemens Industry Software NV
Priority date: 2018-05-30
Filing date: 2018-05-30
Publication date: 2021-10-07
Anticipated expiration: 2038-05-30
Also published as: EP3776127A1; WO2019228626A1; JP6976484B2; CN112236732B; EP3776127B1; US11249485B2; US20210208596A1; ES2913725T3; CN112236732A

Abstract

同一の所定の軌道を繰り返し追従するように自動走行車両を制御する方法。ａ）所定の軌道を示す目標軌道信号の受信と、ｂ）所定の軌道に沿って車両を操舵するのに適する制御信号の生成と、さらに複数の反復の少なくとも１つについて、ｃ）制御信号を車両に送信して、所定の軌道に沿って車両を操舵すること、ｄ）制御信号に従って操舵された車両が追従する実際の軌道を測定すること、ｅ）測定された実際の軌道を示す実際の軌道信号を記録すること、ｆ）反復学習制御装置を用いて、制御信号と、実際の軌道信号と、目標軌道信号とを用いて、変更された制御信号を決定することとを含む。本方法は、後続の反復中に追従性能を向上できる。

Description

本発明は、自動走行（自動運転）の分野に関し、より具体的には、同一の所定の軌道を繰り返し追従するように自動走行装置（自動運転装置）を制御する方法とシステムに関する。

自動走行車両（自動運転車両）を所望の軌道に追従させる制御を行うために、比例積分微分（ＰＩＤ：proportional integral derivative）制御、状態空間制御、フィードバック制御およびモデル予測制御（ＭＰＣ：model predictive control）等の制御方法が用いられている。

所定の駐車場所までのホーム駐車場若しくはバレット駐車場または自動走行ラップ（ＬＡＰ）レース等では、自動走行車両は、指定された駐車スペースまでの軌道や、ラップ周りの軌道等の、同一の所定の軌道を追従するように繰り返し制御されている。

本発明の課題の一つは、同一の所定の軌道を繰り返し追従させるように自動走行車両を制御する場合の性能を向上させることである。

本発明に係る第１の態様では、同一の所定の軌道を繰り返し追従するように自動走行装置を制御する方法を提供するが、この方法は、ａ）所定の軌道を示す目標軌道信号（ターゲット軌道信号）を受信するステップと、ｂ）所定の軌道に沿って自動走行装置を操舵（操縦）するのに適した制御信号を生成するステップと、を含む。本方法は、さらに、複数の反復の少なくとも１つについて、ｃ）制御信号を自動走行装置に供給することによって、所定の軌道に沿って自動走行装置を操舵するステップと、ｄ）制御信号に従って操舵されることに応答して、自動走行装置によって追従される実際の軌道を測定するステップと、ｅ）測定された実際の軌道を示す実際の軌道信号を記録するステップと、ｆ）少なくとも制御信号と、実際の軌道信号と、目標軌道信号とに基づいて、変更された制御信号を決定するように、反復学習制御装置を使用するステップと、を含む。

上記方法は、有利には、同一の所定の軌道に沿って自動走行装置を操舵する後続の反復中に、自動走行装置の追従性能（追跡性能）を向上するために、反復学習制御（ＩＬＣ：Iterative Learning Control）を活用する。

「追従性能」とは、例えば、所定の軌道と実際の軌道との間の追従のエラー（誤差）または偏差でもよく、そして、「追従性能を最適化すること」とは、追従のエラーを減少することを示し得る。

自動走行装置は、実際の自動走行車両でもよい。または、自動走行装置は、車両（自動車）のシュミレーションモデルでもよい。本明細書で使用される「自動」とは、人間の介入なしに、自動走行装置が所定の軌道に追従することができる能力を示し得る。

用語「信号（シグナル）」は、時系列の読み取りまたは値を示し得る。時系列とは、連続的であってもよく、または離散的であってもよい。離散的な時系列とは、等間隔であってもよく、または非等間隔であってもよい。制御信号において、値は、加速度および操舵角を含み得る。それぞれの軌道信号において、値は、２次元座標または３次元座標を含み得る。それぞれの信号は、さらに、各値についての時間を示すタイムコードを含み得る。

所定の軌道は、車両が追従することが想定されている所望の経路または道（ルート）でもよい。所定の軌道の例としては、バレット駐車場（出発点）の入り口から所定の駐車場所（終点）までの軌道、またはレーシング場のラップのスタートライン（出発点）からフィニッシュライン（終点）までの軌道または周回の軌道が挙げられる。

ステップａ）では、所定の軌道は、例えば、駐車場制御装置および／またはレース場制御装置等の固設型の制御装置から、および／または、車載ナビゲーション制御装置等の自動走行車両の車載型制御装置から、および／または移動装置（携帯装置）から受信することができる。

ステップｂ）では、所定の軌道に沿って自動走行装置を操舵するのに適した制御信号は、目標軌道信号を受信することに応答して、人間の運転者、ＰＩＤ制御装置または同様物等によって車両に与えられる加速度および操舵角等の時系列の制御入力を検出し、記録することによって生成されてもよい。あるいは、制御信号は、計算によって生成されてもよい。

本明細書中の「所定の軌道に沿って自動走行装置を操舵する」という用語は、所定の軌道から、許容可能な追従のエラーで逸脱し得る実際の軌道に沿って、追従する、または移動する若しくは運転するように、自動走行装置を制御することを示し得る。

「複数の反復」とは、１つまたは複数の数を示し得る。

それぞれの反復とは、それぞれの制御信号に従って、所定の軌道の開始点から所定の軌道に沿った終点まで、自動走行装置を操舵する各場合（事例）を示し得る。具体的には、第１の反復において、ステップｂ）で生成された制御信号に応答して、ステップｃ）、ｄ）、ｅ）およびｆ）を実行してもよい。任意のさらなる反復において、ステップｃ）、ｄ）、ｅ）およびｆ）は、制御信号として、ステップｆ）で生成された、変更された制御信号に応答して実行されてもよい。

ステップｃ）において自動走行装置に制御信号を送ることとは、複数の時間の場合の各々で、自動走行装置の操舵装置（ステアリング装置）等の、自動走行装置に対して、制御信号によって構成されるそれぞれの値を提供することを示し得る。

同様に、ステップｄ）における測定およびステップｅ）における記録も、複数の時間の場合の少なくともいくつかについて繰り返し実施することができる。すなわち、ステップｄ）およびｅ）は、ステップｃ）と並行して、および／または、ステップｃ）と同期して、実行されてもよい。

ステップｄ）の測定は、二次元座標値および／または三次元座標値を取得するために、所定の軌道または同様物等に沿って配置された標識ポスト（サインポスト）との無線通信を使用して、ＧＰＳ受信装置等の位置特定装置（ロケーション装置）を使用することを示し得る。

ステップｅ）では、記録することは、複数の時間の場合について、ステップｄ）で測定された複数の値から信号を形成することを示し得る。

ステップｆ）において、反復学習制御装置は、現在の反復における制御信号および実際の軌道信号（記録された実際の軌道信号）に基づいて、後続の反復のために変更された（更新された、改善された、または最適化された）制御信号を提供するために、反復学習制御（ＩＬＣ）を使用するように構成された装置でもよい。

より具体的には、「制御信号および目標軌道信号に基づく」とは、「実際の軌道信号と目標軌道信号との間の追従のエラーを示す実際の追従のエラー信号に基づくこと」を意味し得る。実際の追従のエラー信号とは、目標軌道信号から実際の軌道信号を差し引くことによって得られてもよい。「追従のエラー」とは、それぞれの信号の間の平均または二乗平均平方根距離等の偏差を示し得る。

「信号に基づく」とは、特に、「入力として信号を使用すること」を示し得る。

さらに、より具体的には、反復学習制御装置は、追従性能を最適化する最適化制御信号を、反復の各々で繰り返し使用することによって、反復学習するように構成されることができる。特に、追従性能を最適化するとは、実際の追従のエラー信号（エネルギ内容、時間平均値、またはその二乗平均平方根）を減少または最小化することを示し得る。

具体的には、「学習する」とは、パラメータ、オペレータまたは制御モデル等、反復学習制御装置内に記憶されたデータを繰り返し変更する（更新するまたは最適化する）ことを示し得る。

ステップｆ）は、制御信号のそれぞれの値、実際の軌道信号の対応する値、および目標値信号の対応する値が、変更された制御信号の対応する値を決定するために使用されて、全ての値が同じ時間の事例に関する値である実施形態に限定されないことに留意されたい。

むしろ、ステップｆ）は、全ての信号を使用して操作することが好ましい。即ち、複数の時間の事例の各々について変更された制御信号の各値は、制御信号、実際の軌道信号および目標値信号および／または実際の追従のエラー信号の各々の時系列の全ての時間の事例または時間のある範囲の事例に対応する一部に基づいて決定されてもよい。

一実施形態によると、ステップｅ）は、自動走行装置が操舵される間に、実際の軌道信号を記憶装置内に記録することを含み、少なくともステップｆ）が、ステップｃ）で自動走行装置が操舵された後に、実行される。

すなわち、反復学習制御装置は、オフラインで用いられてもよく、すなわち、所定の軌道に沿って自動走行装置を操舵する操作が完了した後に用いられて、所定の軌道に沿って自動走行装置を操舵する後続の反復に備えてもよい。

時間が重要なオンラインの操作と比較して、反復学習制御装置のオフラインの操作は、反復学習制御装置内でより高度な制御アルゴリズム（より高度なパラメータ、オペレータ、またはより高度で計算集約的な制御モデル）を使用できるという利点を提供し得る。これにより、追従性能をさらに最適化することが可能になる。

特に、実際の軌道信号は、実際の軌道が測定される複数の時間の事例のうちの少なくともいくつかのそれぞれについて、位置の値（座標値）が記憶装置（メモリデバイス）内に記憶することで記録されてもよい。

記憶装置は、ＲＡＭ、フラッシュメモリ、ハードディスクドライブまたは同様物等の揮発性または不揮発性メモリでもよい。

さらなる実施形態によれば、本方法はさらに、複数の反復に続く反復について、制御信号として、変更された制御信号を使用することを含む。

ステップｃ）からステップｆ）までの複数の反復に続く反復について、制御信号として、変更された制御信号を繰り返し使用することによって、複数の反復の後に、有利には、追従性能を最大化するために最適な制御信号を決定することができる。

「後続の反復（続く反復）」とは、現在の反復の直後に続く次の反復を示すことができ、および／または、現在の反復より後の時点で実行される一つおいて次、または後続の任意のさらなる反復を示すことができる。

複数の反復のステップは、部分的に重複可能なことに留意されたい。例えば、ラップ（ＬＡＰ）レースにおいて、現在の反復の直後に、所定の軌道に沿って車両を操舵する後続の反復の場合、現在の反復の直後の次の反復では、現在の反復で使用されたものと同じ制御信号ｕを使用してもよく、そして、ステップｆ）で決定された、変更された制御信号ｕｕが、次の反復で提供されずに、次の反復の後に続く後続の反復（一つおいて次の反復）で提供されてもよい。

このようにステップｆ）とステップｃ）、ｄ）、ｅ）とを並列化することにより、ラップレースの場合でも高度なモデルを用いたオフラインの反復学習制御を有利に用いることができる。

さらなる実施形態によれば、反復学習制御装置は、制御信号から、予測された軌道信号を生成するのに適した制御モデルを含み、そして、ステップｆ）は、ｆｌ）制御信号および実際の軌道信号に基づいて制御モデルを変更するステップと、ｆ２）変更された制御モデルに基づいて制御信号を変更するステップと、を含む。

すなわち、変更された出力信号は、制御信号、実際の軌道信号、目標軌道信号、および変更されたモデルに基づいて決定される。

換言すると、本実施形態に係る制御方法は、フィードバック制御、モデルベース（model-based）制御、および学習制御（ラーニング・コントロール）の組合せとして説明することができる。この組合せは、追従性能をより最適化できるという点で有利であり得る。

特に、ステップｆｌ）では、制御モデルは、制御信号および実際の軌道信号から導出可能な、自動走行装置に関する情報に基づいて変更されてもよい。

このように、ステップｆｌ）は、制御モデルが自動走行装置に関する新しい情報を学習する学習ステップとして説明することができ、そして、ステップｆ２）は、学習した情報を適用する際に、変更された制御信号を決定するために、学習した情報が使用される適用ステップとして説明することができる。

さらなる実施形態によれば、ステップｆｌ）は、制御信号から、制御モデルによって生成された、予測された軌道信号と、実際の軌道信号との間の偏差を減少させるように、制御モデルを変更することを含む。

それにより、有利には、反復学習制御装置により構成される制御モデルは、実際の軌道信号をより正確に予測するために最適化される。

具体的には、ステップｆｌ）は、最適化問題を解くことを含み得る。最適化問題は、上記偏差を減少または最小化する制御モジュールの変更されたパラメータを決定する際に構成されてもよい。最小化とは、局所的な最小化または広域的な最小化でもよい。

さらなる実施形態によれば、ステップｆ２）は、変更された制御信号から、変更された制御モデルによって生成された、予測された軌道信号と、目標軌道信号との間の偏差を減少させるように、制御信号を変更することを含む。

これにより、有利には、変更された制御信号を使用して実施される後続の反復の予測された追従のエラー（予測された軌道信号と目標軌道信号との間の偏差）が減少される。したがって、有利には、後続の反復の実際の追従のエラーも同様に減少され得る。

具体的には、ステップｆ２）は、最適化問題を解くことを含み得る。最適化問題は、偏差を減少または最小化する、変更された制御信号を決定することでもよい。最小化は、局所的な最小化または広域的な最小化でもよい。

さらなる実施形態によれば、ステップｆｌ）および／またはステップｆ２）において実施される上記変更は、自動走行装置に課される制約の下で実施される。

制約の例としては、最大舵角、最大加速度、および同様物等が挙げられる。この制約は、それぞれの最適化問題を解くときに適用され得る。

それにより、有利には、変更された制御信号は、自動走行装置の所望の挙動および／または特性について調整されてもよい。

さらなる実施形態によれば、ステップｄ）は、実際の軌道に関する実際のパラメータを決定することを含む。制御モデルは、さらに、予測された軌道に関する予測されたパラメータを生成するように適合される。ステップｆｌ）は、制御モデルによって生成された、予測されたパラメータと、実際のパラメータとの間の偏差を減少させるように、制御モデルを変更することを含み；および／または、ステップｆ２）は、所定のパラメータ目標と、制御モデルによって生成された、予測されたパラメータとの間の偏差を減少させるように、制御信号を変更することを含む。それぞれの軌道に関するそれぞれのパラメータは、それぞれの軌道の物理的特性および／または自動走行装置および／またはそれぞれの軌道に追従するときの自動走行装置の挙動を示すパラメータである。

従って、「追従性能の最適化」とは、所定の軌道の座標と実際の軌道の位置座標との間の追従のエラーまたは偏差を減少させることだけを単に指すのではない。むしろ、有利には、それぞれの軌道に関する任意の所望のパラメータ間の偏差を減少できる。所望のパラメータは、追従のエラー、燃料消費量、車両の一部の摩耗、総走行時間および同様物等のうちの１つでもよい。

ステップｆ）が、最適化問題を解くことを含む実施形態では、可能な限り減少されることが望ましい偏差が、最適化問題の目的関数として設定されてもよく、一方、所定の最大限界を超えないことが望ましい偏差が、最適化問題を解くときの制約として設定されてもよいことに留意されたい。例えば、燃料消費量を目的関数として使用してもよく、かつ燃料消費量を最適化するための制約として、追従のエラーを使用してもよい。あるいは、燃費消費量を制約として使用してもよく、かつ追従の精度（正確さ）を最適化するための目的関数として、追従のエラーを使用してもよい。

さらなる実施形態によれば、予測された軌道に関する予測されたパラメータおよび実際の軌道に関する実際のパラメータはそれぞれ、それぞれの軌道を追従する際に自動走行装置によって消費される燃料の量と、それぞれの軌道を追従するために自動走行装置が要する時間の少なくとも１つを示す。

特に、それぞれのパラメータは、それぞれの軌道の所定の部分、例えば、その開始点からその終点までを追従するときに要する時間または燃料（量）を示すことができる。

さらなる実施形態によれば、ステップｆｌ）および／またはステップｆ２）では、制御モデルおよび／または制御信号は、複数の反復中に変更される。

すなわち、ステップｆｌ）および／またはステップｆ２）で解かれる最適化問題は、非解析的問題であり得る。非解析的最適化問題を解くことは、最適化問題を反復的に解くことを含み得る。反復的に解くことは、最急降下法および同様物等の使用を含み得る。反復は、それぞれの偏差が所定の閾値を下回るまで繰り返されてもよく、および／またはそれぞれの偏差が、連続する反復の間の所定の閾値よりも小さく変化するまで行われてもよく、および／または最急勾配が所定の閾値を下回るまで行われてもよい。換言すれば、広域的または局所的な最小化で収束が達成されるまで、反復を繰り返すことができる。

従って、有利には、追従性能をさらに改善するために、解析的に解くことができず、かつ反復解法を必要とすることがある、高度な制御モデルが使用されてもよい。

さらなる実施形態によれば、自動走行装置は、自動走行車両（自動車）である。

ここで、「自動」とは、完全に自動化された車両、半自動化された車両、または運転補助機能が備えられた従来型の車両を示し得る。

自動走行車両は、電気自動車、ハイブリッド自動車、内燃機関自動車および同様物等の自動車（車両）でもよい。

本実施形態に係る制御方法は、同一の所定の軌道に沿って車両が操舵されるときは常に有利に実施されてもよい。例えば、車両には、ステップａ）において、自動化された、駐車場またはレース場により、目標軌道信号が提供されてもよい。目標軌道信号に応答して、人間またはＰＩＤ制御装置が、ステップｂ）において、目標軌道に沿って車両を操舵するための制御信号を生成してもよい。次いで、車両は、制御信号に従って目標軌道に沿って操舵されてもよく、その実際の軌道が、ステップｃ）、ｄ）およびｅ）において記録される。その後、追従性能を向上させるために、ステップｆ）が実行されてもよい。次に、同一の目標軌道が車両に与えられた場合、その車両は、ステップｃ）〜ｅ）を繰り返して、向上された追従性能で、目標軌道に沿って車両を自動的に操舵し、そして、追従性能をさらに向上させるためにステップｆ）が実施されてもよい。従って、経時的に、反復学習制御を用いて、所定の軌道に沿って車両を操舵するために要する時間および／または燃料消費量を最適化（減少）することができる。

さらなる実施形態によれば、自動走行装置は、設計下の車両をシミュレートするように構成されたシミュレータ装置である。

設計下の車両は、自動走行車両または従来型の車両でもよく、後者の場合、「自動走行装置」における「自動」とは、人間の介入なしに、シミュレータ装置（必ずしも最終的な車両である必要はない）が、自動的に操作され得ることを示し得る。

シミュレータ装置は、ソフトウェアおよび／またはハードウエアによって実施することができる。特に、シミュレータ装置は、「Siemens Imagine. Lab Amesim」等のシミュレーション・ソフトウェアを用いて作成された、高性能の車両動的モデルでもよい。．

エンジニア（技術者）は、本提案の制御方法を使用して、所定の軌道に沿ってシミュレートされた車両の操舵を繰り返しシミュレートして、上記操舵用に最適な制御入力を決定してもよい。これにより、エンジニアは、車両の動的モデルの最適性能を評価することができる。次に、エンジニアは、所望の特性を備えたモデルが得られるまで、シミュレータ装置を変えて（設計下の車両のモデルを変えて）、このプロセスを繰り返してもよい。

従って、本提案の方法は、初期段階の車両開発の補助として、有利に使用され得る。

さらなる実施形態によれば、ステップｂ）は、自動走行装置を手動および／または自動で操舵することで得られる制御入力から制御信号を生成することを含む。

制御入力は、例えば、操舵角と加速度でもよい。

「手動操舵」とは、人間の運転手による操舵を示し得る。

「自律操舵」とは、ステップｂ）を参照する場合、比例積分微分（ＰＩＤ）制御、状態空間制御、フィードバック制御またはモデル予測制御（ＭＰＣ）等の自動走行制御法（自動運転制御法）を用いた操舵を示し得る。

第１の態様に係る任意の実施形態を、第１の態様に係る任意の実施形態と組み合わせることで、第１の態様に係る別の実施形態を得ることができる。

本発明に係る第２の態様は、少なくとも１つのコンピュータ上で用いられる場合に、自動走行装置を制御するための、上記方法を実施するためのプログラム・コードを含む、コンピュータ・プログラム製品に関する。

コンピュータ・プログラム手段等のコンピュータ・プログラム製品は、メモリ・カード、ＵＳＢスティック、ＣＤ−ＲＯＭ、ＤＶＤ、またはネットワーク内のサーバからダウンロード可能なファイルとして実装できる。例えば、このようなファイルは、無線通信ネットワークから、コンピュータ・プログラム製品を含むファイルを転送することで提供されてもよい。

本発明に係る第３の態様は、同一の所定の軌道を繰り返し追従するように自動走行装置を制御するシステムであって、
ａ）所定の軌道を示す目標軌道信号を受信するように構成された第１の装置と、
ｂ）所定の軌道に沿って自動走行装置を操舵するのに適する制御信号を生成するように構成された第２の装置と、
複数の反復の少なくとも１つについて、
ｃ）自動走行装置に対して制御信号を供給することによって所定の軌道に沿って自動走行装置を操縦することと、
ｄ）制御信号に従って自動走行装置が操舵されることに応答して、自動走行装置によって追従される実際の軌道を測定することと、
ｅ）測定された実際の軌道を示す実際の軌道信号を記録することと、
について構成された前記第３の装置（３０）と、
ｆ）複数の反復の少なくとも１つについて、反復学習制御を使用して、少なくとも制御信号と、実際の軌道信号と、目標軌道信号とに基づいて、更新された制御信号を決定するように構成された、第４の装置（４０）と、

第１の態様の方法を参照して説明した実施形態および特徴は、さらなる態様のシステムについて準用できる。第３の態様のシステムは、第１の態様の方法または第１の態様の実施形態の任意の方法を実行するために実装されてもよい。

それぞれの装置、例えば、第１の装置、第２の装置、第３の装置および／または第４の装置は、ハードウェアおよび／またはソフトウェアで実施することができる。上記装置がハードウェアとして実施される場合、例えば、コンピュータとして、またはプロセッサとして、あるいはシステムの一部として、例えば、コンピュータシステムの一部としてとして実施されてもよい。上記装置がソフトウェアとして実施される場合、コンピュータ・プログラム製品として、機能（ファンクション）として、ルーチンとして、プログラム・コードとして、または実行可能オブジェクトとして実施されてもよい。

本発明のさらなる可能な実装または代替の解決策は、実施形態に関して上述または後述される特徴の（本明細書では必ずしも明示的に言及されない）組合せを包含する。当業者であれば、本発明の最も基本的な形態に対して、個々のまたは別個の態様または特徴を追加できるであろう。

本発明のさらなる実施形態、特徴および利点は、添付の図面を参照して、本発明に係る詳細な説明と特許請求の範囲の記載から明らかになる。
なお、図中、特定されない限り、同一の参照番号は、同一の構成要素または機能的に同等の構成要素を示している。

図１は、第１の実施形態に係る方法を例示したフローチャートである。図２は、第１の実施形態に係るシステムを例示したブロック図である。図３は、第２の実施形態に係るシステムを例示したブロック図である。

図１は、自動走行装置（自動運転装置）が同一の所定の軌道を繰り返し追従するように制御するための、本発明の第１の実施の形態に係る方法（以下、「制御方法」という）を例示したフローチャートである。図２は、第１の実施の形態に従って、自動走行装置が同一の所定の軌道を繰り返し追従するように制御するシステム１（以下、「制御システム」という）を例示したブロック図である。以下、図１、図２を参照する。

制御システム１は、軌道受信装置（第１の装置）１０と、自動走行制御装置（第２の装置）２０と、車両インターフェース・アセンブリ（第３の装置）３０と、反復学習制御装置（第４の装置）４０と、を備える。

制御システム１は、自動走行車（以下、「車両」という。図示略）等の自動走行装置と関連付けられている（例えば、車両内に搭載されている、または車両と通信可能に接続されている）。

制御方法のステップＳ１０では、軌道受信装置１０は、例えば、（バレット）駐車場（図示略）内に設置された送信機等の外部の物体またはエンティティ（図示略）から目標軌道信号ｄを受信する。目標軌道信号ｄは、車両が追従することが予定されている所定の軌道を示す。

一例を示すと、所定の軌道は、（バレット）駐車場の入口から、（バレット）駐車場の所定の駐車スペースまで導く軌道でもよい。

制御方法のステップＳ２０では、自動走行制御装置２０には、目標軌道信号ｄが提供される。なお、自動走行制御装置２０は、本実施形態ではＰＩＤ制御装置でもよい。説明を簡潔にするため、ＰＩＤ制御の詳細については省略する。目標軌道信号ｄが提供されることに応答して、自動走行制御装置は制御信号ｕを生成して、その制御信号ｕを車両インターフェース・アセンブリ３０に供給する。

制御信号ｕが提供されることに応答して、車両インターフェース・アセンブリ３０は、次に３つのステップＳ３１、Ｓ３２、およびＳ３３を実行する。

ステップＳ３１では、制御信号ｕが自動走行装置に供給されることにより、自動走行装置が所定の軌道に沿って操舵または操縦される。

ステップＳ３２では、制御信号ｕに従って操舵されることに応答して、自動走行装置によって追従される実際の軌道が測定される。

ステップＳ３３では、測定された実際の軌道を示す、実際の軌道信号ｙが記録される。

車両インターフェース・アセンブリ３０は、反復学習制御装置４０に対して、実際の軌道信号ｙを供給する。同様に、制御信号ｕおよび目標軌道ｄについても、反復学習制御装置４０に対して供給する。

ステップＳ４０では、反復学習制御装置４０は、反復学習制御（ＩＬＣ）を使用して、制御信号ｕと、実際の軌道信号ｙと、目標軌道信号ｄとに基づいて、変更された制御信号ｕｕを決定する。

ステップＳ３１、Ｓ３２、Ｓ３３およびＳ４０では、このように、ステップＳ３１において、始点から終点まで所定の軌道に沿って車両が操舵された第１の反復を構成し、ステップＳ３２において、実際の軌道が測定され、ステップＳ３３において、実際の軌道信号ｙが記録され、そして、ステップＳ４０において、実際の軌道信号ｙと、目標軌道信号ｄと、制御信号ｕとに基づいて、変更された制御信号ｕｕが決定される。

これにより、第１の反復中に、変更された制御信号ｕｕが決定されるが、有利には、反復学習制御によって、自動化された車両の追従性能（トラッキング性能）が改善され得る。

好適な変更実施例では、ステップＳ４０の後、変更された制御信号ｕｕを車両インターフェース・アセンブリ３０にフィードバックして、ステップＳ３１、Ｓ３２、Ｓ３３およびＳ４０のうちの１つまたは複数の後続の反復中に、制御信号ｕとして使用されるようにしてもよい。

図３は、第２の実施形態に係る制御システム１のブロック図を示す。以下の説明は、図３の制御システムと、図２の制御システム１との間の相違点に関する。以下、図１乃至図３を参照する。

軌道受信装置１０、自動走行制御装置２０、車両インターフェース・アセンブリ３０、および反復学習制御装置４０に加えて、図３のシステム１はさらにデータベース５０を備える。

データベース５０は、複数の制御信号および目標軌道信号を互いに関連付けて記憶するように構成されている。

車両インターフェース・アセンブリ３０は、操舵（ステアリング）装置３１と、測定装置３２と、記憶（メモリ）装置３３と、消費量計（燃費メータ）３４と、を備える。消費量計は、燃料ゲージを含むことができる。

反復学習制御装置４０は、減算装置４１と、反復学習制御器（反復学習コントローラ）４２と、を備える。反復学習制御器４２は、制御モデル４３を備える。

第２の実施形態に係るシステム１は、以下の仕方で動作されてもよい。
ステップＳ１０において、軌道受信装置１０は、外部の物体から目標軌道信号ｄを受信する。目標軌道信号ｄは、一連の目標位置の値ｄ（ｋ）を含み、この際、ｋ＝ｌ…Ｋであって、ｋは、離散化された時間等の離散化指標であり、かつＫは、目標軌道信号ｄによって構成される値の総数である。軌道受信装置１０は、目標軌道信号ｄ（ｋ）を、ｋ＝ｌ…Ｋの様式で自動走行制御装置２０に対して送信して、後述のように、制御信号ｕを生成するために使用されるようにし、またデータベース５０に対して送信して、後述のように、変更された制御信号ｕｕと関連してその中で記憶されるようにし、また反復学習制御装置４０に対して送信して、予測された追従のエラー信号と、実際の追従のエラー信号ｅとを決定するために使用されるようにする。

自動走行制御装置２０は、ステップＳ２０において、車両インターフェース・アセンブリ３０に供給される制御信号ｕを、２つの仕方のいずれかで生成するように構成されてもよい。

具体的には、自動走行制御装置２０は、データベース５０と通信可能に接続されている。自動走行制御装置２０は、目標軌道信号ｄを受信すると、データベース５０に問合わせて、目標軌道信号ｄと関連した制御信号（または、目標軌道信号ｄと同一の所定の軌道を示す目標軌道信号と関連して保存されている制御信号ｕ）がデータベース５０内に保存されているか否かを判定してもよい。

データベース５０が、目標軌道信号ｄと関連して記憶された制御信号ｕを含む場合には、自動走行制御装置２０は、目標軌道信号ｄによって示される所定の軌道に沿って車両を操舵するための、継続する反復が所望であると知ることができる。この場合、記憶された制御信号は、軌道信号ｄによって示される所定の軌道に沿って車両を操舵するための変更された（更新された、改善された、または最適化された）制御信号ｕｕであってもよい。このように、自動走行制御装置２０は、制御信号ｕとして、目標軌道信号ｄと関連してデータベース５０内に記憶されている制御信号ｕｕを車両インターフェース・アセンブリ３０に供給することで、制御信号ｕを生成してもよい。

または、データベース５０が、目標軌道信号ｄと関連して記憶された制御信号を含まない場合には、自動走行制御装置２０は、ＰＩＤ制御または同様物を使用して制御信号ｕを生成して、その制御信号ｕを車両インターフェース・アセンブリ３０に供給してもよい。

車両用インターフェース・アセンブリ３０では、制御信号ｕが供給されることに応答して、以下のステップが実行される。

ステップＳ３１で所定の軌道に沿って車両を操舵するために、離散化された時間ｋ毎に、制御信号ｕの対応する値ｕ（ｋ）が操舵装置３１に対して供給される。値ｕ（ｋ）は、加速度および操舵角を含むことができる。この値ｕ（ｋ）は、さらに、記憶装置３３に対して供給されて、その内で記憶されるようにする。これにより、制御信号ｕが記憶装置３３内で記録されてもよい。

車両が所定の軌道に沿って操舵される間、離散化された時間ｋ毎に、測定装置３２は、車両が、ステップＳ３２内で制御信号ｕに従って操舵されることに応答して、車両によって追従される実際の軌道の現在の座標を測定する。現在の座標は、記憶装置３３に供給されて、そこで記憶される。これにより、実際の軌道信号ｙを記憶装置３３内に記録してもよい（ステップＳ３３、図１）。

さらに、実際の軌道（実際の軌道に関連する実際のパラメータの一例）に追従しながら車両によって消費される燃料の量を示すパラメータｐが記憶装置３３内に記憶される。パラメータｐは、燃料ゲージ３４によって、例えば離散化された時間ｋ毎等のように、一定の間隔で決定されて、更新される。

所定の軌道に沿って車両を操縦する操作が完了した後、すなわち、離散化された時間Ｋに到達すると、記録された制御信号ｕｒ（ｋ）（ｋ＝ｌ．．．Ｋ）と、記録された実際の軌道信号ｙｒ（ｋ）（ｋ＝ｌ．．．Ｋ）と、記録された実際のパラメータｐｒと、が反復学習制御装置４０に対して供給される。

より具体的には、記録された実際の軌道信号ｙｒは、反復学習制御装置４０の減算装置４１に供給されてもよい。目標軌道信号ｄも減算装置４１に供給されてもよい。減算装置４１は、目標軌道信号ｄ（ｋ）から、記録された実際の軌道信号ｙｒ（ｋ）を減算して、実際の追従のエラー信号ｅ（ｋ）を求めることができる。実際の追従のエラー信号ｅ（ｋ）（ｋ＝ｌ．．．Ｋ）は、記録された制御信号ｕｒ（ｋ）と、記録されたパラメータｐｒとともに、反復学習制御装置４２に供給されてもよい。

反復学習制御装置４２は、車両を含む制御システムの制御モデル４３を備える。

具体的には、ステップＳ４０において、反復学習制御装置４２は、学習関数（ラーニング関数）ｆを評価することで、制御モデル４３を用いて、変更された制御信号ｕｕ（ｋ）を決定することができる。学習関数ｆは、以下に示すように、実際の追従のエラーｅ（ｋ）と、記録された実際の制御信号ｕｒ（ｋ）と、記録されたパラメータ信号ｐｒとの関数でもよい。

ｕｕ（ｋ）＝ｆ［ｕｒ（ｋ）、ｅ（ｋ）、ｐｒ］（ｋ＝ｌ．．．Ｋ）

特に、関数ｆは非分析型関数（non-analytical function）でもよい。

具体的には、関数ｆの評価は、学習処理（ラーニング・プロセス）を含むことができ、その際、実際の追従のエラー信号ｅ（ｋ）と、記録された実際のパラメータ信号ｐｒ（ｋ）と、実際の制御信号ｕｒ（ｋ）とから学習された知識に基づいて、制御モデル４３が変更される。関数ｆの評価は、さらに、最適化処理を含むことができ、その際、学習処理において変更された、変更後の制御モデル４３に基づいて、変更された制御信号ｕｕ（ｋ）が決定される。

最適化問題は、目的関数と制約とを含み得る。目的関数は、追従エラーを減少させることを目的としてもよく、かつ制約は、最大限に許容可能な燃料消費（量）でもよい。逆に、目的関数は、燃料消費（量）を減らすことを目的としてもよく、かつ制約は、最大限に許容可能な追従エラーでもよい。

このようにして変更された制御信号ｕｕ（ｋ）が決定されると、変更された制御信号ｕｕ（ｋ）がデータベース５０に提供されて、その中でターゲット軌道信号ｄ（ｋ）と関連付けられて記憶される。

このように、変更された制御信号ｕｕ（ｋ）は、軌道受信装置１０が同一の目標軌道信号ｄ（ｋ）を受信する後続の反復の間に、自動走行制御装置２０によって使用できるようになる。

従って、同一の所定の軌道を追従するときに車両に用いられた、経験した追従エラー、燃料消費または時間等の追従性能は、後続の反復によって反復的に改善され得る。

ここで、第２の実施形態に係る好適な変更例を用いて、ステップＳ４０の好適な変更例についてより詳細に説明する。

第２の実施形態に係る好適な変更例では、制御モデル４３は、この制御モデル４３に提供される制御信号に基づいて予測された軌道信号を生成するように構成され得る。制御モデル４３は、さらに、制御信号に基づいて、予測されたパラメータを生成するように構成され得る。

すなわち、好適な変更例では、反復学習制御装置４２は、ステップＳ４０において制御モデル４３を用いて学習関数ｆを評価するために後続のステップを実行できる。

上述した学習処理の一例として、第１のサブステップ（ｆｌ）では、反復学習制御装置４２は、制御モデル４３を複数の反復で変更してもよい。各反復中、反復学習制御装置４２は、制御モデル４３を使用して、記録された制御信号ｕｒ（ｋ）に基づいて、予測された軌道信号ｙｐ（ｋ）と予測されたパラメータｐｐとを決定してもよい。

ここで、予測されたパラメータｐｐは、予測された軌道信号ｙｐ（ｋ）によって示される予測された軌道に追従しながら、車両によって消費される、予測された燃料の量（一例を挙げると、予測された軌道と関連する予測されたパラメータ）でもよい。

それぞれの反復中、反復学習制御装置４２は、最急降下法等の反復最適化法に従って、制御モデル４３を変更してもよい。最適化法の目的関数は、予測された軌道ｙｐ（ｋ）と、記録された軌道ｙｒ（ｋ）との間の偏差を減少または最小化すること、および／または、予測されたパラメータｐｐと記録されたパラメータｐｒとの間の偏差を減少または最小化することでもよい。

本明細書では、予測された軌道信号ｙｐ（ｋ）と記録された軌道信号ｙｒ（ｋ）との間の偏差を減少させることは、予測された軌道信号ｙｐ（ｋ）を目標軌道信号ｄ（ｋ）から差し引くことによって決定される予測された追従のエラー信号と、実際の追従のエラー信号ｅ（ｋ）との間の偏差を減少させることと機能的に同等であり得ることに留意されたい。減算装置４１は、予測された追従のエラー信号を決定するために使用され得るが、図３には明示されていない。

反復学習制御装置４２は、その１つまたは複数のパラメータを変更することによって、制御モデル４３を変更することができる。反復学習制御装置４２は、局所的または広域的な最小値での偏差の収束が達成されるまで、制御モデル４３を反復的に変更し続けることができる。

換言すると、第１のサブステップ（ｆｌ）の学習処理では、反復学習制御装置４２は、最適化問題を解くことで、制御モデル４３によってモデル化された、車両を含む制御システムの観測された挙動と、制御モデル４３とがより良く一致するようにしてもよい。この際、観測された挙動は、記録された制御信号ｕｒ（ｋ）と、記録されたパラメータｐｒと、記録された実際の軌道信号ｙｒ（ｋ）（実際の追従のエラー信号ｅ（ｋ））とによって示され得る。

ステップＳ４０の第２のサブステップ（ｆ２）では、反復学習制御装置４２は、変更された制御信号ｕｕ（ｋ）を反復的に決定してもよい。具体的には、反復学習制御装置４２は、まず、変更された制御信号ｕｕ（ｋ）として、記録された制御信号ｕｒ（ｋ）を使用し、そして変更された制御信号ｕｕ（ｋ）を複数の反復の中で反復的に変更してもよい。

各反復中、反復学習制御装置４２は、変更された制御モデル４３を使用して、現在の変更された制御信号ｕｕ（ｋ）に基づいて、予測された目標軌道ｙｐ（ｋ）と予測されたパラメータｐｐとを決定してもよい。

それぞれの反復中、反復学習制御装置４２は、最急降下法等の反復最適化法に従って、変更された制御信号ｕｕ（ｋ）を変更してもよい。最適化法の目的関数は、予測された軌道ｙｐ（ｋ）と所望の目標軌道ｄ（ｋ）との間の偏差（追従エラーを減少または最小化することとも呼ばれる）を減少または最小化すること、および／または、予測されたパラメータｐｐと所定のパラメータ目標との間の偏差を減少または最小化することであり得る。具体的には、所定のパラメー目標は、許容可能な最大の総合的な燃料消費量でもよい。

反復学習制御装置４２は、局所的または広域的な最小値での偏差の収束が達成されるまで、制御モデル４３を反復的に変更し続けることができる。

ここで、最小化の対象の偏差が、予測された軌道ｙｐ（ｋ）と目標軌道ｄ（ｋ）との間の偏差として選択される場合、反復学習制御装置４２は、予測された追従エラー（一例を挙げれば、最適化の対象の予測された追従性能）を効果的に最適化する。最小化の対象の偏差が、予測されたパラメータｐｐと所定のパラメータ目標との間の偏差として選択される場合、反復学習制御装置４２は、予測された軌道に追従するときに、車両によって消費される燃料の予測量等の、予測された軌道と関連する予測されたパラメータを効果的に最適化する（予測された追従性能についての他の例）。

予測された追従エラーを最適化する際、許容可能な最大の燃料消費量は、変更された制御信号ｕｕ（ｋ）を変更するときの制約として考慮され得る。反対に、予測された燃料消費量を最適化する場合、許容可能な最大の追従エラーは、変更された制御信号ｕｕ（ｋ）を変更するときの制約として考慮され得る。

変更された制御信号ｕｕ（ｋ）を変更する際に考慮されるさらなる制約は、許容可能な最大舵角や、許容可能な最大加速度等の、車両の特性によって課される制約でもよい。

換言すると、第２のサブステップ（ｆ２）の最適化処理において、反復学習制御装置４２は、最適化問題を解くことによって、変更された制御モデル４３によって生成された予測に基づいて、期待される変更された制御信号ｕｕ（ｋ）を決定することで、所定の制約の組み合わせの下で、改善または最適化された追従性能（最小の追従エラーまたは最小の燃料消費量等）が得られるようにしてもよい。

このようにして、ステップ（ｆｌ）において、受信された目標軌道信号ｄ（ｋ）によって示された所定の軌道に沿って車両が操舵された後に、ステップＳ４０が実行されたとき、制御モデル４３が学習によって変更されて、ステップ（ｆ２）において、予測された追従性能を最適化することで制御信号が変更される。

各反復（車両が同一の所定の軌道に沿って操舵される、すなわちステップＳ３１、Ｓ３２およびＳ３３、図１に従って操舵される反復）中にステップＳ４０を繰り返し実行することで、有利には、反復学習を通して、後続の反復で実際の追従性能を改善することができる。

以上、好適な実施形態に従って本発明について説明したが、これら実施形態のすべてについて修正が可能なことは、当業者であれば自明であろう。

上記実施形態は、主にバレット駐車場におけるシナリオを考慮して説明されたが、本開示内容は、ラップ(ＬＡＰ) レーシングのシナリオ、ホーム駐車場のシナリオ、および自動走行装置が同一の所定の軌道に沿って繰り返し操舵される任意の他のシナリオに対しても同様に適用可能である。

本実施形態は、自動走行装置の一例として、車両（自動車）等を用いた場合の自動走行車両を想定して説明した。しかしながら、本開示内容は、他、自動走行装置が設計下の自動車をシミュレートするように構成されたシミュレータ装置である発展形態のシナリオに対しても同様に適用可能である。

軌道に関連するパラメータは、消費される燃料の量に限定されず、他、車両の一部における摩耗量や、所定の軌道のうちの始点から終点までの間で車両の操舵が完了するまでに要する時間や、同様物等を含み得る。

なお、第２の実施形態によれば、複数のターゲット軌道信号と関連する変更された制御信号とをデータベース５０に記憶できることに留意されたい。好ましくは、データベース５０には、各々が目標軌道信号の１つに関連付けられた制御モデル４３の複数の事例（インスタンス）を格納することができる。ここで、制御モデルの事例とは、例えば、一組のモデルパラメータでもよい。より正確には、ステップＳ４０の実行毎に、反復学習制御装置４２は、ステップＳ４０の学習処理および最適化処理を実行する前に、現在の目標軌道信号に対応する制御モデル４３の対応する事例を、反復学習制御装置４２内に入れる（ロードする）ことができ、そして、ステップＳ４０の完了時に、変更された制御モデル４３（その事例）をデータベース５０に書き戻すことができる。すなわち、制御モデル４３の異なる事例は、異なる目標軌道信号（異なる運転シナリオ）に従って教示（変更）されてもよい。

しかしながら、データベース５０は、非限定的で選択的な特徴であって、後続のインターフェースのために車両インターフェース３０に対して変更された制御信号ｕｕを直接フィードバックすることも考慮されている。データベース５０を含まない実施形態は、ラップ（ＬＡＰ）レーシングのシナリオでは効果的に使用され得るが、その際、自動走行車両が同一のラップに沿って繰り返し格納されて、追従性能の最適化がレースを通じてなされる。レースの終了後、学習された情報は、もはや必要とされないため、そのような情報をデータベースに記憶する必要はない。

ステップＳ３１、Ｓ３２、Ｓ３３およびＳ４０の一部または全ては、当業者の判断で並列化することができる。

実際の軌道信号ｙおよび所望の信号ｄ等の第２の実施形態で説明した様々な信号は、必ずしも同じ離散指標ｋを用いてパラメータ化される必要はなく、それぞれ異なる離散化を用いてパラメータ化されてもよい。

１制御システム
１０軌道受信装置（第１の装置）
２０自動走行（自動運転）制御装置（第２の装置）
３０車両インターフェース・アセンブリ（第３の装置）
４０反復学習制御装置（第４の装置）
５０データベース

所定の駐車場所までのホーム駐車場若しくはバレット駐車場または自動走行ラップ（ＬＡＰ）レース等では、自動走行車両は、指定された駐車スペースまでの軌道や、ラップ周りの軌道等の、同一の所定の軌道を追従するように繰り返し制御されている。
上記種類の方法は、２０１５年７月１日、米国自動制御会議（AMERICANAUTOMATIC CONTROL COUNCIL）、２０１５年度米国制御会議（ACC：AMERICAN CONTROL CONFERENCE）、カパニア・ニティンＲ（KAPANIANITIN R）等による『反復学習制御による高度動的自律走行軌道の経路追跡（Path tracking ofhighly dynamic autonomous vehicle trajectories via interative learning control）』、第２７５３頁−第２７５８頁、ＸＰ０３３１８５２５９、から知られている。
同様の開示内容が、２０１１年７月２０日、ＩＥＥＥ（アイ・トリプル・イー）、２０１１年度国際会議、ＰＡＣＣ（Process automation, control and computing）、マノハランＰＳ（MANOHARAN PS）等による『反復学習制御を用いた軌道追跡（Trackingtrajectory using iterative learning control）』、第１頁−第５頁、ＸＰ０３１９２８４２２、から知られている（DOI: 10.1109/PACC.2011.5978963, ISBN:978-1-61284-765-8）。

Claims

同一の所定の軌道を繰り返し追従するように自動走行装置を制御する方法であって、
ａ)所定の軌道を示す目標軌道信号（ｄ）を受信するステップ（Ｓ１０）と、
ｂ)前記所定の軌道に沿って前記自動走行装置を操舵するのに適する制御信号（ｕ）を生成するステップ（Ｓ２０）と、
複数の反復の少なくとも１つについて、
ｃ)前記自動走行装置に対して前記制御信号（ｕ）を供給して、所定の軌道に沿って前記自動走行装置を操舵するステップ（Ｓ３１）と、
ｄ)前記制御信号（ｕ）に従って操舵されることに応答して、前記自動走行装置によって追従される実際の軌道を測定するステップ（Ｓ３２）と、
ｅ)測定された前記実際の軌道を示す実際の軌道信号（ｙ）を記録するステップ（Ｓ３３）と、
ｆ)反復学習制御装置（４０）を用いて、少なくとも前記制御信号（ｕ）と、前記実際の軌道信号（ｙ）と、前記目標軌道信号（ｄ）とに基づいて、変更された制御信号（ｕｕ）を決定するステップ（Ｓ４０）と、
を含む方法。
前記ステップｅ）では、前記自動走行装置が操舵される間に、前記実際の軌道信号（ｙ）を記憶装置（３３）内に記録することを含み、かつ少なくとも前記ステップｆ）は、前記自動走行装置が前記ステップｃ）中で操舵された後に実行される、請求項１に記載の方法。
さらに、
ｈ) 前記制御信号（ｕ）として、前記変更された制御信号（ｕｕ）を前記複数の反復に続く反復で使用する、請求項１または２に記載の方法。
前記反復学習制御装置（４０）は、前記制御信号から、予測された軌道信号を生成するのに適する制御モデルを備え、
前記ステップｆ）は、
ｆｌ）前記制御信号と前記実際の軌跡信号とに基づいて前記制御モデルを変更することと、
ｆ２）前記変更された制御モデルに基づいて前記制御信号を変更することと、を含む、
請求項１〜３のうちのいずれか１項に記載の方法。
前記ステップｆｌ）は、前記制御信号（ｕ）から前記制御モデル（４３）によって生成された、予測された軌道信号と、前記実際の軌道信号（ｙ）と、の間の偏差を減少させるように、前記制御モデル（４３）を変更することを含む、請求項４に記載の方法。
前記ステップｆ２）は、前記変更された制御信号（ｕｕ）から前記変更された制御モデル（４３）によって生成された、前記予測された軌道信号と、前記目標軌道信号（ｄ）との間の偏差を減少させるように、前記制御信号（ｕ）を変更することを含む、請求項４または５に記載の方法。
前記ステップｆｌ）および／または前記ステップｆ２）で実施される前記変更は、前記自動走行装置に課される制約の下で実行される、請求項４〜６のうちのいずれか１項に記載の方法。
前記ステップｄ）は、前記実際の軌道に関する実際のパラメータを決定することを含み、
前記制御モデル（４３）は、前記予測された軌道に関する予測されたパラメータを生成するようにさらに適合され、
前記ステップｆｌ）は、前記制御モデル（４３）によって生成された前記予測されたパラメータと前記実際のパラメータとの間の偏差を減少させるように、前記制御モデル（４３）を変更することを含み、および／または、
前記ステップｆ２）は、前記制御モデル（４３）によって生成された前記予測されたパラメータと、所定のパラメータ目標との間の偏差を減少させるように、前記制御信号を変更することを含み、
それぞれの軌道に関するそれぞれのパラメータは、それぞれの軌道の物理的特性および／または自動走行装置および／または自動走行装置がそれぞれの軌道を追従するときの自動走行装置の挙動を示すパラメータである、請求項４〜７のうちのいずれか１項に記載の方法。
前記予測された軌道に関する予測されたパラメータと、前記実際の軌道に関する実際のパラメータはそれぞれ、前記自動走行装置が、前記それぞれの軌道を追従する際に要する時間と、前記自動走行装置がそれぞれの軌道を追従する際に消費する燃料量のうちの少なくとも１つを示す、請求項８に記載の方法。
前記ステップｆｌ）および／または前記ステップｆ２）において、前記制御モデル（４３）および／または前記制御信号（ｕ）が、前記複数の反復の中で変更される、請求項４〜９のうちのいずれか１項に記載の方法。
前記自動走行装置が、自動走行型車両であることを特徴とする請求項４〜１０のうちのいずれか１項に記載の方法。
前記自動走行装置が、設計下の車両をシミュレートするように構成されたシミュレータ装置である、請求項４〜１０のうちのいずれか１項に記載の方法。
前記ステップｂ）が、前記自動走行装置を手動および／または自動で操舵することで得られる制御入力から前記制御信号（ｕ）を生成することを含む、請求項１〜１２のうちのいずれか１項に記載の方法。
コンピュータ・プログラム製品であって、
少なくとも１つのコンピュータ上で実行される場合、請求項１〜１３のうちのいずれか１項に記載の方法を実行するプログラム・コードを備えることを特徴とするコンピュータ・プログラム製品。
同一の所定の軌道を繰り返し追従するように自動走行装置を制御するシステム（１）であって、
ａ）所定の軌道を示す目標軌道信号（ｄ）を受信するように構成された第１の装置（１０）と、
ｂ）所定の軌道に沿って前記自動走行装置を操舵するのに適した制御信号（ｕ）を生成するように構成された第２の装置（２０）と、
複数の反復の少なくとも１つについて、
ｃ) 前記自動走行装置に対して制御信号（ｕ）を供給することにより所定の軌道に沿って前記自動走行装置を操縦することと、
ｄ) 前記制御信号（ｕ）に従って操舵されることに応答して、前記自動走行装置によって追従される実際の軌道を測定することと、
ｅ）測定された前記実際の軌道を示す実際の軌道信号（ｙ）を記録することと、
について構成された前記第３の装置（３０）と、
ｆ）複数の反復の少なくとも１つについて、反復学習制御を使用して、少なくとも、前記制御信号（ｕ）と、前記実際の軌道信号（ｙ）と、前記目標軌道信号（ｄ）とに基づいて、更新された制御信号（ｕｕ）を決定するように構成された第４の装置（４０）と、
を含むシステム。