JP2023502797A

JP2023502797A - 自動運転車または半自動運転車のアダプティブコントロール

Info

Publication number: JP2023502797A
Application number: JP2022555258A
Authority: JP
Inventors: バーントープ，カール; ディ・カイラノ，ステファノ; メナー，マルセル
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2019-12-03
Filing date: 2020-12-01
Publication date: 2023-01-25
Anticipated expiration: 2040-12-01
Also published as: CN114746823A; US20210165409A1; US11327492B2; EP4070167B1; JP7334364B2; EP4070167A1; WO2021112262A1

Abstract

車両のコントローラは、制御関数を使用して、車両の現在の状態を目標状態に遷移させる。制御関数は、第１モーメントおよび少なくとも１つの高次モーメントが規定する目標状態のパラメトリック確率分布を出力するための確率論的制御関数である。コントローラは、現在の状態を、次の運転意思に一致する制御関数のサブ集合に少なくとも登録して目標状態のパラメトリック確率分布のサブ集合を生成し、パラメトリック確率分布のサブ集合を結合して目標状態の統合パラメトリック確率分布を生成し、目標状態の統合パラメトリック確率分布の第１モーメントと少なくとも１つの高次モーメントとに基づいて制御コマンドを決定する。

Description

本発明は、全体的に、車両を制御することに関し、特に、自動運転車または半自動運転車を制御することに関する。

自動運転車は、相互接続された高度なセンシングコンポーネントおよび制御コンポーネントの統合を必要とする複雑な意思決定システムである。最高レベルでは、ルートプランナーによって道路網から一連の運転意思が計算される。離散意思決定層は、局所的な車両の運転目標を決定する役割を担う。各意思は、右折するという意思、車線に留まるという意思、左折するという意思、または交差点において特定の車線で完全停止するという意思のうちのいずれかであり得る。センシング／マッピングモジュールは、レーダー、ＬＩＤＡＲ、カメラ、およびＧＰＳ（Global Positioning System）情報など、様々なセンサー情報を以前のマッピング情報とともに使用して、運転シナリオに関連性のある周囲の状況の各部を推定する。

モーションプランニングの出力は、車両コントローラへの入力である。モーションプランナーは、センシング／マッピングモジュールからの出力に基づいて車両が従うべき安全かつ所望の、動的に実現可能な軌道を決定する役割を担う。次に、車両制御アルゴリズムが、操舵角、車輪トルク、およびブレーキ力など、コマンドを発行することによって、比較的高いサンプリング頻度でこの基準の動きを追跡することを目標とする。最後に、アクチュエータ制御層がアクチュエータを調整して、これらの要求コマンドを実現する。

自動運転車におけるモーションプランニングの課題は、標準ロボディクスセットアップと多くの類似点を共有しており、課題の非凸性により、ほとんどの場合、最適解が扱い難い。特化したシナリオの場合、順動的最適化（Direct Dynamic Optimization）に依拠する手法が開発されてきた。しかしながら、これでは、非凸性のせいで、局所的な最適解に終わるだけであり、全体的な最適解からは程遠く、比較的大きな演算負荷および時間がかかる可能性がある。モーションプランニングは、高速探索ランダムツリー（ＲＲＴ：Rapidly-Exploring Random Tree）法などのサンプリングベースの方法、または、Ａ^＊、Ｄ^＊およびその他のバリエーションなどのグラフ探索法を使用して行われることが多い。

このサンプリングを決定論的に行う方法がある一方で、米国特許第９，５６８，９１５号に記載の方法など、確率論的サンプリングを利用する方法もある。このサンプリング技術は、高速機械計算に適しているが、サンプリング法によって生成される経路は、自動運転車または半自動運転車内の乗員には不自然に感じられる場合がある。したがって、依然として、自動運転車または半自動運転車のパスプランニングおよび制御を改善する必要がある。

いくつかの実施の形態は、サンプリングベースのパスプランニング方法は、性質上、日和見的かつ試験的であるという認識に基づく。サンプリング技術は、高速機械計算に適しているが、人間のドライバーがパスプランニングおよび／または運転タスクに取り組む方法に必ずしも一致しているわけではない。その結果、サンプリング法によって生成される経路は、自動運転車または半自動運転車の乗員には不自然に感じられる場合がある。

たしかに、人間のドライバーは、動いている途中に自由空間をサンプリングすることによって運転車両の経路を決定することはない。そのためには、いくつかの実施の形態の目的は、自動運転車または半自動運転車の自動制御に適した方法における経路生成についての人間のドライバーに意思決定を近似させることである。具体的には、いくつかの実施の形態は、以下に概要を説明する理解および目的のうち１つまたは組合せを用いる。

第１に、いくつかの実施の形態は、人間のドライバーは、日和見的にサンプリングするのではなく、１つまたは複数の運転目的を達成することを目標とした、結果重視の方法で車両を操作しているという認識に基づく。たとえば、車両の正面の空間をサンプリングするのではなく、意識的または無意識に直近の未来の運転目的を立てることは、人間のドライバーの本質である。運転目的として、現在の速さを維持すること、車間距離を維持すること、速さ制限まで速さを上げること、止まれの標識で停止すること、車両を車線中央に維持すること、車線を変更すること、障害物を回避することなどが挙げられる。これらの目的を立てた後、人間のドライバーは、自身の経験と運転スタイルで車両を動かす。そのためには、いくつかの実施の形態の目的は、サンプリングベースのパスプランニングではなく、運転目的ベースのパスプランニングを提供することである。

第２に、人間のドライバーは、複数の目的について、それらの重要度および類似度に基づいてバランスを取ることができる。たとえば、現在の速さの維持という一方の運転目的が、車間距離を維持するという他方の運転目的と相反する場合、人間のドライバーは、これらの目的のバランスを取って安全な運転意思を決定するであろう。そのためには、いくつかの実施の形態の別の目的は、様々な運転目的について、特定の運転状況に対するこれらの目的の重要度に基づいてバランスを取るのに適した、運転目的をベースにしたパスプランニングを提供することである。

第３に、人間のドライバーは、意思決定において柔軟性を受け入れる。このような柔軟性は、ドライバーの運転スタイル、運転の不安を大きくさせる交通量もしくは明白な視界の状態などの環境の状況、またはドライバーの単なる気分に基づき得る。そのためには、いくつかの実施の形態の目的は、運転目的をベースにしたパスプランニング手法にこのような柔軟性を取り入れることである。

第４に、人間は、異なるスタイルで車両を運転する。運転スタイルとして、攻めた運転、守りの運転、および普通または中立の運転などが挙げられる。そのためには、いくつかの実施の形態の別の目的は、異なる運転スタイルに適応可能な、運転目的をベースにしたパスプランニングを提供することである。

第５に、道路状況は予測不能であり、めまぐるしく変化し続ける。そのためには、いくつかの実施の形態の別の目的は、制御適応に適した、運転目的をベースにしたパスプランニングを提供することである。

それゆえ、異なる実施の形態が、上述した目的のうち１つまたは組合せに自動運転車または半自動運転車の制御に適した方法で対処する。

いくつかの実施の形態は、運転目的に対応して１つまたは複数の状態変数を現在値から１つまたは複数の未来値に遷移させる制御関数によって運転目的を表すことができるという理解に基づいている。制御関数は、「どのように」という質問ではなく、「何」という質問に返答するので、これらの制御関数は、人間のドライバーの結果重視の方法を模倣する。とりわけ、運転経験を模倣するために、これらの制御関数は予め決定されている。いくつかの実施の形態では、１つの運転目的に対して１つの制御関数がある。それゆえ、制御関数として、現在の速さを維持するための関数、車間距離を維持するための関数、速さ制限まで速さを上げるための関数、止まれの標識で停止するための関数、車両を車線中央に維持するための関数、車線を変更するための関数、障害物を回避するための関数などが挙げられる。

制御関数の入力は、現在の速さ、加速度、位置、および進行方向のうち１つまたは組合せなど、車両の状態変数を含む。また、制御関数への入力は、環境のマップと交通データとを含み得る。制御関数の出力は、状態変数の目標値のうち１つまたは組合せを含む。たとえば、車間距離を維持するための制御関数は、車両の目標速さを出力し得る。車線を変更するための制御関数は、一連の横加速度値を出力し得る。

そのためには、いくつかの実施の形態は、制御目的の集合について決定した制御関数の集合を保持して、先に列挙した第１の理解に対処する。異なる制御関数は、異なる方法で決定され得る。いくつかの関数は、アナリティカルな関数であり、一定の法則に基づいて目標状態変数を推定する。いくつかの関数は、課題解決器（ソルバー）であり、微分方程式の解に基づいて目標状態変数を推定する。いくつかの関数は、学習する関数であり、訓練データから予め学習したハイパーパラメータに従って目標状態変数を推定する。ハイパーパラメータにより、制御関数を実際の運転データにマッピングすることができる。

いくつかの実施の形態は、制御関数は確率論的であるべきである、すなわち、目標状態変数の確率論的分布を出力するべきであるという理解に基づいている。たとえば、現在の速さを維持するための制御関数は、速さ値および加速度値だけでなく、これらの値の確率論的分布も出力すべきである。確率論的分布は、ガウス分布の場合の平均値および分散値のように、そのパラメータによってパラメータ化することができる。そのためには、いくつかの実施の形態では、制御関数は、目標状態変数に現在の状態変数をマッピングする決定論的成分と、目標状態変数ごとに分布を規定する確率論的成分とを含む。事実上、制御関数の確率論的であるという性質が、運転意思決定における柔軟性を模倣するようになり、運転目的をベースにしたパスプランニングを、制御環境の予測不能性に適応させることができるようになる。

次に、いくつかの実施の形態は、制御関数の確率論的成分が複数の制御目的のバランスを取る経路を生成する際の関数の重要度を符号化できるという理解に基づいている。たとえば、いくつかの実施の形態では、制御目的の重要度は、制御関数の確率論的成分の分散値に反比例する。いくつかの実施の形態は、この関係性を複数の制御関数の出力を結合するために利用して、車両経路の目標状態を推定する。

次に、いくつかの実施の形態は、制御関数の確率論的成分が乗員の運転スタイルを符号化できるという理解に基づいている。たとえば、普通の運転スタイルについては制御関数の決定論的成分を決定できる一方で、制御関数の確率論的成分は、普通のスタイルからのずれを表し得る。たとえば、制御関数を、異なる運転スタイルにマッピングされた複数の確率論的成分に対応付けることができる。たとえば、車線を変更するという運転目的の場合、制御関数の確率論的成分は、シグモイド関数に類似した経路を出力する。攻めの運転スタイルに対応する確率論的成分は、シグモイド関数を範囲に含む分布を形成し、シグモイド関数の曲率が規定する転回よりも急な転回を用いる尤度を上げる。そのためには、いくつかの実施の形態は、少なくとも一部の制御関数についての確率論的成分の集合を集合に含めて、確率論的成分の選択が運転スタイルに反映されるようにする。

これに加えて、またはこれに代えて、いくつかの実施の形態は、目標状態変数の確率分布が表す経路に従って車両を制御する、分布を意識したコントローラを使用する。具体的には、いくつかの実施の形態は、（半）自動運転システムに統合アーキテクチャを使用する。この統合アーキテクチャには、低速かつ長期の、サンプリングベースのモーションプランニングアルゴリズムと、高速かつ反応性が高い、最適化ベースの予測車両コントローラとを含む。この統合により、モーションプランニング層および車両制御層による複数の競合する目的、たとえば、比較的複雑な高速道路および都市の運転シナリオにおいて安全要件を満たすこと、および、信頼性が高く快適な運転挙動を確実にすることの両方を達成するという責任を体系的かつ効果的に共有することが可能になる。この統合は、経路生成が不確実な状態での制御の柔軟性に適応できる。

これに加えて、コントローラは、目標状態変数の確率論的分布の第１モーメントおよび高次モーメントを考慮して、車両のアクチュエータに対する制御コマンドを決定する。たとえば、一実施の形態では、コントローラは、予測範囲にわたるコスト関数を最適化することによって制御コマンドを決定し、車両の１つまたは複数のアクチュエータに対する一連の制御コマンドを生成するように構成された予測コントローラである。コスト関数を最適化することによって、統合パラメトリック確率分布の第１モーメントが規定する一連の目標状態を追跡するコストのバランスを、車両の動きの少なくとも１つのその他の基準値のコストに対して取ることができる。最適化のバランスを取る際、統合確率分布の高次モーメントのうちの１つまたは複数を用いて追跡コストの重要度が重み付けされる。

したがって、一実施の形態は、車両の動きを制御するためのシステムを開示する。このシステムは、車両の現在の状態と、車両の近傍の環境の画像と、車両の次の運転意思とを受け付けるように構成された入力インターフェースと、制御関数の集合を格納するように構成されたメモリとを備える。各制御関数は、その対応する制御目的に基づいて、車両の現在の状態を目標状態に遷移させるように構成される。制御関数のうち少なくともいくつかは、確率論的制御関数であり、確率論的制御関数の出力が第１モーメントおよび少なくとも１つの高次モーメントが規定する目標状態のパラメトリック確率分布になるよう、現在の状態を目標状態に遷移させるための決定論的成分と、決定論的成分が決定した目標状態を中心とした値の確率論的分布を決定するための確率論的成分とを含む。システムは、さらに、モーションプランナーおよびコントローラを実行するように構成されたプロセッサを備える。モーションプランナーは、実行されると、現在の状態を、次の運転意思に一致する制御関数のサブ集合に少なくとも登録して目標状態のパラメトリック確率分布のサブ集合を生成し、パラメトリック確率分布のサブ集合を結合して目標状態の統合パラメトリック確率分布を生成する。コントローラは、実行されると、目標状態の統合パラメトリック確率分布の第１モーメントおよび少なくとも１つの高次モーメントに基づいて制御コマンドを決定する。システムは、さらに、車両のアクチュエータに制御コマンドを出力するように構成された出力インターフェースを備える。

別の実施の形態は、車両の動きを制御するための方法を開示する。この方法は、制御関数の集合を格納するメモリに結合されたプロセッサを使用する。各制御関数は、その対応する制御目的に基づいて、車両の現在の状態を目標状態に遷移させるように構成される。制御関数のうち少なくともいくつかは、確率論的制御関数であり、確率論的制御関数の出力が第１モーメントおよび少なくとも１つの高次モーメントが規定する目標状態のパラメトリック確率分布になるよう、現在の状態を目標状態に遷移させるための決定論的成分と、決定論的成分が決定した目標状態を中心とした値の確率論的分布を決定するための確率論的成分とを含む。プロセッサは、方法を実装する格納された命令に連結される。命令は、プロセッサによって実行されると、方法の少なくともいくつかのステップを実行する。当該いくつかのステップは、車両の現在の状態、車両の近傍の環境の画像、および車両の次の運転意思を受け付けるステップと、現在の状態を、次の運転意思に一致する制御関数のサブ集合に少なくとも登録して目標状態のパラメトリック確率分布のサブ集合を生成するステップと、パラメトリック確率分布のサブ集合を結合して目標状態の統合パラメトリック確率分布を生成するステップと、目標状態の統合パラメトリック確率分布の第１モーメントおよび少なくとも１つの高次モーメントに基づいて制御コマンドを決定するステップと、車両のアクチュエータに制御コマンドを出力するステップとを含む。

さらに別の実施の形態は、プロセッサによって実行可能であり、方法を実行するためのプログラム、を含んだ非一時的なコンピュータ読み取り可能な記憶媒体を開示する。この媒体は、制御関数の集合を格納する。各制御関数は、その対応する制御目的に基づいて、車両の現在の状態を目標状態に遷移させるように構成される。制御関数のうち少なくともいくつかは、確率論的制御関数であり、確率論的制御関数の出力が第１モーメントおよび少なくとも１つの高次モーメントが規定する目標状態のパラメトリック確率分布になるよう、現在の状態を目標状態に遷移させるための決定論的成分と、決定論的成分が決定した目標状態を中心とした値の確率論的分布を決定するための確率論的成分とを含む。方法は、車両の現在の状態、車両の近傍の環境の画像、および車両の次の運転意思とを受け付けるステップと、現在の状態を、次の運転意思に一致する制御関数のサブ集合に少なくとも登録して目標状態のパラメトリック確率分布のサブ集合を生成するステップと、パラメトリック確率分布のサブ集合を結合して目標状態の統合パラメトリック確率分布を生成するステップと、目標状態の統合パラメトリック確率分布の第１モーメントおよび少なくとも１つの高次モーメントに基づいて制御コマンドを決定するステップと、車両のアクチュエータに制御コマンドを出力するステップとを含む。

いくつかの実施の形態に係る、結果重視の車両制御の模式図である。いくつかの実施の形態に係る、結果重視の車両制御の模式図である。いくつかの実施の形態に係る、道路上を運転するための運転挙動の制御目的候補、およびそれらの対応する制御関数の例示的な一覧を示す図である。いくつかの実施の形態が採用する確率論的制御関数の構造の模式図である。いくつかの実施の形態に係る、車両コントローラの性能に対するモーションプランナーの確率論的出力の効果の例を示す図である。いくつかの実施の形態に係る、車両コントローラの性能に対するモーションプランナーの確率論的出力の効果の例を示す図である。本発明の一実施の形態に係る、車両を制御するための方法のフローチャートである。道路上を移動し、かつ環境と相互作用する車両を制御するための制御システムの全体的なブロック図である。いくつかの実施の形態に係る、どのようにモーションプランナーが様々な車両コントローラと相互作用するかについてのブロック図である。一実施の形態に係る、入力インターフェース、選択インターフェース、出力インターフェース、モーションプランナー、コントローラ、プロセッサ、およびメモリの接続関係の一般的な構造を示す図である。運転スタイルを選択するための車両の関連内装品、またはユーザインターフェースの例示的なセットアップを示す図である。道路上に車両を維持するという制御目的に対応する制御関数を説明するイラストである。道路上での車両走行時間を短縮するという制御目的に対応する制御関数を説明するイラストである。安全に車両を追い抜くという運転目的を表現するための制御関数を説明するイラストである。いくつかの実施の形態に係る、現在の速さを維持するという目的の制御関数を説明できる方法を説明するイラストである。一実施の形態に係る、スムーズに運転するという運転目的の制御関数を説明できる方法を説明するイラストである。一実施の形態に係る、共分散を有するガウス成分を説明するイラストである。一連の状態および関連する確率分布関数をもたらす確率論的制御関数の概念、および人間同士で意思決定がどのように異なり得るかを示す図である。一実施の形態に係る、制御関数の確率論的成分を決定するための方法のフローチャートである。一実施の形態に係る、ステップ長を決定するための方法を示す図である。一実施の形態に係る、制御関数のサブ集合を選択するための方法のフローチャートである。異なる運転スタイルの制御関数の成分を説明するイラストである。異なる運転スタイルの制御関数の成分を説明するイラストである。運転スタイルの違いを識別するためにどのように確率論的成分を利用できるかを示す図である。その他の実施の形態が決定する異なるパラメータの乗員快適性制御関数の決定論的部分の例を示す図である。一実施の形態に係る、等位集合の形状を規定する指数を決定するための方法のフローチャートである。選択した制御関数に現在の状態を登録するための方法のフローチャートである。制御関数を結合して関数の重要度を相対的に符号化するための方法のフローチャートである。いくつかの実施の形態に係る、どのように異なる制御関数の重要度のバランスを取るかについての方法を説明するイラストである。本発明の一実施の形態に係る、一連の結合された状態および確率分布を決定し、車両の動きを制御するための方法のブロック図である。本発明のいくつかの実施の形態に係る、車両の動きを規定する状態遷移のツリーの模式図である。本発明のいくつかの実施の形態に係る、一連の分布を決定し、車両を制御するための方法のフローチャートである。確率論的制御関数に一致している各状態の確率を決定する方法のフローチャートである。自動運転車の位置の予測が障害物の不確実領域と交差し、当該位置に障害物がある確率が衝突しきい値よりも高い位置にある例を示す図である。確率論的制御関数に一致する状態を生成するためのステップのイテレーションを３回行った結果を簡略化した模式図である。図９Ｄの第１イテレーションにおいて５つの状態に割り当てられ得る確率を示す図である。

図１Ａおよび図１Ｂは、いくつかの実施の形態に係る、結果重視の車両制御の模式図である。いくつかの実施の形態は、サンプリングベースのパスプランニング方法は、性質上、日和見的かつ試験的であるという認識に基づく。サンプリング技術は、高速機械計算に適しているが、人間のドライバーがパスプランニングおよび／または運転タスクに取り組む方法に必ずしも一致しているわけではない。

いくつかの実施の形態は、人間のドライバーは、日和見的にサンプリングするのではなく、１つまたは複数の運転目的を達成することを目標とした、結果重視の方法で車両を操作しているという認識に基づく。たとえば、車両の正面の空間をサンプリングするのではなく、意識的または無意識に直近の未来の運転目的を立てることは、人間のドライバーの本質である。運転目的／決定として、現在の速さを維持すること、車間距離を維持すること、速さ制限まで速さを上げること、止まれの標識で停止すること、車両を車線中央に維持すること、車線を変更すること、障害物を回避することなどが挙げられる。これらの目的を立てた後、人間のドライバーは、自身の経験と運転スタイルで車両を動かす。そのためには、いくつかの実施の形態の目的は、サンプリングベースのパスプランニングではなく、目的ベースのパスプランニングを提供することである。そのためには、いくつかの実施の形態は、環境１１５における車両の現在の状態に基づいて、制御車両１１０についての１つまたは複数の運転意思１２５を立てるように構成された意思決定モジュール１２０を採用する。

これに加えて、人間のドライバーは、複数の目的について、目的の重要度および類似度に基づいてバランスを取ることができる。そのためには、いくつかの実施の形態は、１つまたは複数の制御目的に対応する制御関数１３５の一覧をメモリに保持している。各制御関数は、車両１１０の現在の状態を、対応する制御の目的に基づいてその未来の目標状態にマッピングする。車両の状態は、車両の位置、速度、および進行方向など、複数の状態変数を含み得る。異なる状態変数の集合が可能であり、いくつかの状態変数を別の状態変数にマッピングすることができる。

いくつかの実施の形態は、運転目的に対応して１つまたは複数の状態変数を現在値から１つまたは複数の未来値に遷移させる制御関数によって当該運転目的を表すことができるという理解に基づいている。制御関数は、「どのように」という質問ではなく、「何」という質問に返答するので、これらの制御関数は、人間のドライバーの結果重視の方法を模倣する。とりわけ、これらの制御関数は、運転経験を模倣するように予め決定される。いくつかの実施の形態では、１つの運転目的に対して１つの制御関数がある。それゆえ、制御関数として、現在の速さを維持するための関数、車間距離を維持するための関数、速さ制限まで速さを上げるための関数、止まれの標識で停止するための関数、車両を車線中央に維持するための関数、車線を変更するための関数、障害物を回避するための関数などが挙げられる。

制御関数への入力は、現在の速さ、加速度、位置、および進行方向のうち１つまたは組合せなど、車両の状態変数を少なくとも１つを含む。また、制御関数への入力は、環境のマップと交通データとを含み得る。このマップおよび交通データは、環境１１５の画像を形成し得る。制御関数の出力は、状態変数の目標値のうち１つまたは組合せを含む。たとえば、車間距離を維持するための制御関数は、車両の目標速さを出力し得る。車線を変更するための制御関数は、一連の横加速度値を出力し得る。

制御関数を予め決定することにより、モーションプランナー１３０が運転意思に一致した制御関数を使用して、未来の目標状態を統合して評価できるようになる。たとえば、運転意思が車線に留まることである場合、道路上の障害物から安全マージンを守ること、および車両の位置を車線中央に維持することが運転意思に一致した目的である一方、車線を変更するという目的は、運転意思に一致した目的ではない。

これに加えて、またはこれに代えて、人間のドライバーは、意思決定において柔軟性を受け入れる。このような柔軟性は、ドライバーの運転スタイル、トラフィックの状態もしくは単に運転の不安を増大させる明白な視界など、環境の状況、またはドライバーの単なる気分に基づき得る。そのためには、いくつかの実施の形態の目的は、運転目的をベースにしたパスプランニング手法にこのような柔軟性を取り入れることである。これに加えて、人間は、異なるスタイルで車両を運転する。運転スタイルとして、攻めた運転、守りの運転、および普通または中立の運転などが挙げられる。そのためには、いくつかの実施の形態の別の目的は、異なる運転スタイルに適応可能な、運転目的をベースにしたパスプランニングを提供することである。

これらの柔軟性を可能にするために、いくつかの実施の形態では、制御関数１３５は、確率論的である、すなわち、目標状態変数１４５の確率論的分布を出力する。たとえば、現在の速さを維持するための制御関数は、速さ値および加速度値だけでなく、これらの値の確率論的分布も出力する。確率論的分布は、ガウス分布の場合の平均値および分散値のように、そのパラメータによってパラメータ化することができる。そのためには、いくつかの実施の形態では、制御関数は、目標状態変数に現在の状態変数をマッピングする決定論的成分と、目標状態変数ごとに分布を規定する確率論的成分とを含む。事実上、制御関数の確率論的であるという性質が、運転意思決定における柔軟性を模倣するようになり、運転目的をベースにしたパスプランニングを、制御環境の予測不能性に適応させることができるようになる。

とりわけ、異なる制御関数は、同じ状態変数または異なる状態変数の確率論的分布を決定できる。それゆえ、いくつかの実施の形態は、確率論的分布１４５を結合して、目標状態の１つまたは複数の状態変数の統合分布１５５にする。本明細書において、統合分布１５５を、目標状態の統合パラメトリック確率分布と称する。なぜならば、このような統合パラメータ分布は、第１モーメント１４０のパラメータ、ならびに、第２モーメント、第３モーメント、および／または第４モーメントなど、少なくとも１つの高次モーメント１５０のパラメータによって規定されるからである。

高次モーメントを有する統合パラメトリック確率分布によって目標状態を推定することにより、いくつかの実施の形態は、目標状態変数の確率分布が表す経路に従って車両を制御（１６５）する、分布を意識したコントローラ１６０を利用できるようになる。たとえば、いくつかの実施の形態は、（半）自動運転システムに統合アーキテクチャを使用する。この統合アーキテクチャには、低速のモーションプランニング１３０と、高速かつ反応性が高い車両コントローラ１６０とを含む。車両コントローラ１６０は、目標状態の統合パラメトリック確率分布の第１モーメントと少なくとも１つの高次モーメントとに基づいてアクチュエータ１７０の制御コマンド１６５を決定する。この統合により、モーションプランニング層および車両制御層による複数の競合する目的、たとえば、比較的複雑な高速道路および都市の運転シナリオにおいて安全要件を満たすこと、および、信頼性が高く快適な運転挙動を確実にすることの両方を達成するという責任を体系的かつ効果的に共有することが可能になる。この統合は、経路生成が不確実な状態での制御の柔軟性に適応できる。

図２Ａは、いくつかの実施の形態に係る、道路上を運転するための運転挙動の制御目的候補、およびそれらの対応する制御関数の例示的な一覧を示す図である。これらの目的を立てた後、人間のドライバーは、自身の経験と運転スタイルで車両を動かす。しかしながら、いくつかの実施の形態は、対応する運転目的の制御関数を設計する。制御関数は、車両の現在の状態を、対応する目的に従って車両の目標状態に遷移させる。制御関数は、解析的に設計することができ、および／またはデータから学習させることができる。

たとえば、１つの運転目的は、車両に道路上に留まる（２００）よう命じることであり、その対応する道路上滞在関数は、車両の位置を道路の境界内に維持するように構成される。追加の運転目的候補は、車両が公称速度２２０で車線の中央を走行する（２１０）ことを命じてもよい。その対応する制御関数は、車両の位置を車線の中央に維持するように構成された車線中央関数、および／または、車両の現在の速さを維持するように構成された速さ維持関数を含んでもよい。

また、別の例では、運転目的は、車両と道路上の障害物との間を最小距離に維持するように構成された対応する安全マージン関数を利用して、車両に周囲の障害物に対する安全マージンを維持する（２３０）よう命じることができる。これに加えて、人間のドライバーについての一般的な運転目的の別の候補として、同じ車線の車両との安全距離を維持する（２４０）ことがある。これは、車両と前を走る車両との間の最小車間距離を維持するように構成された最小車間距離関数を用いて実現できる。乗員の快適性、燃料の消費、摩耗、またはその他を理由に、車両のスムーズな運転（２５０）を命じたいと望むドライバーもいる。いくつかの実施の形態は、車両の動きのスムーズさを維持するように構成されたスムーズ運転関数を利用することによってこれを実現できる。

その他の運転目的として、車両の速さを速さ制限に維持するように構成された速さ制限関数を使用して速さ制限まで速さを上げる（２６０）こと、車両の現在位置を現在の車線から隣接する車線に変更するように構成された車線変更関数を使用して車線を変更する（２７０）こと、交差点における車両のアイドル時間を減らすように構成された交差点横断関数を使用することによって交差点でのアイドリングを最小限に抑えて（２８０）燃料の消費を減らすことなどが挙げられる。

典型的に、人間のドライバーには、互いを相殺する運転目的があるであろう。たとえば、周囲の障害物までの安全マージンを維持（２３０）しながら一定速度を保つこと（２２０）は不可能であろう。あるいは、運転目的２１０は、車両が複数の車線のうち１つの車線中央を維持するべきであると提示するのみである。いくつかの実施の形態は、少なくともいくつかの制御関数を確率論的関数にすることによって、互いを相殺する運転目的間のバランスを取る。

具体的には、いくつかの実施の形態は、ドライバーの運転目的が正確に満たされることはないという理解に基づいている。たとえば、速さ制限まで速さを上げる（２６０）という目的は、周囲の障害物までの安全マージンを維持する（２３０）という運転目的とは両立しない場合があるであろう。また、ドライバーが決める最も重要な運転目的は、その時々によって若干異なるであろう。さらには、自動運転車両の場合、運転目的を正確に満たせなくするその他の不確実性が存在する。それゆえ、運転目的の実現における不正確さ、およびこのような運転目的が満たされる程度は、時によって異なるであろう。

図２Ｂは、いくつかの実施の形態が採用する確率論的制御関数２１５の構造の模式図である。各制御関数２１５は、その対応する制御目的に基づいて、車両の現在の状態を目標状態に確率論的に遷移させるように構成される。そのためには、確率論的制御関数２１５は、現在の状態を目標状態２５５に遷移させるための決定論的成分２２５と、決定論的成分が決定した目標状態を中心とした値の確率論的分布２６５を決定するための確率論的成分２３５とを備える。決定論的成分は、目標状態の１つの値２４５、または一連の複数の値２５５を生成できる。これに加えて、またはこれに代えて、決定論的成分を複数回実行して当該一連の値２５５を生成できる。しかしながら、いつくかの実施態様では、確率論的制御関数の出力が第１モーメントおよび少なくとも１つの高次モーメントが規定する目標状態のパラメトリック確率分布２７５になるよう、一連の目標状態の値２４５ごとに確率論的分布２６５が存在する。

たとえば、一実施の形態は、制御関数の集合を使用する。この集合は、複数の関数のうちの１つまたは組合せを含み、当該複数の関数は、車両の位置を道路の境界内に維持するという制御目的を有する道路上滞在関数を含む。当該道路上滞在関数は、車両の現在の進行方向に基づく車両の一連の目標進行方向と、道路の境界までの車両の距離とを出力する決定論的成分を含む。道路上滞在関数は、道路上滞在関数の決定論的成分が決定した一連の目標進行方向に含まれる各目標進行方向を中心とした値の確率論的分布を提供する確率論的成分を含む。複数の関数は、さらに、車両の位置を車線の中央に維持するという制御目的を有する車線中央関数を含む。当該車線中央関数は、一連の目標進行方向を追跡することによって車線の中央からの車両の現在位置の横方向のずれが小さくなるように、車両の現在の進行方向、および当該横方向のずれに基づいて一連の車両の目標進行方向を出力する決定論的成分を含む。車線中央関数は、車線中央関数の決定論的成分が決定した一連の目標進行方向に含まれる各目標進行方向を中心とした値の確率論的分布を提供する確率論的成分を含む。複数の関数は、さらに、車両の現在の速さを維持するという制御目的を有する速さ維持関数を含む。当該速さ維持関数は、目標速度が現在の速度に等しくなるように車両の現在の速度に基づいて目標速度を出力する決定論的成分を含む。速さ維持関数は、速さ維持関数の決定論的成分が決定した目標速度を中心とした値の確率論的分布を提供する確率論的成分を含む。複数の関数は、さらに、車両の速さを速さ制限に維持するという制御目的を有する速さ制限関数を含み、当該速さ制限関数は、現在の速度から速さ制限に達する車両の一連の目標速度を出力する決定論的成分を含む。速さ制限関数は、速さ制限関数の決定論的成分が決定した一連の目標速度に含まれる各目標速度を中心とした値の確率論的分布を提供する確率論的成分を含む。複数の関数は、さらに、車両と道路上の障害物との間の最小距離を維持するという制御目的を有する安全マージン関数を含む。当該安全マージン関数は、障害物の位置までの最小距離を少なくとも維持する車両の一連の目標位置を出力する決定論的成分を含む。安全マージン関数は、安全マージン関数の決定論的成分が決定した一連の目標位置のすべてのインスタンスを中心とした目標位置の値の分布を提供する確率論的成分を含む。複数の関数は、さらに、車両と前を走る車両との間の最小車間距離を維持するという制御目的を有する最小車間距離関数を含み、当該最小車間距離関数は、最小車間距離を維持する車両の一連の目標速度を出力する決定論的成分を含む。最小車間距離関数は、最小車間距離関数の決定論的成分が決定した一連の目標速度に含まれる各目標速度を中心とした値の分布を提供する確率論的成分を含む。複数の関数は、さらに、車両の動きのスムーズさを維持するという制御目的を有するスムーズ運転関数を含む。当該スムーズ運転関数は、目標速度と現在の速度との差がしきい値未満になるように、現在の速度に基づいて車両の目標速度を出力する決定論的成分を含む。スムーズ運転関数は、スムーズ運転関数の決定論的成分が決定した目標速度を中心とした値の分布を提供する確率論的成分を含む。複数の関数は、さらに、車両の現在位置を現在の車線から隣接する車線に変更するという制御目的を有する車線変更関数を含む。当該車線変更関数は、車両を隣接する車線の中央まで移動させる一連の車両の目標速度を出力する決定論的成分を含む。車線変更関数は、車線変更関数の決定論的成分が決定した一連の目標速度のすべてのインスタンスを中心とした目標位置の値の分布を提供する確率論的成分を含む。複数の関数は、さらに、交差点における車両のアイドル時間を減らすという制御目的を有する交差点横断関数を含む。当該交差点横断関数は、交差点にある障害物および横断することを管理する交通規則を考慮して交差点を横断する時間を低減する一連の車両の目標速度を出力する決定論的成分を含む。交差点横断関数は、交差点横断関数の決定論的成分が決定した一連の目標速度のすべてのインスタンスを中心とした目標位置の値の分布を提供する確率論的成分を含む。

図２Ｃは、いくつかの実施の形態に係る、車両コントローラ１６０に対するモーションプランナーの確率論的出力の影響の例を示す図である。この例では、車両２１０ｃの現在の状態、および車両が到達しようとする目標状態２２０ｃである。目標状態２２０ｃは、車両に関連するデカルト座標位置、速度、または別のエンティティであってもよい。目標状態２２０ｃは、特定の状態、または、複数の状態から構成される１つの領域であってもよい。たとえば、目標状態２２０ｃは、許容速度の区間、または、デカルト空間における位置候補の領域であってもよい。適した制御入力とは、図２Ａの運転目的のような運転目的を実現しながら車両２１０ｃをその初期状態から目標状態２２０ｃに変える入力のことであり、たとえば、運転目的は、道路上の領域２３１ｃ内に留まることであってもよい。入力から得られる結果状態２３０ｃは、ワンタイムステップのための制御入力が適用されることになる状態遷移に対応してもよい。または、結果状態２３０ｃは、軌道２１１ｃを有する初期状態２１０ｃに結びつけられてもよい、すなわち、一連の状態遷移であってもよい。

現在の状態から目標状態への遷移は、自動運転車の場合、車両の動きのモデルへの制御入力をテストすることによって行われてもよい。動きのモデルは、モデルに登録された制御入力に従って車両の状態を遷移させる。様々な実施の形態では、車両の動きのモデルには、不確実性が含まれる。そのために、モデルが車両の実際の動きの簡潔な記述であることを考慮するだけでなく、車両の真の状態を検知する際の不確実性、障害物の状態を検知する際の不確実性、および環境を検知する際の不確実性も考慮するために、車両の動きのモデルは、確率論的動きモデルとなる。

図２Ｃは、制御入力の特定の選択、すなわち、手動運転者の運転挙動の結果として得られる目標状態領域２３１ｃを示しており、２３１ｃは、ゼロ以外の確率論的成分であり、２３０ｃは、領域２２０ｃが含む決定論的成分である。運転目的領域２２０ｃは、目標状態領域２３１と重なり合っていない。すなわち、領域２３１ｃは、運転目的領域２２０ｃを含まない。それゆえ、図２Ｃを参照すると、運転目的２２０ｃは実現されないおそれがあり、コントローラはその動作を変更するであろう。

図２Ｄは、制御入力の特定の選択、すなわち、手動運転者の運転挙動の結果として得られる目標状態領域２３１ｄを示しており、２３１ｄは、ゼロ以外の確率論的成分であり、２３０ｄは、領域２３１ｄに含まれる決定論的成分である。運転目的領域２２０ｄは、目標状態領域２３１ｄよりも小さく、２３１ｄに完全に含まれている。すなわち、領域２３１ｄは、領域２２０ｄを含む。それゆえ、図２Ｄを参照すると、運転目的２２０ｄは、制御入力の選択によって実現されると考えられる。

図３Ａは、本発明の一実施の形態に係る、車両を制御するための方法のフローチャートである。この方法は、車両のプロセッサを用いて実装されてもよい。方法は、車両の現在の状態、車両の現在の状態の近傍の環境の画像、および車両の次の運転意思を入力インターフェースから受け付け（３１０ａ）、制御関数の集合３０９ａをメモリから取り出す。制御関数のうち少なくともいくつかは、確率論的制御関数であり、確率論的制御関数の出力が確率分布の第１モーメントおよび少なくとも１つの高次モーメントを規定する目標状態のパラメトリック確率分布になるよう、現在の状態を目標状態に遷移させるための決定論的成分と、決定論的成分が決定した目標状態を中心とした値の確率論的分布を決定するための確率論的成分とを含む。

次に、方法は、少なくとも制御関数のサブ集合３０９ａを選択（３２０ａ）して、車両の現在の状態、環境、および次の運転意思に基づく制御関数のサブ集合３２５ａを生成する。次に、制御関数のサブ集合を使用して、方法は、選択した制御関数３２５ａに現在の状態を登録（３３０ａ）して、車両が目標状態に到達するためのモーションプランを規定する一連の状態についての一連のパラメトリック確率分布のサブ集合３３５ａを生成する。次に、方法は、サブ集合に含まれている一連のパラメトリック確率分布を結合（３４０ａ）して、目標状態の統合パラメトリック確率分布３３７ａを生成する。最後に、コントローラは、目標状態の統合パラメトリック確率分布の第１モーメントと少なくとも１つの高次モーメントとに基づいて、制御コマンド３４５を決定（３５０ａ）する。

図３Ｂは、いくつかの実施の形態に係る、道路上を移動し、かつ環境３５０と相互作用する車両３００を制御するための制御システム２９９の全体的なブロック図である。制御システム２９９のそれぞれ異なる構成要素は、メモリに動作可能に接続された１つまたは複数のプロセッサ、および／または車両の様々な種類のセンサーを用いて実現されてもよい。本明細書において使用するとき、車両は、乗用車、バスを含む車輪の付いた車両を意味し得る。車両は、自動運転車であってもよく、半自動運転車であってもよい。制御システム２９９は、車両３００に内蔵されてもよく、制御システム２９９のそれぞれ異なる構成要素の実現は、車両の車種によって異なってもよい。たとえば、車両の車種によっては、車両３００のアクチュエータへの制御コマンドを生成するコントローラ３６０は、異なってもよい。制御システム２９９は、慣性計測装置（ＩＭＵ：Inertial Measurrement Unit）を使用して、車両の回転速度および車両の加速度など、車両の慣性部品を測定するセンシングシステム３３０を備えてもよい。たとえば、ＩＭＵは、３軸加速度計、３軸ジャイロスコープ、および／または磁力計を含んでもよい。ＩＭＵは、制御システム２９９のその他の構成要素に速度、向き、および／またはその他の位置関連情報を提供してもよい。また、センシングシステム３３０は、ＧＰＳ（Global Positioning System）または同等のシステムからグローバル位置情報を受信してもよい。または、センシングシステム３３０は、カメラセンサ、レーダーセンサ、および／またはライダーセンサを備えて環境についての情報を取り出してもよい。

また、制御システムは、車両の現在の状態２９０、車両の現在の状態の近傍の環境の画像２９０、および車両の次の運転意思２９０を受け付けるように構成された入力インターフェース３２０を備える。入力インターフェース３２０は、情報２９０を受け付けてモーションプランナー３４０に送信する（３２１）。モーションプランナー３４０は、送信された情報３２１およびセンシングシステム３３０からのデータ３３１を使用して、車両が目標状態に到達するためのモーションプランを規定する一連の状態のパラメトリック確率分布の一連のサブ集合を生成する。

入力インターフェースは、環境についての情報を車両の外部ソース２９０から受け付けてもよい、または、情報３３１を車両内部に位置するセンシングシステム３３０から受け付けてもよい。同様に、入力インターフェース３２０は、次の目標状態についての情報を外部ソースから受け付けてもよく、または、当該情報をルートプランナー３８０または同様のシステムから受け付けてもよい（３７１）。

また、制御システム２９９は、目標状態の統合パラメトリック確率分布の第１モーメントと少なくとも１つの高次モーメントとに基づいて制御コマンド３６９を決定するように構成された少なくとも１つの車両コントローラ３６０を備える。制御コマンド３６９は、出力インターフェース３７０に送信される。出力インターフェース３７０は、制御コマンドを車両のアクチュエータに出力（３７１）するように構成される。

また、制御システム２９９は、車両３００の乗員に運転スタイルを選択させる選択インターフェース３１０を備える。プロセッサは、選択された運転スタイルに対応する確率論的制御関数の確率論的成分を互いに関連付ける。選択インターフェース３１０を使用して車両の乗員が選べる運転スタイルの集合３９２は、異なる運転スタイルを含んだメモリに格納されており、格納されている運転スタイル３９０は、車両のドライバーからリアルタイムで収集したデータまたはリモート接続３９９によって収集したデータを使用して学習される。

図３Ｃは、いくつかの実施の形態に係る、どのようにモーションプランナーが様々な車両コントローラと相互作用するかについてのブロック図である。この実施例では、コントローラ３０１ｃは、動きモデル、一連の状態およびパラメトリック確率分布３４１、ならびにセンシングシステムからの情報３３１を使用し、予測範囲にわたるコスト関数を最適化して、車両の１つまたは複数のアクチュエータに対する一連の制御コマンドを生成するモデルベースの予測コントローラである。ここで、コスト関数を最適化することによって、パラメトリック確率分布の第１モーメントが規定する一連の目標状態を追跡するコストのバランスを、車両の動きの少なくとも１つのその他の基準値のコストに対して取ることができる。ここで、最適化のバランスを取る際、確率分布の高次モーメントのうちの１つまたは複数を用いて追跡コストの重要度が重み付けされる。たとえば、コントローラは、モデル予測コントローラ（ＭＰＣ：Model-Predictive Controller）であってもよい。コントローラ３０１ｃは、自動運転の場合、スタンドアロンコントローラであってもよく、半自動運転の場合、ドライバーの操作３０７ｃを補完的するためのコントローラであってもよい。たとえば、自動運転の場合、コントローラは、基準軌道３４１と、状態制約および入力制約３１４ｃとを受信し、車輪の所望の操舵角３０４ｃを生成して車両の横の動きを制御する、ならびに／または所望の速度または加速度３０４ｃを生成して車両の縦の動きを制御する。半自動運転の場合、ドライバー３０７ｃは、ハンドルを切って、スロットル／ブレーキ入力が生成する縦加速度とともに（可能であれば）操舵角３０８ｃを取得する。このような場合、ＭＰＣは、ドライバーの入力の補正値を生成して、限界で運転している場合の車両を安定化させることができる。このような場合、ＭＰＣによってアクチュエータからの入力３０６ｃが利用される。

一実施の形態では、制御コマンドは、以下の追跡型最適制御問題の式を解くことによって決定される。

一実施の形態では、リアルタイムイテレーション（ＲＴＩ：Real-time Iteration）を用いる逐次二次計画法（ＳＱＰ：Sequential Quadratic Programming）を使用してＮＬＰを解く。ＲＴＩ手法は、制御タイムステップ当たり１つのＳＱＰイテレーションに基づいた手法であり、ワンタイムステップから次のステップまでの状態および制御軌道の継続ベースのウォームスタートを使用している。各イテレーションは、次の２つのステップから構成される。（１）準備段階：システムダイナミクスを離散化して線形化する、残りの制約関数を線形化する、２次の目的の近似を評価して最適制御が構造化されたＱＰ部分問題を構築する。（２）フィードバック段階：ＱＰを解いてすべての最適化変数の現在値を更新し、次の制御入力を取得してシステムにフィードバックを適用する。

別の実施の形態では、主有効制約法アルゴリズム内の反復ソルバーの前処理に対する低ランク更新を用いた、ブロック構造化された因数分解技術を用いる。これにより、実装が比較的単純であるが、計算コスト効率が高く、信頼性があり、組み込みハードウェアに適したＱＰソルバーが得られる。

一実施の形態では、ＭＰＣ追跡コストは、時変正定値対角重み行列を用いて重み付けされる。対角値の各々は、対応するパラメトリック確率分布の個々の高次モーメントに対する反比例関係に基づいて計算される。

その他の実施の形態では、ＭＰＣは、追跡コストにおいて、時変正定値重み行列を使用する。時変正定値重み行列は、確率論的モーションプランナーからのパラメトリック確率分布の一連の共分散行列をステージ単位でスケールした逆関数として計算される。モーションプランナーは、異なる制御目的をそれぞれの重要度に応じて重み付けし、ＭＰＣが車両を制御するのに適した一連の状態および確率分布を生成する。

しかしながら、一実施の形態は、ＭＰＣがモーションプランナーよりも環境の変化に素早く対応できるよう、モーションプランナーはＭＰＣよりも長いタイムスケール上で動作すると理解している。その結果、一実施の形態では、重み行列と共分散行列との逆相関関係は、追跡制御目的ごとに相対的に異なり得る性能依存スケーリングと、追跡コスト関数において制御目的の各々の重み付けについての下限値と上限値との間の時変正定値重み行列の各々を指定する飽和関数とを含む。

図３Ｂを参照すると、モーションプランナーは、ＭＰＣからの情報３５９を利用してもよい。たとえば、一実施の形態では、ＭＰＣなどの予測コントローラは、有効制約の種類および／または数に基づいて確率論的分布の高次モーメントを調整するように構成された確率論的モーションプランナーに有効制約をフィードバックする。これは、たとえば、モーションプランナーが選択した制御関数のサブ集合を、モーションプランナーが検出できていない環境変化に合うように調整する必要がある場合に有益である。このような場合、有効制約を、ＭＰＣがより良く動作するために制御関数のサブ集合が選択されるモーションプランナーへの情報として利用してもよい。

図３Ｄは、一実施の形態に係る、入力インターフェース３８０ｄ、選択インターフェース３９０ｄ、出力インターフェース３７０ｄ、モーションプランナー３４０ｄ、コントローラ３６０ｄ、プロセッサ３３０ｄ、およびメモリ３２０ｄの接続関係の一般的な構造を示す図である。モーションプランナー３４０ｄおよびコントローラ３６０ｄは、モーションプランナー３４０ｄおよびコントローラ３６０ｄのモジュールを実行するための少なくとも１つのプロセッサ３３０ｄに接続される。プロセッサ３３０ｄは、一次モーメント、二次モーメント、および／または三次モーメントなど、目標状態のそれぞれ異なる高次モーメントを規定する確率論的成分の集合によって規定された制御関数の集合を格納（３１７ｄ）するメモリ３２０ｄに接続（３２９ｄ）される。また、メモリ３２０ｄは、平均ベクトルの要素、共分散行列の要素、慎重な運転または守りの運転、普通の運転、および攻めた運転など、異なる運転スタイルを規定する歪度インジケータの要素など、確率論的成分のパラメータの集合を格納（３１８ｄ）する。また、メモリ３２０ｄは、限定されないが、様々な車両パラメータの値、計算された車両の状態の各々の値、動きモデルなど、様々なモデル、および車両の各状態に至る動きなど、モーションプランナーおよびコントローラの内部情報などのような、追加情報を格納（３１９ｄ）する。

いくつかの実施の形態では、異なる制御関数の確率論的成分が、対応する決定論的成分が決定した目標状態を中心とした確率論的分布の移動に反映された目標状態のそれぞれ異なる高次モーメントを規定するよう、制御システムは、複数の確率論的成分を、１つまたは複数の制御関数のために保持する。同じ制御関数の異なる確率論的成分は、異なる運転スタイル、たとえば、攻めの運転スタイルまたは守りの運転スタイルに対応する。制御関数に含まれる複数の確率論的成分のうち１つが選択されたことに応答して、制御システムのプロセッサは、制御関数の決定論的成分が決定した目標状態を中心とした確率論的分布を決定するために、選択された確率論的成分に制御関数を対応付ける。

たとえば、一実施の形態では、制御システムは、攻めの運転スタイルに対応する攻めの確率論的成分および守りの運転スタイルに対応する守りの確率論的成分を含む、速さ制限関数についての複数の確率論的成分を保持する。この実施例では、攻めの確率論的成分に従って速さ制限を超える目標速さをサンプリングする尤度は、守りの確率論的成分に従って速さ制限を超える速さをサンプリングする尤度よりも大きい。

これに加えて、またはこれに代えて、一実施の形態では、制御システムは、攻めの運転スタイルに対応する攻めの確率論的成分および守りの運転スタイルに対応する守りの確率論的成分を含む、安全マージン関数についての複数の確率論的成分を保持する。この実施例では、攻めの確率論的成分に従ってサンプリングされる目標位置の値は、守りの確率論的成分に従ってサンプリングされる目標位置の値よりも障害物に近い値である可能性が高い。

これに加えて、またはこれに代えて、一実施の形態では、制御システムは、攻めの運転スタイルに対応する攻めの確率論的成分および守りの運転スタイルに対応する守りの確率論的成分を含む、最小車間距離関数についての複数の確率論的成分を保持する。この実施例では、攻めの確率論的成分に従ってサンプリングされる目標速度の値によって得られる車間距離は、守りの確率論的成分に従ってサンプリングされる目標速度の値に係る車間距離よりも小さな車間距離になる可能性が高い。

これに加えて、またはこれに代えて、一実施の形態では、制御システムは、攻めの運転スタイルに対応する攻めの確率論的成分および守りの運転スタイルに対応する守りの確率論的成分を含む、車線変更関数についての複数の確率論的成分を保持する。この実施例では、攻めの確率論的成分に従ってサンプリングされる目標速度の値によって得られる曲線は、守りの確率論的成分に従ってサンプリングされる目標速度の値に従う曲線よりも急な曲線になる可能性が高い。

図３Ｅは、いくつかの実施の形態に係る、運転スタイルを選択するための車両の関連内装品、またはユーザインターフェースの例示的なセットアップを示す図である。これらの実施の形態では、車両の乗員は、車両のハンドルまたはダッシュボード３４０ｅに関連付けられたボタン３５０ｅによって、特定の運転スタイルで運転するかどうかを決定できる。ダッシュボード３００ｅは、人間の操作者が車両を運転できるハンドル３１０ｅと、車両の速度出力およびセンサー出力など、異なる態様を表示するためのディスプレイ３２０ｅとを備える。マニュアルモードでは、運転スタイル決定モード３６０ｅをオンにすることによって、人間の操作者の運転スタイルが学習され、その後、当該人間の操作者の運転スタイルに類似した制御関数の集合として識別される。

人間の操作者、または車両の別のユーザは、運転スタイルの手入力（３４０ｅ）を選んでもよい。たとえば、車両の乗員は、乗員から受信する運転の仕方に対する漸進的な調整に従って運転スタイルを変更するよう選択インターフェースに通知することによって当該調整を行うことにより、運転スタイルを変更してもよい（３４０ｅ）。たとえば、攻めの運転スタイルを選択した場合、乗員は、当該攻めの運転スタイルをより多くまたはより少なく攻めたスタイルに変更できる。たとえば、車線変更制御関数の場合、さらに攻めたスタイルの方がより急な転回を行うことができる一方で、障害物を回避するための制御関数は、乗員が望む場合、障害物との距離をさらに近づけるであろう。同様に、守りの運転スタイルを選択した場合、乗員は、当該攻めたスタイルをより多くまたはより少なく守りのスタイルに変更できる。守りを抑えたスタイルへの変更を指示することによって、実施の形態は、攻めたスタイルに向けて確率論的成分を移動させる。より守りのスタイルへの変更を指示することによって、実施の形態は、確率論的成分または決定論的成分を変更して、運転をより守りの運転にすることができる。

可視化モジュール３３０ｅも含まれており、可視化モジュール３３０ｅは、現在の車両の運転および周囲の状況、ならびに新しい運転スタイルを追加するまたはすでに含まれている車両の運転スタイルを改善するためのボタン３７０ｅを、それらが利用可能になった場合に無線で表示する。３４０ｅには、カーナビゲーションシステムまたは同等のシステムも含まれており、人間の操作者は、車両の最終的な運転意思を当該カーナビゲーションシステムに入れることができ、その後、カーナビゲーションシステムは、通過点または途中の目標位置を車両に提供する。

図４Ａ～図４Ｅは、本発明のいくつかの実施の形態に係る、制御関数候補のサブ集合、ならびにその決定論的成分および確率論的成分を説明するイラストである。

図４Ａは、道路上に車両４１０ａを維持する（２００）という制御目的に対応する制御関数を説明するイラストである。道路の境界は、４２０ａによって定められている。この制御関数は、決定論的成分４３０ａおよび確率論的成分４４０ａによって規定されている。たとえば、人間のドライバーのデータを記録し、たとえば、このデータまでの平均ユークリッド距離を最小限に抑えることによって、または、良好な近似になる確率を最大化することによって近似を最適化することによって決定論的成分を決定してもよい。決定論的成分４３０ａを中心とした記録データの変動を求めることによって確率論的成分４４０ａを決定してもよい。たとえば、確率論的成分４４０ａの変動内に記録データのすべてを含む確率を最大化することによって確率論的成分４４０ａを決定してもよく、または、限られた量の記録データを考慮して無限のデータの実際の変動を推定することによって決定してもよい。

いくつかの実施の形態は、道路の境界４２０ａによって限定された制御関数として制御関数をモデル化することは可能であるが、これは、人間による運転の仕方ではないという認識に基づいている。その代わりに、人間は、乗車時間を短くするために、曲がり角でコーナーに斜めに入ると決めるであろう。図４Ｂは、道路上の車両４１０ｂの走行時間を短くするという制御目的に対応する制御関数を説明するイラストである。道路の境界は、４２０ｂによって定められている。制御関数は、決定論的成分４３０ｂおよび確率論的成分４４０ｂによって規定されている。たとえば、人間のドライバーのデータを記録し、たとえば、このデータまでの平均ユークリッド距離を最小限に抑えることによって、または、良好な近似になる確率を最大化することによって近似を最適化することによって決定論的成分を決定してもよい。決定論的成分４３０ｂを中心とした記録データの変動を求めることによって確率論的成分４４０ｂを決定してもよい。たとえば、確率論的成分４４０ｂの変動内に記録データのすべてを含む確率を最大化することによって確率論的成分４４０ｂを決定してもよく、または、限られた量の記録データを考慮して無限のデータの実際の変動を推定することによって決定してもよい。

図４Ｃは、安全に車両を追い抜くという運転目的を表現するための制御関数４６０ｃを説明するイラストである。車両４１０は、車線の境界４７０ｃがある２車線道路上を走行する。たとえば、同様の状況で人間のドライバーについて収集したデータから決定論的成分４２０ｃを決定してもよい。確率論的成分４４０ｃは、すべての状況が同じではないこと、および、ドライバーが、通常、ほかの車両４６０ｃの挙動によってわずかに異なる挙動をすることを示している。その結果、確率論的成分４４０ｃは、追い越しが行われるエリアでは、より大きな変動を示している。

図４Ｄは、いくつかの実施の形態に係る、現在の速さを維持するという目的の制御関数２２０を説明できるイラストである。図４Ｄは、道路の曲率の関数として、すなわち、道路の旋回半径の１つの指標として速度がモデル化される場合を示している。曲率が小さい場合、すなわち、ほとんど直線である道路の場合、制御関数の決定論的成分４２０ｄは、現在の速さ４１０ｄと等しい。しかしながら、曲率が大きくなると、現在の速さを維持することが難しくなり、決定論的成分はゼロまで下がる。また、図４Ｄに示すように、曲率が小さい場合、確率論的成分４３０ｄは、変動が小さい公称速さの周辺に集まっている。しかしながら、曲率が大きくなると、ドライバーが加える速さのより大きな変動を反映した、より大きな非対称の変動がある。

図４Ｅは、一実施の形態に係る、スムーズに運転する（２５０）という運転目的の制御関数を説明できるイラストである。複数の方法で制御関数をモデル化できる。図４Ｅは、加速度の制御関数としてスムーズさを説明する例を示す。決定論的成分４１０ｅは、加速度ゼロの周辺に集まっており、確率論的成分４２０ｅは、非対称である。これは、人間の操作者が、通常、危険な状況には、大きな正の加速度ではなく、より速い負の減速をできるようにしていることを示している。なぜならば、危険な状況は、通常、交通安全に関連しないためである。

複数の本発明の実施の形態は、決定論的成分と確率論的成分とに分解された複数の確率論的制御関数を使用しており、これらの確率論的制御関数を結合して、車両を制御するために利用できる一連の状態および一連の関連する確率分布を決定する。

図４Ｇは、一連の状態および関連する確率分布関数をもたらす確率論的制御関数の概念、および人間同士で意思決定がどのように異なり得るかを示す図である。図４Ｇは、行く手を阻む移動車両が１つの場合の確率論的制御関数のパラメータを２つ実現するための制御関数からの出力を考慮した、状態の確率分布を示している。ここで、カラーマップは、考えられる初期状態を示している。左側は、平均的な普通のドライバーに近似させた共通パラメータの集合を用いた場合の例であり、図４Ｇの右側部分は、個人化されたドライバー、この場合、より攻めたドライバーのパラメータについての結果を示している。この図示した例では、個人化されたモーションプランナーは、行く手を阻む車両を転回中に追い抜く可能性が高い（行く手を阻む車両の後ろに付いて行く確率が低い）が、共通パラメータを用いたモーションプランナーは、行く手を阻む車両の後ろに留まる可能性のほうが高い（車線を切り替える確率が低い）。

いくつかの実施の形態は、以下の分布から確率論的成分を決定する。

いくつかの実施の形態では、スペクトル分解を利用して正定値の共分散行列を適用するために投影４３０ｈが用いられる。

特定の状況に関連性があるとして定められた、より多くの制御関数が存在してもよい。図５Ａは、一実施の形態に係る、制御関数のサブ集合を選択するための方法３２０ａのフローチャートである。この方法は、メモリから制御関数の集合５１０ａを取り出す。車両の環境の画像５１１ａおよび次の運転意思５１２ａの情報を使用して、方法は、適用できない制御関数を破棄する（５２０ａ）。たとえば、次の運転意思が一車線の道路上で赤信号で止まることである場合、車線変更（２７０）に関する制御関数、および速さの増加（２６０）に関する制御関数を破棄してもよい。

次に、制御関数の第１サブ集合５２５ａと、車両の乗員が入力した好みの運転スタイル５２１ａとを使用して、方法３２０ａは、要求を満たしていない制御関数を破棄する。たとえば、車両の乗員がかなりの攻めの運転スタイルを選択した場合、ほかの車両に対して安全マージンを維持する（２３０）という運転目的の制御関数を破棄してもよい。

異なる確率分布を提供するために、同じ運転目的を表すが確率論的パラメータが異なる複数の制御関数が存在する場合があるであろう。たとえば、車線変更（２７０）は、複数の方法で行うことができ、選択された運転スタイル５２１ａによっては、その他の制御関数ではなく、同じ運転目的に関連付けられた異なる制御関数または異なる制御関数のパラメータが選択され得る。

いくつかの実施の形態は、制御関数の確率論的成分が乗員の運転スタイルを符号化できるという理解に基づいている。たとえば、普通の運転スタイルについては制御関数の決定論的成分を決定できる一方で、制御関数の確率論的成分は、普通のスタイルからのずれを表し得る。たとえば、制御関数を、異なる運転スタイルにマッピングされた複数の確率論的成分に対応付けることができる。たとえば、車線を変更するという運転目的の場合、制御関数の確率論的成分は、シグモイド関数に類似した経路を出力する。攻めの運転スタイルに対応する確率論的成分は、シグモイド関数を範囲に含む分布を形成し、シグモイド関数の曲率が規定する転回よりも急な転回を用いる尤度を上げる。そのためには、いくつかの実施の形態は、少なくとも一部の制御関数についての確率論的成分の集合を集合に含めて、確率論的成分の選択が運転スタイルに反映されるようにする。

異なる運転スタイルを異なる制御関数に対応付けてもよく、異なる運転スタイルを異なる方法で定めてもよい。たとえば、普通の運転スタイルを、人間の操作者の集合について決定されたパラメータの平均によって規定された決定論的パラメータ、確率論的パラメータ、および関連するパラメータを有する運転スタイルとして定めてもよい。同様に、守りの運転スタイルを、どうしても必要な場合以外は追い越しをせず、周囲の車両との最大許容距離を維持する運転スタイルとして定めてもよい。同様の方法で、攻めの運転スタイルを、速度が速さ制限からの偏差を最小限に抑えようとする運転スタイルとして定めてもよい。すなわち、この速さ制限の前後の許容変動は、車両の安全を確保しつつ、最小限に維持される。

制御関数の決定論的成分および確率論的成分によって異なる運転スタイルを決定できる。図５Ｂは、異なる運転スタイルの制御関数の成分を説明するイラストである。例示的な説明として、攻めの（左）スタイルおよび守りの（右）スタイルの実施例が採用され、速さ制限を維持するという運転目的が選択される。攻めの運転スタイルには、速さ制限５０１ｂを速さ制限５０１ｂと同じに維持するという速度運転目的のための制御関数の決定論的成分５０２ｂがあり、確率論的成分５１０ｂは、ほぼゼロである。しかしながら、守りの運転では、特に、速さ制限よりも下にある速度範囲の前後での速度の大きな変動を許容しており、決定論的成分もまた、速さ制限よりも下にある。

図５Ｃは、異なる運転スタイルの制御関数の成分を説明する別のイラストである。ここでは、決定論的成分５０２ｃおよび５０３ｃは、速さ制限５０１ｃと同一であり、確率論的成分が運転スタイルのすべてを規定している。たとえば、守りの運転の確率論的成分５２０ｃのほうが、対応する攻めた運転の確率論的成分５１０ｃよりも大きく、低い（すなわち、より守りの）速度のほうに偏っている。

図５Ｄは、運転スタイルの違いを識別するためにどのように確率論的成分を利用できるかを示す図である。自動運転車５１０ｄは、２車線一方通行道路上で、ほかの車両５２０ｄを追い抜くために車線変更を行っているところである。この例では、攻めの運転でも守りの運転でも、決定論的成分５５０ｄは同じであり、たとえば、記録された運転データと関数近似との差を数値的、すなわち、反復的手順によって最適化することによって取得できる。守りの運転スタイルの場合、道路上での挙動の変動およびセンシングの不確実性を十分に考慮するために、確率論的成分５３０ｄは、障害物５２０ｄから離れた距離に偏っている。一方で、攻めの運転スタイルの確率論的成分は、決定論的成分の周辺に集まっている。すなわち、この特定の場合では、決定論的成分は、守りのスタイルよりも、攻めたスタイルの平均を反映している。

図５Ｅは、決定論的部分その他の実施の形態が決定する異なるパラメータの乗員快適性制御関数の例を示す図である。

方法は、データに含まれている最大加速度の等位集合の値として規定される最大加速度を決定する（５１０ｆ）。次に、方法は、指数５２２ｆを決定する（５２０ｆ）。決定した指数５２２ｆを用いて、方法は、加速度および指数を乗員快適性制御関数の等位集合に挿入することによって快適度５３２ｆを決定する（５３０ｆ）。

快適度を満たす場合（５４０ｆ）、方法は、決定した指数５２２ｆを出力する。そうでない場合、新しい指数を決定する（５２０ｆ）。

別の実施の形態は、横加速度および縦加速度のＭ個の最大成分の集合の中央値を評価することによって、快適度５２２ｆを決定する（５３０ｆ）。

快適度要件は、いくつかの方法で決定できる。一実施の形態は、快適度５３２ｆを加速度５１２ｆと比較することによって、快適度が５４０ｆを満たしているかどうかを判断する。

車両の乗員についての学習された決定論的成分および確率論的成分を使用して、確率論的制御関数を用いて一連の状態および確率分布を決定してもよい。

図６Ａは、選択した制御関数３２５ａに現在の状態を登録して、車両が目標状態に到達するためのモーションプランを規定する一連の状態についての一連のパラメトリック確率分布３３５ａのサブ集合を生成するための方法３３０ａのフローチャートである。方法は、決定したサブ集合６１０ａと、たとえば車両のセンシングシステムから判断した現在の状態６１５ａとを使用し、それぞれ異なる目標状態の高次モーメントを規定する確率論的成分と各制御関数とを対応付けた集合を生成（６２０ａ）して、制御関数のサブ集合を規定する決定論的成分と確率論的成分との集合６２５ａを生成する。次に、方法は、決定論的成分および確率論的成分６２５ａを反復（６３０ａ）して、制御関数のサブ集合に含まれる制御関数ごとのモーションプランを定める一連の状態および関連する確率分布（６３５ａ）を生成する。

いくつかの実施の形態は、制御関数の確率論的成分が複数の制御目的のバランスを取る一連の状態を生成する際の関数の重要度を符号化できるという理解に基づいている。たとえば、いくつかの実施の形態では、制御目的の重要度は、制御関数の確率論的成分の分散値に反比例する。いくつかの実施の形態は、この関係性を複数の制御関数の出力を結合するために利用して、車両経路の目標状態を推定する。それぞれ異なる運転スタイルを異なって選択することで、確率論的分布の組合せのバランスを取ってもよい。たとえば、守りの運転スタイルの場合、速さ制限に従うよりも周囲の障害物までの安全距離を維持するほうが重要である。

図６Ｂは、制御関数を結合して関数の重要度を相対的に符号化するための方法３４０ａのフローチャートである。この方法は、決定した一連の状態および確率分布６１２ｂを使用して、一連の決定論的成分に含まれる決定論的成分を結合（６１０ｂ）して、統合決定論的成分６１５ｂにする。次に、方法は、確率論的成分を結合（６２０ｂ）して、結合された一連の制御関数（６２５ｂ）を生成する。統合分布関数６２１Ｂを用いて、方法は、結合制御関数６２５ｂを統合分布関数６２１Ｂと結合（６３０ｂ）して、いくつかの実施の形態に係る、車両を制御するために使用できる一連の目標分布６３５ｂを生成する。

図６Ｃは、いくつかの実施の形態に係る、どのように異なる制御関数の重要度のバランスを取るかについての方法を説明するイラストである。図６Ｃは、制御関数として表される運転目的が２つある状況を示しており、公称速度を維持し、安全距離を維持している。速度要件は、速度の公称速度からの偏差を示す関数として表され、安全距離は、自動運転車から道路上の障害物までのユークリッド距離として表される。速度制御関数の決定論的成分は、ゼロであり、確率論的成分は、決定論的成分の周辺に集まった細長い形状６１０ｃを有している。一方で、安全距離要件の決定論的成分６２０ｃはゼロ以外であり、確率論的成分６３０ｃは、決定論的成分の前後での大きな変動を許容する。また、この例示的な実施例では、決定論的成分は、確率論的成分の平均周辺に集まっていない。速度と距離は同じではないので、速度制御関数および安全距離制御関数を、共通状態に変換（６４０ｃ）する。ここで、制御関数を比較してもよい。次に、制御関数を結合（６５０ｃ）し、制御関数をまとめて重み付けする統合分布にする。たとえば、図６Ｃでは、統合分布は、重要度のバランスを取って（６５０ｃ）、共通決定論的成分６７０ｃおよび確率論的成分６６０ｃを生成する。共通決定論的成分６７０ｃおよび確率論的成分６６０は、速度制御関数のそれぞれの成分に近い。なぜならば、速度制御関数の確率分布の変動６１０ｃは、安全距離制御関数の確率論的成分６３０ｃよりもかなり小さいためである。

統合分布は、複数の方法で選択できる。たとえば、ステップごとの制御関数ごとの一連の成分に含まれる確率論的成分がガウス分布されている場合、多変量ガウス分布として統合分布を選択できる。ここで、各制御関数の重要度の重みは、成分ごとの共分散の逆関数によって重み付けされる。

決定論的成分は、複数の方法で選ぶことができる。たとえば、一実施の形態は、ガウス分布の平均を構成するように決定論的成分をベクトルにスタックすることによって、当該決定論的成分を結合する。

一連の成分に含まれているステップごとの確率論的成分はガウス分布されているが、一連の分布は、特に、結合された場合、非ガウス分布になる。たとえば、決定論的成分は、現在の状態を制御関数出力にマッピングする非線形関数になるおそれがあり、一連の成分が非ガウス分布されてしまう。このような場合に一連の結合した状態および分布を決定するために、たとえばサンプリングによって数値近似を利用してもよい。

図７Ａは、本発明の一実施の形態に係る、予測範囲の一連の結合された目標状態および統合パラメトリック確率分布を反復的に決定するための方法のブロック図である。この方法は、車両のプロセッサを用いて実装されてもよい。前回のイテレーションで決定した統合パラメトリック確率分布７４５ａを用いて、方法は、統合パラメトリック分布７４５ａを表す初期状態をサンプリング（７５０ａ）して、サンプリングした初期状態７５５ａの集合を生成する。次に、制御関数のサブ集合７５４ａを用いて、方法は、制御入力の実行可能領域をサンプリングして、制御関数のサブ集合に一致するゼロ以外の確率を有するサンプリングした制御入力の集合を生成する。車両の動きのモデル７６４ａおよびサンプリングした制御入力７６５ａを用いて、方法は、サンプリングした初期状態７５５ａを伝播し、制御入力ごとおよび初期状態ごとに次の状態７７５ａの集合を決定する（７７０ａ）。次に、方法は、当該次のサンプリングした状態の集合７７５ａを制御関数のサブ集合７５４ａに登録して、当該次の状態７７５ａが制御関数のサブ集合に一致していること示す状態７７５ａごとの確率の集合を生成する。最後に、次の目標状態の確率を結合（７８０ａ）して次の目標状態の統合パラメトリック確率分布を生成（７９０ａ）して、方法の反復が終了する。

いくつかの実施の形態では、一連の結合した状態および確率分布を決定することは、運転意思に到達する一連の状態が見つかるまで展開するツリーとして実装される。

図８は、本発明のいくつかの実施の形態に係る、車両の動きを規定する状態遷移のツリーの模式図である。走行可能空間８３０にある現在のツリーは、車両の現在の状態を示すルートノード８００を有すると示されており、ノードとして状態を含み、状態空間の枝として状態遷移を含み、その他の本発明の実施の形態に従って選択された制御入力から生じている。たとえば、枝８２１は、ルートノード８００から状態８２０に所定時間制御入力を適用することによって生じる動きである。ツリーは、車両の目標状態８１０および目標領域８４０を含んでもよい。本発明の一実施の形態では、複数の目標状態８１０および複数の領域８４０があってもよい。枝８２１を生じさせる。それによって、状態８２０も生じさせる制御入力に確率を対応付けてもよい。よって、当該確率は、車両、障害物、および環境のモデルにおける不確実性を考慮する。

いくつかの実施の形態では、枝８２１は、複数の時刻にまたがって制御入力を評価することによって作成されるが、その他の実施の形態では、時刻ごとに新しい制御入力を決定する。ここで、制御入力の決定については、その他の本発明の実施の形態に従って説明する。その他の実施の形態では、枝８２１は、１つまたはいくつかの時刻にまたがって複数の制御入力を集約することによって作成される。目標領域８４０に向けてツリーを展開する際、初期状態が選択され、制御入力が決定され、対応する状態の列、および最終状態が決定される。たとえば、８８０が選択した状態であってもよく、８８１がツリーに枝として追加される軌道であってもよく、８６０がノードとしてツリーに追加される最終状態であってもよい。

図９Ａは、本発明のいくつかの実施の形態に係る、一連の分布を決定し、車両を制御するための方法８９９のフローチャートである。この方法は、車両の初期状態から車両の目標状態までの車両の動きを指定する一連の制御入力を反復的に決定する。異なる実施の形態では、初期状態は、車両の現在の状態であり、および／または、初期状態は、方法の前回のイテレーションで決定した制御入力に対応する状態である。

動きは、たとえば図８に示すような、車両の状態を繋いでいる状態遷移によって規定される。各状態は、車両の位置、速度、および進行方向を含む。動きは、終了条件を満たすまで、たとえば、一定時間または所定のイテレーション回数、反復的に決定される。図９Ａの方法のイテレーションは、以下のステップを含む。

方法は、確率が高い状態遷移が制御関数のサブ集合に一致するよう、初期状態、サンプリングした状態の集合、および対応する状態遷移の集合を決定する（９００）。たとえば、方法は、図８の状態８８０、状態遷移８８１、および状態８６０を決定する。

図９Ｂは、確率論的制御関数に一致している各状態の確率を決定する方法９１０のフローチャートである。各状態の確率を決定する際、まず、状態は、衝突についてチェックされる（９１１）。次の状態、および状態までに至る状態遷移に衝突がない場合、制御関数のサブ集合との状態の一致を判断（９１２）し、各状態の確率を計算する（９１３）。

図９Ｃは、自動運転車の位置９１０ｃの予測が障害物９２０ｃの不確実領域９２１ｃと交差し、障害物９２０ｃの確率が衝突しきい値９３０ｃよりも高い位置９１０ｃにある例を示す図である。たとえば、車両のセンサーは、障害物の位置を時間関数として決定してもよい。モーションプランニングシステムは、次の状態が障害物の不確実領域と交差する確率を決定し、次の状態が障害物の不確実領域と交差する確率が衝突しきい値よりも高い場合、サンプリングした状態の確率にゼロを割り当てる。

方法９１０の別の実施の形態では、集約した確率がしきい値を下回る場合（９１４）（ここで、しきい値は、所定のしきい値であってもよい）、状態が制御関数に一致している確率が高くなるので、方法は、終了し（９１５）、再スタートする（８９９）。

図９Ｄは、イテレーションごとに５つのサンプリングした状態が生成された場合の、ステップ９００と、９１０と、９２０とのイテレーションを３回の行った結果を簡略化した模式図である。初期状態９１０ｄは、動きのモデルおよび確率論的制御関数を用いて予め予測され（９１１ｄ）、それに続く５つの状態は、９２１ｄ、９２２ｄ、９２３ｄ、９２４ｄ、および９２５ｄである。確率は、確率論的制御関数９２６ｄ、および確率的に許容できる制御関数９２６ｄのずれ９２７ｄに応じて決定される。各タイムステップ、すなわち、各イテレーションでは、確率の集約を用いて、集約した制御入力および対応する状態９２０ｄが生成される。

図９Ｅは、図９Ｄの第１イテレーションにおいて５つの状態に割り当てられ得る確率を示す図である。これらの確率９２１ｅ、９２２ｅ、９２３ｅ、９２４ｅ、および９２５ｅは、状態９２１ｄ、９２２ｄ、９２３ｄ、９２４ｄ、および９２５ｄを示す点の大きさの選択に反映されている。

一連の確率分布を決定すると、その結果、シーケンスのタイムステップごとに図９Ｅのような確率の分布が決定される。たとえば、この分布は、図９Ｅのような離散分布として表されてもよく、または、たとえば、カーネル密度平滑器を用いて。確率に対応付けられた離散状態を、連続した状態にしてもよい。

図９Ｄに戻ると、状態９２０ｄは、次のイテレーションにとっての初期状態になる。当該次のイテレーションでも、同じく５つのサンプリングした状態９３１ｄ、９３２ｄ、９３３ｄ、９３４ｄ、および９３５ｄが生成される。状態９３０ｄは、このイテレーションでサンプリングした状態の確率に従って選択される。状態９３０ｄは、次のイテレーションにとっての初期状態である。

上述した本発明の実施の形態は、数多くの方法のいずれによっても実現できる。たとえば、ハードウェア、ソフトウェア、または、それらの組合せを用いて実施の形態を実現してもよい。ソフトウェアで実現された場合、１つのコンピュータ上に配置されていても複数のコンピュータ間で分散されていても、任意の適切なプロセッサまたはプロセッサの集まり上でこのソフトウェアコードを実行できる。このようなプロセッサは、１つの集積回路部品に１つ以上のプロセッサを含めた集積回路として実現されてもよい。しかし、プロセッサは、任意の適切なフォーマットの回路を用いて実現されてもよい。

また、本明細書において概要を説明した様々な方法または工程は、様々なオペレーティングシステムまたはプラットフォームのいずれか１つを採用する１つ以上のプロセッサ上で実行可能なソフトウェアとしてコーディングされてもよい。これに加えて、このようなソフトウェアは、複数の適したプログラミング言語および／もしくはプログラミングツールもしくはスクリプティングツールのいずれかを用いて書かれてもよく、または、フレームワークもしくは仮想マシン上で実行される実行可能な機械言語コードもしくは中間コードとしてコンパイルされてもよい。典型的に、プログラムモジュールの機能は、様々な実施の形態において所望されるように組み合わせたり分散させたりしてもよい。

また、本発明の実施の形態は、説明を行った方法として実装されてもよい。方法の一部として実行される動作は、適切に順序付けされてもよい。したがって、例示した順序とは異なる順序で動作を実行する実施の形態が構成されてもよく、例示した実施の形態では連続した動作として示されていたとしても、一部の動作を同時に行うことを含んでもよい。

好ましい実施の形態の例として本発明を説明したが、本発明の要旨および範囲内で様々なその他の改作および変更が行われてもよいことを理解されたい。そのため、添付の特許請求の範囲の目的は、本発明の趣旨および範囲に含まれるすべてのこのような変形例および変更例を対象として含むことである。

Claims

車両の動きを制御するためのシステムであって、
前記車両の現在の状態と、前記車両の近傍の環境の画像と、前記車両の次の運転意思とを受け付けるように構成された入力インターフェースと、
制御関数の集合を格納するように構成されたメモリとを備え、各制御関数は、その対応する制御目的に基づいて、前記車両の現在の状態を目標状態に遷移させるように構成され、前記制御関数のうち少なくともいくつかは、確率論的制御関数であり、前記確率論的制御関数の出力が第１モーメントおよび少なくとも１つの高次モーメントが規定する前記目標状態のパラメトリック確率分布になるよう、前記現在の状態を前記目標状態に遷移させるための決定論的成分と、前記決定論的成分が決定した前記目標状態を中心とした値の確率論的分布を決定するための確率論的成分とを含み、前記システムは、さらに、
モーションプランナーおよびコントローラを実行するように構成されたプロセッサを備え、
前記モーションプランナーは、実行されると、
前記現在の状態を、次の運転意思に一致する制御関数のサブ集合に少なくとも登録して前記目標状態のパラメトリック確率分布のサブ集合を生成し、
前記パラメトリック確率分布のサブ集合を結合して前記目標状態の統合パラメトリック確率分布を生成し、
前記コントローラは、実行されると、
前記目標状態の統合パラメトリック確率分布の前記第１モーメントおよび少なくとも１つの高次モーメントに基づいて前記制御コマンドを決定し、前記システムは、さらに、
前記車両のアクチュエータに前記制御コマンドを出力するように構成された出力インターフェースを備える、システム。
前記制御関数のそれぞれ異なる確率論的成分が、前記対応する決定論的成分が決定した前記目標状態を中心とした前記確率論的分布の移動に反映された前記目標状態のそれぞれ異なる高次モーメントを規定するよう、前記メモリは、１つまたは複数の制御関数の複数の確率論的成分を格納し、
前記プロセッサは、前記制御関数の複数の確率論的成分のうち１つが選択されたことに応答して、前記制御関数の決定論的成分が決定した前記目標状態を中心とした前記確率論的分布を決定するために、選択された前記確率論的成分に前記制御関数を対応付ける、請求項１に記載のシステム。
前記制御関数の異なる確率論的成分は、攻めの運転スタイル、守りの運転スタイル、および普通の運転スタイルのうち少なくともいくつかを含む、異なる運転スタイルに対応し、前記システムは、さらに、
前記車両の乗員に運転スタイルを選択させる選択インターフェースを備え、前記プロセッサは、選択された前記運転スタイルに対応する確率論的成分に前記制御関数を対応付ける、請求項２に記載のシステム。
前記メモリは、前記制御関数の複数の決定論的成分をさらに格納し、前記制御関数の異なる確率論的成分および異なる決定論的成分は、攻めの運転スタイル、守りの運転スタイル、および普通の運転スタイルのうち少なくともいくつかを含む、異なる運転スタイルに対応し、前記システムは、さらに、
前記車両の乗員に運転スタイルを選択させる選択インターフェースを備え、前記プロセッサは、選択された前記運転スタイルに対応する前記確率論的成分および前記決定論的成分に前記制御関数を対応付ける、請求項２に記載のシステム。
前記車両の乗員は、前記乗員から受信する運転の仕方に対する漸進的な調整に従って前記運転スタイルを変更するよう選択インターフェースに通知することによって前記調整を行うことにより、前記運転スタイルを変更する、請求項２に記載のシステム。
前記プロセッサは、前記車両の現在の状態、前記車両の環境の画像、および前記車両の次の運転意思のうち１つまたは組合せに基づいて前記制御関数のサブ集合を選択するように構成される、請求項１に記載のシステム。
前記メモリは、前記対応する種類の次の運転意思に適用可能な制御関数のそれぞれ異なるサブ集合にそれぞれ異なる種類の次の運転意思をマッピングする一連のルールを保持し、
前記プロセッサは、前記車両の次の運転意思の種類に基づいて前記制御関数のサブ集合を選択するように構成され、
前記次の運転意思の種類は、動きの方向の維持、障害物の回避、車線変更、信号での停止、および転回のうち、１つまたは組合せを含む、請求項６に記載のシステム。
前記目標状態の統合パラメトリック確率分布が多変量確率分布になるよう、前記パラメトリック確率分布のサブ集合は、前記目標状態のそれぞれ異なる状態変数のパラメトリック確率分布を含む、請求項１に記載のシステム。
前記目標状態の統合パラメトリック確率分布が前記状態変数の単変量確率分布になるよう、前記プロセッサは、前記パラメトリック確率分布のサブ集合を状態変数の確率分布に変換する、請求項１に記載のシステム。
前記制御関数の集合は、複数の関数のうち１つまたは組合せを含み、前記複数の関数は、
前記車両の位置を道路の境界内に維持するという前記制御目的を有する道路上滞在関数を含み、前記道路上滞在関数は、前記車両の現在の進行方向に基づく前記車両の一連の目標進行方向と、前記道路の境界までの前記車両の距離とを出力する前記決定論的成分を含み、前記道路上滞在関数は、前記道路上滞在関数の決定論的成分が決定した前記一連の前記目標進行方向に含まれる各目標進行方向を中心とした値の前記確率論的分布を提供する前記確率論的成分を含み、前記複数の関数は、さらに、
前記車両の位置を車線の中央に維持するという前記制御目的を有する車線中央関数を含み、前記車線中央関数は、一連の目標進行方向を追跡することによって前記車線の中央からの前記車両の現在位置の横方向のずれが小さくなるように、前記車両の現在の進行方向および前記横方向のずれに基づいて前記車両の一連の目標進行方向を出力する前記決定論的成分を含み、前記車線中央関数は、前記車線中央関数の決定論的成分が決定した前記一連の目標進行方向に含まれる各目標進行方向を中心とした値の前記確率論的分布を提供する前記確率論的成分を含み、前記複数の関数は、さらに、
前記車両の現在の速さを維持するという前記制御目的を有する速さ維持関数を含み、前記速さ維持関数は、目標速度が前記現在の速度に等しくなるように前記車両の現在の速度に基づいて前記目標速度を出力する前記決定論的成分を含み、前記速さ維持関数は、前記速さ維持関数の決定論的成分が決定した前記目標速度を中心とした値の前記確率論的分布を提供する前記確率論的成分を含み、前記複数の関数は、さらに、
前記車両の速さを速さ制限に維持するという前記制御目的を有する速さ制限関数を含み、前記速さ制限関数は、前記現在の速度から前記速さ制限に達する前記車両の一連の目標速度を出力する前記決定論的成分を含み、前記速さ制限関数は、前記速さ制限関数の決定論的成分が決定した前記一連の目標速度に含まれる各目標速度を中心とした値の前記確率論的分布を提供する前記確率論的成分を含み、前記複数の関数は、さらに、
前記車両と前記道路上の障害物との間の最小距離を維持するという前記制御目的を有する安全マージン関数を含み、前記安全マージン関数は、少なくとも前記障害物の位置までの最小距離を少なくとも維持する前記車両の一連の目標位置を出力する前記決定論的成分を含み、前記安全マージン関数は、前記安全マージン関数の決定論的成分が決定した前記一連の目標位置のすべてのインスタンスを中心とした前記目標位置の値の前記分布を提供する前記確率論的成分を含み、前記複数の関数は、さらに、
前記車両と前を走る車両との間の最小車間距離を維持するという前記制御目的を有する最小車間距離関数を含み、前記最小車間距離関数は、前記最小車間距離を維持する前記車両の一連の目標速度を出力する前記決定論的成分を含み、前記最小車間距離関数は、前記最小車間距離関数の決定論的成分決定した前記一連の目標速度に含まれる各目標速度を中心とした値の前記分布を提供する前記確率論的成分を含み、前記複数の関数は、さらに、
前記車両の動きのスムーズさを維持するという前記制御目的を有するスムーズ運転関数を含み、前記スムーズ運転関数は、前記目標速度と前記現在の速度との差がしきい値未満になるように、前記現在の速度に基づいて前記車両の目標速度を出力する前記決定論的成分を含み、前記スムーズ運転関数は、前記スムーズ運転関数の決定論的成分が決定した前記目標速度を中心とした値の前記分布を提供する前記確率論的成分を含み、前記複数の関数は、さらに、
前記車両の現在位置を現在の車線から隣接する車線に変更するという前記制御目的を有する車線変更関数を含み、前記車線変更関数は、前記車両を前記隣接する車線の中央まで移動させる前記車両の一連の目標速度を出力する前記決定論的成分を含み、前記車線変更関数は、前記車線変更関数の決定論的成分が決定した前記一連の目標速度のすべてのインスタンスを中心とした前記目標位置の値の前記分布を提供する前記確率論的成分を含み、前記複数の関数は、さらに、
交差点における前記車両のアイドル時間を減らすという前記制御目的を有する交差点横断関数を含み、前記交差点横断関数は、前記交差点にある障害物および前記横断することを管理する交通規則を考慮して前記交差点を横断する時間を低減する前記車両の一連の目標速度を出力する前記決定論的成分を含み、前記交差点横断関数は、前記交差点横断関数の決定論的成分が決定した前記一連の標速度のすべてのインスタンスを中心とした前記目標位置の値の前記分布を提供する前記確率論的成分を含む、請求項１に記載のシステム。
前記制御関数のそれぞれ異なる確率論的成分が、前記対応する決定論的成分が決定した前記目標状態を中心とした前記確率論的分布の移動に反映された前記目標状態のそれぞれ異なる高次モーメントを規定するよう、前記メモリは、１つまたは複数の制御関数の複数の確率論的成分を格納し、前記プロセッサは、前記制御関数の複数の確率論的成分のうち１つが選択されたことに応答して、前記制御関数の決定論的成分が決定した前記目標状態を中心とした前記確率論的分布を決定するために、選択された前記確率論的成分に前記制御関数を対応付け、
前記メモリは、攻めの運転スタイルに対応する攻めの確率論的成分および守りの運転スタイルに対応する守りの確率論的成分を含む、前記速さ制限関数についての前記複数の確率論的成分を格納し、前記攻めの確率論的成分に従って前記速さ制限を超える目標速さをサンプリングする尤度は、前記攻めの確率論的成分に従って前記速さ制限を超える前記速さをサンプリングする前記尤度よりも大きく、
前記メモリは、前記攻めの運転スタイルに対応する攻めの確率論的成分、および前記守りの運転スタイルに対応する守りの確率論的成分を含む、前記安全マージン関数についての前記複数の確率論的成分を格納し、前記攻めの確率論的成分に従ってサンプリングされる前記目標位置の値は、前記攻めの確率論的成分に従ってサンプリングされる前記目標位置の値よりも前記障害物に近い値である可能性が高く、
前記メモリは、前記攻めの運転スタイルに対応する攻めの確率論的成分、および前記守りの運転スタイルに対応する守りの確率論的成分を含む、前記最小車間距離関数についての前記複数の確率論的成分を格納し、前記攻めの確率論的成分に従ってサンプリングされる前記目標速度の値によって得られる車間距離は、前記攻めの確率論的成分に従ってサンプリングされる前記目標速度の値に係る車間距離よりも小さな車間距離になる可能性が高く、
前記メモリは、前記攻めの運転スタイルに対応する攻めの確率論的成分、および前記守りの運転スタイルに対応する守りの確率論的成分を含む、前記車線変更関数についての前記複数の確率論的成分を格納し、前記攻めの確率論的成分に従ってサンプリングされる前記目標速度の値によって得られる曲線は、前記攻めの確率論的成分に従ってサンプリングされる前記目標速度の値に従う曲線よりも急な曲線になる可能性が高い、請求項１０に記載のシステム。
前記コントローラは、予測範囲にわたるコスト関数を最適化することによって前記制御コマンドを決定し、前記車両の１つまたは複数のアクチュエータに対する一連の制御コマンドを生成するように構成された予測コントローラであり、前記コスト関数を最適化することによって、前記統合パラメトリック確率分布の第１モーメント規定する前記一連の目標状態を追跡するコストのバランスを、前記車両の動きの少なくとも１つのその他の基準値少なくとも１つのその他の基準値のコストに対して取り、前記バランス最適化において、前記統合確率分布の高次モーメントのうちの１つまたは複数を用いて前記追跡コストの重要度が重み付けされる、請求項１に記載のシステム。
前記確率分布の高次モーメントは、前記車両の前記モーションプランについての前記確率論的モーションプランナーの信頼度を示し、アダプティブ予測コントローラは、前記信頼度が増加すると、前記バランス最適化における前記追跡の重みを増やして前記予測車両状態値の前記一連の目標状態からの下方変動を許容し、前記信頼度が低下すると、前記バランス最適化における前記追跡の重みを減らして前記予測車両状態値の前記一連の目標状態からの情報変動を許容する、請求項１２に記載のシステム。
前記予測コントローラは、前記確率分布の高次モーメントから導出された値を有する時変正定値重み行列を用いて重み付けされた前記追跡コストを含む時変ステージ単位最小二乗法コスト関数（Time-varying stage-wise least square cost function）として公式化される前記コスト関数を用いるモデル予測コントローラ（ＭＰＣ：Model Predictive Contoroller）である、請求項１２に記載のシステム。
前記モーションプランナーは、予測範囲にわたる前記目標状態の一連の統合パラメトリック確率分布を反復的に生成する、確率論的かつ予測的なモーションプランナーであり、イテレーションごとに、前記モーションプランナーは、
制御入力の実行可能領域をサンプリングして、前記制御関数のサブ集合に一致するゼロ以外の確率を有するサンプリングした制御入力の集合を生成し、
前記制御関数のサブ集合に一致する制御入力とともに前記車両の動きモデルを用いて、前記サンプリングした状態を伝播し、次のサンプリングした状態の集合を生成し、
前記次のサンプリングした状態の集合を前記制御関数のサブ集合に登録して次の目標状態の確率論的分布の集合を生成し、
前記次の目標状態の確率論的分布の集合を結合して前記次の目標状態の前記統合パラメトリック確率分布を生成するように構成される、請求項１に記載のシステム。
車両の動きを制御するための方法であって、前記方法は、制御関数の集合を格納するメモリに結合されたプロセッサを使用し、各制御関数は、その対応する制御目的に基づいて、前記車両の現在の状態を目標状態に遷移させるように構成され、前記制御関数のうち少なくともいくつかは、確率論的制御関数であり、前記確率論的制御関数の出力が第１モーメントおよび少なくとも１つの高次モーメントが規定する前記目標状態のパラメトリック確率分布になるよう、前記現在の状態を前記目標状態に遷移させるための決定論的成分と、前記決定論的成分が決定した前記目標状態を中心とした値の確率論的分布を決定するための確率論的成分とを含み、前記プロセッサは、前記方法を実装する格納された命令に連結され、前記命令は、前記プロセッサによって実行されると、前記方法の少なくともいくつかのステップを実行し、前記いくつかのステップは、
前記車両の現在の状態、前記車両の近傍の環境の画像、および前記車両の次の運転意思を受け付けるステップと、
前記現在の状態を、次の運転意思に一致する制御関数のサブ集合に少なくとも登録して前記目標状態のパラメトリック確率分布のサブ集合を生成するステップと、
前記パラメトリック確率分布のサブ集合を結合して前記目標状態の統合パラメトリック確率分布を生成するステップと、
前記目標状態の統合パラメトリック確率分布の前記第１モーメントおよび少なくとも１つの高次モーメントに基づいて前記制御コマンドを決定するステップと、
前記車両のアクチュエータに前記制御コマンドを出力するステップとを含む、方法。
プロセッサによって実行可能であり、方法を実行するためのプログラムを含んだ非一時的なコンピュータ読み取り可能な記憶媒体であって、前記媒体は、制御関数の集合を格納し、各制御関数は、その対応する制御目的に基づいて、前記車両の現在の状態を目標状態に遷移させるように構成され、前記制御関数のうち少なくともいくつかは、確率論的制御関数であり、前記確率論的制御関数の出力が第１モーメントおよび少なくとも１つの高次モーメントが規定する前記目標状態のパラメトリック確率分布になるよう、前記現在の状態を前記目標状態に遷移させるための決定論的成分と、前記決定論的成分が決定した前記目標状態を中心とした値の確率論的分布を決定するための確率論的成分とを含み、前記方法は、
前記車両の現在の状態、前記車両の近傍の環境の画像、および前記車両の次の運転意思とを受け付けるステップと、
前記現在の状態を、次の運転意思に一致する制御関数のサブ集合に少なくとも登録して前記目標状態のパラメトリック確率分布のサブ集合を生成するステップと、
前記パラメトリック確率分布のサブ集合を結合して前記目標状態の統合パラメトリック確率分布を生成するステップと、
前記目標状態の統合パラメトリック確率分布の前記第１モーメントおよび少なくとも１つの高次モーメントに基づいて前記制御コマンドを決定するステップと、
前記車両のアクチュエータに前記制御コマンドを出力するステップとを含む、非一時的なコンピュータ読み取り可能な記憶媒体。