JP2023502797A - 自動運転車または半自動運転車のアダプティブコントロール - Google Patents

自動運転車または半自動運転車のアダプティブコントロール Download PDF

Info

Publication number
JP2023502797A
JP2023502797A JP2022555258A JP2022555258A JP2023502797A JP 2023502797 A JP2023502797 A JP 2023502797A JP 2022555258 A JP2022555258 A JP 2022555258A JP 2022555258 A JP2022555258 A JP 2022555258A JP 2023502797 A JP2023502797 A JP 2023502797A
Authority
JP
Japan
Prior art keywords
vehicle
stochastic
function
control
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022555258A
Other languages
English (en)
Other versions
JP7334364B2 (ja
Inventor
バーントープ,カール
ディ・カイラノ,ステファノ
メナー,マルセル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JP2023502797A publication Critical patent/JP2023502797A/ja
Application granted granted Critical
Publication of JP7334364B2 publication Critical patent/JP7334364B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0088Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0217Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory in accordance with energy consumption, time reduction or distance reduction criteria
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • B60W60/0011Planning or execution of driving tasks involving control alternatives for a single driving scenario, e.g. planning several paths to avoid obstacles
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0214Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory in accordance with safety or protection criteria, e.g. avoiding hazardous areas
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0223Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving speed control of the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C5/00Registering or indicating the working of vehicles
    • G07C5/08Registering or indicating performance data other than driving, working, idle, or waiting time, with or without registering driving, working, idle or waiting time
    • G07C5/0841Registering performance data
    • G07C5/085Registering performance data using electronic data carriers

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Human Computer Interaction (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Traffic Control Systems (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)
  • Navigation (AREA)

Abstract

車両のコントローラは、制御関数を使用して、車両の現在の状態を目標状態に遷移させる。制御関数は、第1モーメントおよび少なくとも1つの高次モーメントが規定する目標状態のパラメトリック確率分布を出力するための確率論的制御関数である。コントローラは、現在の状態を、次の運転意思に一致する制御関数のサブ集合に少なくとも登録して目標状態のパラメトリック確率分布のサブ集合を生成し、パラメトリック確率分布のサブ集合を結合して目標状態の統合パラメトリック確率分布を生成し、目標状態の統合パラメトリック確率分布の第1モーメントと少なくとも1つの高次モーメントとに基づいて制御コマンドを決定する。

Description

本発明は、全体的に、車両を制御することに関し、特に、自動運転車または半自動運転車を制御することに関する。
自動運転車は、相互接続された高度なセンシングコンポーネントおよび制御コンポーネントの統合を必要とする複雑な意思決定システムである。最高レベルでは、ルートプランナーによって道路網から一連の運転意思が計算される。離散意思決定層は、局所的な車両の運転目標を決定する役割を担う。各意思は、右折するという意思、車線に留まるという意思、左折するという意思、または交差点において特定の車線で完全停止するという意思のうちのいずれかであり得る。センシング/マッピングモジュールは、レーダー、LIDAR、カメラ、およびGPS(Global Positioning System)情報など、様々なセンサー情報を以前のマッピング情報とともに使用して、運転シナリオに関連性のある周囲の状況の各部を推定する。
モーションプランニングの出力は、車両コントローラへの入力である。モーションプランナーは、センシング/マッピングモジュールからの出力に基づいて車両が従うべき安全かつ所望の、動的に実現可能な軌道を決定する役割を担う。次に、車両制御アルゴリズムが、操舵角、車輪トルク、およびブレーキ力など、コマンドを発行することによって、比較的高いサンプリング頻度でこの基準の動きを追跡することを目標とする。最後に、アクチュエータ制御層がアクチュエータを調整して、これらの要求コマンドを実現する。
自動運転車におけるモーションプランニングの課題は、標準ロボディクスセットアップと多くの類似点を共有しており、課題の非凸性により、ほとんどの場合、最適解が扱い難い。特化したシナリオの場合、順動的最適化(Direct Dynamic Optimization)に依拠する手法が開発されてきた。しかしながら、これでは、非凸性のせいで、局所的な最適解に終わるだけであり、全体的な最適解からは程遠く、比較的大きな演算負荷および時間がかかる可能性がある。モーションプランニングは、高速探索ランダムツリー(RRT:Rapidly-Exploring Random Tree)法などのサンプリングベースの方法、または、A、Dおよびその他のバリエーションなどのグラフ探索法を使用して行われることが多い。
このサンプリングを決定論的に行う方法がある一方で、米国特許第9,568,915号に記載の方法など、確率論的サンプリングを利用する方法もある。このサンプリング技術は、高速機械計算に適しているが、サンプリング法によって生成される経路は、自動運転車または半自動運転車内の乗員には不自然に感じられる場合がある。したがって、依然として、自動運転車または半自動運転車のパスプランニングおよび制御を改善する必要がある。
いくつかの実施の形態は、サンプリングベースのパスプランニング方法は、性質上、日和見的かつ試験的であるという認識に基づく。サンプリング技術は、高速機械計算に適しているが、人間のドライバーがパスプランニングおよび/または運転タスクに取り組む方法に必ずしも一致しているわけではない。その結果、サンプリング法によって生成される経路は、自動運転車または半自動運転車の乗員には不自然に感じられる場合がある。
たしかに、人間のドライバーは、動いている途中に自由空間をサンプリングすることによって運転車両の経路を決定することはない。そのためには、いくつかの実施の形態の目的は、自動運転車または半自動運転車の自動制御に適した方法における経路生成についての人間のドライバーに意思決定を近似させることである。具体的には、いくつかの実施の形態は、以下に概要を説明する理解および目的のうち1つまたは組合せを用いる。
第1に、いくつかの実施の形態は、人間のドライバーは、日和見的にサンプリングするのではなく、1つまたは複数の運転目的を達成することを目標とした、結果重視の方法で車両を操作しているという認識に基づく。たとえば、車両の正面の空間をサンプリングするのではなく、意識的または無意識に直近の未来の運転目的を立てることは、人間のドライバーの本質である。運転目的として、現在の速さを維持すること、車間距離を維持すること、速さ制限まで速さを上げること、止まれの標識で停止すること、車両を車線中央に維持すること、車線を変更すること、障害物を回避することなどが挙げられる。これらの目的を立てた後、人間のドライバーは、自身の経験と運転スタイルで車両を動かす。そのためには、いくつかの実施の形態の目的は、サンプリングベースのパスプランニングではなく、運転目的ベースのパスプランニングを提供することである。
第2に、人間のドライバーは、複数の目的について、それらの重要度および類似度に基づいてバランスを取ることができる。たとえば、現在の速さの維持という一方の運転目的が、車間距離を維持するという他方の運転目的と相反する場合、人間のドライバーは、これらの目的のバランスを取って安全な運転意思を決定するであろう。そのためには、いくつかの実施の形態の別の目的は、様々な運転目的について、特定の運転状況に対するこれらの目的の重要度に基づいてバランスを取るのに適した、運転目的をベースにしたパスプランニングを提供することである。
第3に、人間のドライバーは、意思決定において柔軟性を受け入れる。このような柔軟性は、ドライバーの運転スタイル、運転の不安を大きくさせる交通量もしくは明白な視界の状態などの環境の状況、またはドライバーの単なる気分に基づき得る。そのためには、いくつかの実施の形態の目的は、運転目的をベースにしたパスプランニング手法にこのような柔軟性を取り入れることである。
第4に、人間は、異なるスタイルで車両を運転する。運転スタイルとして、攻めた運転、守りの運転、および普通または中立の運転などが挙げられる。そのためには、いくつかの実施の形態の別の目的は、異なる運転スタイルに適応可能な、運転目的をベースにしたパスプランニングを提供することである。
第5に、道路状況は予測不能であり、めまぐるしく変化し続ける。そのためには、いくつかの実施の形態の別の目的は、制御適応に適した、運転目的をベースにしたパスプランニングを提供することである。
それゆえ、異なる実施の形態が、上述した目的のうち1つまたは組合せに自動運転車または半自動運転車の制御に適した方法で対処する。
いくつかの実施の形態は、運転目的に対応して1つまたは複数の状態変数を現在値から1つまたは複数の未来値に遷移させる制御関数によって運転目的を表すことができるという理解に基づいている。制御関数は、「どのように」という質問ではなく、「何」という質問に返答するので、これらの制御関数は、人間のドライバーの結果重視の方法を模倣する。とりわけ、運転経験を模倣するために、これらの制御関数は予め決定されている。いくつかの実施の形態では、1つの運転目的に対して1つの制御関数がある。それゆえ、制御関数として、現在の速さを維持するための関数、車間距離を維持するための関数、速さ制限まで速さを上げるための関数、止まれの標識で停止するための関数、車両を車線中央に維持するための関数、車線を変更するための関数、障害物を回避するための関数などが挙げられる。
制御関数の入力は、現在の速さ、加速度、位置、および進行方向のうち1つまたは組合せなど、車両の状態変数を含む。また、制御関数への入力は、環境のマップと交通データとを含み得る。制御関数の出力は、状態変数の目標値のうち1つまたは組合せを含む。たとえば、車間距離を維持するための制御関数は、車両の目標速さを出力し得る。車線を変更するための制御関数は、一連の横加速度値を出力し得る。
そのためには、いくつかの実施の形態は、制御目的の集合について決定した制御関数の集合を保持して、先に列挙した第1の理解に対処する。異なる制御関数は、異なる方法で決定され得る。いくつかの関数は、アナリティカルな関数であり、一定の法則に基づいて目標状態変数を推定する。いくつかの関数は、課題解決器(ソルバー)であり、微分方程式の解に基づいて目標状態変数を推定する。いくつかの関数は、学習する関数であり、訓練データから予め学習したハイパーパラメータに従って目標状態変数を推定する。ハイパーパラメータにより、制御関数を実際の運転データにマッピングすることができる。
いくつかの実施の形態は、制御関数は確率論的であるべきである、すなわち、目標状態変数の確率論的分布を出力するべきであるという理解に基づいている。たとえば、現在の速さを維持するための制御関数は、速さ値および加速度値だけでなく、これらの値の確率論的分布も出力すべきである。確率論的分布は、ガウス分布の場合の平均値および分散値のように、そのパラメータによってパラメータ化することができる。そのためには、いくつかの実施の形態では、制御関数は、目標状態変数に現在の状態変数をマッピングする決定論的成分と、目標状態変数ごとに分布を規定する確率論的成分とを含む。事実上、制御関数の確率論的であるという性質が、運転意思決定における柔軟性を模倣するようになり、運転目的をベースにしたパスプランニングを、制御環境の予測不能性に適応させることができるようになる。
次に、いくつかの実施の形態は、制御関数の確率論的成分が複数の制御目的のバランスを取る経路を生成する際の関数の重要度を符号化できるという理解に基づいている。たとえば、いくつかの実施の形態では、制御目的の重要度は、制御関数の確率論的成分の分散値に反比例する。いくつかの実施の形態は、この関係性を複数の制御関数の出力を結合するために利用して、車両経路の目標状態を推定する。
次に、いくつかの実施の形態は、制御関数の確率論的成分が乗員の運転スタイルを符号化できるという理解に基づいている。たとえば、普通の運転スタイルについては制御関数の決定論的成分を決定できる一方で、制御関数の確率論的成分は、普通のスタイルからのずれを表し得る。たとえば、制御関数を、異なる運転スタイルにマッピングされた複数の確率論的成分に対応付けることができる。たとえば、車線を変更するという運転目的の場合、制御関数の確率論的成分は、シグモイド関数に類似した経路を出力する。攻めの運転スタイルに対応する確率論的成分は、シグモイド関数を範囲に含む分布を形成し、シグモイド関数の曲率が規定する転回よりも急な転回を用いる尤度を上げる。そのためには、いくつかの実施の形態は、少なくとも一部の制御関数についての確率論的成分の集合を集合に含めて、確率論的成分の選択が運転スタイルに反映されるようにする。
これに加えて、またはこれに代えて、いくつかの実施の形態は、目標状態変数の確率分布が表す経路に従って車両を制御する、分布を意識したコントローラを使用する。具体的には、いくつかの実施の形態は、(半)自動運転システムに統合アーキテクチャを使用する。この統合アーキテクチャには、低速かつ長期の、サンプリングベースのモーションプランニングアルゴリズムと、高速かつ反応性が高い、最適化ベースの予測車両コントローラとを含む。この統合により、モーションプランニング層および車両制御層による複数の競合する目的、たとえば、比較的複雑な高速道路および都市の運転シナリオにおいて安全要件を満たすこと、および、信頼性が高く快適な運転挙動を確実にすることの両方を達成するという責任を体系的かつ効果的に共有することが可能になる。この統合は、経路生成が不確実な状態での制御の柔軟性に適応できる。
これに加えて、コントローラは、目標状態変数の確率論的分布の第1モーメントおよび高次モーメントを考慮して、車両のアクチュエータに対する制御コマンドを決定する。たとえば、一実施の形態では、コントローラは、予測範囲にわたるコスト関数を最適化することによって制御コマンドを決定し、車両の1つまたは複数のアクチュエータに対する一連の制御コマンドを生成するように構成された予測コントローラである。コスト関数を最適化することによって、統合パラメトリック確率分布の第1モーメントが規定する一連の目標状態を追跡するコストのバランスを、車両の動きの少なくとも1つのその他の基準値のコストに対して取ることができる。最適化のバランスを取る際、統合確率分布の高次モーメントのうちの1つまたは複数を用いて追跡コストの重要度が重み付けされる。
したがって、一実施の形態は、車両の動きを制御するためのシステムを開示する。このシステムは、車両の現在の状態と、車両の近傍の環境の画像と、車両の次の運転意思とを受け付けるように構成された入力インターフェースと、制御関数の集合を格納するように構成されたメモリとを備える。各制御関数は、その対応する制御目的に基づいて、車両の現在の状態を目標状態に遷移させるように構成される。制御関数のうち少なくともいくつかは、確率論的制御関数であり、確率論的制御関数の出力が第1モーメントおよび少なくとも1つの高次モーメントが規定する目標状態のパラメトリック確率分布になるよう、現在の状態を目標状態に遷移させるための決定論的成分と、決定論的成分が決定した目標状態を中心とした値の確率論的分布を決定するための確率論的成分とを含む。システムは、さらに、モーションプランナーおよびコントローラを実行するように構成されたプロセッサを備える。モーションプランナーは、実行されると、現在の状態を、次の運転意思に一致する制御関数のサブ集合に少なくとも登録して目標状態のパラメトリック確率分布のサブ集合を生成し、パラメトリック確率分布のサブ集合を結合して目標状態の統合パラメトリック確率分布を生成する。コントローラは、実行されると、目標状態の統合パラメトリック確率分布の第1モーメントおよび少なくとも1つの高次モーメントに基づいて制御コマンドを決定する。システムは、さらに、車両のアクチュエータに制御コマンドを出力するように構成された出力インターフェースを備える。
別の実施の形態は、車両の動きを制御するための方法を開示する。この方法は、制御関数の集合を格納するメモリに結合されたプロセッサを使用する。各制御関数は、その対応する制御目的に基づいて、車両の現在の状態を目標状態に遷移させるように構成される。制御関数のうち少なくともいくつかは、確率論的制御関数であり、確率論的制御関数の出力が第1モーメントおよび少なくとも1つの高次モーメントが規定する目標状態のパラメトリック確率分布になるよう、現在の状態を目標状態に遷移させるための決定論的成分と、決定論的成分が決定した目標状態を中心とした値の確率論的分布を決定するための確率論的成分とを含む。プロセッサは、方法を実装する格納された命令に連結される。命令は、プロセッサによって実行されると、方法の少なくともいくつかのステップを実行する。当該いくつかのステップは、車両の現在の状態、車両の近傍の環境の画像、および車両の次の運転意思を受け付けるステップと、現在の状態を、次の運転意思に一致する制御関数のサブ集合に少なくとも登録して目標状態のパラメトリック確率分布のサブ集合を生成するステップと、パラメトリック確率分布のサブ集合を結合して目標状態の統合パラメトリック確率分布を生成するステップと、目標状態の統合パラメトリック確率分布の第1モーメントおよび少なくとも1つの高次モーメントに基づいて制御コマンドを決定するステップと、車両のアクチュエータに制御コマンドを出力するステップとを含む。
さらに別の実施の形態は、プロセッサによって実行可能であり、方法を実行するためのプログラム、を含んだ非一時的なコンピュータ読み取り可能な記憶媒体を開示する。この媒体は、制御関数の集合を格納する。各制御関数は、その対応する制御目的に基づいて、車両の現在の状態を目標状態に遷移させるように構成される。制御関数のうち少なくともいくつかは、確率論的制御関数であり、確率論的制御関数の出力が第1モーメントおよび少なくとも1つの高次モーメントが規定する目標状態のパラメトリック確率分布になるよう、現在の状態を目標状態に遷移させるための決定論的成分と、決定論的成分が決定した目標状態を中心とした値の確率論的分布を決定するための確率論的成分とを含む。方法は、車両の現在の状態、車両の近傍の環境の画像、および車両の次の運転意思とを受け付けるステップと、現在の状態を、次の運転意思に一致する制御関数のサブ集合に少なくとも登録して目標状態のパラメトリック確率分布のサブ集合を生成するステップと、パラメトリック確率分布のサブ集合を結合して目標状態の統合パラメトリック確率分布を生成するステップと、目標状態の統合パラメトリック確率分布の第1モーメントおよび少なくとも1つの高次モーメントに基づいて制御コマンドを決定するステップと、車両のアクチュエータに制御コマンドを出力するステップとを含む。
いくつかの実施の形態に係る、結果重視の車両制御の模式図である。 いくつかの実施の形態に係る、結果重視の車両制御の模式図である。 いくつかの実施の形態に係る、道路上を運転するための運転挙動の制御目的候補、およびそれらの対応する制御関数の例示的な一覧を示す図である。 いくつかの実施の形態が採用する確率論的制御関数の構造の模式図である。 いくつかの実施の形態に係る、車両コントローラの性能に対するモーションプランナーの確率論的出力の効果の例を示す図である。 いくつかの実施の形態に係る、車両コントローラの性能に対するモーションプランナーの確率論的出力の効果の例を示す図である。 本発明の一実施の形態に係る、車両を制御するための方法のフローチャートである。 道路上を移動し、かつ環境と相互作用する車両を制御するための制御システムの全体的なブロック図である。 いくつかの実施の形態に係る、どのようにモーションプランナーが様々な車両コントローラと相互作用するかについてのブロック図である。 一実施の形態に係る、入力インターフェース、選択インターフェース、出力インターフェース、モーションプランナー、コントローラ、プロセッサ、およびメモリの接続関係の一般的な構造を示す図である。 運転スタイルを選択するための車両の関連内装品、またはユーザインターフェースの例示的なセットアップを示す図である。 道路上に車両を維持するという制御目的に対応する制御関数を説明するイラストである。 道路上での車両走行時間を短縮するという制御目的に対応する制御関数を説明するイラストである。 安全に車両を追い抜くという運転目的を表現するための制御関数を説明するイラストである。 いくつかの実施の形態に係る、現在の速さを維持するという目的の制御関数を説明できる方法を説明するイラストである。 一実施の形態に係る、スムーズに運転するという運転目的の制御関数を説明できる方法を説明するイラストである。 一実施の形態に係る、共分散を有するガウス成分を説明するイラストである。 一連の状態および関連する確率分布関数をもたらす確率論的制御関数の概念、および人間同士で意思決定がどのように異なり得るかを示す図である。 一実施の形態に係る、制御関数の確率論的成分を決定するための方法のフローチャートである。 一実施の形態に係る、ステップ長を決定するための方法を示す図である。 一実施の形態に係る、制御関数のサブ集合を選択するための方法のフローチャートである。 異なる運転スタイルの制御関数の成分を説明するイラストである。 異なる運転スタイルの制御関数の成分を説明するイラストである。 運転スタイルの違いを識別するためにどのように確率論的成分を利用できるかを示す図である。 その他の実施の形態が決定する異なるパラメータの乗員快適性制御関数の決定論的部分の例を示す図である。 一実施の形態に係る、等位集合の形状を規定する指数を決定するための方法のフローチャートである。 選択した制御関数に現在の状態を登録するための方法のフローチャートである。 制御関数を結合して関数の重要度を相対的に符号化するための方法のフローチャートである。 いくつかの実施の形態に係る、どのように異なる制御関数の重要度のバランスを取るかについての方法を説明するイラストである。 本発明の一実施の形態に係る、一連の結合された状態および確率分布を決定し、車両の動きを制御するための方法のブロック図である。 本発明のいくつかの実施の形態に係る、車両の動きを規定する状態遷移のツリーの模式図である。 本発明のいくつかの実施の形態に係る、一連の分布を決定し、車両を制御するための方法のフローチャートである。 確率論的制御関数に一致している各状態の確率を決定する方法のフローチャートである。 自動運転車の位置の予測が障害物の不確実領域と交差し、当該位置に障害物がある確率が衝突しきい値よりも高い位置にある例を示す図である。 確率論的制御関数に一致する状態を生成するためのステップのイテレーションを3回行った結果を簡略化した模式図である。 図9Dの第1イテレーションにおいて5つの状態に割り当てられ得る確率を示す図である。
図1Aおよび図1Bは、いくつかの実施の形態に係る、結果重視の車両制御の模式図である。いくつかの実施の形態は、サンプリングベースのパスプランニング方法は、性質上、日和見的かつ試験的であるという認識に基づく。サンプリング技術は、高速機械計算に適しているが、人間のドライバーがパスプランニングおよび/または運転タスクに取り組む方法に必ずしも一致しているわけではない。
いくつかの実施の形態は、人間のドライバーは、日和見的にサンプリングするのではなく、1つまたは複数の運転目的を達成することを目標とした、結果重視の方法で車両を操作しているという認識に基づく。たとえば、車両の正面の空間をサンプリングするのではなく、意識的または無意識に直近の未来の運転目的を立てることは、人間のドライバーの本質である。運転目的/決定として、現在の速さを維持すること、車間距離を維持すること、速さ制限まで速さを上げること、止まれの標識で停止すること、車両を車線中央に維持すること、車線を変更すること、障害物を回避することなどが挙げられる。これらの目的を立てた後、人間のドライバーは、自身の経験と運転スタイルで車両を動かす。そのためには、いくつかの実施の形態の目的は、サンプリングベースのパスプランニングではなく、目的ベースのパスプランニングを提供することである。そのためには、いくつかの実施の形態は、環境115における車両の現在の状態に基づいて、制御車両110についての1つまたは複数の運転意思125を立てるように構成された意思決定モジュール120を採用する。
これに加えて、人間のドライバーは、複数の目的について、目的の重要度および類似度に基づいてバランスを取ることができる。そのためには、いくつかの実施の形態は、1つまたは複数の制御目的に対応する制御関数135の一覧をメモリに保持している。各制御関数は、車両110の現在の状態を、対応する制御の目的に基づいてその未来の目標状態にマッピングする。車両の状態は、車両の位置、速度、および進行方向など、複数の状態変数を含み得る。異なる状態変数の集合が可能であり、いくつかの状態変数を別の状態変数にマッピングすることができる。
いくつかの実施の形態は、運転目的に対応して1つまたは複数の状態変数を現在値から1つまたは複数の未来値に遷移させる制御関数によって当該運転目的を表すことができるという理解に基づいている。制御関数は、「どのように」という質問ではなく、「何」という質問に返答するので、これらの制御関数は、人間のドライバーの結果重視の方法を模倣する。とりわけ、これらの制御関数は、運転経験を模倣するように予め決定される。いくつかの実施の形態では、1つの運転目的に対して1つの制御関数がある。それゆえ、制御関数として、現在の速さを維持するための関数、車間距離を維持するための関数、速さ制限まで速さを上げるための関数、止まれの標識で停止するための関数、車両を車線中央に維持するための関数、車線を変更するための関数、障害物を回避するための関数などが挙げられる。
制御関数への入力は、現在の速さ、加速度、位置、および進行方向のうち1つまたは組合せなど、車両の状態変数を少なくとも1つを含む。また、制御関数への入力は、環境のマップと交通データとを含み得る。このマップおよび交通データは、環境115の画像を形成し得る。制御関数の出力は、状態変数の目標値のうち1つまたは組合せを含む。たとえば、車間距離を維持するための制御関数は、車両の目標速さを出力し得る。車線を変更するための制御関数は、一連の横加速度値を出力し得る。
制御関数を予め決定することにより、モーションプランナー130が運転意思に一致した制御関数を使用して、未来の目標状態を統合して評価できるようになる。たとえば、運転意思が車線に留まることである場合、道路上の障害物から安全マージンを守ること、および車両の位置を車線中央に維持することが運転意思に一致した目的である一方、車線を変更するという目的は、運転意思に一致した目的ではない。
これに加えて、またはこれに代えて、人間のドライバーは、意思決定において柔軟性を受け入れる。このような柔軟性は、ドライバーの運転スタイル、トラフィックの状態もしくは単に運転の不安を増大させる明白な視界など、環境の状況、またはドライバーの単なる気分に基づき得る。そのためには、いくつかの実施の形態の目的は、運転目的をベースにしたパスプランニング手法にこのような柔軟性を取り入れることである。これに加えて、人間は、異なるスタイルで車両を運転する。運転スタイルとして、攻めた運転、守りの運転、および普通または中立の運転などが挙げられる。そのためには、いくつかの実施の形態の別の目的は、異なる運転スタイルに適応可能な、運転目的をベースにしたパスプランニングを提供することである。
これらの柔軟性を可能にするために、いくつかの実施の形態では、制御関数135は、確率論的である、すなわち、目標状態変数145の確率論的分布を出力する。たとえば、現在の速さを維持するための制御関数は、速さ値および加速度値だけでなく、これらの値の確率論的分布も出力する。確率論的分布は、ガウス分布の場合の平均値および分散値のように、そのパラメータによってパラメータ化することができる。そのためには、いくつかの実施の形態では、制御関数は、目標状態変数に現在の状態変数をマッピングする決定論的成分と、目標状態変数ごとに分布を規定する確率論的成分とを含む。事実上、制御関数の確率論的であるという性質が、運転意思決定における柔軟性を模倣するようになり、運転目的をベースにしたパスプランニングを、制御環境の予測不能性に適応させることができるようになる。
とりわけ、異なる制御関数は、同じ状態変数または異なる状態変数の確率論的分布を決定できる。それゆえ、いくつかの実施の形態は、確率論的分布145を結合して、目標状態の1つまたは複数の状態変数の統合分布155にする。本明細書において、統合分布155を、目標状態の統合パラメトリック確率分布と称する。なぜならば、このような統合パラメータ分布は、第1モーメント140のパラメータ、ならびに、第2モーメント、第3モーメント、および/または第4モーメントなど、少なくとも1つの高次モーメント150のパラメータによって規定されるからである。
高次モーメントを有する統合パラメトリック確率分布によって目標状態を推定することにより、いくつかの実施の形態は、目標状態変数の確率分布が表す経路に従って車両を制御(165)する、分布を意識したコントローラ160を利用できるようになる。たとえば、いくつかの実施の形態は、(半)自動運転システムに統合アーキテクチャを使用する。この統合アーキテクチャには、低速のモーションプランニング130と、高速かつ反応性が高い車両コントローラ160とを含む。車両コントローラ160は、目標状態の統合パラメトリック確率分布の第1モーメントと少なくとも1つの高次モーメントとに基づいてアクチュエータ170の制御コマンド165を決定する。この統合により、モーションプランニング層および車両制御層による複数の競合する目的、たとえば、比較的複雑な高速道路および都市の運転シナリオにおいて安全要件を満たすこと、および、信頼性が高く快適な運転挙動を確実にすることの両方を達成するという責任を体系的かつ効果的に共有することが可能になる。この統合は、経路生成が不確実な状態での制御の柔軟性に適応できる。
図2Aは、いくつかの実施の形態に係る、道路上を運転するための運転挙動の制御目的候補、およびそれらの対応する制御関数の例示的な一覧を示す図である。これらの目的を立てた後、人間のドライバーは、自身の経験と運転スタイルで車両を動かす。しかしながら、いくつかの実施の形態は、対応する運転目的の制御関数を設計する。制御関数は、車両の現在の状態を、対応する目的に従って車両の目標状態に遷移させる。制御関数は、解析的に設計することができ、および/またはデータから学習させることができる。
たとえば、1つの運転目的は、車両に道路上に留まる(200)よう命じることであり、その対応する道路上滞在関数は、車両の位置を道路の境界内に維持するように構成される。追加の運転目的候補は、車両が公称速度220で車線の中央を走行する(210)ことを命じてもよい。その対応する制御関数は、車両の位置を車線の中央に維持するように構成された車線中央関数、および/または、車両の現在の速さを維持するように構成された速さ維持関数を含んでもよい。
また、別の例では、運転目的は、車両と道路上の障害物との間を最小距離に維持するように構成された対応する安全マージン関数を利用して、車両に周囲の障害物に対する安全マージンを維持する(230)よう命じることができる。これに加えて、人間のドライバーについての一般的な運転目的の別の候補として、同じ車線の車両との安全距離を維持する(240)ことがある。これは、車両と前を走る車両との間の最小車間距離を維持するように構成された最小車間距離関数を用いて実現できる。乗員の快適性、燃料の消費、摩耗、またはその他を理由に、車両のスムーズな運転(250)を命じたいと望むドライバーもいる。いくつかの実施の形態は、車両の動きのスムーズさを維持するように構成されたスムーズ運転関数を利用することによってこれを実現できる。
その他の運転目的として、車両の速さを速さ制限に維持するように構成された速さ制限関数を使用して速さ制限まで速さを上げる(260)こと、車両の現在位置を現在の車線から隣接する車線に変更するように構成された車線変更関数を使用して車線を変更する(270)こと、交差点における車両のアイドル時間を減らすように構成された交差点横断関数を使用することによって交差点でのアイドリングを最小限に抑えて(280)燃料の消費を減らすことなどが挙げられる。
典型的に、人間のドライバーには、互いを相殺する運転目的があるであろう。たとえば、周囲の障害物までの安全マージンを維持(230)しながら一定速度を保つこと(220)は不可能であろう。あるいは、運転目的210は、車両が複数の車線のうち1つの車線中央を維持するべきであると提示するのみである。いくつかの実施の形態は、少なくともいくつかの制御関数を確率論的関数にすることによって、互いを相殺する運転目的間のバランスを取る。
具体的には、いくつかの実施の形態は、ドライバーの運転目的が正確に満たされることはないという理解に基づいている。たとえば、速さ制限まで速さを上げる(260)という目的は、周囲の障害物までの安全マージンを維持する(230)という運転目的とは両立しない場合があるであろう。また、ドライバーが決める最も重要な運転目的は、その時々によって若干異なるであろう。さらには、自動運転車両の場合、運転目的を正確に満たせなくするその他の不確実性が存在する。それゆえ、運転目的の実現における不正確さ、およびこのような運転目的が満たされる程度は、時によって異なるであろう。
図2Bは、いくつかの実施の形態が採用する確率論的制御関数215の構造の模式図である。各制御関数215は、その対応する制御目的に基づいて、車両の現在の状態を目標状態に確率論的に遷移させるように構成される。そのためには、確率論的制御関数215は、現在の状態を目標状態255に遷移させるための決定論的成分225と、決定論的成分が決定した目標状態を中心とした値の確率論的分布265を決定するための確率論的成分235とを備える。決定論的成分は、目標状態の1つの値245、または一連の複数の値255を生成できる。これに加えて、またはこれに代えて、決定論的成分を複数回実行して当該一連の値255を生成できる。しかしながら、いつくかの実施態様では、確率論的制御関数の出力が第1モーメントおよび少なくとも1つの高次モーメントが規定する目標状態のパラメトリック確率分布275になるよう、一連の目標状態の値245ごとに確率論的分布265が存在する。
たとえば、一実施の形態は、制御関数の集合を使用する。この集合は、複数の関数のうちの1つまたは組合せを含み、当該複数の関数は、車両の位置を道路の境界内に維持するという制御目的を有する道路上滞在関数を含む。当該道路上滞在関数は、車両の現在の進行方向に基づく車両の一連の目標進行方向と、道路の境界までの車両の距離とを出力する決定論的成分を含む。道路上滞在関数は、道路上滞在関数の決定論的成分が決定した一連の目標進行方向に含まれる各目標進行方向を中心とした値の確率論的分布を提供する確率論的成分を含む。複数の関数は、さらに、車両の位置を車線の中央に維持するという制御目的を有する車線中央関数を含む。当該車線中央関数は、一連の目標進行方向を追跡することによって車線の中央からの車両の現在位置の横方向のずれが小さくなるように、車両の現在の進行方向、および当該横方向のずれに基づいて一連の車両の目標進行方向を出力する決定論的成分を含む。車線中央関数は、車線中央関数の決定論的成分が決定した一連の目標進行方向に含まれる各目標進行方向を中心とした値の確率論的分布を提供する確率論的成分を含む。複数の関数は、さらに、車両の現在の速さを維持するという制御目的を有する速さ維持関数を含む。当該速さ維持関数は、目標速度が現在の速度に等しくなるように車両の現在の速度に基づいて目標速度を出力する決定論的成分を含む。速さ維持関数は、速さ維持関数の決定論的成分が決定した目標速度を中心とした値の確率論的分布を提供する確率論的成分を含む。複数の関数は、さらに、車両の速さを速さ制限に維持するという制御目的を有する速さ制限関数を含み、当該速さ制限関数は、現在の速度から速さ制限に達する車両の一連の目標速度を出力する決定論的成分を含む。速さ制限関数は、速さ制限関数の決定論的成分が決定した一連の目標速度に含まれる各目標速度を中心とした値の確率論的分布を提供する確率論的成分を含む。複数の関数は、さらに、車両と道路上の障害物との間の最小距離を維持するという制御目的を有する安全マージン関数を含む。当該安全マージン関数は、障害物の位置までの最小距離を少なくとも維持する車両の一連の目標位置を出力する決定論的成分を含む。安全マージン関数は、安全マージン関数の決定論的成分が決定した一連の目標位置のすべてのインスタンスを中心とした目標位置の値の分布を提供する確率論的成分を含む。複数の関数は、さらに、車両と前を走る車両との間の最小車間距離を維持するという制御目的を有する最小車間距離関数を含み、当該最小車間距離関数は、最小車間距離を維持する車両の一連の目標速度を出力する決定論的成分を含む。最小車間距離関数は、最小車間距離関数の決定論的成分が決定した一連の目標速度に含まれる各目標速度を中心とした値の分布を提供する確率論的成分を含む。複数の関数は、さらに、車両の動きのスムーズさを維持するという制御目的を有するスムーズ運転関数を含む。当該スムーズ運転関数は、目標速度と現在の速度との差がしきい値未満になるように、現在の速度に基づいて車両の目標速度を出力する決定論的成分を含む。スムーズ運転関数は、スムーズ運転関数の決定論的成分が決定した目標速度を中心とした値の分布を提供する確率論的成分を含む。複数の関数は、さらに、車両の現在位置を現在の車線から隣接する車線に変更するという制御目的を有する車線変更関数を含む。当該車線変更関数は、車両を隣接する車線の中央まで移動させる一連の車両の目標速度を出力する決定論的成分を含む。車線変更関数は、車線変更関数の決定論的成分が決定した一連の目標速度のすべてのインスタンスを中心とした目標位置の値の分布を提供する確率論的成分を含む。複数の関数は、さらに、交差点における車両のアイドル時間を減らすという制御目的を有する交差点横断関数を含む。当該交差点横断関数は、交差点にある障害物および横断することを管理する交通規則を考慮して交差点を横断する時間を低減する一連の車両の目標速度を出力する決定論的成分を含む。交差点横断関数は、交差点横断関数の決定論的成分が決定した一連の目標速度のすべてのインスタンスを中心とした目標位置の値の分布を提供する確率論的成分を含む。
図2Cは、いくつかの実施の形態に係る、車両コントローラ160に対するモーションプランナーの確率論的出力の影響の例を示す図である。この例では、車両210cの現在の状態、および車両が到達しようとする目標状態220cである。目標状態220cは、車両に関連するデカルト座標位置、速度、または別のエンティティであってもよい。目標状態220cは、特定の状態、または、複数の状態から構成される1つの領域であってもよい。たとえば、目標状態220cは、許容速度の区間、または、デカルト空間における位置候補の領域であってもよい。適した制御入力とは、図2Aの運転目的のような運転目的を実現しながら車両210cをその初期状態から目標状態220cに変える入力のことであり、たとえば、運転目的は、道路上の領域231c内に留まることであってもよい。入力から得られる結果状態230cは、ワンタイムステップのための制御入力が適用されることになる状態遷移に対応してもよい。または、結果状態230cは、軌道211cを有する初期状態210cに結びつけられてもよい、すなわち、一連の状態遷移であってもよい。
現在の状態から目標状態への遷移は、自動運転車の場合、車両の動きのモデルへの制御入力をテストすることによって行われてもよい。動きのモデルは、モデルに登録された制御入力に従って車両の状態を遷移させる。様々な実施の形態では、車両の動きのモデルには、不確実性が含まれる。そのために、モデルが車両の実際の動きの簡潔な記述であることを考慮するだけでなく、車両の真の状態を検知する際の不確実性、障害物の状態を検知する際の不確実性、および環境を検知する際の不確実性も考慮するために、車両の動きのモデルは、確率論的動きモデルとなる。
図2Cは、制御入力の特定の選択、すなわち、手動運転者の運転挙動の結果として得られる目標状態領域231cを示しており、231cは、ゼロ以外の確率論的成分であり、230cは、領域220cが含む決定論的成分である。運転目的領域220cは、目標状態領域231と重なり合っていない。すなわち、領域231cは、運転目的領域220cを含まない。それゆえ、図2Cを参照すると、運転目的220cは実現されないおそれがあり、コントローラはその動作を変更するであろう。
図2Dは、制御入力の特定の選択、すなわち、手動運転者の運転挙動の結果として得られる目標状態領域231dを示しており、231dは、ゼロ以外の確率論的成分であり、230dは、領域231dに含まれる決定論的成分である。運転目的領域220dは、目標状態領域231dよりも小さく、231dに完全に含まれている。すなわち、領域231dは、領域220dを含む。それゆえ、図2Dを参照すると、運転目的220dは、制御入力の選択によって実現されると考えられる。
図3Aは、本発明の一実施の形態に係る、車両を制御するための方法のフローチャートである。この方法は、車両のプロセッサを用いて実装されてもよい。方法は、車両の現在の状態、車両の現在の状態の近傍の環境の画像、および車両の次の運転意思を入力インターフェースから受け付け(310a)、制御関数の集合309aをメモリから取り出す。制御関数のうち少なくともいくつかは、確率論的制御関数であり、確率論的制御関数の出力が確率分布の第1モーメントおよび少なくとも1つの高次モーメントを規定する目標状態のパラメトリック確率分布になるよう、現在の状態を目標状態に遷移させるための決定論的成分と、決定論的成分が決定した目標状態を中心とした値の確率論的分布を決定するための確率論的成分とを含む。
次に、方法は、少なくとも制御関数のサブ集合309aを選択(320a)して、車両の現在の状態、環境、および次の運転意思に基づく制御関数のサブ集合325aを生成する。次に、制御関数のサブ集合を使用して、方法は、選択した制御関数325aに現在の状態を登録(330a)して、車両が目標状態に到達するためのモーションプランを規定する一連の状態についての一連のパラメトリック確率分布のサブ集合335aを生成する。次に、方法は、サブ集合に含まれている一連のパラメトリック確率分布を結合(340a)して、目標状態の統合パラメトリック確率分布337aを生成する。最後に、コントローラは、目標状態の統合パラメトリック確率分布の第1モーメントと少なくとも1つの高次モーメントとに基づいて、制御コマンド345を決定(350a)する。
図3Bは、いくつかの実施の形態に係る、道路上を移動し、かつ環境350と相互作用する車両300を制御するための制御システム299の全体的なブロック図である。制御システム299のそれぞれ異なる構成要素は、メモリに動作可能に接続された1つまたは複数のプロセッサ、および/または車両の様々な種類のセンサーを用いて実現されてもよい。本明細書において使用するとき、車両は、乗用車、バスを含む車輪の付いた車両を意味し得る。車両は、自動運転車であってもよく、半自動運転車であってもよい。制御システム299は、車両300に内蔵されてもよく、制御システム299のそれぞれ異なる構成要素の実現は、車両の車種によって異なってもよい。たとえば、車両の車種によっては、車両300のアクチュエータへの制御コマンドを生成するコントローラ360は、異なってもよい。制御システム299は、慣性計測装置(IMU:Inertial Measurrement Unit)を使用して、車両の回転速度および車両の加速度など、車両の慣性部品を測定するセンシングシステム330を備えてもよい。たとえば、IMUは、3軸加速度計、3軸ジャイロスコープ、および/または磁力計を含んでもよい。IMUは、制御システム299のその他の構成要素に速度、向き、および/またはその他の位置関連情報を提供してもよい。また、センシングシステム330は、GPS(Global Positioning System)または同等のシステムからグローバル位置情報を受信してもよい。または、センシングシステム330は、カメラセンサ、レーダーセンサ、および/またはライダーセンサを備えて環境についての情報を取り出してもよい。
また、制御システムは、車両の現在の状態290、車両の現在の状態の近傍の環境の画像290、および車両の次の運転意思290を受け付けるように構成された入力インターフェース320を備える。入力インターフェース320は、情報290を受け付けてモーションプランナー340に送信する(321)。モーションプランナー340は、送信された情報321およびセンシングシステム330からのデータ331を使用して、車両が目標状態に到達するためのモーションプランを規定する一連の状態のパラメトリック確率分布の一連のサブ集合を生成する。
入力インターフェースは、環境についての情報を車両の外部ソース290から受け付けてもよい、または、情報331を車両内部に位置するセンシングシステム330から受け付けてもよい。同様に、入力インターフェース320は、次の目標状態についての情報を外部ソースから受け付けてもよく、または、当該情報をルートプランナー380または同様のシステムから受け付けてもよい(371)。
また、制御システム299は、目標状態の統合パラメトリック確率分布の第1モーメントと少なくとも1つの高次モーメントとに基づいて制御コマンド369を決定するように構成された少なくとも1つの車両コントローラ360を備える。制御コマンド369は、出力インターフェース370に送信される。出力インターフェース370は、制御コマンドを車両のアクチュエータに出力(371)するように構成される。
また、制御システム299は、車両300の乗員に運転スタイルを選択させる選択インターフェース310を備える。プロセッサは、選択された運転スタイルに対応する確率論的制御関数の確率論的成分を互いに関連付ける。選択インターフェース310を使用して車両の乗員が選べる運転スタイルの集合392は、異なる運転スタイルを含んだメモリに格納されており、格納されている運転スタイル390は、車両のドライバーからリアルタイムで収集したデータまたはリモート接続399によって収集したデータを使用して学習される。
図3Cは、いくつかの実施の形態に係る、どのようにモーションプランナーが様々な車両コントローラと相互作用するかについてのブロック図である。この実施例では、コントローラ301cは、動きモデル、一連の状態およびパラメトリック確率分布341、ならびにセンシングシステムからの情報331を使用し、予測範囲にわたるコスト関数を最適化して、車両の1つまたは複数のアクチュエータに対する一連の制御コマンドを生成するモデルベースの予測コントローラである。ここで、コスト関数を最適化することによって、パラメトリック確率分布の第1モーメントが規定する一連の目標状態を追跡するコストのバランスを、車両の動きの少なくとも1つのその他の基準値のコストに対して取ることができる。ここで、最適化のバランスを取る際、確率分布の高次モーメントのうちの1つまたは複数を用いて追跡コストの重要度が重み付けされる。たとえば、コントローラは、モデル予測コントローラ(MPC:Model-Predictive Controller)であってもよい。コントローラ301cは、自動運転の場合、スタンドアロンコントローラであってもよく、半自動運転の場合、ドライバーの操作307cを補完的するためのコントローラであってもよい。たとえば、自動運転の場合、コントローラは、基準軌道341と、状態制約および入力制約314cとを受信し、車輪の所望の操舵角304cを生成して車両の横の動きを制御する、ならびに/または所望の速度または加速度304cを生成して車両の縦の動きを制御する。半自動運転の場合、ドライバー307cは、ハンドルを切って、スロットル/ブレーキ入力が生成する縦加速度とともに(可能であれば)操舵角308cを取得する。このような場合、MPCは、ドライバーの入力の補正値を生成して、限界で運転している場合の車両を安定化させることができる。このような場合、MPCによってアクチュエータからの入力306cが利用される。
一実施の形態では、制御コマンドは、以下の追跡型最適制御問題の式を解くことによって決定される。
Figure 2023502797000002
一実施の形態では、リアルタイムイテレーション(RTI:Real-time Iteration)を用いる逐次二次計画法(SQP:Sequential Quadratic Programming)を使用してNLPを解く。RTI手法は、制御タイムステップ当たり1つのSQPイテレーションに基づいた手法であり、ワンタイムステップから次のステップまでの状態および制御軌道の継続ベースのウォームスタートを使用している。各イテレーションは、次の2つのステップから構成される。(1)準備段階:システムダイナミクスを離散化して線形化する、残りの制約関数を線形化する、2次の目的の近似を評価して最適制御が構造化されたQP部分問題を構築する。(2)フィードバック段階:QPを解いてすべての最適化変数の現在値を更新し、次の制御入力を取得してシステムにフィードバックを適用する。
別の実施の形態では、主有効制約法アルゴリズム内の反復ソルバーの前処理に対する低ランク更新を用いた、ブロック構造化された因数分解技術を用いる。これにより、実装が比較的単純であるが、計算コスト効率が高く、信頼性があり、組み込みハードウェアに適したQPソルバーが得られる。
一実施の形態では、MPC追跡コストは、時変正定値対角重み行列を用いて重み付けされる。対角値の各々は、対応するパラメトリック確率分布の個々の高次モーメントに対する反比例関係に基づいて計算される。
その他の実施の形態では、MPCは、追跡コストにおいて、時変正定値重み行列を使用する。時変正定値重み行列は、確率論的モーションプランナーからのパラメトリック確率分布の一連の共分散行列をステージ単位でスケールした逆関数として計算される。モーションプランナーは、異なる制御目的をそれぞれの重要度に応じて重み付けし、MPCが車両を制御するのに適した一連の状態および確率分布を生成する。
しかしながら、一実施の形態は、MPCがモーションプランナーよりも環境の変化に素早く対応できるよう、モーションプランナーはMPCよりも長いタイムスケール上で動作すると理解している。その結果、一実施の形態では、重み行列と共分散行列との逆相関関係は、追跡制御目的ごとに相対的に異なり得る性能依存スケーリングと、追跡コスト関数において制御目的の各々の重み付けについての下限値と上限値との間の時変正定値重み行列の各々を指定する飽和関数とを含む。
図3Bを参照すると、モーションプランナーは、MPCからの情報359を利用してもよい。たとえば、一実施の形態では、MPCなどの予測コントローラは、有効制約の種類および/または数に基づいて確率論的分布の高次モーメントを調整するように構成された確率論的モーションプランナーに有効制約をフィードバックする。これは、たとえば、モーションプランナーが選択した制御関数のサブ集合を、モーションプランナーが検出できていない環境変化に合うように調整する必要がある場合に有益である。このような場合、有効制約を、MPCがより良く動作するために制御関数のサブ集合が選択されるモーションプランナーへの情報として利用してもよい。
図3Dは、一実施の形態に係る、入力インターフェース380d、選択インターフェース390d、出力インターフェース370d、モーションプランナー340d、コントローラ360d、プロセッサ330d、およびメモリ320dの接続関係の一般的な構造を示す図である。モーションプランナー340dおよびコントローラ360dは、モーションプランナー340dおよびコントローラ360dのモジュールを実行するための少なくとも1つのプロセッサ330dに接続される。プロセッサ330dは、一次モーメント、二次モーメント、および/または三次モーメントなど、目標状態のそれぞれ異なる高次モーメントを規定する確率論的成分の集合によって規定された制御関数の集合を格納(317d)するメモリ320dに接続(329d)される。また、メモリ320dは、平均ベクトルの要素、共分散行列の要素、慎重な運転または守りの運転、普通の運転、および攻めた運転など、異なる運転スタイルを規定する歪度インジケータの要素など、確率論的成分のパラメータの集合を格納(318d)する。また、メモリ320dは、限定されないが、様々な車両パラメータの値、計算された車両の状態の各々の値、動きモデルなど、様々なモデル、および車両の各状態に至る動きなど、モーションプランナーおよびコントローラの内部情報などのような、追加情報を格納(319d)する。
いくつかの実施の形態では、異なる制御関数の確率論的成分が、対応する決定論的成分が決定した目標状態を中心とした確率論的分布の移動に反映された目標状態のそれぞれ異なる高次モーメントを規定するよう、制御システムは、複数の確率論的成分を、1つまたは複数の制御関数のために保持する。同じ制御関数の異なる確率論的成分は、異なる運転スタイル、たとえば、攻めの運転スタイルまたは守りの運転スタイルに対応する。制御関数に含まれる複数の確率論的成分のうち1つが選択されたことに応答して、制御システムのプロセッサは、制御関数の決定論的成分が決定した目標状態を中心とした確率論的分布を決定するために、選択された確率論的成分に制御関数を対応付ける。
たとえば、一実施の形態では、制御システムは、攻めの運転スタイルに対応する攻めの確率論的成分および守りの運転スタイルに対応する守りの確率論的成分を含む、速さ制限関数についての複数の確率論的成分を保持する。この実施例では、攻めの確率論的成分に従って速さ制限を超える目標速さをサンプリングする尤度は、守りの確率論的成分に従って速さ制限を超える速さをサンプリングする尤度よりも大きい。
これに加えて、またはこれに代えて、一実施の形態では、制御システムは、攻めの運転スタイルに対応する攻めの確率論的成分および守りの運転スタイルに対応する守りの確率論的成分を含む、安全マージン関数についての複数の確率論的成分を保持する。この実施例では、攻めの確率論的成分に従ってサンプリングされる目標位置の値は、守りの確率論的成分に従ってサンプリングされる目標位置の値よりも障害物に近い値である可能性が高い。
これに加えて、またはこれに代えて、一実施の形態では、制御システムは、攻めの運転スタイルに対応する攻めの確率論的成分および守りの運転スタイルに対応する守りの確率論的成分を含む、最小車間距離関数についての複数の確率論的成分を保持する。この実施例では、攻めの確率論的成分に従ってサンプリングされる目標速度の値によって得られる車間距離は、守りの確率論的成分に従ってサンプリングされる目標速度の値に係る車間距離よりも小さな車間距離になる可能性が高い。
これに加えて、またはこれに代えて、一実施の形態では、制御システムは、攻めの運転スタイルに対応する攻めの確率論的成分および守りの運転スタイルに対応する守りの確率論的成分を含む、車線変更関数についての複数の確率論的成分を保持する。この実施例では、攻めの確率論的成分に従ってサンプリングされる目標速度の値によって得られる曲線は、守りの確率論的成分に従ってサンプリングされる目標速度の値に従う曲線よりも急な曲線になる可能性が高い。
図3Eは、いくつかの実施の形態に係る、運転スタイルを選択するための車両の関連内装品、またはユーザインターフェースの例示的なセットアップを示す図である。これらの実施の形態では、車両の乗員は、車両のハンドルまたはダッシュボード340eに関連付けられたボタン350eによって、特定の運転スタイルで運転するかどうかを決定できる。ダッシュボード300eは、人間の操作者が車両を運転できるハンドル310eと、車両の速度出力およびセンサー出力など、異なる態様を表示するためのディスプレイ320eとを備える。マニュアルモードでは、運転スタイル決定モード360eをオンにすることによって、人間の操作者の運転スタイルが学習され、その後、当該人間の操作者の運転スタイルに類似した制御関数の集合として識別される。
人間の操作者、または車両の別のユーザは、運転スタイルの手入力(340e)を選んでもよい。たとえば、車両の乗員は、乗員から受信する運転の仕方に対する漸進的な調整に従って運転スタイルを変更するよう選択インターフェースに通知することによって当該調整を行うことにより、運転スタイルを変更してもよい(340e)。たとえば、攻めの運転スタイルを選択した場合、乗員は、当該攻めの運転スタイルをより多くまたはより少なく攻めたスタイルに変更できる。たとえば、車線変更制御関数の場合、さらに攻めたスタイルの方がより急な転回を行うことができる一方で、障害物を回避するための制御関数は、乗員が望む場合、障害物との距離をさらに近づけるであろう。同様に、守りの運転スタイルを選択した場合、乗員は、当該攻めたスタイルをより多くまたはより少なく守りのスタイルに変更できる。守りを抑えたスタイルへの変更を指示することによって、実施の形態は、攻めたスタイルに向けて確率論的成分を移動させる。より守りのスタイルへの変更を指示することによって、実施の形態は、確率論的成分または決定論的成分を変更して、運転をより守りの運転にすることができる。
可視化モジュール330eも含まれており、可視化モジュール330eは、現在の車両の運転および周囲の状況、ならびに新しい運転スタイルを追加するまたはすでに含まれている車両の運転スタイルを改善するためのボタン370eを、それらが利用可能になった場合に無線で表示する。340eには、カーナビゲーションシステムまたは同等のシステムも含まれており、人間の操作者は、車両の最終的な運転意思を当該カーナビゲーションシステムに入れることができ、その後、カーナビゲーションシステムは、通過点または途中の目標位置を車両に提供する。
図4A~図4Eは、本発明のいくつかの実施の形態に係る、制御関数候補のサブ集合、ならびにその決定論的成分および確率論的成分を説明するイラストである。
図4Aは、道路上に車両410aを維持する(200)という制御目的に対応する制御関数を説明するイラストである。道路の境界は、420aによって定められている。この制御関数は、決定論的成分430aおよび確率論的成分440aによって規定されている。たとえば、人間のドライバーのデータを記録し、たとえば、このデータまでの平均ユークリッド距離を最小限に抑えることによって、または、良好な近似になる確率を最大化することによって近似を最適化することによって決定論的成分を決定してもよい。決定論的成分430aを中心とした記録データの変動を求めることによって確率論的成分440aを決定してもよい。たとえば、確率論的成分440aの変動内に記録データのすべてを含む確率を最大化することによって確率論的成分440aを決定してもよく、または、限られた量の記録データを考慮して無限のデータの実際の変動を推定することによって決定してもよい。
いくつかの実施の形態は、道路の境界420aによって限定された制御関数として制御関数をモデル化することは可能であるが、これは、人間による運転の仕方ではないという認識に基づいている。その代わりに、人間は、乗車時間を短くするために、曲がり角でコーナーに斜めに入ると決めるであろう。図4Bは、道路上の車両410bの走行時間を短くするという制御目的に対応する制御関数を説明するイラストである。道路の境界は、420bによって定められている。制御関数は、決定論的成分430bおよび確率論的成分440bによって規定されている。たとえば、人間のドライバーのデータを記録し、たとえば、このデータまでの平均ユークリッド距離を最小限に抑えることによって、または、良好な近似になる確率を最大化することによって近似を最適化することによって決定論的成分を決定してもよい。決定論的成分430bを中心とした記録データの変動を求めることによって確率論的成分440bを決定してもよい。たとえば、確率論的成分440bの変動内に記録データのすべてを含む確率を最大化することによって確率論的成分440bを決定してもよく、または、限られた量の記録データを考慮して無限のデータの実際の変動を推定することによって決定してもよい。
図4Cは、安全に車両を追い抜くという運転目的を表現するための制御関数460cを説明するイラストである。車両410は、車線の境界470cがある2車線道路上を走行する。たとえば、同様の状況で人間のドライバーについて収集したデータから決定論的成分420cを決定してもよい。確率論的成分440cは、すべての状況が同じではないこと、および、ドライバーが、通常、ほかの車両460cの挙動によってわずかに異なる挙動をすることを示している。その結果、確率論的成分440cは、追い越しが行われるエリアでは、より大きな変動を示している。
図4Dは、いくつかの実施の形態に係る、現在の速さを維持するという目的の制御関数220を説明できるイラストである。図4Dは、道路の曲率の関数として、すなわち、道路の旋回半径の1つの指標として速度がモデル化される場合を示している。曲率が小さい場合、すなわち、ほとんど直線である道路の場合、制御関数の決定論的成分420dは、現在の速さ410dと等しい。しかしながら、曲率が大きくなると、現在の速さを維持することが難しくなり、決定論的成分はゼロまで下がる。また、図4Dに示すように、曲率が小さい場合、確率論的成分430dは、変動が小さい公称速さの周辺に集まっている。しかしながら、曲率が大きくなると、ドライバーが加える速さのより大きな変動を反映した、より大きな非対称の変動がある。
図4Eは、一実施の形態に係る、スムーズに運転する(250)という運転目的の制御関数を説明できるイラストである。複数の方法で制御関数をモデル化できる。図4Eは、加速度の制御関数としてスムーズさを説明する例を示す。決定論的成分410eは、加速度ゼロの周辺に集まっており、確率論的成分420eは、非対称である。これは、人間の操作者が、通常、危険な状況には、大きな正の加速度ではなく、より速い負の減速をできるようにしていることを示している。なぜならば、危険な状況は、通常、交通安全に関連しないためである。
複数の本発明の実施の形態は、決定論的成分と確率論的成分とに分解された複数の確率論的制御関数を使用しており、これらの確率論的制御関数を結合して、車両を制御するために利用できる一連の状態および一連の関連する確率分布を決定する。
Figure 2023502797000003
Figure 2023502797000004
Figure 2023502797000005
図4Gは、一連の状態および関連する確率分布関数をもたらす確率論的制御関数の概念、および人間同士で意思決定がどのように異なり得るかを示す図である。図4Gは、行く手を阻む移動車両が1つの場合の確率論的制御関数のパラメータを2つ実現するための制御関数からの出力を考慮した、状態の確率分布を示している。ここで、カラーマップは、考えられる初期状態を示している。左側は、平均的な普通のドライバーに近似させた共通パラメータの集合を用いた場合の例であり、図4Gの右側部分は、個人化されたドライバー、この場合、より攻めたドライバーのパラメータについての結果を示している。この図示した例では、個人化されたモーションプランナーは、行く手を阻む車両を転回中に追い抜く可能性が高い(行く手を阻む車両の後ろに付いて行く確率が低い)が、共通パラメータを用いたモーションプランナーは、行く手を阻む車両の後ろに留まる可能性のほうが高い(車線を切り替える確率が低い)。
いくつかの実施の形態は、以下の分布から確率論的成分を決定する。
Figure 2023502797000006

Figure 2023502797000007
Figure 2023502797000008
Figure 2023502797000009
Figure 2023502797000010
Figure 2023502797000011
Figure 2023502797000012
Figure 2023502797000013
いくつかの実施の形態では、スペクトル分解を利用して正定値の共分散行列を適用するために投影430hが用いられる。
特定の状況に関連性があるとして定められた、より多くの制御関数が存在してもよい。図5Aは、一実施の形態に係る、制御関数のサブ集合を選択するための方法320aのフローチャートである。この方法は、メモリから制御関数の集合510aを取り出す。車両の環境の画像511aおよび次の運転意思512aの情報を使用して、方法は、適用できない制御関数を破棄する(520a)。たとえば、次の運転意思が一車線の道路上で赤信号で止まることである場合、車線変更(270)に関する制御関数、および速さの増加(260)に関する制御関数を破棄してもよい。
次に、制御関数の第1サブ集合525aと、車両の乗員が入力した好みの運転スタイル521aとを使用して、方法320aは、要求を満たしていない制御関数を破棄する。たとえば、車両の乗員がかなりの攻めの運転スタイルを選択した場合、ほかの車両に対して安全マージンを維持する(230)という運転目的の制御関数を破棄してもよい。
異なる確率分布を提供するために、同じ運転目的を表すが確率論的パラメータが異なる複数の制御関数が存在する場合があるであろう。たとえば、車線変更(270)は、複数の方法で行うことができ、選択された運転スタイル521aによっては、その他の制御関数ではなく、同じ運転目的に関連付けられた異なる制御関数または異なる制御関数のパラメータが選択され得る。
いくつかの実施の形態は、制御関数の確率論的成分が乗員の運転スタイルを符号化できるという理解に基づいている。たとえば、普通の運転スタイルについては制御関数の決定論的成分を決定できる一方で、制御関数の確率論的成分は、普通のスタイルからのずれを表し得る。たとえば、制御関数を、異なる運転スタイルにマッピングされた複数の確率論的成分に対応付けることができる。たとえば、車線を変更するという運転目的の場合、制御関数の確率論的成分は、シグモイド関数に類似した経路を出力する。攻めの運転スタイルに対応する確率論的成分は、シグモイド関数を範囲に含む分布を形成し、シグモイド関数の曲率が規定する転回よりも急な転回を用いる尤度を上げる。そのためには、いくつかの実施の形態は、少なくとも一部の制御関数についての確率論的成分の集合を集合に含めて、確率論的成分の選択が運転スタイルに反映されるようにする。
異なる運転スタイルを異なる制御関数に対応付けてもよく、異なる運転スタイルを異なる方法で定めてもよい。たとえば、普通の運転スタイルを、人間の操作者の集合について決定されたパラメータの平均によって規定された決定論的パラメータ、確率論的パラメータ、および関連するパラメータを有する運転スタイルとして定めてもよい。同様に、守りの運転スタイルを、どうしても必要な場合以外は追い越しをせず、周囲の車両との最大許容距離を維持する運転スタイルとして定めてもよい。同様の方法で、攻めの運転スタイルを、速度が速さ制限からの偏差を最小限に抑えようとする運転スタイルとして定めてもよい。すなわち、この速さ制限の前後の許容変動は、車両の安全を確保しつつ、最小限に維持される。
制御関数の決定論的成分および確率論的成分によって異なる運転スタイルを決定できる。図5Bは、異なる運転スタイルの制御関数の成分を説明するイラストである。例示的な説明として、攻めの(左)スタイルおよび守りの(右)スタイルの実施例が採用され、速さ制限を維持するという運転目的が選択される。攻めの運転スタイルには、速さ制限501bを速さ制限501bと同じに維持するという速度運転目的のための制御関数の決定論的成分502bがあり、確率論的成分510bは、ほぼゼロである。しかしながら、守りの運転では、特に、速さ制限よりも下にある速度範囲の前後での速度の大きな変動を許容しており、決定論的成分もまた、速さ制限よりも下にある。
図5Cは、異なる運転スタイルの制御関数の成分を説明する別のイラストである。ここでは、決定論的成分502cおよび503cは、速さ制限501cと同一であり、確率論的成分が運転スタイルのすべてを規定している。たとえば、守りの運転の確率論的成分520cのほうが、対応する攻めた運転の確率論的成分510cよりも大きく、低い(すなわち、より守りの)速度のほうに偏っている。
図5Dは、運転スタイルの違いを識別するためにどのように確率論的成分を利用できるかを示す図である。自動運転車510dは、2車線一方通行道路上で、ほかの車両520dを追い抜くために車線変更を行っているところである。この例では、攻めの運転でも守りの運転でも、決定論的成分550dは同じであり、たとえば、記録された運転データと関数近似との差を数値的、すなわち、反復的手順によって最適化することによって取得できる。守りの運転スタイルの場合、道路上での挙動の変動およびセンシングの不確実性を十分に考慮するために、確率論的成分530dは、障害物520dから離れた距離に偏っている。一方で、攻めの運転スタイルの確率論的成分は、決定論的成分の周辺に集まっている。すなわち、この特定の場合では、決定論的成分は、守りのスタイルよりも、攻めたスタイルの平均を反映している。
Figure 2023502797000014
Figure 2023502797000015
Figure 2023502797000016
Figure 2023502797000017

図5Eは、決定論的部分その他の実施の形態が決定する異なるパラメータの乗員快適性制御関数の例を示す図である。
Figure 2023502797000018
Figure 2023502797000019
Figure 2023502797000020
Figure 2023502797000021
Figure 2023502797000022
Figure 2023502797000023
方法は、データに含まれている最大加速度の等位集合の値として規定される最大加速度を決定する(510f)。次に、方法は、指数522fを決定する(520f)。決定した指数522fを用いて、方法は、加速度および指数を乗員快適性制御関数の等位集合に挿入することによって快適度532fを決定する(530f)。
快適度を満たす場合(540f)、方法は、決定した指数522fを出力する。そうでない場合、新しい指数を決定する(520f)。
Figure 2023502797000024
別の実施の形態は、横加速度および縦加速度のM個の最大成分の集合の中央値を評価することによって、快適度522fを決定する(530f)。
快適度要件は、いくつかの方法で決定できる。一実施の形態は、快適度532fを加速度512fと比較することによって、快適度が540fを満たしているかどうかを判断する。
Figure 2023502797000025
Figure 2023502797000026
Figure 2023502797000027
車両の乗員についての学習された決定論的成分および確率論的成分を使用して、確率論的制御関数を用いて一連の状態および確率分布を決定してもよい。
図6Aは、選択した制御関数325aに現在の状態を登録して、車両が目標状態に到達するためのモーションプランを規定する一連の状態についての一連のパラメトリック確率分布335aのサブ集合を生成するための方法330aのフローチャートである。方法は、決定したサブ集合610aと、たとえば車両のセンシングシステムから判断した現在の状態615aとを使用し、それぞれ異なる目標状態の高次モーメントを規定する確率論的成分と各制御関数とを対応付けた集合を生成(620a)して、制御関数のサブ集合を規定する決定論的成分と確率論的成分との集合625aを生成する。次に、方法は、決定論的成分および確率論的成分625aを反復(630a)して、制御関数のサブ集合に含まれる制御関数ごとのモーションプランを定める一連の状態および関連する確率分布(635a)を生成する。
いくつかの実施の形態は、制御関数の確率論的成分が複数の制御目的のバランスを取る一連の状態を生成する際の関数の重要度を符号化できるという理解に基づいている。たとえば、いくつかの実施の形態では、制御目的の重要度は、制御関数の確率論的成分の分散値に反比例する。いくつかの実施の形態は、この関係性を複数の制御関数の出力を結合するために利用して、車両経路の目標状態を推定する。それぞれ異なる運転スタイルを異なって選択することで、確率論的分布の組合せのバランスを取ってもよい。たとえば、守りの運転スタイルの場合、速さ制限に従うよりも周囲の障害物までの安全距離を維持するほうが重要である。
図6Bは、制御関数を結合して関数の重要度を相対的に符号化するための方法340aのフローチャートである。この方法は、決定した一連の状態および確率分布612bを使用して、一連の決定論的成分に含まれる決定論的成分を結合(610b)して、統合決定論的成分615bにする。次に、方法は、確率論的成分を結合(620b)して、結合された一連の制御関数(625b)を生成する。統合分布関数621Bを用いて、方法は、結合制御関数625bを統合分布関数621Bと結合(630b)して、いくつかの実施の形態に係る、車両を制御するために使用できる一連の目標分布635bを生成する。
図6Cは、いくつかの実施の形態に係る、どのように異なる制御関数の重要度のバランスを取るかについての方法を説明するイラストである。図6Cは、制御関数として表される運転目的が2つある状況を示しており、公称速度を維持し、安全距離を維持している。速度要件は、速度の公称速度からの偏差を示す関数として表され、安全距離は、自動運転車から道路上の障害物までのユークリッド距離として表される。速度制御関数の決定論的成分は、ゼロであり、確率論的成分は、決定論的成分の周辺に集まった細長い形状610cを有している。一方で、安全距離要件の決定論的成分620cはゼロ以外であり、確率論的成分630cは、決定論的成分の前後での大きな変動を許容する。また、この例示的な実施例では、決定論的成分は、確率論的成分の平均周辺に集まっていない。速度と距離は同じではないので、速度制御関数および安全距離制御関数を、共通状態に変換(640c)する。ここで、制御関数を比較してもよい。次に、制御関数を結合(650c)し、制御関数をまとめて重み付けする統合分布にする。たとえば、図6Cでは、統合分布は、重要度のバランスを取って(650c)、共通決定論的成分670cおよび確率論的成分660cを生成する。共通決定論的成分670cおよび確率論的成分660は、速度制御関数のそれぞれの成分に近い。なぜならば、速度制御関数の確率分布の変動610cは、安全距離制御関数の確率論的成分630cよりもかなり小さいためである。
統合分布は、複数の方法で選択できる。たとえば、ステップごとの制御関数ごとの一連の成分に含まれる確率論的成分がガウス分布されている場合、多変量ガウス分布として統合分布を選択できる。ここで、各制御関数の重要度の重みは、成分ごとの共分散の逆関数によって重み付けされる。
決定論的成分は、複数の方法で選ぶことができる。たとえば、一実施の形態は、ガウス分布の平均を構成するように決定論的成分をベクトルにスタックすることによって、当該決定論的成分を結合する。
一連の成分に含まれているステップごとの確率論的成分はガウス分布されているが、一連の分布は、特に、結合された場合、非ガウス分布になる。たとえば、決定論的成分は、現在の状態を制御関数出力にマッピングする非線形関数になるおそれがあり、一連の成分が非ガウス分布されてしまう。このような場合に一連の結合した状態および分布を決定するために、たとえばサンプリングによって数値近似を利用してもよい。
図7Aは、本発明の一実施の形態に係る、予測範囲の一連の結合された目標状態および統合パラメトリック確率分布を反復的に決定するための方法のブロック図である。この方法は、車両のプロセッサを用いて実装されてもよい。前回のイテレーションで決定した統合パラメトリック確率分布745aを用いて、方法は、統合パラメトリック分布745aを表す初期状態をサンプリング(750a)して、サンプリングした初期状態755aの集合を生成する。次に、制御関数のサブ集合754aを用いて、方法は、制御入力の実行可能領域をサンプリングして、制御関数のサブ集合に一致するゼロ以外の確率を有するサンプリングした制御入力の集合を生成する。車両の動きのモデル764aおよびサンプリングした制御入力765aを用いて、方法は、サンプリングした初期状態755aを伝播し、制御入力ごとおよび初期状態ごとに次の状態775aの集合を決定する(770a)。次に、方法は、当該次のサンプリングした状態の集合775aを制御関数のサブ集合754aに登録して、当該次の状態775aが制御関数のサブ集合に一致していること示す状態775aごとの確率の集合を生成する。最後に、次の目標状態の確率を結合(780a)して次の目標状態の統合パラメトリック確率分布を生成(790a)して、方法の反復が終了する。
いくつかの実施の形態では、一連の結合した状態および確率分布を決定することは、運転意思に到達する一連の状態が見つかるまで展開するツリーとして実装される。
図8は、本発明のいくつかの実施の形態に係る、車両の動きを規定する状態遷移のツリーの模式図である。走行可能空間830にある現在のツリーは、車両の現在の状態を示すルートノード800を有すると示されており、ノードとして状態を含み、状態空間の枝として状態遷移を含み、その他の本発明の実施の形態に従って選択された制御入力から生じている。たとえば、枝821は、ルートノード800から状態820に所定時間制御入力を適用することによって生じる動きである。ツリーは、車両の目標状態810および目標領域840を含んでもよい。本発明の一実施の形態では、複数の目標状態810および複数の領域840があってもよい。枝821を生じさせる。それによって、状態820も生じさせる制御入力に確率を対応付けてもよい。よって、当該確率は、車両、障害物、および環境のモデルにおける不確実性を考慮する。
いくつかの実施の形態では、枝821は、複数の時刻にまたがって制御入力を評価することによって作成されるが、その他の実施の形態では、時刻ごとに新しい制御入力を決定する。ここで、制御入力の決定については、その他の本発明の実施の形態に従って説明する。その他の実施の形態では、枝821は、1つまたはいくつかの時刻にまたがって複数の制御入力を集約することによって作成される。目標領域840に向けてツリーを展開する際、初期状態が選択され、制御入力が決定され、対応する状態の列、および最終状態が決定される。たとえば、880が選択した状態であってもよく、881がツリーに枝として追加される軌道であってもよく、860がノードとしてツリーに追加される最終状態であってもよい。
図9Aは、本発明のいくつかの実施の形態に係る、一連の分布を決定し、車両を制御するための方法899のフローチャートである。この方法は、車両の初期状態から車両の目標状態までの車両の動きを指定する一連の制御入力を反復的に決定する。異なる実施の形態では、初期状態は、車両の現在の状態であり、および/または、初期状態は、方法の前回のイテレーションで決定した制御入力に対応する状態である。
動きは、たとえば図8に示すような、車両の状態を繋いでいる状態遷移によって規定される。各状態は、車両の位置、速度、および進行方向を含む。動きは、終了条件を満たすまで、たとえば、一定時間または所定のイテレーション回数、反復的に決定される。図9Aの方法のイテレーションは、以下のステップを含む。
方法は、確率が高い状態遷移が制御関数のサブ集合に一致するよう、初期状態、サンプリングした状態の集合、および対応する状態遷移の集合を決定する(900)。たとえば、方法は、図8の状態880、状態遷移881、および状態860を決定する。
Figure 2023502797000028
Figure 2023502797000029
Figure 2023502797000030
図9Bは、確率論的制御関数に一致している各状態の確率を決定する方法910のフローチャートである。各状態の確率を決定する際、まず、状態は、衝突についてチェックされる(911)。次の状態、および状態までに至る状態遷移に衝突がない場合、制御関数のサブ集合との状態の一致を判断(912)し、各状態の確率を計算する(913)。
Figure 2023502797000031
図9Cは、自動運転車の位置910cの予測が障害物920cの不確実領域921cと交差し、障害物920cの確率が衝突しきい値930cよりも高い位置910cにある例を示す図である。たとえば、車両のセンサーは、障害物の位置を時間関数として決定してもよい。モーションプランニングシステムは、次の状態が障害物の不確実領域と交差する確率を決定し、次の状態が障害物の不確実領域と交差する確率が衝突しきい値よりも高い場合、サンプリングした状態の確率にゼロを割り当てる。
方法910の別の実施の形態では、集約した確率がしきい値を下回る場合(914)(ここで、しきい値は、所定のしきい値であってもよい)、状態が制御関数に一致している確率が高くなるので、方法は、終了し(915)、再スタートする(899)。
Figure 2023502797000032
Figure 2023502797000033
Figure 2023502797000034
図9Dは、イテレーションごとに5つのサンプリングした状態が生成された場合の、ステップ900と、910と、920とのイテレーションを3回の行った結果を簡略化した模式図である。初期状態910dは、動きのモデルおよび確率論的制御関数を用いて予め予測され(911d)、それに続く5つの状態は、921d、922d、923d、924d、および925dである。確率は、確率論的制御関数926d、および確率的に許容できる制御関数926dのずれ927dに応じて決定される。各タイムステップ、すなわち、各イテレーションでは、確率の集約を用いて、集約した制御入力および対応する状態920dが生成される。
図9Eは、図9Dの第1イテレーションにおいて5つの状態に割り当てられ得る確率を示す図である。これらの確率921e、922e、923e、924e、および925eは、状態921d、922d、923d、924d、および925dを示す点の大きさの選択に反映されている。
一連の確率分布を決定すると、その結果、シーケンスのタイムステップごとに図9Eのような確率の分布が決定される。たとえば、この分布は、図9Eのような離散分布として表されてもよく、または、たとえば、カーネル密度平滑器を用いて。確率に対応付けられた離散状態を、連続した状態にしてもよい。
図9Dに戻ると、状態920dは、次のイテレーションにとっての初期状態になる。当該次のイテレーションでも、同じく5つのサンプリングした状態931d、932d、933d、934d、および935dが生成される。状態930dは、このイテレーションでサンプリングした状態の確率に従って選択される。状態930dは、次のイテレーションにとっての初期状態である。
Figure 2023502797000035
上述した本発明の実施の形態は、数多くの方法のいずれによっても実現できる。たとえば、ハードウェア、ソフトウェア、または、それらの組合せを用いて実施の形態を実現してもよい。ソフトウェアで実現された場合、1つのコンピュータ上に配置されていても複数のコンピュータ間で分散されていても、任意の適切なプロセッサまたはプロセッサの集まり上でこのソフトウェアコードを実行できる。このようなプロセッサは、1つの集積回路部品に1つ以上のプロセッサを含めた集積回路として実現されてもよい。しかし、プロセッサは、任意の適切なフォーマットの回路を用いて実現されてもよい。
また、本明細書において概要を説明した様々な方法または工程は、様々なオペレーティングシステムまたはプラットフォームのいずれか1つを採用する1つ以上のプロセッサ上で実行可能なソフトウェアとしてコーディングされてもよい。これに加えて、このようなソフトウェアは、複数の適したプログラミング言語および/もしくはプログラミングツールもしくはスクリプティングツールのいずれかを用いて書かれてもよく、または、フレームワークもしくは仮想マシン上で実行される実行可能な機械言語コードもしくは中間コードとしてコンパイルされてもよい。典型的に、プログラムモジュールの機能は、様々な実施の形態において所望されるように組み合わせたり分散させたりしてもよい。
また、本発明の実施の形態は、説明を行った方法として実装されてもよい。方法の一部として実行される動作は、適切に順序付けされてもよい。したがって、例示した順序とは異なる順序で動作を実行する実施の形態が構成されてもよく、例示した実施の形態では連続した動作として示されていたとしても、一部の動作を同時に行うことを含んでもよい。
好ましい実施の形態の例として本発明を説明したが、本発明の要旨および範囲内で様々なその他の改作および変更が行われてもよいことを理解されたい。そのため、添付の特許請求の範囲の目的は、本発明の趣旨および範囲に含まれるすべてのこのような変形例および変更例を対象として含むことである。

Claims (17)

  1. 車両の動きを制御するためのシステムであって、
    前記車両の現在の状態と、前記車両の近傍の環境の画像と、前記車両の次の運転意思とを受け付けるように構成された入力インターフェースと、
    制御関数の集合を格納するように構成されたメモリとを備え、各制御関数は、その対応する制御目的に基づいて、前記車両の現在の状態を目標状態に遷移させるように構成され、前記制御関数のうち少なくともいくつかは、確率論的制御関数であり、前記確率論的制御関数の出力が第1モーメントおよび少なくとも1つの高次モーメントが規定する前記目標状態のパラメトリック確率分布になるよう、前記現在の状態を前記目標状態に遷移させるための決定論的成分と、前記決定論的成分が決定した前記目標状態を中心とした値の確率論的分布を決定するための確率論的成分とを含み、前記システムは、さらに、
    モーションプランナーおよびコントローラを実行するように構成されたプロセッサを備え、
    前記モーションプランナーは、実行されると、
    前記現在の状態を、次の運転意思に一致する制御関数のサブ集合に少なくとも登録して前記目標状態のパラメトリック確率分布のサブ集合を生成し、
    前記パラメトリック確率分布のサブ集合を結合して前記目標状態の統合パラメトリック確率分布を生成し、
    前記コントローラは、実行されると、
    前記目標状態の統合パラメトリック確率分布の前記第1モーメントおよび少なくとも1つの高次モーメントに基づいて前記制御コマンドを決定し、前記システムは、さらに、
    前記車両のアクチュエータに前記制御コマンドを出力するように構成された出力インターフェースを備える、システム。
  2. 前記制御関数のそれぞれ異なる確率論的成分が、前記対応する決定論的成分が決定した前記目標状態を中心とした前記確率論的分布の移動に反映された前記目標状態のそれぞれ異なる高次モーメントを規定するよう、前記メモリは、1つまたは複数の制御関数の複数の確率論的成分を格納し、
    前記プロセッサは、前記制御関数の複数の確率論的成分のうち1つが選択されたことに応答して、前記制御関数の決定論的成分が決定した前記目標状態を中心とした前記確率論的分布を決定するために、選択された前記確率論的成分に前記制御関数を対応付ける、請求項1に記載のシステム。
  3. 前記制御関数の異なる確率論的成分は、攻めの運転スタイル、守りの運転スタイル、および普通の運転スタイルのうち少なくともいくつかを含む、異なる運転スタイルに対応し、前記システムは、さらに、
    前記車両の乗員に運転スタイルを選択させる選択インターフェースを備え、前記プロセッサは、選択された前記運転スタイルに対応する確率論的成分に前記制御関数を対応付ける、請求項2に記載のシステム。
  4. 前記メモリは、前記制御関数の複数の決定論的成分をさらに格納し、前記制御関数の異なる確率論的成分および異なる決定論的成分は、攻めの運転スタイル、守りの運転スタイル、および普通の運転スタイルのうち少なくともいくつかを含む、異なる運転スタイルに対応し、前記システムは、さらに、
    前記車両の乗員に運転スタイルを選択させる選択インターフェースを備え、前記プロセッサは、選択された前記運転スタイルに対応する前記確率論的成分および前記決定論的成分に前記制御関数を対応付ける、請求項2に記載のシステム。
  5. 前記車両の乗員は、前記乗員から受信する運転の仕方に対する漸進的な調整に従って前記運転スタイルを変更するよう選択インターフェースに通知することによって前記調整を行うことにより、前記運転スタイルを変更する、請求項2に記載のシステム。
  6. 前記プロセッサは、前記車両の現在の状態、前記車両の環境の画像、および前記車両の次の運転意思のうち1つまたは組合せに基づいて前記制御関数のサブ集合を選択するように構成される、請求項1に記載のシステム。
  7. 前記メモリは、前記対応する種類の次の運転意思に適用可能な制御関数のそれぞれ異なるサブ集合にそれぞれ異なる種類の次の運転意思をマッピングする一連のルールを保持し、
    前記プロセッサは、前記車両の次の運転意思の種類に基づいて前記制御関数のサブ集合を選択するように構成され、
    前記次の運転意思の種類は、動きの方向の維持、障害物の回避、車線変更、信号での停止、および転回のうち、1つまたは組合せを含む、請求項6に記載のシステム。
  8. 前記目標状態の統合パラメトリック確率分布が多変量確率分布になるよう、前記パラメトリック確率分布のサブ集合は、前記目標状態のそれぞれ異なる状態変数のパラメトリック確率分布を含む、請求項1に記載のシステム。
  9. 前記目標状態の統合パラメトリック確率分布が前記状態変数の単変量確率分布になるよう、前記プロセッサは、前記パラメトリック確率分布のサブ集合を状態変数の確率分布に変換する、請求項1に記載のシステム。
  10. 前記制御関数の集合は、複数の関数のうち1つまたは組合せを含み、前記複数の関数は、
    前記車両の位置を道路の境界内に維持するという前記制御目的を有する道路上滞在関数を含み、前記道路上滞在関数は、前記車両の現在の進行方向に基づく前記車両の一連の目標進行方向と、前記道路の境界までの前記車両の距離とを出力する前記決定論的成分を含み、前記道路上滞在関数は、前記道路上滞在関数の決定論的成分が決定した前記一連の前記目標進行方向に含まれる各目標進行方向を中心とした値の前記確率論的分布を提供する前記確率論的成分を含み、前記複数の関数は、さらに、
    前記車両の位置を車線の中央に維持するという前記制御目的を有する車線中央関数を含み、前記車線中央関数は、一連の目標進行方向を追跡することによって前記車線の中央からの前記車両の現在位置の横方向のずれが小さくなるように、前記車両の現在の進行方向および前記横方向のずれに基づいて前記車両の一連の目標進行方向を出力する前記決定論的成分を含み、前記車線中央関数は、前記車線中央関数の決定論的成分が決定した前記一連の目標進行方向に含まれる各目標進行方向を中心とした値の前記確率論的分布を提供する前記確率論的成分を含み、前記複数の関数は、さらに、
    前記車両の現在の速さを維持するという前記制御目的を有する速さ維持関数を含み、前記速さ維持関数は、目標速度が前記現在の速度に等しくなるように前記車両の現在の速度に基づいて前記目標速度を出力する前記決定論的成分を含み、前記速さ維持関数は、前記速さ維持関数の決定論的成分が決定した前記目標速度を中心とした値の前記確率論的分布を提供する前記確率論的成分を含み、前記複数の関数は、さらに、
    前記車両の速さを速さ制限に維持するという前記制御目的を有する速さ制限関数を含み、前記速さ制限関数は、前記現在の速度から前記速さ制限に達する前記車両の一連の目標速度を出力する前記決定論的成分を含み、前記速さ制限関数は、前記速さ制限関数の決定論的成分が決定した前記一連の目標速度に含まれる各目標速度を中心とした値の前記確率論的分布を提供する前記確率論的成分を含み、前記複数の関数は、さらに、
    前記車両と前記道路上の障害物との間の最小距離を維持するという前記制御目的を有する安全マージン関数を含み、前記安全マージン関数は、少なくとも前記障害物の位置までの最小距離を少なくとも維持する前記車両の一連の目標位置を出力する前記決定論的成分を含み、前記安全マージン関数は、前記安全マージン関数の決定論的成分が決定した前記一連の目標位置のすべてのインスタンスを中心とした前記目標位置の値の前記分布を提供する前記確率論的成分を含み、前記複数の関数は、さらに、
    前記車両と前を走る車両との間の最小車間距離を維持するという前記制御目的を有する最小車間距離関数を含み、前記最小車間距離関数は、前記最小車間距離を維持する前記車両の一連の目標速度を出力する前記決定論的成分を含み、前記最小車間距離関数は、前記最小車間距離関数の決定論的成分決定した前記一連の目標速度に含まれる各目標速度を中心とした値の前記分布を提供する前記確率論的成分を含み、前記複数の関数は、さらに、
    前記車両の動きのスムーズさを維持するという前記制御目的を有するスムーズ運転関数を含み、前記スムーズ運転関数は、前記目標速度と前記現在の速度との差がしきい値未満になるように、前記現在の速度に基づいて前記車両の目標速度を出力する前記決定論的成分を含み、前記スムーズ運転関数は、前記スムーズ運転関数の決定論的成分が決定した前記目標速度を中心とした値の前記分布を提供する前記確率論的成分を含み、前記複数の関数は、さらに、
    前記車両の現在位置を現在の車線から隣接する車線に変更するという前記制御目的を有する車線変更関数を含み、前記車線変更関数は、前記車両を前記隣接する車線の中央まで移動させる前記車両の一連の目標速度を出力する前記決定論的成分を含み、前記車線変更関数は、前記車線変更関数の決定論的成分が決定した前記一連の目標速度のすべてのインスタンスを中心とした前記目標位置の値の前記分布を提供する前記確率論的成分を含み、前記複数の関数は、さらに、
    交差点における前記車両のアイドル時間を減らすという前記制御目的を有する交差点横断関数を含み、前記交差点横断関数は、前記交差点にある障害物および前記横断することを管理する交通規則を考慮して前記交差点を横断する時間を低減する前記車両の一連の目標速度を出力する前記決定論的成分を含み、前記交差点横断関数は、前記交差点横断関数の決定論的成分が決定した前記一連の標速度のすべてのインスタンスを中心とした前記目標位置の値の前記分布を提供する前記確率論的成分を含む、請求項1に記載のシステム。
  11. 前記制御関数のそれぞれ異なる確率論的成分が、前記対応する決定論的成分が決定した前記目標状態を中心とした前記確率論的分布の移動に反映された前記目標状態のそれぞれ異なる高次モーメントを規定するよう、前記メモリは、1つまたは複数の制御関数の複数の確率論的成分を格納し、前記プロセッサは、前記制御関数の複数の確率論的成分のうち1つが選択されたことに応答して、前記制御関数の決定論的成分が決定した前記目標状態を中心とした前記確率論的分布を決定するために、選択された前記確率論的成分に前記制御関数を対応付け、
    前記メモリは、攻めの運転スタイルに対応する攻めの確率論的成分および守りの運転スタイルに対応する守りの確率論的成分を含む、前記速さ制限関数についての前記複数の確率論的成分を格納し、前記攻めの確率論的成分に従って前記速さ制限を超える目標速さをサンプリングする尤度は、前記攻めの確率論的成分に従って前記速さ制限を超える前記速さをサンプリングする前記尤度よりも大きく、
    前記メモリは、前記攻めの運転スタイルに対応する攻めの確率論的成分、および前記守りの運転スタイルに対応する守りの確率論的成分を含む、前記安全マージン関数についての前記複数の確率論的成分を格納し、前記攻めの確率論的成分に従ってサンプリングされる前記目標位置の値は、前記攻めの確率論的成分に従ってサンプリングされる前記目標位置の値よりも前記障害物に近い値である可能性が高く、
    前記メモリは、前記攻めの運転スタイルに対応する攻めの確率論的成分、および前記守りの運転スタイルに対応する守りの確率論的成分を含む、前記最小車間距離関数についての前記複数の確率論的成分を格納し、前記攻めの確率論的成分に従ってサンプリングされる前記目標速度の値によって得られる車間距離は、前記攻めの確率論的成分に従ってサンプリングされる前記目標速度の値に係る車間距離よりも小さな車間距離になる可能性が高く、
    前記メモリは、前記攻めの運転スタイルに対応する攻めの確率論的成分、および前記守りの運転スタイルに対応する守りの確率論的成分を含む、前記車線変更関数についての前記複数の確率論的成分を格納し、前記攻めの確率論的成分に従ってサンプリングされる前記目標速度の値によって得られる曲線は、前記攻めの確率論的成分に従ってサンプリングされる前記目標速度の値に従う曲線よりも急な曲線になる可能性が高い、請求項10に記載のシステム。
  12. 前記コントローラは、予測範囲にわたるコスト関数を最適化することによって前記制御コマンドを決定し、前記車両の1つまたは複数のアクチュエータに対する一連の制御コマンドを生成するように構成された予測コントローラであり、前記コスト関数を最適化することによって、前記統合パラメトリック確率分布の第1モーメント規定する前記一連の目標状態を追跡するコストのバランスを、前記車両の動きの少なくとも1つのその他の基準値少なくとも1つのその他の基準値のコストに対して取り、前記バランス最適化において、前記統合確率分布の高次モーメントのうちの1つまたは複数を用いて前記追跡コストの重要度が重み付けされる、請求項1に記載のシステム。
  13. 前記確率分布の高次モーメントは、前記車両の前記モーションプランについての前記確率論的モーションプランナーの信頼度を示し、アダプティブ予測コントローラは、前記信頼度が増加すると、前記バランス最適化における前記追跡の重みを増やして前記予測車両状態値の前記一連の目標状態からの下方変動を許容し、前記信頼度が低下すると、前記バランス最適化における前記追跡の重みを減らして前記予測車両状態値の前記一連の目標状態からの情報変動を許容する、請求項12に記載のシステム。
  14. 前記予測コントローラは、前記確率分布の高次モーメントから導出された値を有する時変正定値重み行列を用いて重み付けされた前記追跡コストを含む時変ステージ単位最小二乗法コスト関数(Time-varying stage-wise least square cost function)として公式化される前記コスト関数を用いるモデル予測コントローラ(MPC:Model Predictive Contoroller)である、請求項12に記載のシステム。
  15. 前記モーションプランナーは、予測範囲にわたる前記目標状態の一連の統合パラメトリック確率分布を反復的に生成する、確率論的かつ予測的なモーションプランナーであり、イテレーションごとに、前記モーションプランナーは、
    制御入力の実行可能領域をサンプリングして、前記制御関数のサブ集合に一致するゼロ以外の確率を有するサンプリングした制御入力の集合を生成し、
    前記制御関数のサブ集合に一致する制御入力とともに前記車両の動きモデルを用いて、前記サンプリングした状態を伝播し、次のサンプリングした状態の集合を生成し、
    前記次のサンプリングした状態の集合を前記制御関数のサブ集合に登録して次の目標状態の確率論的分布の集合を生成し、
    前記次の目標状態の確率論的分布の集合を結合して前記次の目標状態の前記統合パラメトリック確率分布を生成するように構成される、請求項1に記載のシステム。
  16. 車両の動きを制御するための方法であって、前記方法は、制御関数の集合を格納するメモリに結合されたプロセッサを使用し、各制御関数は、その対応する制御目的に基づいて、前記車両の現在の状態を目標状態に遷移させるように構成され、前記制御関数のうち少なくともいくつかは、確率論的制御関数であり、前記確率論的制御関数の出力が第1モーメントおよび少なくとも1つの高次モーメントが規定する前記目標状態のパラメトリック確率分布になるよう、前記現在の状態を前記目標状態に遷移させるための決定論的成分と、前記決定論的成分が決定した前記目標状態を中心とした値の確率論的分布を決定するための確率論的成分とを含み、前記プロセッサは、前記方法を実装する格納された命令に連結され、前記命令は、前記プロセッサによって実行されると、前記方法の少なくともいくつかのステップを実行し、前記いくつかのステップは、
    前記車両の現在の状態、前記車両の近傍の環境の画像、および前記車両の次の運転意思を受け付けるステップと、
    前記現在の状態を、次の運転意思に一致する制御関数のサブ集合に少なくとも登録して前記目標状態のパラメトリック確率分布のサブ集合を生成するステップと、
    前記パラメトリック確率分布のサブ集合を結合して前記目標状態の統合パラメトリック確率分布を生成するステップと、
    前記目標状態の統合パラメトリック確率分布の前記第1モーメントおよび少なくとも1つの高次モーメントに基づいて前記制御コマンドを決定するステップと、
    前記車両のアクチュエータに前記制御コマンドを出力するステップとを含む、方法。
  17. プロセッサによって実行可能であり、方法を実行するためのプログラムを含んだ非一時的なコンピュータ読み取り可能な記憶媒体であって、前記媒体は、制御関数の集合を格納し、各制御関数は、その対応する制御目的に基づいて、前記車両の現在の状態を目標状態に遷移させるように構成され、前記制御関数のうち少なくともいくつかは、確率論的制御関数であり、前記確率論的制御関数の出力が第1モーメントおよび少なくとも1つの高次モーメントが規定する前記目標状態のパラメトリック確率分布になるよう、前記現在の状態を前記目標状態に遷移させるための決定論的成分と、前記決定論的成分が決定した前記目標状態を中心とした値の確率論的分布を決定するための確率論的成分とを含み、前記方法は、
    前記車両の現在の状態、前記車両の近傍の環境の画像、および前記車両の次の運転意思とを受け付けるステップと、
    前記現在の状態を、次の運転意思に一致する制御関数のサブ集合に少なくとも登録して前記目標状態のパラメトリック確率分布のサブ集合を生成するステップと、
    前記パラメトリック確率分布のサブ集合を結合して前記目標状態の統合パラメトリック確率分布を生成するステップと、
    前記目標状態の統合パラメトリック確率分布の前記第1モーメントおよび少なくとも1つの高次モーメントに基づいて前記制御コマンドを決定するステップと、
    前記車両のアクチュエータに前記制御コマンドを出力するステップとを含む、非一時的なコンピュータ読み取り可能な記憶媒体。
JP2022555258A 2019-12-03 2020-12-01 自動運転車または半自動運転車のアダプティブコントロール Active JP7334364B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/701,701 2019-12-03
US16/701,701 US11327492B2 (en) 2019-12-03 2019-12-03 Adaptive control of autonomous or semi-autonomous vehicle
PCT/JP2020/046445 WO2021112262A1 (en) 2019-12-03 2020-12-01 Adaptive control of autonomous or semi-autonomous vehicle

Publications (2)

Publication Number Publication Date
JP2023502797A true JP2023502797A (ja) 2023-01-25
JP7334364B2 JP7334364B2 (ja) 2023-08-28

Family

ID=74186783

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022555258A Active JP7334364B2 (ja) 2019-12-03 2020-12-01 自動運転車または半自動運転車のアダプティブコントロール

Country Status (5)

Country Link
US (1) US11327492B2 (ja)
EP (1) EP4070167B1 (ja)
JP (1) JP7334364B2 (ja)
CN (1) CN114746823A (ja)
WO (1) WO2021112262A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190185012A1 (en) 2017-12-18 2019-06-20 PlusAI Corp Method and system for personalized motion planning in autonomous driving vehicles
US11130497B2 (en) * 2017-12-18 2021-09-28 Plusai Limited Method and system for ensemble vehicle control prediction in autonomous driving vehicles
US11814073B2 (en) * 2020-03-18 2023-11-14 Baidu Usa Llc Learning based controller for autonomous driving
CN111861128B (zh) * 2020-06-20 2024-03-22 清华大学 自动驾驶车辆人机协同操纵过程的接管舒适性评价方法、系统及存储介质
GB2612632B (en) * 2021-11-08 2024-04-03 Jaguar Land Rover Ltd Control system for a vehicle and method thereof
CN114030488B (zh) * 2022-01-11 2022-05-03 清华大学 实现自动驾驶决策的方法、装置、计算机存储介质及终端
DE102022200536B3 (de) 2022-01-18 2023-03-30 Volkswagen Aktiengesellschaft Fahrassistenzeinrichtung und Verfahren zum Durchführen einer wenigstens teilautomatischen Fahrzeugfunktion in Abhängigkeit von einer zu bewertenden Fahrstrecke
CN115096307B (zh) * 2022-04-28 2024-05-14 河海大学 一种匹配导航系统概率函数自主分裂与融合滤波方法
CN114973656A (zh) * 2022-05-10 2022-08-30 清华大学 交通交互性能的评估方法、装置、设备、介质和产品
CN117130265B (zh) * 2023-10-27 2024-01-02 江苏辰星药业股份有限公司 一种保健品运输环境自适应控制方法及系统
CN117275240B (zh) * 2023-11-21 2024-02-20 之江实验室 考虑多类型驾驶风格的交通信号强化学习控制方法和装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018534205A (ja) * 2016-02-11 2018-11-22 三菱電機株式会社 車両の運動を制御する方法、及び車両の制御システム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100365430C (zh) * 2002-07-15 2008-01-30 汽车系统实验室公司 道路曲率估计和车辆目标状态估计系统
US10994729B2 (en) * 2017-03-29 2021-05-04 Mitsubishi Electric Research Laboratories, Inc. System and method for controlling lateral motion of vehicle
US10860022B2 (en) * 2018-04-11 2020-12-08 GM Global Technology Operations LLC Method and apparatus for automatical rule learning for autonomous driving

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018534205A (ja) * 2016-02-11 2018-11-22 三菱電機株式会社 車両の運動を制御する方法、及び車両の制御システム

Also Published As

Publication number Publication date
EP4070167B1 (en) 2023-11-29
WO2021112262A1 (en) 2021-06-10
US20210165409A1 (en) 2021-06-03
US11327492B2 (en) 2022-05-10
EP4070167A1 (en) 2022-10-12
CN114746823A (zh) 2022-07-12
JP7334364B2 (ja) 2023-08-28

Similar Documents

Publication Publication Date Title
JP7334364B2 (ja) 自動運転車または半自動運転車のアダプティブコントロール
US10012984B2 (en) System and method for controlling autonomous vehicles
JP7345676B2 (ja) 自動または半自動運転車両の適応制御
US11091158B2 (en) System and method for controlling motion of vehicle with variable speed
Wang et al. A reinforcement learning based approach for automated lane change maneuvers
CN112888612A (zh) 自动驾驶车辆规划
JP6494872B2 (ja) 車両の運動を制御する方法、及び車両の制御システム
US10324469B2 (en) System and method for controlling motion of vehicle in shared environment
Sukthankar Situation awareness for tactical driving
EP3610345A1 (en) Control system of vehicle, method for controlling vehicle, and non-transitory computer readable memory
CN112034833A (zh) 规划用于自动驾驶车辆的开放空间轨迹的在线代理
Moghadam et al. An autonomous driving framework for long-term decision-making and short-term trajectory planning on frenet space
JP2021011173A (ja) 予測装置、予測方法、プログラムおよび車両制御システム
CN113200054A (zh) 一种自动驾驶接管的路径规划方法及系统
US20230418247A1 (en) Automatic generation of control decision logic for complex engineered systems from dynamic physical model
CN114919578B (zh) 智能车行为决策方法、规划方法、系统及存储介质
Siboo et al. An Empirical Study of DDPG and PPO-Based Reinforcement Learning Algorithms for Autonomous Driving
Li et al. Decision making for autonomous vehicles
Reddy Autonomous car: Deployment of reinforcement learning in various autonomous driving applications
US20240092398A1 (en) Trajectory prediction based on a decision tree
Thurachen Decision Making in Autonomous Driving by Integrating Rules with Deep Reinforcement Learning
Cruise Control model for safe and efficient car following
Mondal DEVELOPMENT OF AUTONOMOUS VEHICLE MOTION PLANNING AND CONTROL ALGORITHM WITH D* PLANNER AND MODEL PREDICTIVE CONTROL IN A DYNAMIC ENVIRONMENT

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220512

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230511

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230718

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230816

R150 Certificate of patent or registration of utility model

Ref document number: 7334364

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150