JP2022544770A

JP2022544770A - コストベースの経路決定

Info

Publication number: JP2022544770A
Application number: JP2022508871A
Authority: JP
Inventors: カルドウェルティモシー; フォンセカラスムス; コビラロフマリン; ブラッドフィールドパッカージェファーソン
Original assignee: ズークスインコーポレイテッド
Priority date: 2019-08-13
Filing date: 2020-08-12
Publication date: 2022-10-21
Also published as: WO2021030476A1; EP4014157A1; CN114222691A; US20210046924A1; US11161502B2

Abstract

車両コンピューティングシステムは、共に関連付けられるコストに基づいて車両がとるべきアクションを決定するための技術を実装してよい。コストは、環境において動作しているオブジェクト（例えば、別の車両、自転車運転者、歩行者など）に対するアクションの影響に部分的に基づいてよい。車両コンピューティングシステムは、センサーデータに基づいてオブジェクトを検出してよく、アクションを実行している車両に対するオブジェクトの予測される反応に基づいてオブジェクト軌道を決定してよい。車両コンピューティングシステムは、アクションおよび／または予測されるオブジェクト軌道に基づいて、車両がとることが可能であるそれぞれのアクションに対する安全性、快適性、進行、および／または運用規則に関連付けられるコストを決定してよい。ある例示において、最低コストのアクションは、車両が実行するために選択されてよい。

Description

本発明は、コストベースの経路決定に関する。

本ＰＣＴ国際特許出願は、２０１９年８月１３日に出願された「COST-BASED PATH DETERMINATION」と題された米国特許出願第１６／５３９，９２８号の継続であり、優先権の利益を主張し、そのすべての内容は、参照により本明細書に組み込まれる。

自律車両および半自律車両におけるプラニングシステムは、動作環境における車両に対してとるべきアクションを決定する。車両に対するアクションは、環境において存在するオブジェクトを回避することに部分的に基づいて決定されることがある。例えば、アクションは、二重駐車車両を迂回すること、車線変更をして道路における別の車両を回避することなどが生成されてよい。従来のプラニングシステムは、アクションが最も保守的なアクションであるということの決定に基づいて、車両に対するアクションを選択することがある。しかしながら、このような従来のプラニングシステムは、環境における他のオブジェクトに対する車両のアクションの影響を考慮しない、環境の車両中心の見方を採用することがある。そのため、従来のプラニングシステムは、同一の道路を走行する他の車両などの環境において動作する他のオブジェクトに悪影響を与えることがある。

詳細な説明は、添付の図面を参照して説明される。図面において、参照番号の左端の数字は、その参照番号が最初に出現する図面を特定する。異なる図面における同一の参照番号の使用は、類似、または同一の構成要素、または特徴を示す。

環境における自律車両を示す図であり、ここで、例示的なコストベースの経路決定システムは、環境において使用する自律車両に対して経路を決定することに用いられることができる。車両に対して環境おいて使用するさまざまな候補アクション、およびそれぞれの候補アクションに関連付けられる算定されたコストを示す図である。環境における車両を示す図であり、ここで、例示的なコストベースの経路決定システムは、二次的なオブジェクトに対するアクションの影響に基づいてアクションに関連付けられるコストを決定することができる。環境における車両を示す図であり、ここで、例示的なコストベースの経路決定システムは、閉塞区域を識別して、部分的に閉塞区域に基づいてとるべきアクションを決定するように構成されることができる。環境における車両を示す図であり、ここで、例示的なコストベースの経路決定システムは、優先権を有するオブジェクトの経路が遮断されているという判断に基づいてとるべきアクションを決定するように構成されることができる。少なくとも部分的にアクション報酬に基づくとるべきアクションを決定するように構成される環境における車両を示す図である。本明細書で説明される技術を実装するための例示的なシステムのブロック図である。少なくとも部分的にアクションに関連付けられるコストに基づくアクションに従って車両を制御するための例示的なプロセスを示す図である。少なくとも部分的にアクションに関連付けられる安全性のコストに基づくアクションに従って車両を制御するための例示的なプロセスを示す図である。少なくとも部分的にオブジェクトが閉塞区域に存在するという確率に基づいて車両を制御するための例示的なプロセスを示す図である。

本開示は、アクションに関連付けられるコストに基づいて、車両がとるべきアクション（例えば、走行する経路）を動的に決定するための技術に向けられている。コストは、車両を含む環境において動作しているオブジェクト（例えば、別の車両、自転車、歩行者など）に対するアクションの影響に部分的に基づいてよい。少なくともある例示において、このようなコストは、可能性のあるアクションを実行することに応答して、少なくとも部分的に環境における他のオブジェクトの予測されるモーションに基づいてよい。コストは、安全性（例えば、車両とオブジェクトとの衝突を回避すること）、快適性（例えば、突然の動きの欠如）、進行状況（例えば、目的地への動き）、運用規則（例えば、道路の規則、法律、条令、規制など）などに基づいてよい。車両コンピューティングシステムは、車両がとる１つまたは複数の可能性のあるアクションを決定することができ、それぞれの可能性のあるアクションに関連付けられるコストを算定することができる。さまざまな例示において、アクションは、共に関連付けられている最適なコスト（例えば、最低コスト、最高コスト、閾値を下回るコストなど）に基づいて選択されてよい。

車両は、環境における１つまたは複数のオブジェクトを検出するように構成される車両コンピューティングシステムを有する自律型または半自律型の車両を含んでよい。オブジェクトは、静的オブジェクト（例えば、建物、橋、標識など）、および他の車両（例えば、車、トラック、バイク、モペッドなど）、歩行者、自転車運転者などのような動的オブジェクトを含んでよい。それとは反対に示されない限り、本明細書における「オブジェクト」という用語は、動的オブジェクト（例えば、一瞬停止してはいるが、動いているおよび／または動くことが可能であるオブジェクト）を参照する。ある例示において、オブジェクトは、車両のセンサー（例えば、カメラ、モーションディテクター、ライダー、レーダー、飛行時間など）からのセンサーデータに基づいて検出されてよい。ある例示において、オブジェクトは、例えば、別の車両に関連付けられるセンサーまたは複数の車両とデータを共有するように構成される環境において取り付けられるセンサーのようなリモートセンサーから受信したセンサーデータに基づいて検出されてよい。ある例示において、車両コンピューティングシステムは、検出されたオブジェクトを意味論的に分類するように構成されてよい。分類は、別の車両（例えば、自動車、ピックアップトラック、セミトレーラートラック、トラクター、バス、電車など）、歩行者、自転車運転者、乗馬者などを含んでよい。例えば、車両コンピューティングシステムは、２つのオブジェクトを検出してよく、第１のオブジェクトを自動車として分類してよく、第２のオブジェクトをピックアップトラックとして分類してもよい。

さまざまな例示において、車両コンピューティングシステムは、検出されたオブジェクトを有する環境において動作している間に、車両がとることが可能である１つまたは複数のアクションを決定してよい。アクションは、車両が環境を通してとり得る１つまたは複数の可能性のある経路（例えば、１つまたは複数の車両軌道）を表現してよい。アクションは、右に車線変更、左に車線変更、車線にとどまること、障害物（例えば、二重駐車車両、トラフィックコーンなど）を迂回することなどのような１つまたは複数の参照アクション（例えば、車両が動的な動作環境に反応して実行するように構成される操作のグループのうちの１つ）を含んでよい。アクションは、さらに、速度の変化（例えば、速度維持、加速、減速など）、位置の変化（例えば、車線での位置の変更）などのような１つまたは複数のサブアクションを含んでよい。例えば、アクションは、車線にとどまる（参照アクション）こと、および車線での車両の位置を中央位置から車線の左側で動作するまで調整する（サブアクション）ことを含んでよい。別の例示に対して、アクションは、車線に２秒間とどまって（第１の参照アクション）、左への車線変更に続く（第２の参照アクション）間に、一時停止の標識での初期位置から加速すること（サブアクション）を含んでよい。このような例示において、アクションは、連続したアクションを含んでよい。

ある例示において、車両コンピューティングシステムは、車両が優先権を有さない（例えば、オブジェクトが優先権を有する）状況において車両がとるアクション（例えば、参照アクションおよびサブアクション）を決定するように構成されてよい。ある例示において、車両コンピューティングシステムは、優先権を有する車両が優先権を行使することを妨げられ得る状況において、車両が安全に前進し得る手段を決定するように構成されてよい。例えば、車両は、自動車の後で４方向の停止標識に接近することがある。しかしながら、歩行者は、自動車の前の道路を横断し得ることによって、自動車が優先権を行使して車両の前を通過することを妨げる。車両コンピューティングシステムは、自動車を遮断している歩行者を識別することができ、遮断されている自動車に基づいて車両がとるべき１つまたは複数のアクションを決定することができる。第１のアクションは、停止標識にとどまる（例えば、車線での位置を維持し、実質的にゼロ速度を維持する）ことを含んでよく、優先権を有する自動車が車両の前を通過することを待つ。第２のアクションは、車線での車両の位置を維持すること、および停止標識から加速することを含んでよく、優先権を有して、自動車の前の交差点を通って横断する。

さまざまな例示において、車両コンピューティングシステムは、環境における車両に適用可能である参照アクションおよび／またはサブアクションを決定するように構成されてよい。例えば、車線変更は、１つの車線の道路上を動作している車両に対して適用可能である参照アクションではないことがある。別の例示において、加速することは、制限速度で動作している車両に対して適用可能であるサブアクションではないことがある。

さまざまな例示において、車両コンピューティングシステムは、環境において検出されたそれぞれのオブジェクトの初期位置を決定するように構成されてよい。さまざまな例示において、車両コンピューティングシステムは、共に関連する初期位置からのようなそれぞれの検出されたオブジェクトに関連付けられる１つまたは複数の予測される軌道を決定してよい。ある例示において、１つまたは複数の予測される軌道は、センサーデータに基づいて決定されてよい。予測されるそれぞれの軌道は、検出されたオブジェクトが環境を通して走行し得る可能性のある経路を表現してよい。１つまたは複数の予測される軌道は、車両のアクションに対するオブジェクトの予測される反応（例えば、アクティブ予測）に基づいてよい。例えば、アクションは、別の車両が現在走行している車線への車線変更操作を実行する車両を含んでよい。車両コンピューティングシステムは、他の車両の予測される軌道が車両に対して車線変更を実行するための空間を提供するためにわずかな負の加速（減速）を含み得るということの決定をしてよい。

ある例示において、１つまたは複数の予測される軌道は、２０１７年１１月８日に出願された米国特許出願番号第１５／８０７，５２１号に記載されているようなオブジェクトの動作を予測するための確率的ヒートマップ（例えば、離散化された確率分布）を用いて決定されてよく、「Probabilistic Heat Maps for Behavior Prediction」と題され、その内容全体が参照により本明細書に組み込まれる。ある例示において、１つまたは複数の予測される軌道は、２０１８年１０月４日に出願された「Trajectory Prediction on Top-Down Scenes」と題された米国特許出願番号第１６／１５１，６０７号で、および２０１９年７月５日に出願された「Prediction on Top-Down Scenes based on Action Data」と題された米国特許出願番号第１６／５０４，１４７号に記載される技術を利用することによるような環境のトップダウン表現に基づいてよく、それらの全内容は参照により本明細書に組み込まれる。さまざまな例示において、１つまたは複数の予測される軌道は、木探索法、時相論理式、および／または機械学習技術を利用して決定されてよい。

追加、または代替において、車両コンピューティングシステムは、環境（これは、対向する交通を含んでよい）の視界が障害物によるような遮断され得る閉塞区域（例えば、閉塞領域とも称される）を識別するように構成されてよい。閉塞区域は、車両コンピューティングシステムがオブジェクトを検出することが可能ではない領域を画定することができる。さまざまな例示において、車両コンピューティングシステムは、閉塞区域に関連付けられる道路の関連するセクションを識別するように構成されてよい。このような例示において、道路のセクションは、車両に関連し得る方向にオブジェクトが動作するように構成される１つまたは複数の車線、歩道、自転車専用車線などを含んでよい。例えば、閉塞区域は、オブジェクトが車両への走行し得る道路の２つの車線を含んでよい。このような例示において、オブジェクトが車両から離れる方向に走行する道路の任意のさらなる車線は、閉塞区域において含まれないことがある。

さまざまな例示において、車両コンピューティングシステムは、道路の関連するセクションに基づいて、オブジェクトが閉塞区域を通して走行することとなるという確率を決定することができる。ある例示において、オブジェクトが閉塞区域を通して走行することとなるという確率は、道路の関連セクションに関連付けられる格納データに基づいてよい。格納されたデータは、時間の経過とともにキャプチャされた道路の関連セクションに関連付けられるセンサーデータを含んでよい。ある例示において、確率は、時刻、曜日、月、季節などに基づいてよい。ある例示において、確率は、機械学習技術を利用して決定されてよい。このような例示において、機械学習モデルは、経時的にキャプチャされた道路の関連するセクションに関連付けられるセンサーデータのような訓練データで訓練されてよい。オブジェクトが存在し得るという確率に基づいて、車両コンピューティングシステムは、予測されるオブジェクト軌道を有する予測されるオブジェクトを生成してよく、とるべきアクションを決定する。

それぞれの可能性のある車両アクション（例えば、参照アクションおよびサブアクション）ごとに、車両コンピューティングシステムは、時間期間（例えば、５秒、８秒、１２秒など）、車両およびオブジェクトを環境における前方に投影することによって、将来の状態（例えば、推定される状態）をシミュレートしてよい。車両コンピューティングシステムは、共に関連付けられる１つまたは複数の予測される軌道に基づいて、オブジェクトを前方に投影（例えば、オブジェクトの将来の位置を推定）してよい。車両コンピューティングシステムは、アクションに関連付けられる１つまたは複数の車両軌道に基づいて、車両を前方に投影（例えば、車両の将来の位置を推定する）してよい。推定される状態は、車両の推定される場所（例えば、推定される位置）、将来の時点でのオブジェクトの推定される場所、および／またはオブジェクトの任意の他の対応する運動学的説明（速度、加速度、ヨー、ヨーレートなど）を表現してよい。さまざまな例示において、車両コンピューティングシステムは、時間期間を通して所定のレート（例えば、１０ヘルツ、２０ヘルツ、５０ヘルツなど）で推定される状態を決定してよい。少なくとも１つの例示において、推定される状態は、１０ヘルツ（例えば、８秒の時間期間にわたって８０個の推定される状態）のレートで実行されてよい。ある例示において、車両コンピューティングデバイスは、実質的に平行してさまざまな時間間隔で車両およびオブジェクトの推定される状態を決定してよい。このような例示において、車両コンピューティングデバイスは、要求される時間を減少させてよく、時間期間にわたって一組の推定される状態を生成する。

車両コンピューティングシステムは、車両およびオブジェクトの互いに対する推定される位置に基づくようなそれぞれの推定される状態に関連付けられるコストを決定してよい。ある例示において、車両コンピューティングシステムは、１つまたは複数の因子に基づいて、それぞれの推定される状態を分析してよく、コスト値を推定される状態に適用するか、またはそうでなければ決定してよい。このような例示において、推定される状態のコストは、因子のそれぞれに関連付けられるコストの合計を含んでよい。１つまたは複数の因子は、車両および／またはオブジェクトの安全性（例えば、車両とオブジェクトとの間の衝突回避）、快適性（例えば、車両とオブジェクトとの間の最短の距離よりも短いときの高い加速度にペナルティを科すことによる、例えば、突然の動きの欠如）、進行（例えば、目的地への動き）、運用規則（例えば、道路の規則、法律、条令、規制など）などを含んでよい。

車両および／またはオブジェクトの安全性は、車両とオブジェクトとの間の衝突の尤度（例えば、衝突の確率）を含んでよい。衝突の尤度は、車両とオブジェクトとの間の距離（例えば、５フィート、２メートル、０．５メートル以内など）、収束軌道（例えば、アクションに関連付けられる車両軌道と実質的に交差することとなるオブジェクト軌道）、車両とオブジェクトとの間の収束レート（例えば、毎秒２メートル、毎秒１０フィートなど）などに基づいて算定されてよい。ある例示において、衝突の尤度は、距離および／または収束レートに関連付けられる閾値に基づいてよい。例えば、車両に関連付けられる推定される状態とオブジェクトに関連付けられる推定される位置との間の距離は、閾値距離（例えば、６フィート、２．５メートルなど）よりも短いかまたは等しくてよい。そのため、車両コンピューティングシステムは、車両とオブジェクトとの間に衝突の尤度が存在するということを決定してよい。別の例示に対して、車両に関連付けられる軌道およびオブジェクトに関連付けられる軌道は、収束の閾値レート（例えば、６フィート、２．５メートル、毎秒１．５メートルの収束など）と等しいかまたはそれもより高い速度で収束してよい。そのため、車両コンピューティングシステムは、車両とオブジェクトとの間に衝突の尤度が存在するということを決定してよい。ある例示において、衝突の尤度または確率は、実際の距離および／または収束レートが閾値を下回るかまたは上回る量に基づいてよい。このような例示において、衝突の確率は、車両により近いほど増加してよく、オブジェクトは、推定される状態（例えば、互いに６インチ以内の場合は、９５％の衝突確率）および／または収束レートが閾値を上回る量（例えば、毎秒１０メートルの収束レートを有する９０％の衝突確率）にある。ある例示において、衝突の確率は、機械学習技術を利用して決定されてよい。このような例示において、機械学習モデルは、車両およびオブジェクトが環境においてインタラクトする状況を含む訓練データに基づいて衝突の確率を決定するために訓練されてよい。

さまざまな例示において、安全因子に関連付けられるコストは、衝突の確率に基づいてよい。ある例示において、衝突の確率が、衝突が起こり得るということを示す事前に定義された閾値（例えば、３０％、５０％など）よりも高い場合、固定コスト（例えば、５０、７５、９０など）を含んでよい。ある例示において、コストは、衝突決定の確率に基づいてよい。例えば、車両コンピューティングシステムは、推定される状態における衝突の確率が９５％であると決定してよく、車両コンピューティングシステムは、推定される状態の安全因子に対する９５のコストを評価してよい。

さまざまな例示において、因子は、オブジェクトおよび／または車両の快適性を含んでよい。ある例示において、快適性のコストは、安全性のコストに基づいて決定されてよい。ある例示において、快適性のコストは、安全性のコストの一部（例えば、５０％、２０％など）を含んでよい。ある例示において、安全性のコストは、衝突の確率に基づくなどのベースのコストを含んでよい。このような例示において、推定される状態に対する合計の安全性のコストを決定するために、車両コンピューティングシステムは、第１の多項式関数（例えば、ｘ⁴、ｘ⁶など）をベースのコストに適用してよく、快適性のコストを決定するために、第２の多項式関数（例えば、ｘ²、ｘ³など）を適用してもよい。例えば、車両コンピューティングシステムは、衝突の確率になどに基づいて、推定される状態に関連付けられる４のベースのコストを決定してよい。推定される状態の安全性のコストは、２５６（ベースのコスト⁴）であってよく、快適性のコストは、１６（ベースのコスト²）であってよい。別の例示に対して、車両コンピューティングシステムは、推定される状態に関連付けられる安全性のコストが４０であると決定してよく、推定される状態に関連付けられる快適性のコストが２０（安全性のコストの５０％）であると決定してもよい。

ある例示において、快適性は、車両のアクションによって引き起こされるオブジェクトおよび／または車両に関連付けられる推定される加速度（例えば、正、負、横方向など）および／または加速度の変化（例えば、ジャーク）を含んでよい。例えば、車両のアクションは、オブジェクトにかなりの力でブレーキを適用させてよく、衝突を回避するような、－２メートル毎秒毎秒の加速（例えば、減速）を引き起こしてよい。ある例示において、快適性のコストは、加速度に関連付けられる値に基づいてよい。例えば、毎秒２フィートの負の加速度（例えば、毎秒－２フィート）は、２の快適性のコストをもたらしてよい。言うまでもなく、加速度値および／またはコストの例示、限定されることを意図するものではなく、他の値および／またはコストは、本明細書で企図される。

本明細書で列挙される任意のこのような例示において、快適性のコストおよび安全性のコストは、同一のパラメーター、および／またはこのようなパラメーターの同一の機能に基づいて決定されてよいが、安全性のコストは、安全性の臨界体制（オブジェクトへの近接、オブジェクトクラスへの近接、速度など）における快適性のコストを大幅に上回る。

さまざまな例示において、快適性のコストは、推定される状態における推定される状態において車両とオブジェクトとの相対位置の間の距離（例えば、１０フィート、５フィート、２メートルなど）に関連付けられてよい。ある例示において、距離は、時間期間にわたって車両とオブジェクトとの間の最接近点を含んでよい。距離は、オブジェクトおよび車両が互いに最接近点に接近するにつれて、車両および／またはオブジェクトにおける乗員の快適性に関連付けられてよい。ある例示において、快適性のコストは、距離の逆数、または距離が減少するにつれてコストが増加するという着想を表現する任意の他の算定に基づくコストを適用することによるなど、距離に基づいて算定されてよい。さまざまな例示において、快適性のコストは、閾値距離に関連付けられてよい。このような例示において、快適性のコストは、車両およびオブジェクトの相対位置が互いの閾値距離内にあるという事実に基づいて評価されてよい。

さまざまな例示において、快適性のコストは、推定される状態における車両とオブジェクトとの間の閉包レートに関連付けられてよい。このような例示において、快適性のコストは、オブジェクト軌道および／または車両軌道に関連付けられる相対速度に基づいてよい。例えば、毎時２０マイルの閉包レートを有するオブジェクトおよび車両は、４の快適性のコストを含んでよく、毎時５マイルの閉包レートを有するオブジェクトおよび車両は、１の快適性のコストを含んでよい。さまざまな例示において、コストおよび／または距離は、オブジェクトの分類に基づいてよい。例えば、別の車両から５フィート離れた車両位置は、１の快適性のコストを含んでよく、歩行者から５フィート離れた車両位置は、５の快適性のコストを含んでよい。

さまざまな例示において、因子は、目的地への動いているオブジェクトおよび／または車両の進行を含んでよい。ある例示において、コストは、衝突を回避するためなど、オブジェクトおよび／または車両の速度の変化（例えば、減速、停止など）および／または停止位置からの車両の動きの遅延に基づいて算定されてよい。さまざまな例示において、進行のコストは、推定される状態に起因する遅延に実質的に類似する値を含んでよい。例えば、アクションは、オブジェクトが交差点に近接して、交差点を通過する間に、車両が交差点で１１秒間待機することを含んでよい。アクションに関連付けられる進行のコストは、１１の値を含んでよいが、他の値は本明細書で企図される。

さまざまな例示において、因子は、運用規則のコストを含んでよい。運用規則のコストは、道路の規則（例えば、運輸省の法律、条令、規制など）、良好な運転の規則、地域の運転習慣（例えば、一般的な運転慣行）、運転作法（例えば、別の自動車が自転車専用車線などを占有しないで右折するための空間を提供するために車線での位置を調整すること）に基づいてよい。さまざまな例示において、推定される状態に関連付けられる運用規則のコストは、破られたおよび／または満たされている１つまたは複数の規則に基づいて算定されてよい。このような例示において、運用規則のコストは、満たされたもしくは履行された規則に基づいて、破られたもしくは履行されていない、および／または減少した規則（例えば、規則、習慣、作法など）に基づいて増加されてよい。例えば、経路は、交差点における車線変更をする車両を含んでよい。ある環境において違法ではないが、交差点において車線変更をすることは、良好な運転の規則では推奨されないことがあり、それ故に、５のペナルティコストを科すことがある。車線変更は、車線変更の作法のための最短の距離とみなされる別の車両の閾値距離内（例えば、２０フィート、３０フィート、１０メートルなど）であってよい。閾値距離内の車線変更は、１０のさらなるペナルティコストを科すことがある。したがって、推定される状態に関連付けられる合計の運用規則のコストは、１５であってよい。別の例示に対して、経路は、赤信号で停止するために来る間に、車両が車線での位置を左側に調整することを含んでよい。調整された位置は、信号が青に変わることを待たせることなく、後ろにある別の車両が車両の隣を走行するための空間を提供してよく、右折を実行してもよい。位置を調整する作法は、－３の報酬をもたらし（例えば、推定される状態に関連付けられる合計のコストを減少させ）てよい。

ある例示において、因子は、重大性の順にランク付けされてよい。このような例示において、因子のうちの少なくとも１つは、他の因子よりもより高く重み付けされるコストを含んでよい。ある例示において、安全性のコストは、他の因子よりも高く重み付けされてよい。このような例示において、車両コンピューティングシステムは、車両がとるべきアクションの決定において、他の因子を上回る安全性を強調してよい。ある例示において、初期の安全性のコストは、２倍、３倍、４倍などを乗じてよい。ある例示において、車両コンピューティングシステムは、多項式関数（例えば、２次、３次など）を初期の安全性のコストに適用してよい。例えば、車両コンピューティングシステムは、アルファ＊（安全性のコスト）²＋ベータ＊（快適性のコスト）＋ガンマ＊（進行のコスト）＋デルタ＊（運用規則のコスト）に基づいて、推定される状態に関連付けられる合計のコストを決定してよい。

ある例示において、車両コンピューティングシステムは、ランキングに基づいて、それぞれの因子に関連付けられるコストに減少量を乗じてよい。例えば、車両コンピューティングシステムは、安全性のコストに４倍、快適性のコストに３倍などを乗じてよい。ある例示において、車両コンピューティングシステムは、ランキングに基づいて多項式関数を因子に適用してよい。例えば、車両コンピューティングシステムは、アルファ＊（安全性のコスト）⁴＋ベータ＊（快適性のコスト）³＋ガンマ＊（進行のコスト）²＋デルタ＊（運用規則のコスト）に基づいて、推定される状態に関連付けられる合計のコストを決定してよい。

ある例示において、車両コンピューティングシステムは、アクションに関連付けられるそれぞれの推定される状態に対応するコストを合計してよく、アクションに対する合計のコストを決定する。さまざまな例示において、車両コンピューティングシステムは、それぞれの因子に関連付けられる合計のコストおよび全体の合計のコストを算定してよい。このような例示において、車両コンピューティングシステムは、アクションに関連付けられる全体の合計のコストと同様に、アクションに関連付けられる安全性、快適性、進行、および／または運用規則に関連付けられる合計のコストを決定してよい。

さまざまな例示において、車両コンピューティングシステムは、それぞれのアクションに関連付けられる合計のコストを比較してよく、合計のコストに基づいてとるべきアクション（例えば、車両を制御すること）を決定してよい。ある例示において、選択されるアクションは、共に関連付けられる最低コストを有するアクションを含んでよい。このような例示において、他のオブジェクトに対する影響を最小限とする安全なアクションは、低いスコアを含むことがある。ある例示において、選択されるアクションは、共に関連付けられる最高コストを有するアクションを含むことがある。このような例示において、ペナルティは、負の値で報酬をもたらせられてよく、報酬は、正の値でもたらせられてよいことによって、他のオブジェクトに対する影響が最小である安全なアクションは、ハイスコアを含んでよい。

さまざまな例示において、車両コンピューティングシステムは、個別にそれぞれの因子に関連付けられるコストに基づいてアクションをランク付けすることによって、とるべきアクションを決定してよい。少なくとも１つの例示において、車両コンピューティングシステムは、まず安全性のコストに基づいてアクションをランク付けしてよい。このような例示において、車両コンピューティングシステムは、さらなるコスト（例えば、快適性のコスト、進行のコストなど）に対して処理され得る最も安全なアクションに対応する第１の一組のアクションを選択してよい。ある例示において、第１の一組のアクションは、所定の値（例えば、閾値）を上回るか、または下回る安全性のコストを有するアクションを含んでよい。ある例示において、第１の一組のアクションは、最も安全なアクション（例えば、コストをどのように算定するかに応じて、最低ランクまたは最高ランクの安全性のコストを有するアクション）の所定の数および／またはパーセンテージを含んでよい。例えば、第１の一組のアクションは、５つの最低の安全性のコストを有するアクション（例えば、５つの最も安全なアクション）を含んでよい。別の例示において、第１の一組のアクションは、上位２５％の最高の安全性のコスト（最も安全なアクションの２５％）を有するアクションを含んでよい。

さまざまな例示において、車両コンピューティングシステムは、一組のアクションのそれぞれの因子に対して、１つまたは複数の因子（例えば、安全性を下回るようにランク付けされる因子）の第２のランク付けされた因子に関連付けられるコストを決定してよい。少なくとも１つの例示において、第２の因子は、オブジェクトおよび／または車両の快適性を含んでよい。ある例示において、車両コンピューティングシステムは、第２のランク付けされた因子に関連付けられるコストに基づいて、一組のアクションをランク付けしてよい。さまざまな例示において、車両コンピューティングシステムは、第２のランク付けされた因子に関連付けられるコストに基づいて、第２の一組のアクションを識別してよい。さまざまな例示において、第２の一組のアクションは、第２の因子に関連付けられる最高（または最低）のコストを有するアクションの所定の数および／またはパーセンテージを含んでよい。例えば、第２の一組のアクションは、最低の快適性のコストを有する第１の一組のアクションの４つのアクション（例えば、４つの最も快適なアクション）を含んでよい。

さまざまな例示において、車両コンピューティングシステムは、第２の一組のアクションのそれぞれに対して、１つまたは複数の因子の第３のランク付けされた因子に関連付けられるコストを決定してよい。車両コンピューティングシステムは、第２の一組のアクションをランク付けしてよく、上記のような第３のランク付けされた因子に関連付けられるコストに基づいて、第３の一組のアクションを識別してよい。車両コンピューティングシステムは、因子のそれぞれが考慮されるまでその次にランク付けされた因子に関連付けられるコストに基づいて一組のアクションを継続して決定してよい。ある例示において、車両コンピューティングシステムは、因子のそれぞれが考慮された後で、最高ランクのアクションに基づいてとるべきアクションを決定してよい。このような例示において、車両コンピューティングシステムは、アクションに基づいて車両を制御してよい。

本明細書で説明される技術は、自律的および／または半自律的な車両制御プランニングの技術分野への改善を含んでよい。従来、自律車両の制御プラニングにおいて、車両コンピューティングデバイスは、検出されたオブジェクトから最長距離が維持されることをもたらす多様なアクションのうちの１つのアクションのような車両に対して最も保守的な経路をとり、選択するために多様なアクションを考慮してよい。最も保守的な経路は、車両および他のオブジェクトの安全性を確実にする一方で、進行および快適性のような他の因子をよく犠牲にする。しかしながら、本明細書で説明される技術は、車両コンピューティングシステムが、双方の車両に対して、安全性、快適性、進行、および運用規則を最適化するというアクションを選択し得る手段を含む。したがって、本明細書で説明される技術は、自律型および／または半自律型車両の技術分野を改善する。

さらに、上記で説明されるように、従来の制御プラニング技術は、環境において動作しているオブジェクトに対するアクションの影響を考慮しないという点で車両中心である。そのため、従来の制御プラニング技術を採用する車両コンピューティングシステムは、アクションが環境における別のオブジェクトを動作させ得る悪影響を無視してよい。しかしながら、本明細書で説明される技術は、車両コンピューティングシステムが、車両と同様に検出されたオブジェクトに対して、安全性、快適性、進行、および運用規則を最適化するというアクションを選択し得る手段を含む。したがって、本明細書で説明される技術は、自律型および／または半自律型車両の技術分野を改善する。

本明細書で説明される技術は、複数の方法で実装されてよい。例示的な実装は、以下の図面を参照して下記に提供される。自律車両のコンテキストにおいて説明されるが、本明細書で説明される方法、装置、およびシステムは、さまざまなシステム（例えば、センサーシステム、またはロボティックプラットホーム）に適用されてよく、自律車両に限定されない。ある例示において、同様の技術は、このようなシステムがさまざまな操作を実行することが安全であるかの表示を提供し得る運転者制御車両で利用されてよい。別の例示において、この技術は、航空または航海の文脈で、またはプランニング技術を使用する任意のシステムで利用されてよい。

図１は、環境１００における自律車両１０２の図であり、ここで、例示的なコストベースの経路決定システムは、環境１００において使用する自律車両１０２に対して経路を決定することに利用されてよい。車両コンピューティングデバイスは、車両１０２のコストベースの経路決定システムを実行してよい。ある例示において、本明細書で説明されるコストベースの経路決定技術は、図７のプラニングコンポーネント７２４のような車両コンピューティングデバイスのプラニングコンポーネントによって少なくとも部分的に実装されてよく、またはそれに関連付けられて実装されてよい。

さまざまな例示において、車両コンピューティングデバイスは、知覚システムを介するような環境１００における１つまたは複数の動的オブジェクト１０４（例えば、オブジェクト１０４）を検出するように構成されてよい。車両コンピューティングシステムは、１つまたは複数のセンサーから受信したセンサーデータに基づいて、オブジェクト１０４を検出してよい。ある例示において、センサーは、例えば、カメラ、モーションディテクター、ライダー、レーダーのような車両１０２に搭載されるセンサーを含んでよい。ある例示において、センサーは、例えば、別の自律車両に搭載されるセンサー、および／または環境１００に備え付けられるセンサー１０６のような１つまたは複数のリモートセンサーを含んでよい。

さまざまな例示において、車両１０２は、他の自律車両および／またはセンサー１０６からデータを伝送および／または受信するように構成されてよい。データは、環境１００で検出されたオブジェクト１０４に関するデータのようなセンサーデータを含んでよい。さまざまな例示において、環境１００は、交通監視、衝突回避などのためのセンサー１０６を含んでよい。ある例示において、センサー１０６は、例えば、見通しの悪いまたはいくぶん見通しの悪い交差点のような視認性が低下した領域における環境に備え付けられてよく、さらなる視認性を提供する。例えば、環境１００における交差点は、見通しの悪い交差点があると決定されることがあり、ここで、接近する車両１０２は、交差する道路で左または右から接近するオブジェクト１０４および／または他の車両を知覚することが可能ではないことがある。それ故に、環境における交差点は、交差する道路に位置するオブジェクト１０４（１）および１０４（２）のようなオブジェクト１０４に関するセンサーデータを接近する車両１０２に提供するセンサー１０６を含んでよい。さまざまな例示において、車両コンピューティングシステムは、センサーデータを受信してよく、例えば、オブジェクト１０４が、自動車、トラック、バス、セミトレーラートラック、バイク、モペット、自転車運転者、歩行者などであるかのようなオブジェクト１０４のタイプを決定（例えば、オブジェクトのタイプを分類）してもよい。

さまざまな例示において、車両コンピューティングシステムは、検出されたオブジェクト１０４を用いて環境において動作している車両１０２に対して１つまたは複数のアクション１１０を決定してよい。アクション１１０は、車両１０２が環境１００を通してとり得る１つまたは複数の可能性のある経路（例えば、１つまたは複数の車両軌道）を表現してよい。ある例示において、アクション１１０は、検出されたオブジェクト１０４に基づいて決定されてよい。例えば、車両コンピューティングシステムは、右から交差点に接近するオブジェクト１０４（１）および１０４（２）のような１つまたは複数のオブジェクト１０４を検出してよい。車両コンピューティングシステムは、第１のアクション１１０（１）は、初期位置１１２でとどまることを含んでよく、第２のアクション１１０（２）は、初期位置１１２から加速して、オブジェクト１０４（１）および１０４（２）の前の交差点を通過することを含んでよい。

アクション１１０は、右に車線変更、左に車線変更、車線にとどまること、障害物（例えば、二重駐車車両、トラフィックコーンなど）を迂回することなどのような１つまたは複数の参照アクション（例えば、車両が動的な動作環境に反応して実行するように構成される操作のグループのうちの１つ）を含んでよい。アクション１１０は、さらに、速度の変化（例えば、速度維持、加速、減速など）、位置の変化（例えば、車線での位置の変更）などのような１つまたは複数のサブアクションを含んでよい。例えば、第２のアクション１１０（２）のようなアクション１１０は、車線にとどまること（参照アクション）、および第１の加速度で初期位置１１２から加速すること（サブアクション）を含む一方で、第３のアクション１１０（３）は、車線にとどまること（参照アクション）、および第２の加速度で初期位置１１２から加速すること（サブアクション）を含んでよい。別の例示において、アクション１１０（４）のようなアクション１１０は、２秒間車線にとどまっている（第１の参照アクション）間に、初期位置１１２から加速（サブアクション）して、その後で車線変更左にする（第２の参照アクション）ことを含んでよい。さらに別の例示において、アクション１１０（５）のようなアクション１１０は、車線変更を左にしている間（参照アクション）に、第１の加速度で加速すること（サブアクション）、および左車線で確立される場合に第２の加速度で加速することを含んでよい。

ある例示において、車両コンピューティングシステムは、車両１０２が優先権を有さない（例えば、オブジェクト１０４が優先権を有する）状況において車両１０２がとるアクション１１０（例えば、参照アクションおよびサブアクション）を決定するように構成されてよい。このような例示において、車両コンピューティングシステムは、最も保守的な接近を用いるような従来の制御プラニング技術を用いることが可能となることとなるよりも早い時間で車両１０２が安全に前進し得る手段を決定するように構成されてよい。例えば、車両コンピューティングシステムは、車両１０２との衝突を回避するために、車両１０４（１）および１０４（２）を減速するように要求することによるようなオブジェクト１０４（１）および１０４（２）に悪影響を及ぼすことなく、車両１０２がオブジェクト１０４（１）および１０４（２）の前の交差点を安全に通過し得るアクション１１０（５）のようなアクション１１０を識別してよい。そのため、車両１０２は、そうでなければ、最も保守的な接近を用いて可能となることとなるよりもより安全でより速く目的地へ進行するように構成されてよく、これは、オブジェクト１０４（１）および１０４（２）が車両１０２の前の交差点を通過するまで、車両が初期位置１１２にとどまるように要求することとなる。

ある例示において、車両コンピューティングシステムは、交差点における優先権を有するオブジェクト１０４が優先権を行使することを阻止するということの決定をしてよい。例えば、車両１０２は、オブジェクト１０４（例えば、自動車）の後で４方向の停止標識に接近してよい。しかしながら、歩行者は、オブジェクト１０４の前の道路を横断していることがあり、それによってオブジェクト１０４が優先権を行使して、車両１０２の前の交差点を通過することを阻止する。車両コンピューティングシステムは、オブジェクト１０４を遮断する歩行者を識別してよく、オブジェクト１０４が遮断されていることに基づいて、車両１０２がとるべき１つまたは複数のアクション１１０を決定してもよい。第１のアクション１１０（１）は、停止標識（例えば、初期位置１１２）にとどまって、車両１０２の前を通過する優先権を有するオブジェクト１０４を待つことを含んでよい。第２のアクション１１０（２）は、車線での車両１０２の位置を維持すること、および停止標識から優先権を有するオブジェクト１０４の前方の交差点に通過するために加速することを含んでよい。

さまざまな例示において、車両コンピューティングシステムは、環境１００における車両１０２に適用可能であるアクション１１０（例えば、参照アクションおよび／またはサブアクション）を決定するように構成されてよい。例えば、車線変更は、１つの車線の道路で動作している車両に対して適用可能である参照アクションではないことがある。別の例示において、加速することは、制限速度で動作している車両に対して適用可能であるサブアクションではないことがある。

さまざまな例示において、車両コンピューティングシステムは、それぞれ、オブジェクト１０４（１）、１０４（２）、および１０４（３）に関連付けられる軌道１０８（１）、１０８（２）、および１０８（３）のようなアクション１１０、センサーデータ、および／またはオブジェクト１０４のタイプに基づいて、１つまたは複数の予測されるオブジェクト軌道１０８（軌道１０８）を決定してよい。さまざまな例示において、軌道１０８は、車両の予測システムによって決定されるように、オブジェクトの予測されるモーションに基づいて決定されてよい。ある例示において、オブジェクト１０４に関連付けられる軌道１０８は、アクティブ予測に基づいてよい。アクティブ予測は、車両１０２の可能性のあるアクションに基づき得るオブジェクト１０４が有する可能性および／または起こり得る反応を決定することを含む。例えば、車両コンピューティングシステムは、車両１０２と同一の道路上にあり、反対方向に走行するオブジェクト１０４（３）のようなオブジェクト１０４が、車両１０２が交差点におけるアクション１１０（４）または１１０（５）を実行することのような車線変更を実行することに応答して、車線での位置を調整し得るということを決定してよい。したがって、車両コンピューティングシステムは、軌道１０８（３）を決定してよく、（オブジェクト１０４（３）の進行方向に対する）右へのわずかな逸脱を含んでもよい。

さまざまな例示において、軌道１０８は、１つまたは複数の機械学習アルゴリズムを利用して決定されてよい。このような例示において、車両コンピューティングシステムは、予測システムを介するなどで、オブジェクト１０４に関連付けられるセンサーデータを受信してよく、センサーデータに基づいてオブジェクト１０４の挙動を予測してよい。例えば、車両コンピューティングシステムは、経時的に、オブジェクト１０４の動きのキャプチャされた画像データに対して訓練されてよいことによって、車両コンピューティングシステムは、オブジェクト１０４がとり得る将来のアクション（例えば、軌道１０８）を提案し得るという挙動を認識してよい。追加、または代替において、車両コンピューティングシステムは、ヒートマップ（例えば、離散化された確率分布）、環境のトップダウン表現、木探索方法、および／または時間論理式を利用してよく、上記の参照により組み込まれた特許出願で説明されるそれらのようなオブジェクト１０４の１つまたは複数の軌道１０８を決定するが、オブジェクトの将来の状態および／または不確実性の任意の他の表現が企図される。

アクション１１０（１）、１１０（２）、１１０（３）、１１０（４）、および１１０（５）のようなそれぞれの車両アクション１１０に対して、車両コンピューティングシステムは、時間期間（例えば、５秒、８秒、１２秒など）の間に、車両およびオブジェクトを環境において前方に投影することによって、将来の状態（例えば、推定される状態）をシミュレートしてよい。車両コンピューティングシステムは、それぞれのアクション１１０に関連付けられる１つまたは複数の予測される軌道に基づいて、オブジェクトを前方に投影（例えば、オブジェクト１０４の将来の位置を推定）してよい。例えば、車両コンピューティングシステムは、第２のアクション１１０（２）が、一定の進行方向を維持している間に、毎時１マイルの減速（例えば、負の加速）を含むオブジェクト軌道１０８（１）をもたらし得るということを決定してよい。車両コンピューティングシステムは、アクション１１０に関連付けられる１つまたは複数の車両軌道に基づいて、車両１０２を前方に投影（例えば、車両の将来の位置を推定）してよい。図２に図示されるように、推定される状態は、車両１０２の推定される場所（例えば、推定される位置）および将来のある時間でのオブジェクト１０４の推定される位置を表現することができる。さまざまな例示において、車両コンピューティングシステムは、一組の推定される状態（例えば、時間期間を通して車両および／またはオブジェクトの推定される位置を表現する推定される状態のグループ）を通して、所定のレート（例えば、１０ヘルツ、２０ヘルツ、５０ヘルツなど）で推定される状態を決定してよい。少なくとも１つの例示において、推定される状態は、１０ヘルツ（例えば、８秒の時間期間にわたって８０個の推定される状態）のレートで実行されてよい。ある例示において、車両コンピューティングデバイスは、実質的に平行してさまざまな時間間隔で車両およびオブジェクトの推定される状態を決定してよい。このような例示において、車両コンピューティングデバイスは、要求される時間を減少させてよく、時間期間にわたって一組の推定される状態を生成する。

さまざまな例示において、車両コンピューティングシステムは、車両１０２に関係のない１０４（４）のような１つまたは複数のオブジェクト１０４を識別するように構成されてよい。オブジェクト１０４は、オブジェクト１０４および車両１０２が同一の空間を潜在的に占有するか、またはある時間期間（例えば、衝突の可能性）にわたって互いの閾値距離内に来ることが可能である場合、車両１０２に関連してよい。さまざまな例示において、オブジェクトは、オブジェクト１０４（４）に関連付けられる軌道１０８（４）のようなオブジェクト１０４に関連付けられる軌道１０８が、アクション１１０に関連付けられる車両軌道で交差および／または収束することとはならないということの決定に基づいて、車両に関係のないということの決定をしてよい。例えば、オブジェクト１０４（４）に関連付けられる軌道１０８（４）は、車両１０２の進行方向に実質的に直交する道路の車両１０２から離れることを含む。ある例示において、オブジェクト１０４は、オブジェクト１０４の推定される位置が時間期間（例えば、一組の推定される状態）を通して、車両１０２の推定される位置からの閾値距離よりも長くなることとなるということの決定に基づいて、車両１０２に関係のないということの決定をしてよい。オブジェクト１０４が車両１０２に関係のないということの決定に基づいて、オブジェクト１０４は、アクション１１０に関連付けられる推定される状態で無視されてよい。例えば、車両コンピューティングシステムは、オブジェクト１０４（４）が車両１０２に関係のないということの決定をしてよく、オブジェクト１０４（４）に関連付けられる軌道１０８（４）を推定される状態で含まなくてよい。オブジェクト１０４（４）のような関係のないオブジェクト１０４を無視することによって、本明細書で説明される技術は、異なるアクション１１０に関連付けられるコストを決定すること、車両を制御することなどのような関連するオブジェクトおよび車両コンピューティングシステムの他の機能に関連付けられる推定される位置を決定するためのさらなるストレージおよび処理能力を提供することによって、車両コンピューティングシステムの機能を改善してよい。

車両コンピューティングシステムは、車両１０２およびオブジェクト１０４の互いに対する推定される位置に基づくようなそれぞれの推定される状態に関連付けられるコストを決定してよい。ある例示において、車両コンピューティングシステムは、１つまたは複数の因子に基づいて、それぞれの推定される状態を分析してよく、コスト値を推定される状態に適用してもよい。このような例示において、推定される状態のコストは、因子のそれぞれに関連付けられるコストの合計を含んでよい。１つまたは複数の因子は、車両１０２および／またはオブジェクト１０４の安全性（例えば、車両１０２とオブジェクト１０４との間の衝突を回避すること）、快適性（例えば、車両１０２および／またはオブジェクト１０４による突然の動きの欠如）、進行（例えば、車両１０２および／またはオブジェクト１０４の目的地への動き）、運用規則（例えば、道路の規則、法律、条令、規制など）などを含んでよい。少なくともある例示において、（例えば、具体的な状態での）個々のコストは、互いに比較されてよい。

車両１０２および／またはオブジェクト１０４の安全性は、車両１０２とオブジェクト１０４との間の衝突の尤度（例えば、衝突の確率）を含んでよい。衝突の尤度は、車両１０２とオブジェクト１０４との間の距離（例えば、５フィート、２メートル、０．５メートル以内など）、収束軌道（例えば、アクション１１０に関連付けられる車両軌道と実質的に交差することとなるオブジェクト１０４の軌道１０８）、車両１０２とオブジェクト１０４との間の収束レート（例えば、毎秒２メートル、毎秒１０フィートなど）などに基づいて算定されてよい。ある例示において、衝突の尤度は、距離および／または収束レートに関連付けられる閾値に基づいてよい。例えば、車両１０２に関連付けられる推定される状態とオブジェクト１０４に関連付けられる推定される位置との間の距離は、閾値距離（例えば、６フィート、２．５メートルなど）よりも短いかまたは等しくてよい。そのため、車両コンピューティングシステムは、車両とオブジェクトとの間に衝突の尤度が存在するということを決定してよい。別の例示に対して、アクション１１０および軌道１０８に関連付けられる車両軌道は、収束の閾値レート（例えば、毎秒８フィート、毎秒３メートル、毎秒２メートルの収束など）に等しいかまたはそれより高い速度で収束してよい。そのため、車両コンピューティングシステムは、車両１０２とオブジェクト１０４との間に衝突の尤度が存在するということを決定してよい。ある例示において、衝突の尤度または確率は、実際の距離および／または収束レートが閾値を下回るかまたは上回る量に基づいてよい。このような例示において、衝突の確率は、車両により近いほど増加してよく、オブジェクトは、推定される状態（例えば、互いに６インチ以内の場合は、９５％の衝突確率）および／または収束レートが閾値を上回る量（例えば、毎秒１０メートルの収束レートを有する９０％の衝突確率）にある。さまざまな例示において、衝突の確率は、機械学習技術を用いて決定されてよい。このような例示において、機械学習モデルは、車両１０２およびオブジェクト１０４が衝突したか、または衝突しなかった状況を含む訓練データを利用して訓練されてよい。

さまざまな例示において、安全因子（例えば、安全性のコスト）に関連付けられるコストは、衝突の確率に基づいてよい。ある例示において、衝突の確率が衝突が起こり得るということを示す事前に定義された閾値（例えば、４０％、５１％、など）よりも高い場合、固定コスト（例えば、６０、８０、１００など）を含んでよい。ある例示において、固定コストは、閾値を上回るコスト値を含んでよいことによって、車両コンピューティングシステムが共に関連付けられるアクションを選択することが可能ではない。このような例示において、衝突の確率は、車両１０２がとり得るアクション１１０に対する制約を含んでよい。ある例示において、コストは、衝突判断の確率に基づいてよい。ある例示において、安全性のコストと衝突の確率との間の相関は、１：１、２：１、１：２の相関関係などがあってよい。例えば、車両コンピューティングシステムは、推定される状態における衝突の確率が９５％であるということの決定をしてよく、車両コンピューティングシステムは、推定される状態の安全因子に対する９５のコストを評価してよい。ある例示において、安全性のコストは、衝突の確率の多項式関数を含んでよい。ある例示において、安全性のコストは、衝突の閾値確率に基づいて決定されてよい。このような例示において、閾値を下回る衝突の確率に関連付けられる安全性のコストは、第１の関係（例えば、１：１、２：１、ｘ²など）を含んでよく、閾値を上回る衝突の確率に関連付けられる安全性のコストは、第２の関係（例えば、１０：１、ｘ⁴など）を含んでよい。

ある例示において、車両コンピューティングデバイスがアクション１１０（例えば、制約）を選択しないことがある上記の閾値コスト値は、具体的な衝突の確率に関連付けられてよい。例えば、閾値コスト値は、６０％で設定されてよいことによって、６０％またはそれより高い衝突の確率を有するアクション１１０は、車両コンピューティングシステムによって選択されなくてよい。閾値コスト値は、車両１０２がとるアクション１１０の決定において、車両コンピューティングシステムが他の因子を上回る安全性を強調し得る手段を提供してよい。

さまざまな例示において、安全性のコストは、少なくとも部分的に、オブジェクト１０４に関連付けられる分類に基づいてよい。例えば、２台の車両との間の同一の衝突の確率は、車両とバイクとの間の衝突の確率よりも低い安全性のコストをもたらすことがある。ある例示において、歩行者との衝突の確率は、他のすべてが等しい別の車両との衝突の確率に関連付けられるコストを上回ってよい。ある例示において、車両コンピューティングシステムは、オブジェクトに関連付けられる安全性のコストを決定してよく、分類因子（例えば、バイクに対して１．３、歩行者に対して１．５など）によって安全性のコストを増加させてよい。

さまざまな例示において、車両コンピューティングシステムは、衝突の確率に基づくような決定された安全性のコストを２倍、３倍、４倍などに増加させること、または多項式関数（例えば、２次、３次など）を決定された安全性のコストに適用することによって、上記の他の因子の安全性を強調してよい。例えば、車両コンピューティングシステムは、合計の安全性コスト＝（決定された安全性のコスト）²のような安全性のコストに２次方程式を適用してよい。

さまざまな例示において、因子は、オブジェクト１０４および／または車両１０２の快適性を含んでよい。ある例示において、オブジェクト１０４の快適性は、アクション１１０に応答するようなオブジェクト１０４の軌道１０８に関連付けられる推定される加速度（例えば、正、負、横方向など）および／または推定される加速度の変化（例えば、ジャーク）を含んでよい。車両１０２の快適性は、アクション１１０（横方向および／または長手方向）に対応する軌道に関連付けられる推定される加速度を含んでよい。例えば、オブジェクト１０４（１）のようなオブジェクト１０４は、かなりの力でブレーキを適用すると予測されてよく、初期位置１１２からゆっくりと加速する車両１０２を含むアクション１１０（２）に応答して、－２メートル毎秒毎秒の加速（例えば、減速）を引き起こす。ある例示において、コストは、加速度に関連付けられる値に基づいてよい。例えば、２フィート毎秒毎秒の負の加速度（例えば、毎秒－２フィート毎秒毎秒）は、２の快適性のコストをもたらしてよい。他の例示において、考慮されるオブジェクト１０４の任意の他の状態／制御は、快適性のコスト（例えば、最も近い隣人、または次に最も近い隣人、ステアリングレート、回転レート、速度、道路の規則の考慮事項として算定され得るように、他の車両にどのくらい近いか、例えば、他のオブジェクトが走り去るために必要とされる速度制限にどのくらい近いか、またはそれを超えるかなど）を決定することに用いられてよい。

ある例示において、快適性コストは、推定される状態で車両１０２とオブジェクト１０４との間の距離に基づいて決定されてよい。ある例示において、アクション１１０に関連付けられる快適性のコストは、時間期間にわたって車両１０２の推定される位置とオブジェクト１０４の推定される位置との間の最も近い接近ポイントに基づいてよい。さまざまな例示において、快適性のコストは、軌道１０８とアクションに関連付けられる車両軌道との間の相対速度に基づいてよい。このような例示において、快適性のコストは、車両１０２とオブジェクト１０４との間の閉包レートに関連付けられてよい。例えば、毎時３０マイルの閉包レートを有するオブジェクトおよび車両は、２０の快適性のコストを含んでよく、毎時６マイルの閉包レートを有するオブジェクトおよび車両は、２の快適性のコストを含んでよい。

ある例示において、快適性のコストに関連付けられる距離および／または相対速度は、オブジェクト１０４に関連付けられる分類に基づいてよい。ある例示において、分類は、快適性のコストに関連付けられる共に関連付けられる距離の範囲を有してよいことによって、車両１０２の推定される位置が推定される状態で具体的な範囲内にある場合、関連する快適性のコストを推定される状態の快適性のコストに加えられる。例えば、歩行者は、関連付けられる快適性のコストが５０である歩行者から任意の方向に１ヤードの第１の範囲を有してよく、関連付けられる快適性のコストが２０である歩行者から任意の方向に３ヤードの第２の範囲を有してもよい。

さまざまな例示において、快適性のコストは、少なくとも部分的に安全性のコストに基づいて決定されてよい。ある例示において、快適性のコストは、安全性のコストの一部（例えば、５０％、２０％など）を含んでよい。ある例示において、安全性のコストは、衝突の確率に基づくなどのベースのコストを含んでよい。このような例示において、推定される状態に対する合計の安全性のコストを決定するために、車両コンピューティングシステムは、第１の関数（例えば、ｘ⁴、ｘ⁶など）をベースのコストに適用してよく、快適性のコストを決定するために、第２の関数（例えば、ｘ²、ｘ³など）を適用してもよい。例えば、車両コンピューティングシステムは、衝突の確率に基づくなどの推定される状態に関連付けられる４のベースのコストを決定してよい。推定される状態の安全性のコストは、２５６（ベースのコスト）⁴であってよく、快適性のコストは、１６（ベースのコスト）²であってよい。別の例示に対して、車両コンピューティングシステムは、推定される状態に関連付けられる安全性のコストが４０であると決定してよく、推定される状態に関連付けられる快適性のコストが２０（安全性のコストの５０％）であると決定してもよい。ある例示において、安全性のコストは、オブジェクト状態の第１の関数（例えば、位置、速度、加速度）および／またはオブジェクト１０４と車両１０２との間の相対状態（例えば、それぞれの位置との間の距離、相対速度、相対加速度など）を含んでよく、快適性のコストは、オブジェクト状態の第２の関数および／またはオブジェクト１０４と車両１０２との間の相対状態を含んでよい。

ある例示において、車両コンピューティングシステムは、それぞれの加速方向に基づいて快適性のコストを評価してよい。このような例示において、負の加速（例えば、減速）および／または横方向の加速度のコストは、正の加速度よりも高いコストを含んでよい。ある例示において、車両コンピューティングシステムは、負の加速度および／または横方向の加速度に２倍、３倍などを乗じてよいか、または負の加速度および／または横方向の加速度に多項式関数（例えば、２次など）を適用してもよい。ある例示において、加速度（例えば、正、負、横方向）は、閾値（例えば、閾値正、負、および／または横方向の加速度）を上回る加速度に基づいて、共に関連付けられるコストを有してよい。このような例示において、車両コンピューティングシステムは、加速度がそれぞれの閾値加速度と等しいかまたはそれを上回るということの決定に基づいてコストを適用してよい。さまざまな例示において、加速度に関連付けられる快適性のコストは、加速度が１つまたは複数の加速度範囲の範囲内にあるということの決定に基づいてよい。このような例示において、範囲は、快適性のコスト値に関連付けられてよい。例えば、－０．５フィート毎秒毎秒から－２フィート毎秒毎秒の１の加速度範囲は、５のコスト値を有してよく、－２．１フィート毎秒毎秒から－５フィート毎秒毎秒の第２の加速度範囲は、１０のコスト値を有してよく、－５．１フィート毎秒毎秒から－１０フィート毎秒毎秒の第３の加速度範囲は、１５のコスト値を有してよい。

さまざまな例示において、車両コンピューティングシステムは、車両１０２に関連付けられる快適性にわたって、オブジェクト１０４に関連付けられる快適性を強調するように構成されてよい。このような例示において、車両コンピューティングシステムは、オブジェクトの快適性のコストに２倍、３倍、４倍などを乗じてよいか、またはオブジェクトのコストに多項式関数を適用してもよい。さまざまな例示において、所与の推定される状態の合計の快適性のコストは、オブジェクトの快適性のコスト（強調のために調整されるか否か）および／または車両の快適性のコストを含んでよい。

さまざまな例示において、因子は、目的地への動いているオブジェクト１０４および／または車両１０２の進行を含んでよい。ある例示において、コストは、衝突を回避するためなど、オブジェクト１０４および／または車両１０２の速度の変化（例えば、減速、停止、加速、減速など）および／または停止位置からの車両１０２の動きの遅延（例えば、車両の時間遅延）に基づいて算定されてよい。さまざまな例示において、進行のコストは、アクション１１０および／または推定される状態（例えば、オブジェクトの時間遅延、車両の時間遅延など）に起因する遅延の秒数に実質的に類似する値を含んでよい。説明される例示において、アクション１１０（１）は、オブジェクト１０４が交差点に接近して、交差点を通過する間に、交差点（例えば、停止標識）で１１秒間待機する車両を含んでよい。アクション１１０（１）に関連付けられる進行のコストは、１１の値を含んでよい。ある例示において、進行のコストは、遅延のレベル（例えば、遅延時間の範囲）に関連付けられてよい。例えば、非常に短い遅延（例えば、１秒よりも短いなど）は、１の進行のコストをもたらしてよい一方で、短い遅延（例えば、１～３秒）は、２の進行のコストなどをもたらしてよい。

さまざまな例示において、進行のコストは、環境１００において動作しているオブジェクト１０４の決定された公称速度のプロファイルに基づいて算定されてよい。公称速度のプロファイルは、オブジェクト１０４が車両１０２の欠如における環境１００を通って走行し得るベースライン速度のプロファイルを含んでよい。ある例示において、公称速度のプロファイルは、事前に記録されたデータに基づくなどの環境１００に関連付けられる速度制限、環境１００において動作しているオブジェクト１０４の周知の特徴などに基づいてよい。さまざまな例示において、車両コンピューティングシステムは、進行のコストを決定するために、公称速度のプロファイルとオブジェクト軌道１０８との間の差を決定してよい。ある例示において、車両コンピューティングシステムは、多項式関数または因子を差に適用してよく、アクションに関連付けられる進行のコストを決定する。少なくともある例示において、このようなコストは、少なくとも部分的に、車両１０２が存在するオブジェクトの予測される軌道と可能性のあるアクションをとることとの間の差に基づいてよい。

さまざまな例示において、因子は、運用規則のコストを含んでよい。運用規則のコストは、道路の規則（例えば、運輸省の法律、条令、規制など）、良好な運転の規則、地域の運転習慣（例えば、一般的な運転慣行）、運転作法（例えば、別の自動車が自転車専用車線などを占有しないで右折するための空間を提供するために車線での位置を調整すること）に基づいてよい。さまざまな例示において、推定される状態に関連付けられる運用規則のコストは、破られたおよび／または満たされている１つまたは複数の規則に基づいて算定されてよい。このような例示において、運用規則のコストは、満たされたもしくは履行された規則に基づいて、破られたもしくは履行されていない、および／または減少した規則（例えば、規則、習慣、作法など）に基づいて増加されてよい。例えば、アクション１１０（４）のようなアクション１１０は、交差点における車線変更をする車両１０２を含んでよい。ある環境において違法ではないが、交差点において車線変更をすることは、良好な運転の規則では推奨されないことがあり、それ故に、１０のペナルティコストを科すことがある。車線変更は、車線変更の作法のための最短の距離とみなされる別の車両の閾値距離内（例えば、２０フィート、３０フィート、１０メートルなど）であってよい。閾値距離内の車線変更は、さらなる１０のペナルティコストを科すことがある。したがって、推定される状態に関連付けられる合計の運用規則のコストは、１５であってよい。別の例示に対して、アクション１１０は、赤信号で停止するために来る間に、車両１０２が車線での位置を左側に調整することを含んでよい。調整された位置は、信号が青に変わることを待たせることなく、車両１０２の後ろから接近するオブジェクトが車両１０２の隣を走行するための空間を提供してよく、右折を実行してもよい。位置を調整する作法は、－３の報酬をもたらし（例えば、推定される状態に関連付けられる合計のコストを減少させ）てよい。

ある例示において、因子は、重大性の順にランク付けされてよい。このような例示において、因子のうちの少なくとも１つは、他の因子よりも高く重み付けされるというコストを含んでよい。上記のように、安全性のコストは、他の因子よりも高く重み付けされてよい。このような例示において、車両コンピューティングシステムは、車両がとるべきアクションの決定において、他の因子を上回る安全性を強調してよい。例えば、車両コンピューティングシステムは、以下の式を用いて、推定される状態に関連付けられる合計のコストを決定してよい。
ＥＳコスト＝（安全性のコスト）²＋（快適性のコスト）＋（進行のコスト）＋（ｏｐ．規則のコスト）（１）

別の例示に対して、車両コンピューティングシステムは、以下の式を用いて、推定される状態に関連付けられる合計のコストを決定してよい。
ＥＳコスト＝［２×（安全性のコスト）］＋（快適性のコスト）＋（進行のコスト）＋（ｏｐ．規則のコスト）（２）

ある例示において、車両コンピューティングシステムは、ランキングに基づいて、それぞれの因子に関連付けられるコストに減少量を乗じてよい。例えば、車両コンピューティングシステムは、安全性のコストに４倍、快適性のコストに３倍、進行のコストに２倍、および運用規則のコストに１倍を乗じてよい。ある例示において、車両コンピューティングシステムは、ランキングに基づいて多項式関数を因子に適用してよい。例えば、車両コンピューティングシステムは、以下の式に従って、推定される状態に関連付けられる合計のコストを決定してよい。
ＥＳコスト＝（安全性のコスト）⁴＋（快適性のコスト）³＋（進行のコスト）²＋（ｏｐ．規則のコスト）（３）

さまざまな例示において、車両コンピューティングシステムは、推定される状態に関連付けられるコスト（例えば、ＥＳコスト）が閾値の推定される状態のコストを上回るということを決定してよい。ある例示において、車両コンピューティングシステムは、ＥＳコストが部分的に閾値を上回ることに基づいて、アクションに関連付けられるデータを無視してよい。

ある例示において、車両コンピューティングシステムは、アクションに関連付けられる一部またはすべての推定される状態に対応するコストを合計してよく、アクションに対する合計のコストを決定する。非限定的な例示として、車両コンピューティングシステムは、以下の式に従って合計のアクションコストを決定してよい。
合計のアクションコスト＝（ＥＳ₁コスト）＋（ＥＳ₂コスト）＋…＋（ＥＳ_Nコスト）（４）

追加的または代替的に、車両コンピューティングシステムは、それぞれの因子に関連付けられる合計のコストを算定してよい。このような例示において、車両コンピューティングシステムは、安全性、快適性、進行、および／またはアクションに関連付けられる運用規則に関連付けられる合計のコストを決定してよい。例えば、アクションに関連付けられる合計の安全性のコストは、以下のように表現されてよい。
合計の安全性のコスト＝（ＥＳ₁安全性のコスト）＋（ＥＳ₂安全性のコスト）＋…＋（ＥＳ_N安全性のコスト）（５）

言うまでもなく、コストの任意の他の組み合わせ（線形、非線形、重み付け、非重み付け、機械学習などか）が企図される。

さまざまな例示において、車両コンピューティングシステムは、それぞれのアクションに関連付けられる合計のコストを比較してよく、合計のコストに基づいてとるべきアクション（例えば、車両を制御すること）を決定してよい。ある例示において、選択されるアクションは、共に関連付けられる最低コストを有するアクションを含んでよい。このような例示において、他のオブジェクトに対する影響を最小限とする安全なアクションは、低いスコアを含むことがある。ある例示において、選択されるアクションは、共に関連付けられる最高コストを有するアクションを含むことがある。このような例示において、ペナルティは、負の値で報酬をもたらせられてよく、報酬は、正の値でもたらせられてよいことによって、他のオブジェクトに対する影響が最小である安全なアクションは、ハイスコアを含んでよい。さまざまな例示において、車両コンピューティングシステムは、決定された（例えば、選択された）アクションに基づいて車両を制御してよい。ある例示において、閾値を上回る任意の１つのコストは、このような軌道を考慮から不適格とみなしてよい。

図２は、環境１００のような環境においてとるべき車両１０２のような車両２０２に対して、可能性のあるアクション（候補アクションとも称される）２０４、２０６、２０８、および２１０の図面２００の集合であり、共に関連付けられるそれぞれのコスト２１２、２１４、２１６、および２１８である。４つのアクションとして説明されるが、第１のアクション２０４は、第１の加速度を有するアクション１１０（２）に対応してよく、第２のアクション２０６は、第２の加速度を有するアクション１１０（２）に対応してよく、第３のアクション２０８は、アクション１１０（５）に対応してよく、および第４のアクション２１０は、アクション１１０（１）に対応してよく、より多くまたはより少ない数のアクションが車両コンピューティングシステムによって考慮されてよい。

ある例示において、アクション２０４、２０６、２０８、および／または２１０は、プラニングコンポーネント（例えば、図７のプラニングコンポーネント７２４）によってアクセス可能であるような車両コンピューティングデバイスのメモリにおいて事前に定義されてよく、および／または格納されてよい。例えば、プラニングコンポーネントは、アクション２０４、２０６、２０８、および／または２１０を、車両２０２が２方向の停止（例えば、ここで、横断する交通が優先権を有する）でとり得る事前に定義された一組のアクションとして格納してよい。ある例示において、アクション２０４、２０６、２０８、および／または２１０は、環境において検出されたオブジェクト２２２（１）および２２２（２）の数および／または近接性に基づくような環境に基づいてプラニングコンポーネントによって決定されてよい。さまざまな例示において、車両コンピューティングシステムは、アクションが具体的な時間（例えば、初期位置から）の環境における車両に適用可能であるかを決定してよい。このような例示において、車両コンピューティングシステムは、所定のアクションにアクセスしてよく、所定のアクションのそれぞれが環境１００に適用可能であるかを決定してよい。アクションは、環境において実行可能である（例えば、車両が２車線道路の右側車線で動作している場合に左側車線への変更）、環境において実行可能でない（例えば、車両が単一の車線の道路で動作している間の車線変更など）、環境に論理的である（例えば、スクールゾーンにおけるゆっくりとした加速など）、環境に論理的でない（例えば、遊び場に近接した急速な加速など）などの決定に基づく環境に適用可能であってよい。

上記のように、アクション２０４、２０６、２０８、および／または２１０は、参照アクションおよび／またはサブアクションを含んでよい。参照アクションは、車線にとどまること、右に車線変更すること、左に車線変更すること、障害物を迂回すること、障害物への迂回を中止することなどを含んでよい。サブアクションは、速度を維持すること、加速すること、減速すること、車線での位置を調整することなどを含んでよい。説明的な例示において、アクション２０４は、車線にとどまること（参照アクション）、および第１の加速度で加速すること（サブアクション）を含み、アクション２０６は、車線にとどまること（参照アクション）、および第２の加速度で加速すること（サブアクション）を含む。さらに、説明的な例示において、アクション２０８は、初期位置２２０から加速している間に車線変更をすることを含み、アクション２１０は、初期位置２２０での位置を実質的に維持することを含む。

さまざまな例示において、アクション２０４、２０６、２０８、および２１０のそれぞれに対して、車両コンピューティングシステムは、それぞれのアクション２０４、２０６、２０８、２１０に基づいて、軌道１０８のような１つまたは複数の予測されるオブジェクト軌道を決定してよい。ある例示において、予測されるオブジェクト軌道は、車両の１つまたは複数のセンサーおよび／または環境におけるセンサー（例えば、別の車両に搭載され、見通しの悪い交差点などのような定位置に固定される）によって収集されるセンサーデータに部分的に基づいてよい。ある例示において、予測されるオブジェクト軌道は、オブジェクト２２２（１）および２２２（２）に関連付けられるそれぞれの分類に部分的に基づいてよい。例えば、自動車として分類されるオブジェクト２２２（１）に関連付けられる第１の予測されるオブジェクト軌道は、オブジェクト２２２（１）の前の交差点を通って走行する車両２０２に応答してブレーキに適用される第１の圧力量に対応する第１の減速を含んでよい。セミトレーラートラックとして分類されるオブジェクト２２２（１）に関連付けられる第２の予測されるオブジェクト軌道は、オブジェクト２２２（１）の前で車両２０２が横断することに応答して、ブレーキに適用される第２の圧力量（例えば、より大きな車両を停止させるためのより大きな圧力）に対応する第２の減速を含んでよい。

さまざまな例示において、予測されるオブジェクト軌道は、車両の予測システムによって決定されるように、オブジェクト２２２（１）および２２２（２）の予測されるモーションに基づいて決定されてよい。ある例示において、オブジェクト２２２（１）および２２２（２）に関連付けられる予測されるオブジェクト軌道は、アクティブ予測に基づいてよい。アクティブ予測は、オブジェクト２２２（１）および２２２（２）がそれぞれのアクション２０４、２０６、２０８、および２１０に基づいて、有し得る可能性のあるおよび／または起こり得る反応を決定することを含む。例えば、車両コンピューティングシステムは、車両２０２と同一の道路にあり、反対方向に走行しているオブジェクト２２２（２）が第３のアクション２０８に示されるように交差点における車線変更を実行することに応答して車線での位置を調整し得るということを決定してよい。したがって、車両コンピューティングシステムは、予測されるオブジェクト軌道が（推定される位置２２６（２）に示される）右へのわずかな逸脱を含み得るということを決定してよい。さまざまな例示において、予測されるオブジェクト軌道は、本明細書に組み込まれる米国特許出願に説明されるものなどの環境１００、ヒートマップ、時相論理式、木探索法、および／または機械学習技術のトップダウン表現を利用して決定されてよい。

図２に図示されるように、それぞれのアクション２０４、２０６、２０８、および２１０に対して、車両コンピューティングシステムは、車両２０２およびオブジェクト２２２（１）およびオブジェクト２２２（２）を時間期間（例えば、５秒、８秒、１２秒など）の間に環境における前方に投影することによって、将来の状態（例えば、推定される状態）をシミュレートすることができる。第１の推定される状態は、オブジェクト２２２（１）に関連付けられる第１の推定されるオブジェクト位置２２４（１）（例えば、オブジェクト位置２２４（１））、オブジェクト２２２（２）に関連付けられる第１の推定されるオブジェクト位置２２６（１）、および第１の推定される車両位置２２８（１）を含んでよく、第２の推定される状態は、オブジェクト２２２（１）に関連付けられる第２の推定されるオブジェクト位置２２４（２）、オブジェクト２２２（２）に関連付けられる第２の推定されるオブジェクト位置２２６（２）、および第２の推定される車両位置２２８（２）などを含んでよい。推定されるオブジェクト位置２２４（１）、２２４（２）、２２４（３）および２２６（１）、２２６（２）、２２６（３）は、それぞれのオブジェクト２２２（１）および２２２（２）に関連付けられる予測されるオブジェクト軌道に基づいて決定されてよい。第１のオブジェクト２２２（１）、第２のオブジェクト２２２（２）、および車両２０２にそれぞれ関連付けられる３つの位置２２４（１）、２２４（２）、２２４（３）、２２６（１）、２２６（２）、２２６（３）、および２２８（１）、２２８（２）、２２８（３）として説明されるが、３つの推定される状態の視覚的表現におけるような時間期間にわたって、オブジェクト２２２（１）、２２２（２）、および車両２０２に対して、より多くまたはより少ない数の推定される状態（例えば、位置）が決定されてよい。

さまざまな例示において、車両コンピューティングシステムは、所定のレート（例えば、１０ヘルツ、２０ヘルツ、５０ヘルツなど）で、時間期間（例えば、４秒、８秒、１０秒など）にわたって推定される状態（このように、推定されるオブジェクト位置２２４（１）、２２４（２）、２２４（３）、および２２６（１）、２２６（２）、２２６（３）、および推定される車両位置２２８（１）、２２８（２）、および２２８（３））を決定してよい。少なくとも１つの例示において、推定される状態は、１０ヘルツ（例えば、８秒の時間期間にわたって８０個の推定される状態）のレートで実行されてよい。このような例示において、推定される位置２２４（１）、２２４（２）、２２４（３）、２２６（１）、２２６（２）、２２６（３）、および２２８（１）、２２８（２）、および２２８（３）は、０．１秒間隔で決定されてよい。ある例示において、車両コンピューティングデバイスは、実質的に平行なさまざまな時間間隔で車両２０２ならびにオブジェクト２２２（１）および２２２（２）の推定される状態を決定してよい。このような例示において、車両コンピューティングデバイスは、要求される時間を減少させてよく、時間期間にわたって一組の推定される状態を生成する。

図２に図示されるように、車両コンピューティングシステムは、第１のアクション２０４に関連付けられる第１のコスト２１２、第２のアクション２０６に関連付けられる第２のコスト２１４、第３のアクション２０８に関連付けられる第３のコスト２１６、第４のアクション２１０に関連付けられる第４のコスト２１８を決定することができる。ある例示において、車両コンピューティングシステムは、車両２０２およびオブジェクト２２２（１）および２２２（２）の推定される位置、ならびに／またはそれぞれのアクション２０４、２０６、２０８、２１０に関連付けられるオブジェクトおよび車両軌道に基づいて、それぞれの推定される状態に関連付けられるコストを決定してよい。このような例示において、コスト２１２、２１４、２１６、および２１８は、それぞれ推定される位置に関連付けられるコストの合計を表現してよい。例えば、第１のコスト２１２に関連付けられる１６の安全性のコストは、それぞれの推定される状態に対して算定されるそれぞれの安全性のコストの合計のコストを表現してよい。例えば、第１の推定される状態は、第１の推定される車両位置２２８（１）から第１の推定されるオブジェクト位置２２２（１）に関連付けられる第１の推定されるオブジェクト位置２２４（１）および／または第２のオブジェクト２２２（２）に関連付けられる第１の推定されるオブジェクト位置２２６（１）までの距離のために少なくとも０の第１の安全性のコストを含んでよく、第２の推定される状態は、車両２０２とオブジェクト２２２（１）および２２２（２）との間のそれぞれの距離が収束する軌道に接近するにつれて、２の第２の安全性のコストを含んでよく、第３の推定される状態は、少なくとも第３の推定される車両位置２２８（３）と第３の推定されるオブジェクト位置２２４（３）との間の限定された距離に基づいて１４の第３の安全性のコストを含んでよい。言うまでもなく、本明細書で説明されるすべてのコストを参照して、任意の数値は、さまざまなコストが互いにどのように比較され得るかを示すためだけの例示的な目的であり、実際の数を反映するものではない。

上記のように、コスト２１２、２１４、２１６、および２１８は、１つまたは複数の因子に基づいて決定されてよい。１つまたは複数の因子は、車両２０２および／またはオブジェクト２２２（１）および２２２（２）の安全性（例えば、車両２０２とオブジェクト２２２（１）および２２２（２）との間の衝突を回避すること）、快適性（例えば、車両２０２および／またはオブジェクト２２２（１）および２２２（２）による突然の動きの欠如）、進行（例えば、車両２０２および／またはオブジェクト２２２（１）および２２２（２）の目的地への動き）、運用規則（例えば、道路の規則、法律、条令、規制など）などを含んでよい。

安全性、快適性、進行、および／または道路の規則に関連付けられる合計のコストとして説明されるが、それぞれの因子コストは、車両２０２および／またはオブジェクト２２２（１）および２２２（１）に対する安全性、快適性、進行、および／または道路の規則を含んでよい。例えば、第２のアクション２０６は、乗員にとってわずかに不快となり得るレートで、初期位置２２０からの車両２０２の加速度を含んでよい。車両コンピューティングシステムは、乗員の不快感が車両２０２に対して２の快適性のコストを含み得るということを決定してよい。さらに、車両コンピューティングシステムは、車両２０２が交差点を横断することに応答して、オブジェクト２２２（１）がわずかな減速を含む予測されるオブジェクト軌道を有し得るということを決定してよい。車両コンピューティングシステムは、オブジェクト２２２（１）の２の快適性のコストを評価してよい。車両の快適性のコストおよびオブジェクト２２２（１）快適性のコストを組み合わせることで、車両コンピューティングシステムは、第２のアクションに対する合計の快適性のコストが４であるということを決定してよい。別の例示において、車両コンピューティングシステムは、第３のアクション２０８が右車線から左車線に車線変更するわずかな横方向の加速度を含むということを決定してよい。初期位置２２０から進行する間のわずかな横方向の加速度に基づいて、車両コンピューティングシステムは、車両の１の快適性のコストを評価してよい。さらに、車両コンピューティングシステムは、わずかな横方向の加速度を含み得るオブジェクト２２２（２）に関連付けられる予測される軌道が車線での位置を右にゆっくりと調整するということを予測してよい。車両コンピューティングシステムは、オブジェクトの１の快適性のコストを第３のアクション２０８に評価してよく、２の合計の快適性のコストをもたらす。さらに別の例示に対して、第４のアクション２１０は、第４のアクション２１０がオブジェクト２２２（１）および２２２（１）に影響を与えることのないということの決定に基づくような車両２０２だけに関連付けられるコストをもたらしてよい。したがって、安全性、快適性、進行、および運用規則（ラベル付けされた道路の規則）コストは、車両に関連付けられる。

ある例示において、それぞれの因子コストは、オブジェクト２２２（１）および２２２（２）のうちの１つまたは複数に関連付けられる安全性、快適性、進行、および／または道路の規則を含んでよい。このような例示において、車両コンピューティングシステムは、アクション２０４、２０６、２０８、または２１０がオブジェクト２２２（１）および２２２（２）に有し得る影響に基づいて、とるべきアクション２０４、２０６、２０８、または２１０を決定するように構成されてよい。例えば、車両コンピューティングシステムは、第１のアクションにおいて車両２０２が交差点を横断することに応答して、オブジェクト２２２（１）が第１の減速で減速し得るということを予測してよい。第１の減速は、オブジェクト２２２（１）の操作者および／または乗員に対するような不快な減速を含んでよい。したがって、快適性のコストは、オブジェクトの６の快適性のコストを含んでよい。しかしながら、第２のアクション２０６は、オブジェクト２２２（１）を第２の減速で減速させ、第２の減速は、第１の減速よりもわずかに低くなると予測されてよい。第２の減速は、第１の減速よりも低い（例えば、不快感がより少ない）ため、オブジェクトの快適性のコストは、４であると決定されてよい。別の例示に対して、第１のアクション２０４に応答して第１のオブジェクト２２２（１）に関連付けられる第１の減速は、第１のオブジェクト２２２（１）が目的地に到達することに遅延をもたらすことがある。したがって、車両コンピューティングシステムは、２の進行のコストを評価してよい。しかしながら、第２のアクション２０６に応答してオブジェクト２２２（１）の第２の減速は、より少ない遅延をもたらすことができ、これによって、１の進行のコストをもたらす。上記のように、進行のコスト値は、アクション２０４、２０６、２０８、または２１０に応答してオブジェクト２２２（１）が遅延する秒数を表現してよく、または、遅延のレベルに対応する値（例えば、１の進行のコストをもたらす非常に短い遅延（例えば、１秒よりも短いなど）、２の進行のコストをもたらす短い遅延（例えば、１～３秒など）など）を表現してもよい。このようなコストのうちの任意の１つまたは複数は、アクションの変化および／または車両の欠如に基づいて、予測される軌道のうちの１つまたは複数に対して決定されてよい。

運用規則のコスト（道路の規則）は、道路の規則（例えば、運輸省の法律、条令、規制など）、良好な運転の規則、地域の運転習慣（例えば、一般的な運転慣行）、運転作法（例えば、別の自動車が自転車専用車線などを占有しないで右折するための空間を提供するために車線での位置を調整すること）に基づいてよい。さまざまな例示において、推定される状態に関連付けられる運用規則のコストは、破られたおよび／または満たされている１つまたは複数の規則に基づいて算定されてよい。このような例示において、運用規則のコストは、満たされたもしくは履行された規則に基づいて、破られたもしくは履行されていない、および／または減少した規則（例えば、規則、習慣、作法など）に基づいて増加されてよい。説明的な例示において、第１のアクション２０４および第２のアクション２０６は、共に、交差点における優先権を有するオブジェクト２２２（１）に基づいて、１の運用規則のコストを含む。第３のアクション２０８は、交差点内の車線変更に基づいて６の運用規則のコストを含む。

さまざまな例示において、車両コンピューティングシステムは、それぞれのアクション２０４、２０６、２０８、および２１０に関連付けられるコスト２１２、２１４、２１６、および２１８を比較してよく、取るべきアクション（例えば、車両を制御する）を決定してよい。ある例示において、車両コンピューティングシステムは、共に関連付けられる最低コストに基づいてとるべきアクションを選択してよい。さまざまな例示において、車両コンピューティングシステムは、因子に関連付けられる閾値レベルを下回る因子コストを有するアクション２０４、２０６、２０８、および２１０を識別してよく、識別されたアクションから最低コストのアクションを選択してよい。例えば、閾値の安全性のコストは、１０の値を含んでよい。第１のアクション２０４は、閾値の安全性のコストを上回る安全性のコストを含むため、車両コンピューティングシステムは、プラニングの考慮事項から第１のアクション２０４を無視してよい。ある例示において、車両コンピューティングシステムは、アクション２０４、２０６、２０８、または２１０に関連付けられる因子コストが閾値を上回っているとして識別してよく、アクション２０４、２０６、２０８、または２１０に関連付けられるコスト値の決定（例えば、算定）を停止してよい。例えば、車両コンピューティングシステムは、第３の推定される状態の後で、第１のアクション２０４が閾値を上回る安全性のコストを有するということを決定してよい。安全性のコストが閾値を上回っているということの決定に基づいて、車両コンピューティングシステムは、推定される状態を生成することを停止してよく、共に関連付けられるコストを決定してよい。このような例示において、本明細書で説明される技術は、他の（実行可能な）アクションに関連付けられるコストを決定するためにさらなるコンピューティングリソースを提供してよく、これによって車両コンピューティングシステムの機能を改善する。

図３は、環境１００における車両１０２のような環境３００における車両３０２の図であり、ここで例示的なコストベースの経路決定システムは、二次的なオブジェクト３０４（２）に対するアクションの影響に基づいてアクションに関連付けられるコストを決定することができる。上記のように、車両コンピューティングシステムは、図１に図示されるアクション１１０（１）、１１０（２）、１１０（３）、１１０（４）、および１１０（５）、および／または図２に図示されるアクション２０４、２０６、２０８、および２１０のような１つまたは複数のアクションを決定してよい。図３に図示されるアクションは、２方向の交差点３１２での初期位置３０６から加速する車両３０２を含み、ここで、主要なオブジェクト３０４（１）および二次的なオブジェクト３０４（２）のような交差する道路を走行するオブジェクト３０４は、優先権を有する。

さまざまな例示において、車両コンピューティングシステムは、車両、別の車両の、および／または環境において取り付けられたうちの１つまたは複数のセンサーによってキャプチャされたセンサーデータに基づくようなオブジェクト３０４を検出してよい。ある例示において、車両コンピューティングシステムは、オブジェクト３０４を主要なオブジェクト３０４（１）および二次的なオブジェクト３０４（２）として指定してよい。二次的なオブジェクト３０４（２）は、二次的なオブジェクト３０４（２）が主要なオブジェクト３０４（１）に続いている（例えば、実質的に同様の進行方向を有して、主要なオブジェクト３０４（１）の後ろに位置される）ということの決定に基づくように指定されてよい。ある例示において、二次的なオブジェクト３０４（２）としての指定は、二次的なオブジェクト３０４（２）が主要なオブジェクト３０４（１）の閾値距離（例えば、１０フィート、４メートルなど）内にあるということの決定に基づいてよい。このような例示において、閾値距離は、オブジェクト３０４の速度、環境に関連付けられる速度制限などに基づいて決定されてよい。さまざまな例示において、二次的なオブジェクト３０４（２）としての指定は、二次的なオブジェクト３０４（２）が車両３０２のアクション（例えば、オブジェクト間の同様の予測される軌道など）に応答するような主要なオブジェクト３０４（１）と同様の方法で反応すると予測される決定に基づいてよい。

ある例示において、車両コンピューティングシステムは、アクションに基づいてオブジェクト３０４の１つまたは複数の予測される軌道を決定してよい。少なくとも１つの例示において、車両コンピューティングシステムは、主要なオブジェクト３０４（１）の１つまたは複数の予測される軌道および主要なオブジェクト３０４（１）に関連付けられる予測される軌道の二次的なオブジェクト３０４（２）に対する影響を決定してよい。さまざまな例示において、車両コンピューティングシステムは、指定されたレート（例えば、５ヘルツ、１０ヘルツなど）で、時間期間（例えば、６秒、７秒、８秒など）にわたって車両３０２およびオブジェクト３０４を前方に投影してよい。推定される車両位置３０８（１）、３０８（２）および３０８（３）ならびに推定されるオブジェクト位置３１０（１）、３１０（２）、および３１０（３）は、例示の目的のために提供されて、より多くまたはより少ない数の推定されるオブジェクト位置は、車両コンピューティングシステムによって決定されてよい。さらに、主要なオブジェクト３０４（１）に関連付けられる推定されるオブジェクト位置３１０（１）、３１０（２）、および３１０（３）として説明されるが、車両コンピューティングシステムは、二次的なオブジェクト３０４（２）の推定されるオブジェクト位置を追加的に生成してよい。

上記のように、推定される車両位置３０８（１）、３０８（２）および３０８（３）ならびに推定されるオブジェクト位置３１０（１）、３１０（２）、および３１０（３）に部分的に基づいて、車両コンピューティングシステムは、アクションが主要なオブジェクト３０４（１）に有する影響に基づいて合計のアクションコストを決定してよい。合計のアクションコストは、１つまたは複数の因子（例えば、安全性、快適性、進行、運用規則など）に関連付けられるコストを含んでよい。ある例示において、車両コンピューティングシステムは、主要なオブジェクト３０４（１）に関連付けられる合計のアクションコスト（例えば、アクションが因子を考慮する主要なオブジェクト３０４（１）に有する合計の影響）を二次的なオブジェクト３０４（２）に適用してよい。このような例示において、オブジェクト３０４に関連付けられる合計のアクションコストは、２倍にされてよい。

ある例示において、車両コンピューティングシステムは、安全性のコスト、快適性のコスト、進行のコスト、および主要なオブジェクト３０４（１）に関連付けられる運用規則のコストを決定してよく、コスト（安全性、快適性、進行、運用規則）の一部またはすべてを二次的なオブジェクト３０４（２）に適用してよい。このような例示において、選択のコストは、アクションに関連付けられる主要なオブジェクト３０４（１）の予測される軌道に応答して、快適性および進行のような二次的なオブジェクト３０４（２）に影響を与えることとなる因子に関連付けられてよい。例えば、図示されるように、アクションは、車両３０２が主要なオブジェクト３０４（１）の前で交差点を横断することを含んでよい。アクションに応答して、車両コンピューティングデバイスは、主要なオブジェクト３０４（１）が交差点に入る前に減速するためにブレーキを適用することとなることが起こり得ることによって、車両３０２との衝突を回避するということを決定してよい。主要なオブジェクト３０４（１）の負の加速度に基づいて、車両コンピューティングシステムは、アクションに関連付けられるオブジェクトの快適性のコストは、４であり、アクションに関連付けられるオブジェクトの進行のコストは、２であるということを決定してよい。さらに、車両コンピューティングシステムは、主要なオブジェクト３０４（１）の負の加速度が二次的なオブジェクト３０４（２）も減速させ得ることによって、主要なオブジェクト３０４（１）との衝突を回避するということの決定をしてよい。そのため、車両コンピューティングシステムは、４のオブジェクトの快適性のコストおよび２のオブジェクトの進行のコストを二次的なオブジェクト３０４（２）に適用してよく、８のオブジェクトの合計の快適性のコストおよび４のオブジェクトの合計の進行のコストをもたらす。

さまざまな例示において、車両コンピューティングシステムは、二次的なオブジェクト３０４（２）に関連付けられるコストが主要なオブジェクト３０４（１）に関連付けられるコストの一部またはすべてのパーセンテージ（例えば、５０％、７５％など）を含むということを決定してよい。上記からの例示用いて、主要なオブジェクト３０４（１）は、４の快適性のコストおよび２のオブジェクトの進行のコストと評価されてよい。車両コンピューティングシステムは、二次的なオブジェクト３０４（２）がそれほど減速する必要がないこととなり、それ故に、３のオブジェクトの快適性のコストおよび１．５のオブジェクトの進行のコスト（例えば、主要なオブジェクトのコストの７５％）を適用することとなるということを決定してよい。ある例示において、パーセンテージは、主要なオブジェクト３０４（１）と二次的なオブジェクト３０４（２）との間の距離に基づいてよい。このような例示において、すぐ後ろから続く（例えば、自動車２台分の長さ以内、２０フィート以内など）二次的なオブジェクト３０４（２）は、より大きな影響を受けることがあり、こういうわけで、より高いパーセンテージ（例えば、８０％、８５％など）が適用されることがあり、主要なオブジェクト３０４（１）（例えば、１０メートル、自動車３台分の長さなど）後ろからより長い距離に続く二次的なオブジェクト３０４（２）は、より低いパーセンテージ（例えば、５０％、２５％など）が適用されることがある。

さまざまな例示において、車両コンピューティングシステムは、主要なオブジェクト３０４（１）（例えば、二次的なオブジェクト３０４（２）、三次的なオブジェクトなど）から離れた車両の数に基づいてパーセンテージを決定してよい。ある例示において、車両コンピューティングシステムは、二次的なオブジェクト３０４（２）に関連付けられるコストが主要なオブジェクト３０４（１）に適用されるコストの第１のパーセンテージを含み、三次的なオブジェクト３０４（１）に関連付けられるコストは、主要なオブジェクト３０４（１）に適用されるコストの第２のパーセンテージを含むということを決定してよい。このような例示において、第２のパーセンテージは、第１のパーセンテージよりも小さくてよい。例えば、二次的なオブジェクト３０４（２）に関連付けられるコストは、主要なオブジェクト３０４（１）に関連付けられるコストの７５％であってよく、三次的なオブジェクトに関連付けられるコストは、主要なオブジェクト３０４（１）に関連付けられるコストの５０％であってよい。ある例示において、車両コンピューティングシステムは、二次的なオブジェクト３０４（２）に関連付けられるコストが主要なオブジェクト３０４（１）に適用されるコストのパーセンテージを含み、三次的なオブジェクト３０４（１）に関連付けられるコストは、二次的なオブジェクト３０４（２）に適用されるコストのパーセンテージを含むということを決定してよい。例えば、二次的なオブジェクト３０４（２）に関連付けられるコストは、主要なオブジェクト３０４（１）に関連付けられるコストの８０％であってよく、三次的なオブジェクトに関連付けられるコストは、二次的なオブジェクト３０４（２）に関連付けられるコストの８０％であってよい。

図４は、環境１００における車両１０２のような環境５００における車両４０２の図であり、ここで、例示的なコストベースの経路決定システムは、閉塞区域４０４を識別して、部分的に閉塞区域４０４に基づいて取るべきアクションを決定するように構成されてよい。１つまたは複数の障害物４０８が閉塞区域４０４に関連付けられる領域を遮断するため、閉塞区域４０４は、車両コンピューティングシステムがオブジェクト１０４のような１つまたは複数のオブジェクト４０６を検出することが可能ではないことがある領域を画定してよい。説明的な例示において、閉塞区域４０４は、障害物４０８（例えば、駐車した自動車）によって遮断された道路４１０の一部を含んでよい。他の例示において、閉塞区域４０４は、歩道、通路、自転車専用車線、または１つまたは複数のオブジェクト４０６の視界が閉塞され得る他の領域を含んでよい。

さまざまな例示において、車両コンピューティングシステムは、閉塞区域４０４の前方境界４１２および後方境界４１４を識別してよい。前方境界４１２は、閉塞区域４０４の前方の大部分のラインを含んでよく、ここの前で、車両コンピューティングシステムは、オブジェクト４０６を検出するように構成されてよい。後方の境界４１４は、閉塞区域４０４の最も遠い後方のラインを含んでよく、ここで結び付けられる境界で、車両コンピューティングシステムは、オブジェクト４０６を検出するように構成されてよい。さまざまな例示において、車両コンピューティングシステムは、１つまたは複数の閉塞された道路領域４１６を識別するように構成されてよい。閉塞された道路領域４１６は、前方の境界から後方の境界４１４まで延長してよい。説明的な例示は、閉塞された道路領域４１６は、それぞれが道路４１０のセクションの個々の車線に関連付けられる。

さまざまな例示において、車両コンピューティングシステムは、道路４１０のセクションに関連付けられる識別子４１８を決定するように構成されてよい。識別子４１８は、環境４００において動作するために車両コンピューティングデバイスによって利用される道路ネットワークの一部に関連付けられる一意の識別子を表現してよい。道路ネットワークの一部は、リモートコンピューティングデバイスを介して、マップデータなどに事前に定義されてよく、車両コンピューティングデバイスに格納され、および／またはアクセス可能であってよい。

さまざまな例示において、車両コンピューティングシステムは、オブジェクト４０６が閉塞区域４０４において走行し得るという確率を決定するように構成されてよい。ある例示において、確率は、識別子４１８および共に関連付けられる事前に記録されたセンサーデータに基づいてよい。ある例示において、確率は、時刻、曜日、月などに基づいてよい。少なくとも１つの例示において、確率は、機械学習技術を利用して決定されてよい。このような例示において、１つまたは複数の機械学習モデルは、さまざまな時間でキャプチャされた事前に記録されたセンサーデータを利用して訓練されてよく、オブジェクト４０６が閉塞区域４０４において動作し得るという確率を決定する。さまざまな例示において、車両コンピューティングシステムは、オブジェクト４０６が「Radar Spatial Estimation」と題された２０１８年９月２８日に出願された米国特許出願第１６／１４７，１７７号、および「Occlusion Aware Planning」と題された２０１８年６月１８日に出願された米国特許出願第１６／０１１，４３６号に説明される技術に従って閉塞区域４０４において動作し得るという確率を決定するように構成されてよく、これらの両方は、参照により本明細書に組み込まれる。

さまざまな例示において、オブジェクト４０６が閉塞区域４０４において動作し得るという確率に基づいて、車両コンピューティングシステムは、予測されるオブジェクト４２０が閉塞区域４０４において動作しているということが起こり得るということを決定（例えば、予測されるオブジェクト４２０を生成してよく、アクションの決定における予測されるオブジェクトに関連付けられるデータを含む）してよい。さまざまな例示において、車両コンピューティングシステムは、オブジェクト４０６が閉塞区域４０４において走行し得るという確率が閾値確率（例えば、＞２０％、＞３０％、＞５０％など）を上回っているということの決定に基づいて、予測されるオブジェクト４２０を生成してよい。例示的な例示において、車両コンピューティングシステムは、確率が閾値確率を上回っているということを決定してよく、道路４１０のセクションの右車線で予測されるオブジェクト４２０を生成してよい。

さらに、確率が閾値を上回っているということの決定に基づいて、車両コンピューティングシステムは、１つまたは複数の予測されるオブジェクト軌道４２２を決定してよい。上記のように、予測されるオブジェクト軌道４２２は、予測されるオブジェクト４２０が車両４０２がとるべきアクションに応答して走行し得る経路および／または速度を含んでよい。予測されるオブジェクト軌道４２２は、識別子４１８（例えば、道路４１０のセクション）に関連付けられる事前に記録されたセンサーデータで訓練された機械学習アルゴリズムおよび／または本明細書で説明されるオブジェクト軌道を決定するための他の技術を利用して決定されてよい。さまざまな例示において、車両コンピューティングシステムは、車両４０２が初期位置４２４からとり得るそれぞれのアクションに関連付けられる予測されるオブジェクト軌道４２２を決定してよい。

さまざまな例示において、車両コンピューティングシステムは、環境４００における予測されるオブジェクト軌道４２２および／または検出されたオブジェクト４０６に関連付けられる軌道に基づいて、それぞれのアクションに関連付けられるコストを算定してよい。このような例示において、車両コンピューティングデバイスは、予測されるオブジェクト４２０および／または検出されたオブジェクト４０６に関連付けられる安全性のコスト、快適性のコスト、進行のコスト、および／または運用規則のコストを決定してよい。ある例示において、検出されたオブジェクト４０６は、二次的なオブジェクト３０４（２）のような予測されるオブジェクト４２０に対する二次的なオブジェクトとみなされてよい。このような例示において、共に関連付けられるコストは、図３に関して上記の二次的なオブジェクトのコスト決定技術を用いて決定されてよい。

さまざまな例示において、車両コンピューティングデバイスは、予測されるオブジェクト４２０、検出されたオブジェクト４０６、および／または車両４０２に関連付けられるコスト（例えば、安全性のコスト、快適性のコスト、進行のコスト、運用規則のコストなど）に基づいて、それぞれのアクションに関連付けられる合計のコストを決定してよい。少なくとも１つの例示において、最低コストを有するアクションは、車両に対してとるべきために車両コンピューティングシステムによって選択されてよい。ある例示において、車両コンピューティングデバイスは、アクションに従って車両を制御させてよい。

図５は、環境１００における車両１０２のような環境５００における車両５０２の図であり、ここで、例示的なコストベースの経路決定システムは、優先権を有するオブジェクト５０６の経路５０４が遮断されるということの決定に基づいてとるべきアクションを決定するように構成されてよい。説明的な例示において、オブジェクト５０６の経路５０４は、歩行者５０８によって遮断される。他の例示において、オブジェクト５０６の経路５０４は、工事区域、事故、前を通過する自転車などのような任意の数の他の理由によって遮断されてよい。本明細書で説明されるように、経路５０４の遮断は、実質的に０の速度を有するオブジェクト５０６に関連付けられる予測されるオブジェクト軌道をもたらしてよい。

さまざまな例示において、車両５０２は、車両５０２のセンサーおよび／または１つまたは複数のリモートセンサーによってキャプチャされたセンサーデータに基づいて、環境５００におけるオブジェクト１０４のようなオブジェクト５０６を検出してよい。ある例示において、車両コンピューティングシステムは、環境５００および／または交差点５１０に関連付けられる道路の規則に基づくようなオブジェクト５０６が優先権を有するということを決定してよい。例えば、車両コンピューティングシステムは、オブジェクト５０６が車両５０２の前に４方向の停止である交差点５１０に到着したということを決定してよく、それ故に、オブジェクト５０６に優先権を与える。別の例示に対して、交差点は、２方向の停止を含んでよく、ここで、車両５０２は、停止することが要求されているが、オブジェクト５０６は、要求されていない、それ故に、オブジェクト５０６に優先権を与える。

説明的な例示において、車両コンピューティングシステムは、センサーデータに基づくような、オブジェクト５０６の経路５０４を遮断する歩行者５０８を検出してよい。ある例示において、歩行者５０８は、車両コンピューティングシステムによって歩行者として分類される第２のオブジェクトを含んでよい。さまざまな例示において、車両コンピューティングシステムは、センサーデータに基づいて、歩行者５０８に関連付けられる１つまたは複数の軌道５１２を決定してよい。さまざまな例示において、軌道５１２は、歩行者５０８としての分類、分類に関連付けられる最高速度、一定の運動学的運動（例えば、一定の速度、進行方向など）のようなさまざまな因子に基づいて決定されてよい。さまざまな例示において、軌道５１２は、本明細書に組み込まれる米国特許出願において説明されるような環境５００、ヒートマップ、時相論理式、木探索法、機械学習技術、および／または予測されるオブジェクト５０６および／または環境における歩行者５０８の動きに対する任意の他の技術のトップダウン表現を利用して決定されてよい。ある例示において、車両コンピューティングシステムは、歩行者５０８としての分類に基づいて軌道５１２を決定してよい。このような例示において、軌道５１２は、歩行者５０８の平均速度、歩行者５０８の最高速度などに基づいてよい。ある例示において、軌道５１２は、歩行者５０８の１つまたは複数の特徴に基づいて決定されてよい。特徴は、身体の位置決め、衣類、履物などを含んでよい。例えば、ビジネスウェアの歩行者５０８に関連付けられる軌道５１２は、時速２マイルであってよく、一方、ランニングウェアを着用している歩行者５０８に関連付けられる軌道５１２は、時速４マイルであってよい（ただし、任意の値が本明細書で用いられることが可能である）。

さまざまな例示において、軌道５１２に基づいて、車両コンピューティングシステムは、経路５０４の遮断に関連付けられる時間遅延（例えば、オブジェクトの時間遅延）を決定してよい。オブジェクトの時間遅延は、歩行者が経路５０４を横断し、オブジェクト５０６に関連付けられる車線を横断し、および／またはオブジェクト５０６に関連付けられる道路を横断するために要求される時間を含んでよい。さまざまな例示において、車両コンピューティングシステムは、オブジェクトの時間遅延に部分的に基づいて、交差点５１０でとるべき１つまたは複数のアクションを決定してよい。例えば、車両コンピューティングシステムは、車両５０２が、オブジェクト５０６が横断することを待つために初期位置５１４（第１のアクション）にとどまってよく、第１の加速度でオブジェクト５０６の前で加速してもよく（第２のアクション）、および第２の加速度でオブジェクト５０６の前で加速してもよい（第３のアクション）ということを決定してよい。

さまざまな例示において、車両コンピューティングシステムは、１つまたは複数の因子に基づいて、１つまたは複数のアクションのそれぞれのアクションに関連付けられるコストを算定してよい。上記のように、１つまたは複数の因子は、安全性、快適性、進行、および／または運用規則を含んでよい。説明的な例示において、車両コンピューティングシステムは、少なくとも、安全性および運用規則に関連付けられるオブジェクト５０６および車両５０２のコスト、ならびに快適性に関連付けられるオブジェクト５０６のコストがそれぞれのアクションに対して同一であり得るということを決定してよい。そのため、車両コンピューティングシステムは、オブジェクト５０６の進行ならびに／または車両５０２の快適性および進行に関連付けられるコストを決定してよい。

さまざまな例示において、オブジェクト５０６に関連付けられる進行のコストは、オブジェクトの時間遅延（例えば、歩行者５０８のためのオブジェクト５０６の動きの遅延）に基づいて決定されてよい。ある例示において、車両コンピューティングシステムは、交差点５１０を通ってオブジェクト５０６の経路５０４の外に加速することに要求される時間を決定してよい。このような例示において、進行のコストは、オブジェクト５０６の前を通過するために要求される時間とオブジェクトの時間遅延との間の差に関連付けられてよい。差は、車両５０２アクションに基づいて、前方運動からのオブジェクト５０６のさらなる遅延を表現してよい。例えば、加速度を有するアクションは、オブジェクトの１秒間のさらなる遅延を引き起こすことがあり、オブジェクト５０６の１の進行のコストをもたらす。別の例示において、加速度を有するアクションは、オブジェクト５０６のさらなる遅延を引き起こすことなく、アクションに関連付けられるオブジェクト５０６の０の進行のコストをもたらす。

上記のように、車両５０２の快適性のコストおよび／または進行のコストは、初期位置５１４からの加速度に基づいてよい。例えば、車両コンピューティングシステムは、第１の加速度を有するアクションに関連付けられる快適性のコストが１であり、進行のコストが１であり、第２の加速度を有する第２のアクションに関連付けられる第２の快適性のコストが２であり、進行のコストが１であるということを決定してよく、第１の加速度は、第２の加速度よりも遅い（例えば、より快適である）。

さまざまな例示において、車両コンピューティングシステムは、１つまたは複数のアクションのそれぞれのアクションのそれぞれの合計のコスト（例えば、１つまたは複数の因子に関連付けられる決定されたコスト）に基づいて、とるべきアクションを決定してよい。さまざまな例示において、車両コンピューティングシステムは、アクションに基づいて車両を制御させてよい。

図６は、少なくとも部分的にアクション報酬に基づいて、とるべきアクション６０４を決定するように構成される環境１００における車両１０２のような環境６００における車両６０２を図示する。さまざまな例示において、アクション報酬は、アクションペナルティの反対（例えば、コストの増加）を含んでよい。このような例示において、アクション報酬は、アクション６０４に関連付けられるコストの減少をもたらしてよい。

ある例示において、車両コンピューティングシステムは、環境６００における１つまたは複数のオブジェクト６０６を検出してよい。車両コンピューティングシステムは、１つまたは複数のセンサーから受信したセンサーデータに基づいて、オブジェクト６０６を検出してよい。ある例示において、センサーは、例えば、カメラ、モーションディテクター、ライダー、レーダーのような車両６０２に搭載されるセンサーを含んでよい。ある例示において、センサーは、１つまたは複数のリモートセンサーを含んでよい。図６に図示されるように、車両コンピューティングデバイスは、車両６０２の後ろにあるオブジェクト６０６（１）を検出してよく、インジケーター６１０など（例えば、方向指示器、ウインカーなど）に基づいて、オブジェクト６０６（１）が交差点６０８で右折することを意図している（例えば、オブジェクト経路６１４をたどる）ということを決定してよい。

さまざまな例示において、車両コンピューティングシステムは、環境６００および／または検出されたオブジェクト６０６に基づいてとるべき１つまたは複数のアクション６０４を決定するように構成されてよい。例えば、停止標識６１２を有する交差点６０８に接近する車両６０２は、停止するまで減速すること（環境６００ベースの決定）が要求される。車両コンピューティングデバイスは、車両６０２が車線での位置を維持することを含む第１のアクション６０４（１）を実行してよく、または停止するまで減速しながら車線での位置を調整すること（オブジェクトベースの決定）を含む第２のアクション６０４（２）を実行してもよいということを決定よい。説明的な例示において、車両コンピューティングデバイスは、隣接する車線での第２のオブジェクト６０６（２）の検出に部分的に基づいて、左への車線変更が実行可能なオプションではないということを決定してよい。隣接する車線が占有されていない他の例示において、車両コンピューティングデバイスは、車線変更が実行可能なオプションであってよいということを決定してよい。

上記のように、車両コンピューティングシステムは、１つまたは複数の因子（例えば、安全性、快適性、進行、運用規則など）に基づいて、それぞれのアクション６０４に関連付けられるコストを決定してよい。さまざまな例示において、車両コンピューティングデバイスは、第２のアクション６０４（２）が車線での車両６０２の右側で動作するためにオブジェクト６０６（１）に対する十分な空間を提供してよいことによって、オブジェクト６０６（１）が共に関連付けられる目的地に到達するために要求される時間を減少させるということを決定してよい。ある例示において、車両コンピューティングデバイスは、アクション６０４（２）に対する進行報酬（例えば、アクション報酬）を評価してよい。ある例示において、進行報酬は、負のコストとして適用されてよい。このような例示において、進行報酬は、アクション６０４（２）の合計のコストの減少をもたらしてよい。車両コンピューティングデバイスは、アクション６０４が共に関連付けられる最低コストを有するということの決定に基づいて、取るべきアクションを決定してよい。例えば、第１のアクション６０４（１）および第２のアクション６０４（２）は、実質的に同一の安全性、快適性、および／または運用規則のコストを有してよい。したがって、進行報酬からもたらせられる合計のコストの低減は、共に関連付けられるより低いコストを有する第２のアクション６０４（２）をもたらしてよい。そのため、車両コンピューティングシステムは、車両がとるべきアクション６０４として第２のアクション６０４（２）を選択してよい。

さまざまな例示において、車両コンピューティングシステムは、安全性、快適性、および／または運用規則の因子がアクション６０４（１）および６０４（２）に対して実質的に同一であるということを決定してよい。このような例示において、車両コンピューティングシステムは、アクション報酬がアクションに適用されるかに対してアクション６０４の決定に焦点を当てる代わりに、安全性、快適性、および／または運用規則の因子に関連するコストを算定しないことがある。それ故に、車両コンピューティングシステムは、オブジェクト経路６１４に従って、オブジェクト６０６（１）に対して交差点６０８を通してより速く進行する能力を提供するために位置を調整する作法のため、アクション６０４（２）に適用されるアクション報酬に基づいて、アクション６０４（２）を決定してよい。

図７は、本明細書で説明される技術を実装するための例示的なシステム７００のブロック図である。少なくとも１つの例示において、システム７００は、車両１０２のような車両７０２を含んでよい。

車両７０２は、車両コンピューティングデバイス７０４、１つまたは複数のセンサーシステム７０６、１つまたは複数のエミッター７０８、１つまたは複数の通信接続７１０、少なくとも１つの直接接続７１２、および１つまたは複数の駆動システム７１４を含んでよい。

車両コンピューティングデバイス７０４は、１つまたは複数のプロセッサ７１６、および１つまたは複数のプロセッサ７１６と通信可能に結合されたメモリ７１８を含んでよい。説明される例示において、車両７０２は、自律車両であるが、車両７０２は、半自律車両のような任意の他のタイプの車両であることが可能であるか、または少なくとも画像キャプチャデバイス（例えば、カメラ対応のスマートフォン）を有する任意の他のシステムであることが可能である。説明される例示において、車両コンピューティングデバイス７０４のメモリ７１８は、ローカリゼーションコンポーネント７２０、知覚コンポーネント７２２、アクションのコストコンポーネント７３０および予測コンポーネント７３２を含むプラニングコンポーネント７２４、１つまたは複数のシステムコントローラー７２６、ならびに１つまたは複数のマップ７２８を格納する。例示的な目的のためにメモリ７１８に存在するように図７に図示されるが、ローカリゼーションコンポーネント７２０、知覚コンポーネント７２２、プラニングコンポーネント７２４、１つまたは複数のシステムコントローラー７２６、１つまたは複数のマップ７２８、アクションのコストコンポーネント７３０、および予測コンポーネント７３２は、追加的に、または代替的に、車両７０２にアクセス可能であってよい（例えば、１つまたは複数のコンピューティングデバイス７３６のメモリ７３４に対するように、車両７０２から離れたメモリ７０２に対して格納されるか、またはさもなければ、車両７０２からアクセス可能である）ということが企図される。例えば、メモリ７３４は、車両７０２のプランニングコンポーネント７２４によってアクセス可能なアクションのコストコンポーネント７３８を格納してよい。

少なくとも１つの例において、ローカリゼーションコンポーネント７２０は、車両７０２の位置および／または方向（例えば、ｘ位置、ｙ位置、ｚ位置、ロール、ピッチ、またはヨーのうちの１つまたは複数）を決定するためにセンサーシステム７０６からのデータを受信する機能を含んでよい。例えば、ローカリゼーションコンポーネント７２０は、マップ７２８からのような環境のマップを含む、および／または要求／受信することができ、マップ内の自律車両の位置および／または方向を継続的に決定することができる。ある例示において、ローカリゼーションコンポーネント７２０は、画像データ、ライダーデータ、レーダーデータ、ＩＭＵデータ、ＧＰＳデータ、ホイールエンコーダーデータなどを受信するためにＳＬＡＭ（simultaneous localization and mapping）、ＣＬＡＭＳ（calibration, localization and mapping, simultaneously）、相対ＳＬＡＭ、バンドル調整、非線形最小二乗最適化などを利用してよく、自律車両の位置を正確に決定する。ある例において、ローカリゼーションコンポーネント７２０は、本明細書で説明されるように、車両７０２のさまざまなコンポーネントにデータを提供してよく、オブジェクトの車両７０２の関連性を決定するための自律車両の初期位置を決定する。

ある例示において、知覚コンポーネント７２２は、オブジェクト検出、セグメンテーション、および／または分類を実行する機能を含んでよい。ある例示において、知覚コンポーネント７２２は、車両７０２に近接するオブジェクト（例えば、エンティティ）の存在、および／またはオブジェクトのタイプ（例えば、自動車、歩行者、自転車運転者、動物、建造物、樹木、路面、縁石、歩道、未知のものなど）としてのオブジェクトの分類を示す処理されたセンサーデータを提供してよい。ある例において、知覚コンポーネント７２２は、車両７０２に近接する静止エンティティの存在および／またはタイプとしての静止エンティティの分類（例えば、建造物、樹木、路面、縁石、歩道、未知のものなど）を示す処理されたセンサーデータを提供してよい。追加的または代替的な例示において、知覚コンポーネント７２２は、検出されたオブジェクト（例えば、追跡されたオブジェクト）および／またはオブジェクトが配置される環境に関連付けられる１つまたは複数の特徴を示す処理されたセンサーデータを提供してよい。ある例示において、オブジェクトに関連付けられる特徴は、ｘの位置（グローバルおよび／またはローカルの位置）、ｙの位置（グローバルおよび／またはローカルの位置）、ｚの位置（グローバルおよび／またはローカルの位置）、方向（例えば、ロール、ピッチ、ヨー）、オブジェクトのタイプ（例えば、分類）、オブジェクトの速度、オブジェクトの加速度、オブジェクトの範囲（サイズ）などを含んでよいが、これらに限定されない。環境に関連付けられる特徴は、環境における別のオブジェクトの存在、環境における別のオブジェクトの状態、時間帯、曜日、季節、気象条件、暗さ／明るさの表示などを含んでよいが、これらには限定されない。

一般に、プラニングコンポーネント７２４は、環境を横断するために車両７０２がたどる経路を決定してよい。例えば、プランニングコンポーネント７２４は、さまざまなルートおよび車両軌道、ならびにさまざまな詳細のレベルを決定してよい。例えば、プランニングコンポーネント７２４は、第１の位置（例えば、現在位置）から第２の位置（例えば、対象位置）まで走行する経路を決定してよい。この説明の目的のために、ルートは、２つの位置との間を走行するための連続するウェイポイント含んでよい。非限定的な例示として、ウェイポイントは、車道、交差点、全地球測位システム（ＧＰＳ）の座標などを含む。さらに、プランニングコンポーネント７２４は、第１の位置から第２の位置までルートの少なくとも一部に沿って自律車両を誘導するための命令を生成してよい。少なくとも１つの例示において、プランニングコンポーネント７２４は、連続するウェイポイントにおける第１のウェイポイントから連続するウェイポイントにおける第２のウェイポイントにどのように自律車両を誘導するかを決定してよい。ある例示において、命令は、車両軌道であってよく、または軌道の一部であってもよい。ある例において、多様な軌道は、後退ホライズン技術（receding horizon technique）に従って（例えば、技術的な許容範囲内で）実質的に同時に生成されてよく、ここで、多様な軌道のうちの１つは、車両７０２に対して選択され、ナビゲートする。

さまざまな例示において、ルートは、本明細書で説明されるように、プラニングコンポーネント７２４がアクションコストに基づいて選択する１つまたは複数のアクションのアクションを含んでよい。このような例示において、プラニングコンポーネント７２４は、環境に適用可能な１つまたは複数のアクションを決定するように構成されるアクションのコストコンポーネント７３０を含んでよい。アクションは、車両７０２が実行し得る参照アクションおよびサブアクションを含んでよい。ある例示において、アクションのコストコンポーネント７３０は、１つまたは複数のアクションのそれぞれのアクションに関連付けられる１つまたは複数の予測されるオブジェクト軌道を受信してよい。例えば、予測コンポーネント７３２は、アクションを実行している車両７０２に対するオブジェクトの予測される反応に基づいて、車両７０２から閾値距離内のオブジェクトに対する１つまたは複数の予測される軌道を生成してよい。ある例示において、予測コンポーネント７３２は、オブジェクトのトレースを測定してよく、観察および予測される動作に基づいてオブジェクトに対する軌道を生成してよい。ある例示において、予測コンポーネント７３２は、本明細書を参照することによって組み込まれる米国特許出願において説明されるように、機械学習技術、環境のトップダウン表現、ヒートマップ、時相論理式、および／または木探索法のうちの１つまたは複数を利用してよく、予測されるオブジェクト軌道を決定する。

さまざまな例示において、アクションのコストコンポーネント７３０は、安全性、快適性、進行、および／または運用規則のような１つまたは複数の因子に基づいて、それぞれのアクションに関連付けられるコストを決定してよい。ある例示において、コストは、アクションに関連付けられる予測されるオブジェクト軌道および／または車両に関連付けられるコストに基づくなどオブジェクトに関連付けられてよい。さまざまな例示において、プラニングコンポーネント７２４は、アクションのそれぞれに関連付けられるコストに基づいて、とるべきアクションを決定してよい。例えば、プラニングコンポーネント７２４は、最低の全体のコストに関連付けられるアクションを選択してよく、車両７０２にアクションを実行させてよい。

さまざまな例示において、コンピューティングデバイス７３６に格納されたアクションのコストコンポーネント７３８は、アクションのコストコンポーネント７３０と同様の機能（例えば、車両７０２がとることが可能である１つまたは複数のアクションを決定し、それぞれのアクションに関連付けられるコストを算定するなど）を実行するように構成されてよい。ある例示において、アクションのコストコンポーネント７３８は、予測コンポーネント７３２から１つまたは複数の予測されるオブジェクト軌道を受信してよい。ある例示において、アクションのコストコンポーネントは、センサーシステム７０６および／または知覚コンポーネント７２２からセンサーデータ（例えば、生のおよび／または処理されたセンサーデータ）を受信してよい。このような例示において、アクションのコストコンポーネント７３８は、本明細書で説明される予測されるオブジェクト軌道を決定するための技術のいずれかを利用する１つまたは複数のアクションに基づいて、１つまたは複数の予測されるオブジェクト軌道を決定するように構成されてよい。アクションのコストコンポーネント７３８は、予測されるオブジェクト軌道（例えば、受信および／または決定された）を利用して、それぞれのアクションに関連付けられるコストを決定してよい。ある例示において、アクションのコストコンポーネント７３８は、それぞれのアクションに関連付けられるコストを車両コンピューティングデバイス７０４に送信してよい。ある例示において、アクションのコストコンポーネント７３８は、最低コストのアクションに関連付けられるコストを車両コンピューティングデバイス７０４に送信してよい。

少なくとも１つの例示において、車両コンピューティングデバイス７０４は、１つまたは複数のシステムコントローラー７２６を含んでよく、これは、ステアリング、推進、制動、安全性、エミッター、通信、および車両７０２の他のシステムを制御するように構成されてよい。システムコントローラー７２６は、駆動システム７１４および／または車両７０２の他のコンポーネントに対応するシステムと通信してよく、および／または制御してよい。

メモリ７１８は、環境内をナビゲートするために車両７０２によって用いられ得る１つまたは複数のマップ７２８をさらに含んでよい。この説明の目的のために、マップは、限定されるわけではないが、（交差点のような）トポロジー、車道、山脈、道路、地形、および一般的な環境などの環境についての情報を提供することが可能な２次元、３次元、またはＮ次元でモデル化される任意の数のデータ構造であってよい。ある例示において、マップは、限定されるわけではないが、テクスチャ情報（例えば、色情報（例えば、ＲＧＢ色情報、Ｌａｂ色情報、ＨＳＶ／ＨＳＬ色情報）など）、強度情報（例えば、ライダー情報、レーダー情報など）、空間情報（例えば、メッシュの上に投影された画像データ、個々の「サーフェル」（例えば、個々の色および／または強度に関連付けられるポリゴン））、反射性情報（例えば、鏡面性情報、再帰反射性情報、ＢＲＤＦ情報、ＢＳＳＲＤＦ情報など）を含んでよい。ある例示において、マップは、環境の３次元メッシュを含んでよい。ある例示において、車両７０２は、少なくとも部分的にマップ７２８に基づいて制御されてよい。つまり、マップ７２８は、ローカリゼーションコンポーネント７２０、知覚コンポーネント７２２、および／またはプラニングコンポーネント７２４に関連して用いられてよく、ローカリゼーションコンポーネント７２０、知覚コンポーネント７２２、および／またはプラニングコンポーネント７２４に関連して用いられてよく、車両７０２の位置を決定し、環境におけるオブジェクトを検出し、ルートを生成し、アクションおよび／または軌道を決定し、環境内をナビゲートする。

ある例示において、１つまたは複数のマップ７２８は、１つまたは複数のネットワーク７４０を介してアクセス可能なリモートコンピューティングデバイス（コンピューティングデバイス７３６など）に格納されてよい。ある例示において、多様なマップ７２８は、例えば、特徴（例えば、エンティティのタイプ、時刻、曜日、季節など）に基づいて格納されてよい。多様なマップ７２８を格納することは、同様のメモリ要件を有してよいが、マップにおけるデータがアクセスされ得る速度を増加させてよい。

理解されるように、本明細書で説明されるコンポーネント（例えば、ローカリゼーションコンポーネント７２０、知覚コンポーネント７２２、アクションコストコンポーネント７３０および予測コンポーネント７３２を含むプラニングコンポーネント７２４、１つまたは複数のシステムコントローラー７２６、１つまたは複数のマップ７２８）は、例示的な目的のために分割されるように説明される。しかしながら、さまざまなコンポーネントによって実行される動作は、任意の他のコンポーネントにおいて組み合わされてよく、または実行されてもよい。

ある例示において、本明細書で説明されるコンポーネントのいくつかまたはすべての態様は、任意のモデル、技術、および／または機械学習技術を含んでよい。例えば、ある例示において、メモリ７１８（および以下で説明されるメモリ７３４）におけるコンポーネントは、ニューラルネットワークとして実装されてよい。

本明細書で説明されるように、例示的なニューラルネットワークは、連続して接続されるレイヤーを通して入力データを通過させ、出力を生成する生物学に着想を得た技術である。ニューラルネットワークにおけるそれぞれのレイヤーは、また、別のニューラルネットワークを含んでよく、または（畳み込みか否かには関係なく）任意の数のレイヤーを含んでもよい。本開示の文脈において理解されることが可能であるように、ニューラルネットワークは、機械学習を利用してよく、これは、学習したパラメーターに基づいて出力が生成される技術のような広範囲なクラスを参照してよい。

ニューラルネットワークのコンテキストにおいて説明されるが、任意のタイプの機械学習が本開示と一致するように用いられてよい。例えば、機械学習技術は、回帰技術（例えば、通常最小二乗回帰（ＯＬＳＲ）、線形回帰、ロジスティック回帰、段階的回帰、ＭＡＲＳ（multivariate adaptive regression splines）、ＬＯＥＳＳ（locally estimated scatterplot smoothing））、インスタンスベースの技術（例えば、リッジ回帰、ＬＡＳＳＯ（least absolute shrinkage and selection operator）、ＥｌａｓｔｉｃＮｅｔ、ＬＡＲＳ（least-angle regression））、決定木技術（例えば、ＣＡＲＴ（classification and regression tree）、ＩＤ３（iterative dichotomiser 3）、カイ二乗自動相互作用検出（ＣＨＡＩＤ）、決定株、条件付き決定木）、ベイジアン技術（例えば、ナイーブベイズ、ガウスナイーブベイズ、多項式ナイーブベイズ、ＡＯＤＥ（average one-dependence estimators）、ベイジアン信頼度ネットワーク（ＢＮＮ）、ベイジアンネットワーク）、クラスタリング技術（例えば、ｋ平均法、ｋメジアン法、期待値最大化（ＥＭ）、階層的クラスタリング）、関連規則学習技術（例えば、パーセプトロン、誤差逆伝播法、ホップフィールドネットワーク、ＲＢＦＮ（Radial Basis Function Network））、深層学習技術（例えば、深層ボルツマンマシン（ＤＢＭ）、深層信頼ネットワーク（ＤＢＮ）、畳み込みニューラルネットワーク（ＣＮＮ）、積層型オートエンコーダ）、次元削減技術（例えば、主成分分析（ＰＣＡ）、主成分回帰（ＰＣＲ）、部分最小二乗回帰（ＰＬＳＲ）、サモンマッピング、多次元スケーリング（ＭＤＳ）、射影追跡法、線形判別分析（ＬＤＡ）、混合判別分析（ＭＤＡ）、二次判別分析（ＱＤＡ）、柔軟判別分析（ＦＤＡ））、アンサンブル技術（例えば、ブースティング、ブートストラップ集約（バギング）、エイダブースト、階層型一般化（ブレンディング）、勾配ブースティングマシン（ＧＢＭ）、勾配ブースト回帰木（ＧＢＲＴ）、ランダムフォレスト）、ＳＶＭ（サポートベクターマシン）、教師付き学習、教師なし学習、半教師付き学習などを含んでよいが、これらに限定されない。アーキテクチャのさらなる例示は、ＲｅｓＮｅｔ５０、ＲｅｓＮｅｔ１０１、ＶＧＧ、ＤｅｎｓｅＮｅｔ、ＰｏｉｎｔＮｅｔなどのようなニューラルネットワークを含む。

少なくとも１つの例示において、センサーシステム７０６は、ライダーセンサー、レーダーセンサー、超音波トランスデューサー、ソナーセンサー、位置センサー（例えば、ＧＰＳ、コンパスなど）、慣性センサー（例えば、慣性測定ユニット（ＩＭＵ）、加速度計、磁力計、ジャイロスコープなど）、カメラ（例えば、ＲＧＢ、ＩＲ、強度、深度、飛行時間など）、マイク、ホイールエンコーダー、環境センサー（例えば、温度センサー、湿度センサー、光センサー、圧力センサーなど）、などを含んでよい。センサー７０６は、これらまたは他のタイプのセンサーのそれぞれの多様な例示を含んでよい。例えば、ライダーセンサーは、車両７０２の角部、前部、後部、側部、および／または上部に位置する個々のライダーセンサーを含んでよい。別の例示として、カメラセンサーは、車両７０２の外部および／または内部についてのさまざまな位置に配置される多様なカメラを含んでよい。センサー７０６は、入力を車両コンピューティングデバイス７０４に提供してよい。追加的または代替的に、センサーシステム７０６は、１つまたは複数のネットワーク７４０を介して、所定の時間期間の経過の後で、ほぼリアルタイムなどで、具体的な周波数で、センサーデータを１つまたは複数のコンピューティングデバイス７３６に送信してよい。

車両７０２は、また、光および／または音を放出するための１つまたは複数のエミッター７０８を含んでよい。エミッター７０８は、車両７０２の乗員と通信する内部オーディオおよび視覚エミッターを含んでよい。例示の目的であり、限定ではなく、内部エミッターは、スピーカー、照明、標識、ディスプレイスクリーン、タッチスクリーン、触覚エミッター（例えば、振動および／または力フィードバック）、機械的アクチュエータ（例えば、シートベルトテンショナー、座席ポジショナー、ヘッドレストポジショナーなど）などを含んでよい。エミッター７０８は、また、外部エミッターを含んでよい。例示の目的であり、限定ではなく、外部エミッターは、走行の方向のシグナルを送るための照明、もしくは車両のアクションの他のインジケーター（例えば、インジケーターライト、標識、ライトアレイなど）、ならびに歩行者または音響ビームステアリング技術を含む１つまたは複数の他の近隣の車両と音響で通信するための１つまたは複数のオーディオエミッター（例えば、スピーカー、スピーカーアレイ、ホーンなど）を含んでよい。

車両７０２は、また、車両７０２と１つまたは複数の他のローカルまたはリモートコンピューティングデバイスとの間の通信を可能とする１つまたは複数の通信接続７１０を含んでよい。例えば、通信接続７１０は、車両７０２上の他のローカルコンピューティングデバイスおよび／または駆動モジュール７１４との通信を容易にすることができる。また、通信接続７１０は、車両が他の近隣のコンピューティングデバイス（例えば、コンピューティングデバイス７３６、他の近隣の車両など）および／またはセンサーデータを受信することに対して１つまたは複数のリモートセンサーシステム７４２と通信することを可能としてよい。

通信接続７１０は、車両コンピューティングデバイス７０４をネットワーク７４０のような別のコンピューティングデバイスまたはネットワークに接続するための物理的および／または論理的インターフェースを含んでよい。例えば、通信接続７１０は、ＩＥＥＥ８０２．１１標準規格によって定義される周波数、ブルートゥースのような短距離無線周波数、セルラー通信（例えば、２Ｇ、３Ｇ、４Ｇ、４ＧＬＴＥ、５Ｇなど）、またはそれぞれのコンピューティングデバイスが他のコンピューティングデバイスとインターフェース接続することを可能とする任意の適切な有線もしくは無線通信プロトコルを介してＷｉ－Ｆｉベースの通信を有効にすることが可能である。

少なくとも１つの例示において、車両７０２は、１つまたは複数の駆動システム７１４を含んでよい。ある例示において、車両７０２は、１つの駆動システム７１４を有してよい。少なくとも１つの例示において、車両７０２が多様な駆動システム７１４を有する場合、個々の駆動システム７１４は、車両７０２の反対側の端部（例えば、前部および後部など）に配置されてよい。少なくとも１つの例示において、駆動システム７１４は、駆動システム７１４および／または車両７０２の周囲の状態を検出する１つまたは複数のセンサーシステムを含んでよい。例示の目的であり、限定ではなく、センサーシステムは、駆動システムのホイールの回転を感知するための１つまたは複数のホイールエンコーダー（例えば、ロータリーエンコーダー）、駆動モジュールの方向および加速度を測定するための慣性センサー（例えば、慣性測定ユニット、加速度計、ジャイロスコープ、磁力計など）、カメラまたは他の画像センサー、駆動モジュールの周囲のオブジェクトを音響的に検出するための超音波センサー、ライダーセンサー、レーダーセンサーなどを含んでよい。ホイールエンコーダーのようなあるセンサーは、駆動システム７１４に一意であってよい。ある場合において、駆動システム７１４上のセンサーシステムは、車両７０２の対応するシステム（例えば、センサーシステム７０６）と重複してよく、または車両７０２の対応するシステムを補完してもよい。

駆動システム７１４は、高電圧バッテリー、車両を推進させるためのモーター、他の車両システムによる使用のためにバッテリーからの直流を交流へと変換するためのインバーター、ステアリングモーターおよびステアリングラックを含むステアリングシステム（これは電動式とすることが可能である）、油圧または電動アクチュエータを含むブレーキシステム、油圧および／または空気圧コンポーネントを含むサスペンションシステム、トラクションの損失を緩和して、制御を維持するために制動力を分配するための安定性制御システム、ＨＶＡＣシステム、照明（例えば、車両の外部周囲を照らすためのヘッド／テールライトのような照明）、および１つまたは複数の他のシステム（例えば、冷却システム、安全システム、車載充電システム、ＤＣ／ＤＣコンバーターのような他の電気コンポーネント、高電圧ジャンクション、高電圧ケーブル、充電システム、充電ポートなど）を含む車両システムの多くを含んでよい。さらに、駆動システム７１４は、センサーシステムからデータを受信して、前処理をし得るさまざまな車両システムの動作を制御するための駆動モジュールコントローラーを含んでよい。ある例示において、駆動モジュールコントローラーは、１つまたは複数のプロセッサ、および１つまたは複数のプロセッサと通信可能に結合されたメモリを含んでよい。メモリは、１つまたは複数のシステムを格納してよく、駆動システム７１４のさまざまな機能を実行する。さらに、駆動システム７１４は、また、それぞれの駆動システムによって、１つまたは複数の他のローカルコンピューティングデバイスまたはリモートコンピューティングデバイスとの通信を可能とする１つまたは複数の通信接続を含んでよい。

少なくとも１つの例示において、直接接続部７１２は、物理的なインターフェースを提供してよく、１つまたは複数の駆動システム７１４を車両７０２の本体と連結する。例えば、直接接続７１２は、駆動システム７１４と車両との間のエネルギー、流体、空気、データなどの転送を可能としてよい。ある例示において、直接接続７１２は、車両７０２の本体に駆動システム７１４をさらにリリース可能に固定してよい。

少なくとも１つの例示において、ローカリゼーションコンポーネント７２０、知覚コンポーネント７２２、プラニングコンポーネント７２４、１つまたは複数のシステムコントローラー７２６、１つまたは複数のマップ７２８、アクションのコストコンポーネント７３０、および予測コンポーネント７３２は、上記のようにデータ（例えば、センサーデータ）を処理してよく、１つまたは複数のネットワーク７４０にわたってそれらのそれぞれの出力をコンピューティングデバイス７３６に送信してよい。少なくとも１つの例示において、ローカリゼーションコンポーネント７２０、知覚コンポーネント７２２、プラニングコンポーネント７２４、１つまたは複数のシステムコントローラー７２６、１つまたは複数のマップ７２８、アクションのコストコンポーネント７３０、および予測コンポーネント７３２は、所定の時間期間の経過の後で、ほぼリアルタイムなどで、具体的な周波数で、それらのそれぞれの出力をコンピューティングデバイス７３６に送信してよい。

ある例示において、車両７０２は、ネットワーク７４０を介してセンサーデータをコンピューティングデバイス７３６に送信してよい。ある例示において、車両７０２は、コンピューティングデバイス７３６および／またはリモートセンサーシステム７４２からネットワーク７４０を介してセンサーデータを受信してよい。センサーデータは、生のセンサーデータおよび／または処理されたセンサーデータおよび／またはセンサーデータの表現を含んでよい。ある例示において、（生または処理された）センサーデータは、１つまたは複数のログファイルとして送信および／または受信されてよい。

コンピューティングデバイス７３６は、１つまたは複数のプロセッサ７４４、ならびにアクションのコストコンポーネント７３８およびセンサーデータ処理コンポーネント７４６を格納するメモリ７３４を含んでよい。さまざまな例示において、センサーデータ処理コンポーネント７４６は、センサーシステム７０６および／またはリモートセンサーシステム７４２のような１つまたは複数のリモートセンサーからデータを受信するように構成されてよい。ある例示において、センサーデータ処理コンポーネント７４６は、車両７０２の可能性のあるまたは候補アクションに関連付けられるコストを決定することに対して、データを処理して、処理されたデータをアクションのコストコンポーネント７３８に送信するように構成されてよい。ある例示において、センサーデータ処理コンポーネント７４６は、アクションのコストコンポーネント７３０および／または予測コンポーネント７３２によって用いられるようにデータを処理して、処理されたセンサーデータを車両コンピューティングデバイス７０４に送信するように構成されてよい。ある例示において、センサーデータ処理コンポーネント７４６は、生のセンサーデータを車両コンピューティングデバイス７０４に送信するように構成されてよい。

車両７０２のプロセッサ７１６およびコンピューティングデバイス７３６のプロセッサ７４４は、本明細書で説明されるように、データを処理して動作を行うための命令を実行することが可能である任意の適切なプロセッサであってよい。例示の目的であり、限定ではなく、プロセッサ７１６および７４４は、１つまたは複数の中央処理装置（ＣＰＵ）、Graphics Processing Units（ＧＰＵ）、または、電子データを処理して、その電子データをレジスタおよび／またはメモリに格納され得る他の電子データへと変換する任意の他のデバイスまたはデバイスの一部を含んでよい。ある例示において、集積回路（例えば、ＡＳＩＣなど）、ゲートアレイ（例えば、ＦＰＧＡなど）、および他のハードウェアデバイスは、また、それらが符号化された命令を実装するように構成される限り、プロセッサとみなされてよい。

メモリ７１８および７３４は、非一時的コンピューター可読媒体の例示である。メモリ７１８および７３４は、オペレーティングシステムおよび１つまたは複数のソフトウェアアプリケーション、命令、プログラム、および／またはデータを格納してよく、本明細書で説明される方法およびさまざまなシステムに起因する機能に実装する。さまざまな実装において、メモリは、スタティックＲＡＭ（ＳＲＡＭ）、シンクロナスＤＲＡＭ（ＳＤＲＡＭ）、不揮発性／フラッシュタイプメモリ、または情報を格納することが可能である任意の他のタイプのメモリのような任意の適切なメモリ技術を用いて実装されてよい。本明細書で説明されるアーキテクチャ、システム、および個々のエレメントは、多くの他の論理的、プログラム的、および物理的なコンポーネントを含んでよく、それらのうちの添付図面に示されるものは、単に本明細書での説明に関連する例示に過ぎない。

ある例示において、メモリ７１８および７３４は、少なくともワーキングメモリおよびストレージメモリを含んでよい。例えば、ワーキングメモリは、プロセッサ７１６および７４４によって操作されるデータを格納するために用いられる制限された容量の高速メモリ（例えば、キャッシュメモリ）であってよい。ある例示において、メモリ７１８および７３４は、データの長期保存のために用いられる比較的大容量の低速メモリであり得るストレージメモリを含んでよい。ある例示において、プロセッサ７１６および７４４は、本明細書で説明されるように、ストレージメモリに格納されているデータを直接操作することが可能ではなく、データは、データに基づく動作を実行させるためにワーキングメモリへとロードされる必要があることがある。

図７は、分散システムとして図示されているが、代替の例示において、車両７０２のコンポーネントは、コンピューティングデバイス７３６に関連付けられてよく、および／またはコンピューティングデバイス７３６のコンポーネントは、車両７０２に関連付けられてよいことに留意されたい。つまり、車両７０２は、コンピューティングデバイス７３６に関連付けられる１つまたは複数の機能を実行してよく、逆もまた同様である。

図８～図１０は、本開示の実施形態に従って例示的なプロセスを図示する。これらのプロセスは、論理フローグラフとして図示され、それぞれの動作は、ハードウェア、ソフトウェア、またはそれらの組み合わせにおいて実装され得る動作のシーケンスを表現する。ソフトウェアのコンテキストにおいて、動作は、１つまたは複数のプロセッサによって実行された場合に、列挙された動作を実行する１つまたは複数のコンピューター可読媒体に格納されたコンピューター実行可能命令を表現する。一般に、コンピューター実行可能命令は、具体的な機能を実行するか、または具体的な抽象データ型を実装するルーティン、プログラム、オブジェクト、コンポーネント、データ構造などを含む。動作が説明される順序は、限定として解釈されることを意図したものではなく、任意の数の説明される動作は、任意の順序で、および／または並行して組み合わされてよく、プロセスを実装する。

図８は、少なくとも部分的に、アクションに関連付けられるコストに基づくアクションに従って車両を制御するための例示的なプロセス８００を図示する。プロセス８００のうちの一部またはすべては、本明細書で説明されるように、図７における１つまたは複数のコンポーネントによって実行されてよい。例えば、プロセス８００のうちの一部またはすべては、車両コンピューティングデバイス７０４および／またはコンピューティングデバイス７３６によって実行されてよい。

動作８０２で、プロセスは、少なくとも部分的に、車両のセンサーに関連付けられるセンサーデータに基づいて、環境におけるオブジェクトを検出することを含むことができる。センサーは、カメラ、モーションディテクター、ライダー、レーダー、飛行時間などを含んでよい。ある例示において、車両コンピューティングシステムは、例えば、別の自律車両に搭載されたセンサー、および／または環境において搭載されたセンサーなどの１つまたは複数のリモートセンサーからセンサーデータを受信してよい。

さまざまな例示において、車両は、他の自律車両および／またはセンサーからデータを伝送および／または受信するように構成されてよい。データは、環境において検出されたオブジェクトに関するデータなどのセンサーデータを含んでよい。さまざまな例示において、環境は、交通監視、衝突回避などのためのセンサーを含んでよい。さまざまな例示において、車両コンピューティングシステムは、センサーデータを受信してよく、例えば、オブジェクトが、自動車、トラック、バス、セミトレーラートラック、バイク、モペット、自転車運転者、歩行者などであるかのようなオブジェクトのタイプを決定（例えば、オブジェクトのタイプを分類）してよい。

動作８０４で、プロセスは、車両１０２のような車両が環境においてとり得るアクションを決定することを含むことができる。アクションは、車両が環境を通してとることが可能である１つまたは複数の可能性のある経路（例えば、１つまたは複数の車両軌道）を表現してよい。アクションは、右に車線変更、左に車線変更、車線にとどまること、障害物（例えば、二重駐車車両、トラフィックコーンなど）を迂回することなどのような１つまたは複数の参照アクション（例えば、車両が動的な動作環境に反応して実行するように構成される操作のグループのうちの１つ）を含んでよい。アクションは、さらに、速度の変化（例えば、速度維持、加速、減速など）、位置の変化（例えば、車線での位置の変更）などのような１つまたは複数のサブアクションを含んでよい。例えば、アクションは、車線にとどまる（参照アクション）こと、および車線での車両の位置を中央位置から車線の左側で動作するまで調整する（サブアクション）ことを含んでよい。

動作８０６で、プロセスは、少なくとも部分的にアクションに基づくオブジェクトに関連付けられるオブジェクト軌道（例えば、予測される軌道）を決定することを含むことができる。オブジェクト軌道は、センサーデータに基づいて決定されてよい。オブジェクト軌道は、検出されたオブジェクトが環境を通して走行し得る可能性のある経路を表現してよい。オブジェクト軌道は、車両アクションに対するオブジェクトの予測される反応（例えば、アクティブ予測）に基づいてよい。例えば、アクションは、別の車両が右から接近して、優先権を有する交差点へと車両が加速することを含んでよい。車両コンピューティングシステムは、他の車両の予測される軌道が車両との衝突を回避するために急速な負の加速度（減速）を含み得るということを決定してよい。さまざまな例示において、オブジェクト軌道は、参照により本明細書に組み込まれる米国特許出願に記載されるように、環境、ヒートマップ、時相論理式、木探索法、機械学習技術、または環境におけるオブジェクトに関連付けられるアクティブ予測を決定することの他の手段のトップダウン表現を利用して決定されてよい。このような例示において、センサーデータ、センサーデータの表現（例えば、境界ボックス、範囲など）、マップ、道路ネットワーク情報、およびアクションに関連付けられる経路（これらのすべては、時間期間にわたってデータのシーケンスを含んでよい）のうちの１つまたは複数は、選択されたオブジェクトの予測される軌道を出力するために訓練された機械学習モデルへと入力されてよい。ある例示において、このようなコストは、車両不在のオブジェクトの予測される軌道に対するベースラインコスト（例えば、車両が存在しなかった場合に、オブジェクトが何をすることとなるか）と比較して算定されてよい。

動作８０８で、プロセスは、少なくとも部分的にオブジェクト軌道に基づくアクションに関連付けられるコストを決定することを含むことができる。コストは、車両を有する環境において動作しているオブジェクト（例えば、別の車両、自転車運転者、歩行者など）に対するアクションの影響に部分的に基づいてよい。上記のように、コストは、１つまたは複数の因子に基づいてよい。因子は、安全性（例えば、衝突の確率、他のオブジェクトからの距離など）、快適性（例えば、突然の動きの欠如、加速度）、進行（例えば、目的地への動き、遅延など）、運用規則（例えば、道路の規則、法律、条令、規制など）などを含んでよいが、任意の数の他の考慮事項が企図される。因子は、車両および／またはオブジェクトに起因してよい。例えば、アクションは、車両およびオブジェクトが減速することなどのため、車両およびオブジェクトへの進行の遅延を引き起こすことがある。

さまざまな例示において、車両コンピューティングシステムは、それぞれの軌道に基づくような車両および／またはオブジェクトの将来の状態（例えば、推定される状態）に関連付けられるコストに基づいて、コストを決定してよい。このような例示において、車両コンピューティングシステムは、時間期間（例えば、６秒、８秒、１６秒など）、環境における車両およびオブジェクトを前方に投影することによって推定される状態を決定してよい。車両コンピューティングシステムは、オブジェクト軌道に基づいてオブジェクトを前方に投影（例えば、オブジェクトの将来の位置を推定）してよい。車両コンピューティングシステムは、アクションに関連付けられる１つまたは複数の車両軌道に基づいて、車両を前方に投影（例えば、車両の将来の位置を推定する）してよい。推定される状態は、車両の推定される場所（例えば、推定される位置）および将来のある時間でのオブジェクトの推定される位置を表現してよい。さまざまな例示において、車両コンピューティングシステムは、時間期間を通して所定のレート（例えば、１０ヘルツ、２０ヘルツ、５０ヘルツなど）で推定される状態を決定してよい。少なくとも１つの例示において、推定される状態は、１０ヘルツ（例えば、０．１秒ごと）のレートで実行されてよい。

さまざまな例示において、車両コンピューティングシステムは、車両およびオブジェクトの互いに対する推定される位置に基づくようなそれぞれの推定される状態に関連付けられるコストを決定してよい。ある例示において、車両コンピューティングシステムは、１つまたは複数の因子に基づいて、それぞれの推定される状態を分析してよく、コスト値を推定される状態に適用してよい。このような例示において、推定される状態のコストは、因子のそれぞれに関連付けられるコストの合計を含んでよい。さまざまな例示において、アクションコストは、それぞれの推定される状態に関連付けられるコストのそれぞれの合計を含んでよい。

動作８１０で、プロセスは、アクションに関連付けられるコストを車両がとり得る他のアクションに関連付けられるコストと比較すること（例えば、上記のアクションに対して同様の方法で算定され得るように）を含むことができる。さまざまな例示において、車両コンピューティングシステムは、アクションの合計のコスト（例えば、それぞれの推定される状態に関連付けられるコストの合計）を、他のアクションに関連付けられるコストと比較してよい。ある例示において、車両コンピューティングデバイスは、因子および／または車両および／またはオブジェクトに関連付けられるアクションの合計のコスト（例えば、安全性のコスト、オブジェクトの快適性のコストなど）を他のアクションに関連付けられる対応するコストと比較してよい。例えば、車両コンピューティングデバイスは、第１のアクションに関連付けられる第１の合計の安全性のコストを第２のアクションに関連付けられる第２の合計の安全性のコストと比較してよい。少なくともある例示において、具体的な時間ステップに関連付けられる１つのコストは、さらなるアクションに関連付けられる同様の瞬時のコストと比較されてよい。

動作８１２で、プロセスは、アクションに関連付けられるコストが他のアクションと比較して最低コストであるかを決定することを含むことができる。さまざまな例示において、車両コンピューティングシステムは、アクションに関連付けられる合計のコストが最低コストであるかを決定してよい。ある例示において、車両コンピューティングシステムは、因子（例えば、安全性のコスト、オブジェクトの快適性のコストなど）に関連付けられる合計のコストが最低コストのアクションであるということを決定してよい。

コストが最低コストのアクションである（動作８１２で「Ｙｅｓ」）ということの決定に基づいて、プロセスは、動作８１４で、プロセスが少なくとも部分的にアクションに基づいて車両を制御させることを含むことができる。さまざまな例示において、アクションに基づいて車両を制御させることは、車両を、アクションに関連付けられる１つまたは複数の軌道に沿って走行させることを含んでよい。

コストが最低コストのアクションではない（動作８１２で「Ｎｏ」）ということの決定に基づいて、プロセスは、動作８１６で、車両を、少なくとも部分的に別のアクションに基づいて制御されるようにさせる。他のアクションは、アクションよりも低いコストを有する別のアクションを含んでよい。他のアクションは、１つまたは複数の他の車両軌道と共に関連付けられていることがある。

図９は、少なくとも部分的にアクションに関連付けられる安全性のコストに基づくアクションに従って、車両を制御するための例示的なプロセスを示すための例示的なプロセス９００を図示する。プロセス９００のうちの一部またはすべては、本明細書で説明されるように、図７における１つまたは複数のコンポーネントによって実行されてよい。例えば、プロセス９００のうちの一部またはすべては、車両コンピューティングデバイス７０４によって実行されてよい。

動作９０２で、プロセスは、車両が環境においてとり得るアクションを決定することを含むことができる。アクションは、車両が環境を通してとることが可能である１つまたは複数の可能性のある経路（例えば、１つまたは複数の車両軌道）を表現してよい。アクションは、右に車線変更、左に車線変更、車線にとどまること、障害物（例えば、二重駐車車両、トラフィックコーンなど）を迂回することなどのような１つまたは複数の参照アクション（例えば、車両が動的な動作環境に反応して実行するように構成される操作のグループのうちの１つ）を含んでよい。アクションは、さらに、速度の変化（例えば、速度維持、加速、減速など）、位置の変化（例えば、車線での位置の変更）などのような１つまたは複数のサブアクションを含んでよい。例えば、アクションは、車線にとどまる（参照アクション）こと、および車線での車両の位置を中央位置から車線の左側で動作するまで調整する（サブアクション）ことを含んでよい。このようなアクションは、複数のアクションのうちの１つであってよく、これは、ある例示において実質的に同時に評価されてよく、車両は、任意の瞬間に実行することが可能であってよい。

動作９０４で、プロセスは、少なくとも部分的にアクションに基づいて、環境において動作するオブジェクトに関連付けられるオブジェクト軌道（例えば、オブジェクトが将来のさまざまな時点で進行し得る場所を示す予測されるオブジェクト軌道）を決定することを含むことができる。オブジェクト軌道は、センサーデータに基づいて決定されてよい。オブジェクト軌道は、検出されたオブジェクトが環境を通して走行し得る可能性のある経路を表現してよい。オブジェクト軌道は、車両アクションに対するオブジェクトの予測される反応（例えば、アクティブ予測）に基づいてよい。例えば、アクションは、別の車両が右から接近して、優先権を有する交差点へと車両が加速することを含んでよい。車両コンピューティングシステムは、他の車両の予測される軌道が車両との衝突を回避するために急速な負の加速度（減速）を含み得るということを決定してよい。さまざまな例示において、オブジェクト軌道は、参照により本明細書に組み込まれる米国特許出願に記載されるように、環境、ヒートマップ、時相論理式、木探索法、機械学習技術、または環境におけるオブジェクトに関連付けられるアクティブ予測を決定することの他の手段のトップダウン表現を利用して決定されてよい。これらの例示は、図８に関して提供される。

動作９０６で、プロセスは、少なくとも部分的にオブジェクト軌道に基づくアクションに関連付けられる安全性のコストを決定することを含むことができる。さまざまな例示において、安全性のコストは、車両とオブジェクトとの間の衝突の尤度（例えば、衝突の確率）を含んでよい。衝突の尤度は、車両とオブジェクトとの間の距離（例えば、５フィート、２メートル、０．５メートル以内など）、収束軌道（例えば、アクションに関連付けられる車両軌道と実質的に交差することとなるオブジェクト軌道）、車両とオブジェクトとの間の収束レート（例えば、毎秒２メートル、毎秒１０フィートなど）などに基づいて算定されてよい。ある例示において、衝突の尤度は、距離および／または収束レートに関連付けられる閾値に基づいてよい。例えば、車両に関連付けられる推定される状態とオブジェクトに関連付けられる推定される位置との間の距離は、閾値距離（例えば、８フィート、３メートルなど）よりも短いかまたは等しくてよい。そのため、車両コンピューティングシステムは、車両とオブジェクトとの間に衝突の尤度が存在するということを決定してよい。別の例示に対して、車両に関連付けられる軌道およびオブジェクトに関連付けられる軌道は、収束の閾値レート（例えば、毎秒６フィート、毎秒２．５メートル、毎秒１．５メートルの収束など）と等しいかまたはそれもより高い速度で収束してよい。そのため、車両コンピューティングシステムは、車両とオブジェクトとの間に衝突の尤度が存在するということを決定してよい。ある例示において、衝突の尤度または確率は、実際の距離および／または収束レートが閾値を下回るかまたは上回る量に基づいてよい。このような例示において、衝突の確率は、車両により近いほど増加してよく、オブジェクトは、推定される状態（例えば、互いに６インチ以内の場合は、９５％の衝突確率）および／または収束レートが閾値を上回る量（例えば、毎秒１０メートルの収束レートを有する９０％の衝突確率）にある。ある例示において、衝突の確率は、機械学習技術を利用して決定されてよい。このような例示において、機械学習モデルは、車両およびオブジェクトが環境においてインタラクトする状況を含む訓練データに基づいて衝突の確率を決定するために訓練されてよい。ある例示において、安全性のコストは、収束レート（例えば、毎秒３フィート＝３の安全性のコスト、毎秒３フィート＝９の安全性のコストなど）に基づいて決定され得るが、このようなパラメーターの任意の他の線形および／または非線形の組み合わせが企図される。

さまざまな例示において、安全性のコストは、衝突の確率に基づいてよい。ある例示において、衝突の確率が衝突が起こり得るということを示す事前に定義された閾値（例えば、３０％、５０％など）よりも高い場合、固定コスト（例えば、５０、７５、９０など）を含んでよい。ある例示において、コストは、衝突判断の確率に基づいてよい。例えば、車両コンピューティングシステムは、推定される状態における衝突の確率が９５％であるということを決定してよく、車両コンピューティングシステムは、推定される状態の安全因子に対する９５のコストを評価してよいが、上記のように確率の任意の線形／非線形関数（多項式、積など）が企図されている。

さまざまな例示において、車両コンピューティングシステムは、衝突の確率に基づくような決定された安全性のコストを２倍、３倍、４倍などに増加させること、または多項式関数（例えば、２次、３次など）を決定された安全性のコストに適用することによって、上記の他の因子の安全性を強調してよい。このような例示において、車両コンピューティングシステムは、衝突の尤度に基づくなどの初期値で安全性のコストを評価してよく、階乗および／または多項式関数を適用することによって安全性のコストを増加させてよい。例えば、車両コンピューティングシステムは、合計の安全性コスト＝（決定された安全性のコスト）²のような安全性のコストに２次方程式を適用してよい。

動作９０８で、プロセスは、安全性のコストが閾値を上回っているかを決定することを含むことができる。閾値は、車両の安全な動作を確実にするために定義されてよい。さまざまな例示において、閾値は、安全因子に関連付けられる所定の最大コストを含んでよい。ある例示において、閾値の安全性のコストは、環境において検出されたオブジェクトの数、検出されたオブジェクトの分類、運用領域（例えば、スクールゾーン、工事区域、幹線道路、ビジネス地区など）などに基づいて動的に決定されてよい。例えば、車両コンピューティングシステムは、閾値の歩行者数が検出される領域で動作する車両のための閾値の安全性のコストを５に設定してよく、高速道路で動作する車両のための閾値の安全性のコストを１０に設定してよい。

安全性のコストが閾値を上回っている（動作９０８で「Ｙｅｓ」）ということの決定に基づいて、動作９１０で、プロセスは、車両プラニングの考慮事項におけるアクションを無視することを含むことができる。さまざまな例示において、車両コンピューティングシステムは、車両を制御するための別のアクションを選択してよい。

安全性のコストが閾値を上回っていない（動作９０８で「Ｎｏ」）ということに基づいて、プロセスは、動作９１２で、１つまたは複数の因子に基づくアクションに関連付けられる合計のコストを決定することを含むことができる。上記のように、因子は、安全因子、快適因子、進行因子、および／または車両および／またはオブジェクトに関連付けられる運用規則因子を含んでよい。合計のコストは、個々の因子（例えば、安全性のコスト、オブジェクトの進行のコストなど）の合計のコストおよび／または因子のそれぞれを含むアクションの合計のコストを含んでよい。

動作９１４で、プロセスは、車両プラニングの考慮事項におけるアクションを含むことができる。さまざまな例示において、車両コンピューティングシステムは、アクションに関連付けられる合計のコストを車両が環境においてとり得る他のアクションに関連付けられる合計のコストと比較してよい。さまざまな例示において、車両コンピューティングシステムは、考慮されるアクションの最低コストのアクションを選択してよい。このような例示において、車両コンピューティングシステムは、最低コストのアクションに基づいて車両を制御させてよい。

図１０は、少なくとも部分的にオブジェクトが閉塞区域に存在するという確率に基づいて車両を制御するための例示的なプロセス１０００を図示する。プロセス１０００のうちの一部またはすべては、本明細書で説明されるように、図７における１つまたは複数のコンポーネントによって実行されてよい。例えば、プロセス１０００のうちの一部またはすべては、車両コンピューティングデバイス７０４によって実行されてよい。

動作１００２で、プロセスは、車両が動作する環境における閉塞区域を識別することを含むことができる。さまざまな例示において、閉塞区域は、車両の１つまたは複数のセンサー（例えば、ライダー、レーダー、カメラなど）から受信したセンサーデータに基づいて識別されてよい。閉塞区域は、車両の知覚システムがオブジェクトを検出することが可能ではない（例えば、障害物、視界の遮断などによって遮断される）環境における領域を画定してよい。さまざまな例示において、車両コンピューティングシステムは、閉塞区域に関連付けられる道路の関連するセクションを識別するように構成されてよい。このような例示において、道路のセクションは、車両に関連し得る方向にオブジェクトが動作するように構成される１つまたは複数の車線、歩道、自転車専用車線などを含んでよい。図４に関して上記で説明されるように、閉塞区域は、オブジェクトが車両へと走行し得る道路の２車線を含んでよい。

動作１００４で、プロセスは、オブジェクトが閉塞区域において動作している確率を決定することを含むことができる。さまざまな例示において、確率は、機械学習技術、および／または上記の参照によって組み込まれる、米国特許出願第１６／１４７，１７７号、および米国特許出願第１６／０１１，４３６号に記載されている１つまたは複数の技術を利用して決定されてよい。さまざまな例示において、車両コンピューティングシステムは、道路の関連するセクションに基づいて、オブジェクトが閉塞区域において動作している確率を決定してよい。ある例示において、オブジェクトが閉塞区域を通して走行することとなるという確率は、道路の関連セクションに関連付けられる格納データに基づいてよい。格納されたデータは、経時的にキャプチャされた道路の関連セクションに関連付けられるセンサーデータ（例えば、事前に記録されたデータ）を含んでよい。ある例示において、確率は、時刻、曜日、月、季節などに基づいてよい。ある例示において、確率は、機械学習技術を利用して決定されてよい。このような例示において、機械学習モデルは、経時的にキャプチャされた道路の関連するセクションに関連付けられるセンサーデータのような訓練データで訓練されてよい。オブジェクトが存在し得るという確率に基づいて、車両コンピューティングシステムは、予測されるオブジェクト軌道を有する予測されるオブジェクトを生成してよく、とるべきアクションを決定する。

動作１００６で、プロセスは、確率が閾値を上回っているかを決定することを含むことができる。閾値確率は、環境、道路のセクション、曜日、週番号などに基づいてよい。さまざまな例示において、閾値確率は、所定の値を含んでよい。ある例示において、閾値は、動的に決定されてよい。このような例示において、閾値確率は、車両が環境において動作している間、道路のセクション、時間、曜日などに基づいて決定されてよい。

確率が閾値を上回っていない（動作１００６で「Ｎｏ」）ということの決定に基づいて、プロセスは、動作１００８で、オブジェクトが閉塞区域において動作していないということを決定することを含むことができる。

動作１０１０で、プロセスは、オブジェクトが閉塞区域において動作していないということを決定することに基づいて車両を制御することを含むことができる。さまざまな例示において、車両コンピューティングシステムは、上記の技術を利用するような環境において１つまたは複数の検出されたオブジェクトに基づいて、とるべきアクションを決定してよい。

確率が閾値を上回っている（動作１００６で「Ｙｅｓ」）ということの決定に基づいて、プロセスは、動作１０１２で、車両プラニングの考慮事項においてオブジェクトに関連付けられるデータを含むことができる。さまざまな例示において、車両コンピューティングシステムは、本明細書で説明される技術を利用するようなオブジェクトに基づいて車両がとり得る１つまたは複数の可能性のあるアクションに関連付けられるコストを決定してよい。このような例示において、車両コンピューティングシステムは、アクションコストに基づいて、車両がとるべきアクション（例えば、制御プラニング）を決定してよい。さまざまな例示において、車両コンピューティングシステムは、少なくとも部分的に、閉塞区域において動作するオブジェクト（例えば、予測されるオブジェクト）に基づいて車両を制御してよい。

（例示的な条項）
Ａ：センサー、１つまたは複数のプロセッサ、および１つまたは複数のプロセッサによって実行された場合に、センサーから環境のセンサーデータを受信し、少なくとも部分的にセンサーデータに基づいて、環境における第１の位置でのオブジェクトを識別し、車両が環境においてとることが可能である第１のアクションおよび第２のアクションを決定し、第１のアクションに関連付けられる第１のオブジェクト軌道および第２のアクションに関連付けられる第２のオブジェクト軌道を決定し、少なくとも部分的に第１のオブジェクト軌道に基づいて、第１のアクションに関連付けられる第１のアクションコストを決定することであって、第１のアクションは、第１の安全性のコスト、第１の快適性のコスト、第１の進行のコスト、または第１の運用規則のコストのうちの少なくとも１つに少なくとも部分的に基づいて決定し、少なくとも部分的に第２のオブジェクト軌道に基づいて、第２のアクションに関連付けられる第２のアクションコストを決定することであって、第２のアクションコストは、第２の安全性のコスト、第２の快適性のコスト、第２の進行のコスト、または第２の運用規則のコストのうちの少なくとも１つに少なくとも部分的に基づいて決定し、第１のアクションに関連付けられる第１のアクションコストが第２のアクションに関連付けられる第２のアクションコストよりも低いということを決定し、および少なくとも部分的に、第１のアクションコストが第２のアクションコストよりも低いということを決定することに基づき、少なくとも部分的に第１のアクションに基づいて車両を制御するように車両を構成するプロセッサ実行可能命令を格納するメモリを備える。

Ｂ：段落Ａが説明するような車両で、第１の安全性のコストは、少なくとも部分的に、第１のオブジェクト軌道に関連付けられるオブジェクトの状態の第１の関数、または第１のオブジェクト軌道と車両との間の相対的な状態に基づき、第１の快適性のコストは、少なくとも部分的に、第１のオブジェクト軌道に関連付けられるオブジェクトの状態の第２の関数、または第１のオブジェクト軌道と車両との間の相対的な状態に基づき、第１の進行のコストは、少なくとも部分的に、オブジェクトの第１のオブジェクト時間の遅延に基づき、および第１の運用規則のコストは、少なくとも部分的に、環境に関連付けられる１つまたは複数の規制に基づいている。

Ｃ：段落ＡまたはＢのいずれかが説明するような車両で、命令は、車両が環境においてとることが可能である第３のアクションを決定し、第３のアクションに関連付けられる第３のオブジェクト軌道を決定し、第３のアクションに関連付けられる第３のコストを決定し、第３のコストが閾値コストよりも高いということを決定し、および制御プラニングの考慮事項から第３のアクションに関連付けられるデータを無視するように車両をさらに構成する。

Ｄ：段落Ａ～Ｃのいずれかが説明するような車両で、命令は、少なくとも部分的にセンサーデータに基づいて、環境における閉塞区域を決定し、機械学習技術を利用して、閉塞区域において動作する第２のオブジェクトに関連付けられる確率を決定し、確率が閾値を上回っているということを決定し、および第２のオブジェクトに関連付けられる予測されるオブジェクト軌道を決定し、第１のアクションコストおよび第２のアクションコストを決定することは、少なくとも部分的に、第２のオブジェクトに関連付けられる予測されるオブジェクト軌道にさらに基づくように車両をさらに構成する。

Ｅ：段落Ａ～Ｄのいずれかが説明するような車両で、第１のオブジェクト軌道および第２のオブジェクト軌道は、機械学習アルゴリズム、環境のトップダウン表現、離散化された確率分布、時相論理式、または木探索法のうちの少なくとも１つに少なくとも部分的に基づいて決定される。

Ｆ：方法は、少なくとも部分的にセンサーデータに基づいて、環境における第１の位置でのオブジェクトを決定すること、環境においてとるべき車両の候補アクションを決定すること、候補アクションに関連付けられるオブジェクト軌道を決定すること、少なくとも部分的に、候補アクションに関連付けられる車両のオブジェクト軌道および車両軌道に基づいて、候補アクションに関連付けられるアクションコストを決定すること、および、少なくとも部分的に、候補アクションに関連付けられるアクションコストに基づいて、車両を制御することを備える。

Ｇ：段落Ｆが説明するような方法で、アクションコストを決定することは、候補アクションに関連付けられる安全性のコストを決定すること、少なくとも部分的にオブジェクト軌道に基づいて、候補アクションに関連付けられる快適性のコストを決定すること、少なくとも部分的にオブジェクト軌道に基づいて、候補アクションに関連付けられる進行のコストを決定すること、または候補アクションに関連付けられる運用規則のコストを決定することのうちの少なくとも１つを含む。

Ｈ：段落ＦまたはＧのいずれかが説明するような方法で、アクションコストは、オブジェクトに関連付けられる快適性のコストを含み、快適性のコストは、オブジェクトの正の加速度、オブジェクトの負の加速度、またはオブジェクトの横方向の加速度のうちの少なくとも１つに少なくとも部分的に基づいている。

Ｉ：段落Ｆ～Ｈのいずれかが説明するような方法で、アクションコストは、安全性のコストを含み、安全性のコストは、車両の推定される車両位置と前記オブジェクトの推定されるオブジェクト位置との間の距離を決定すること、時間期間にわたって車両の推定される位置とオブジェクトの推定される位置との間の収束レートを決定すること、または車両とオブジェクトとの間の衝突の確率を決定することのうちの少なくとも１つに少なくとも部分的に基づいている。

Ｊ：段落Ｆ～Ｉのいずれかが説明するような方法で、候補アクションは、第１の候補アクションであり、オブジェクト軌道は、第１のオブジェクト軌道であり、方法は、環境においてとるべき車両の第２の候補アクションを決定すること、少なくとも部分的に第２の候補アクションに基づいて、第２のオブジェクト軌道を決定すること、少なくとも部分的に第２のオブジェクト軌道に基づいて、第２の候補アクションに関連付けられる安全性のコストを決定すること、安全性のコストが閾値の安全性のコストよりも高いということを決定するステップ、および少なくとも部分的に、安全性のコストが閾値の安全性のコストよりも高いということを決定することに基づいて、第２の候補アクションに関連付けられるデータを制御プラニングの考慮事項において除外することをさらに備える。

Ｋ：段落Ｆ～Ｉのいずれかが説明するような方法で、車両およびオブジェクトの第１の推定される状態を決定することであって、第１の推定される状態は、第１の時間での車両の第１の推定される位置および第１の時間でのオブジェクトの第１の推定される位置を含むこと、車両およびオブジェクトの第２の推定される状態を決定することであって、第２の推定される状態は、第２の時間での車両の第２の推定される位置および第２の時間でのオブジェクトの第２の推定される位置を含むこと、および第１の推定される状態に関連付けられる第１のコストおよび第２の推定される状態に関連付けられる第２のコストを決定することをさらに備え、アクションコストを決定するステップは、少なくとも部分的に、第１のコストおよび第２のコストに基づいている。

Ｌ：段落Ｆ～Ｋのいずれかが説明するような方法で、候補アクションは、第１の候補アクションであり、アクションコストは、第１のアクションコストであり、少なくとも部分的に第１のアクションコストに基づいて車両を制御することは、環境においてとるべき車両の第２の候補アクションを決定すること、少なくとも部分的に第２の候補アクションに基づいて、第２のオブジェクト軌道を決定すること、少なくとも部分的に第２のオブジェクト軌道に基づいて、第２の候補アクションに関連付けられる第２のアクションコストを決定すること、第１のアクションコストが第２のアクションコストよりも低いということを決定すること、および少なくとも部分的に、第１のアクションが第２のアクションよりも小さいことに基づいて、第１のアクションをたどるために車両を制御することを含む。

Ｍ：段落Ｆ～Ｌのいずれかが説明するような方法で、オブジェクトは、第１のオブジェクトであり、方法は、少なくとも部分的にセンサーデータに基づいて、環境における閉塞区域を決定することをさらに備え、候補アクションに関連付けられるアクションコストを決定することは、少なくとも部分的に閉塞区域に基づいている。

Ｎ：段落Ｍが説明するような方法で、第２のオブジェクトが閉塞区域において動作している確率は、機械学習技術、閉塞区域に関連付けられる道路のセクション、閉塞区域に関連付けられる車線の数、閉塞区域のサイズ、時刻、または曜日のうちの少なくとも１つに少なくとも部分的に基づいている。

Ｏ：システムまたはデバイスは、プロセッサ、および実行された場合に、プロセッサに、段落Ｆ～Ｎのいずれか１つで説明されるコンピューター実装方法を実行させる命令を格納する非一時的なコンピューター可読媒体を備える。

Ｐ：システムまたはデバイスは、処理のための手段、および処理のための手段に結合された格納のための手段を備え、格納のための手段は、段落Ｆ～Ｎのいずれか１つで説明されるコンピューター実装方法を実行するために１つまたは複数のデバイスを構成する命令を含む。

Ｑ：非一時的なコンピューター可読媒体は、実行された場合に、１つまたは複数のプロセッサに、少なくとも部分的にセンサーデータに基づいて、環境における第１の位置でのオブジェクトを決定すること、環境においてとるべき車両の候補アクションを決定すること、候補アクションに関連付けられるオブジェクト軌道を決定すること、オブジェクト軌道に関連付けられる加速度、または候補アクションに関連付けられるオブジェクト軌道と車両軌道との間の距離のうちの少なくとも１つに少なくとも部分的に基づいて、候補アクションに関連付けられるコストを決定すること、および、少なくとも部分的に、候補アクションに関連付けられるコストに基づいて、車両を制御することを含む動作を実行させる命令を格納する。

Ｒ：段落Ｑが説明するような非一時的なコンピューター可読媒体で、オブジェクトは、主要なオブジェクトであり、動作は、環境において二次的なオブジェクトを決定することであって、二次的なオブジェクトは、環境における主要なオブジェクトの後ろに位置されて、主要なオブジェクトと同一方向で走行すること、主要なオブジェクトに関連付けられる第１のコストを決定することであって、第１のコストは、少なくとも部分的に、候補アクションに応答するオブジェクトの加速度に基づいて、決定すること、および二次的なオブジェクトに関連付けられる第２のコストを決定することであって、第２のコストは、第１のコストのパーセンテージを含むことをさらに含み、コストは、少なくとも第１のコストおよび第２のコストを含む。

Ｓ：段落ＱまたはＲのいずれかが説明するような非一時的なコンピューター可読媒体で、候補アクションは、第１の候補アクションであり、オブジェクト軌道は、第１のオブジェクト軌道であり、動作は、環境においてとるべき車両の第２の候補アクションを決定すること、少なくとも部分的に第２の候補アクションに基づいて、第２のオブジェクト軌道を決定すること、少なくとも部分的に第２のオブジェクト軌道に基づいて、第２の候補アクションに関連付けられる安全性のコストを決定すること、安全性のコストが閾値の安全性のコストよりも高いということを決定すること、および少なくとも部分的に、安全性のコストが閾値の安全性のコストよりも高いということを決定することに基づいて、第２の候補アクションに関連付けられるデータを制御プラニングの考慮事項において除外することをさらに含む。

Ｔ：段落Ｑ～Ｓのいずれかが説明するような非一時的なコンピューター可読媒体で、候補アクションは、第１の候補アクションであり、オブジェクト軌道は、第１のオブジェクト軌道であり、動作は、環境においてとるべき車両の第２の候補アクションを決定すること、少なくとも部分的に第２のオブジェクト軌道に関連付けられる加速度に基づいて、第２の候補アクションに関連付けられるオブジェクトの快適性のコストを決定すること、オブジェクトの快適性のコストが閾値の快適性のコストよりも高いということを決定すること、および少なくとも部分的に、快適性のコストが閾値の快適性のコストよりも高いということを決定することに基づいて、第２の候補アクションに関連付けられるデータを制御プラニングの考慮事項において除外することをさらに含む。

Ｕ：段落Ｑ～Ｔのいずれかが説明するような非一時的なコンピューター可読媒体で、アクションコストを決定することは、候補アクションに関連付けられる安全性のコストを決定すること、少なくとも部分的にオブジェクト軌道に基づいて、候補アクションに関連付けられる安全性のコストを決定すること、少なくとも部分的にオブジェクト軌道に基づいて、候補アクションに関連付けられる進行のコストを決定すること、または候補アクションに関連付けられる運用規則のコストを決定することのうちの少なくとも１つを含む。

Ｖ：段落Ｑ～Ｕのいずれかが説明するような非一時的なコンピューター可読媒体で、動作は、少なくとも部分的にセンサーデータに基づいて、環境における閉塞区域を決定することをさらに含み、コストを決定することは、少なくとも部分的に閉塞区域にさらに基づいている。

上記のような例示的な条項が１つの具体的な実装に対して説明される一方で、本願の文脈において、本例示的な条項の内容はまた、方法、デバイス、システム、コンピューター可読媒体、および／または別の実装を介して実装されることが可能であることを理解されたい。さらに、例示的な条項Ａ～Ｖのいずれかは、単独で、または他の１つもしくは複数の例示的な条項Ａ～Ｖと組み合わせて実装されてよい。

（結論）
本明細書で説明される技術の１つまたは複数の例示が説明されてきた一方で、それらの例示の様々な変更形態、追加形態、置換形態、および均等形態が、本明細書で説明される技術範囲内に含まれる。

例示の説明において、主張される特許の主題の特定の例を示す、本願の一部を形成する添付図面に対する参照が行われる。他の例示が用いられることが可能であること、および構造上の変更などの変更または変形が行われることが可能であることを理解されたい。このような例示、変更または変形は、意図された発明の主題に対する範囲から必ずしも逸脱するものではない。本明細書におけるステップは、特定の順序で提供される一方で、ある場合において、順序が変更され得ることによって、説明されるシステムおよび方法の機能を変更することなく、特定の入力が異なる時間または異なる順序で提供される。開示された手順は、また、異なる順序で実行されることが可能である。さらに、本明細書におけるさまざまな算定は、開示される順序で実行される必要はなく、算定の代替の順序を用いる他の例示が容易に実装されることが可能である。順序変更されることに加えて、算定は、また、同一の結果を伴って部分的計算に分解されることが可能である。

Claims

車両であって、
センサーと、
１つまたは複数のプロセッサと、
１つまたは複数の前記プロセッサによって実行された場合に、
前記センサーから環境のセンサーデータを受信し、
少なくとも部分的に前記センサーデータに基づいて、前記環境における第１の位置でのオブジェクトを識別し、
前記車両が前記環境においてとることが可能である第１のアクションおよび第２のアクションを決定し、
前記第１のアクションに関連付けられる第１のオブジェクト軌道および前記第２のアクションに関連付けられる第２のオブジェクト軌道を決定し、
少なくとも部分的に前記第１のオブジェクト軌道に基づいて、前記第１のアクションに関連付けられる第１のアクションコストを決定することであって、前記第１のアクションは、第１の安全性のコスト、第１の快適性のコスト、第１の進行のコスト、または第１の運用規則のコストのうちの少なくとも１つに少なくとも部分的に基づいており、
少なくとも部分的に前記第２のオブジェクト軌道に基づいて、前記第２のアクションに関連付けられる第２のアクションコストを決定することであって、前記第２のアクションコストは、第２の安全性のコスト、第２の快適性のコスト、第２の進行のコスト、または第２の運用規則のコストのうちの少なくとも１つに少なくとも部分的に基づいており、
前記第１のアクションに関連付けられる前記第１のアクションコストが前記第２のアクションに関連付けられる前記第２のアクションコストよりも低いということを決定し、および
少なくとも部分的に、前記第１のアクションコストが前記第２のアクションコストよりも低いということを決定することに基づき、少なくとも部分的に前記第１のアクションに基づいて前記車両を制御するように、
前記車両を構成するプロセッサ実行可能命令を格納するメモリと
を備える車両。
前記第１の安全性のコストは、少なくとも部分的に、前記第１のオブジェクトに関連付けられるオブジェクトの状態の第１の関数、または前記第１のオブジェクトと前記車両との間の相対的な状態に基づき、
前記第１の快適性のコストは、少なくとも部分的に、前記第１のオブジェクトに関連付けられる前記オブジェクトの状態の第２の関数、または前記第１のオブジェクトと前記車両との間の前記相対的な状態に基づき、
前記第１の進行のコストは、少なくとも部分的に、前記オブジェクトの第１のオブジェクト時間の遅延に基づき、および
前記第１の運用規則のコストは、少なくとも部分的に、前記環境に関連付けられる１つまたは複数の規制に基づいている、
請求項１に記載の車両。
前記命令は、
前記車両が前記環境においてとることが可能である第３のアクションを決定し、
前記第３のアクションに関連付けられる第３のオブジェクト軌道を決定し、
前記第３のアクションに関連付けられる第３のコストを決定し、
前記第３のコストが閾値コストよりも高いということを決定し、および
制御プラニングの考慮事項から前記第３のアクションに関連付けられるデータを無視するように、
前記車両をさらに構成する請求項１または２のいずれかに記載の車両。
前記命令は、
少なくとも部分的に前記センサーデータに基づいて、前記環境における閉塞区域を決定し、
機械学習技術を利用して、前記閉塞区域において動作する第２のオブジェクトに関連付けられる確率を決定し、
前記確率が閾値を上回っているということを決定し、
前記第２のオブジェクトに関連付けられる予測されるオブジェクト軌道を決定し、および
前記第１のアクションコストおよび前記第２のアクションコストを決定することは、少なくとも部分的に、前記第２のオブジェクトに関連付けられる前記予測されるオブジェクト軌道にさらに基づくように、
前記車両をさらに構成する請求項１ないし３のいずれか一項に記載の車両。
前記第１のオブジェクト軌道および前記第２のオブジェクト軌道は、
機械学習アルゴリズム、
前記環境のトップダウン表現、
離散化された確率分布、
時相論理式、または
木探索法のうちの少なくとも１つに少なくとも部分的に基づいて決定される、
請求項１ないし４のいずれか一項に記載の車両。
少なくとも部分的にセンサーデータに基づいて、環境における第１の位置でのオブジェクトを決定するステップと、
前記環境においてとるべき車両の候補アクションを決定するステップと、
前記候補アクションに関連付けられるオブジェクト軌道を決定するステップと、
少なくとも部分的に、前記アクションに関連付けられる前記車両の前記オブジェクト軌道および車両軌道に基づいて、前記候補アクションに関連付けられるアクションコストを決定するステップと、
少なくとも部分的に、前記候補アクションに関連付けられる前記アクションコストに基づいて、前記車両を制御するステップと
を備える方法。
前記アクションコストを決定するステップは、
前記候補アクションに関連付けられる安全性のコストを決定するステップ、
少なくとも部分的に前記オブジェクト軌道に基づいて、前記候補アクションに関連付けられる快適性のコストを決定するステップ、
少なくとも部分的に前記オブジェクト軌道に基づいて、前記候補アクションに関連付けられる進行のコストを決定するステップ、または
前記候補アクションに関連付けられる運用規則のコストを決定するステップのうちの少なくとも１つを含む、
請求項６に記載の方法。
前記アクションコストは、前記オブジェクトに関連付けられる快適性のコストを含み、前記快適性のコストは、
前記オブジェクトの正の加速度、
前記オブジェクトの負の加速度、または
前記オブジェクトの横方向の加速度のうちの少なくとも１つに少なくとも部分的に基づいている、
請求項６または７のいずれかに記載の方法。
前記アクションコストは、安全性のコストを含み、
前記安全性のコストは、
前記車両の推定される車両位置と前記オブジェクトの推定されるオブジェクト位置との間の距離を決定するステップ、
時間期間にわたって前記車両の推定される位置と前記オブジェクトの推定される位置との間の収束レートを決定するステップ、または
前記車両と前記オブジェクトとの間の衝突の確率を決定するステップのうちの少なくとも１つに少なくとも部分的に基づいている、
請求項６ないし８のいずれか一項に記載の方法。
前記候補アクションは、第１の候補アクションであり、前記オブジェクト軌道は、第１のオブジェクト軌道であり、
前記方法は、
前記環境においてとるべき車両の第２の候補アクションを決定するステップと、
少なくとも部分的に前記第２の候補アクションに基づいて、第２のオブジェクト軌道を決定するステップと、
少なくとも部分的に前記オブジェクト軌道に基づいて、前記第２の候補アクションに関連付けられる安全性のコストを決定するステップと、
前記安全性のコストが閾値の安全性のコストよりも高いということを決定するステップと、
少なくとも部分的に、前記安全性のコストが前記閾値の安全性のコストよりも高いということを決定することに基づいて、前記第２のアクションに関連付けられるデータを制御プラニングの考慮事項において除外するステップと
をさらに備える請求項６ないし９のいずれか一項に記載の方法。
前記車両および前記オブジェクトの第１の推定される状態を決定するステップであって、前記第１の推定される状態は、第１の時間での前記車両の第１の推定される位置および前記第１の時間での前記オブジェクトの第１の推定される位置を含むステップと、
前記車両および前記オブジェクトの第２の推定される状態を決定するステップであって、前記第２の推定される状態は、第２の時間での前記車両の第２の推定される位置および前記第２の時間での前記オブジェクトの第２の推定される位置を含むステップと、
前記第１の推定される状態に関連付けられる第１のコストおよび前記第２の推定される状態に関連付けられる第２のコストを決定するステップとをさらに備え、
前記アクションコストを決定するステップは、少なくとも部分的に、前記第１のコストおよび前記第２のコストに基づいている、
請求項６ないし１０のいずれか一項に記載の方法。
前記候補アクションは、第１の候補アクションであり、
前記アクションコストは、第１のアクションコストであり、
少なくとも部分的に前記第１のアクションコストに基づいて前記車両を制御するステップは、
前記環境においてとるべき前記車両の第２の候補アクションを決定するステップと、
少なくとも部分的に前記第２の候補アクションに基づいて、第２のオブジェクト軌道を決定するステップと、
少なくとも部分的に前記第２のオブジェクト軌道に基づいて、前記第２の候補アクションに関連付けられる第２のアクションコストを決定するステップと、
前記第１のアクションコストが前記第２のアクションコストよりも低いということを決定するステップと、
少なくとも部分的に、前記第１のアクションが前記第２のアクションよりも小さいことに基づいて、前記第１のアクションをたどるために前記車両を制御するステップとを含む、
請求項６ないし１１のいずれか一項に記載の方法。
前記オブジェクトは、第１のオブジェクトであり、
前記方法は、
少なくとも部分的に前記センサーデータに基づいて、前記環境における閉塞区域を決定するステップをさらに備え、
前記候補アクションに関連付けられる前記アクションコストを決定するステップは、少なくとも部分的に前記閉塞区域に基づいている、
請求項６ないし１２のいずれか一項に記載の方法。
第２のオブジェクトが、
機械学習技術、
前記閉塞区域に関連付けられる道路のセクション、
前記閉塞区域に関連付けられる車線の数、
前記閉塞区域のサイズ、
時刻、または
曜日のうちの少なくとも１つに少なくとも部分的に基づいて、前記閉塞区域において動作しているということを決定するステップをさらに備える、
請求項１３に記載の方法。
実行された場合に、１つまたは複数のプロセッサに、請求項６ないし１４のいずれか一項に記載の方法を実行させる命令を格納する非一時的なコンピューター可読媒体。