JP2022539245A

JP2022539245A - アクションデータに基づくトップダウンシーンの予測

Info

Publication number: JP2022539245A
Application number: JP2022500033A
Authority: JP
Inventors: ガリメラゴーサム; コビラロフマリン; ギレルモモラレスモラレスアンドレス; ジェンユーワンカイ
Original assignee: ズークスインコーポレイテッド
Priority date: 2019-07-05
Filing date: 2020-07-02
Publication date: 2022-09-07
Also published as: CN114245885A; WO2021007106A1; EP3994539A4; US20210004611A1; US11631200B2; US20210271901A1; EP3994539A1; US11023749B2

Abstract

車両のアクションに基づいて、環境のトップダウン表現で予測を決定するための手法について、本明細書で説明する。第１の車両（自律車両など）のセンサは、環境のセンサデータをキャプチャでき、これは、第１の車両から離れたオブジェクト（車両または歩行者など）を含み得る。オブジェクトおよび環境のトップダウンビューを表すマルチチャネル画像を、センサデータ、マップデータ、および／またはアクションデータに基づいて生成できる。環境データ（オブジェクトの範囲、速度、レーンの位置、横断歩道など）を画像にエンコードできる。アクションデータは、第１の車両のターゲットレーン、軌道などを表すことができる。時間の経過に伴う環境を表す複数の画像を生成し、将来のオブジェクトの可能な位置に関連付けられた予測確率を出力するように構成された予測システムに入力することができ、これは自律車両のアクションに基づき得る。

Description

［関連出願の相互参照］
この特許出願は、２０１９年７月５日に出願されたシリアル番号１６／５０４，１４７の米国実用特許出願の優先権を主張する。出願シリアル番号１６／５０４，１４７は、参照により本明細書に完全に組み込まれている。

予測技術を使用して、環境内のエンティティの将来の状態を決定できる。つまり、予測技術を使用して、特定のエンティティが将来どのように動作する可能性があるかを決定できる。現在の予測技術は、多くの場合、環境内のエンティティの将来の状態を予測するための物理ベースのモデリングまたは道路規則シミュレーションを含む。

詳細な説明は添付の図面を参照して説明される。図面において、参照番号の左端の数字は参照番号が最初に現れる図を特定している。異なる図面における同じ参照番号の使用は類似または同一の項目または特徴を示す。

図１は、開示の例による、オブジェクトデータおよびアクションデータを受信し、環境を表すマルチチャネル画像を機械学習モデル内へ入力し、オブジェクトデータおよびアクションデータに基づく予測確率を受信するための例示的なプロセスの挿絵付きフロー図である。図２Ａは、本明細書に記載の技術を実装するための例示的なシステムのブロック図を示している。図２Ｂは、本明細書で説明される技術を実装するために機械学習モデルをトレーニングするための例示的なトレーニングコンポーネントのブロック図を示す。図３は、本開示の例による、予測システムへの入力および予測システムをトレーニングするためのトレーニングデータの例示的な図を示す。図４は、本開示の例による、２つの二重駐車車両を含むシナリオの第１および第２の予測確率の図であり、第２の予測確率はアクションデータに部分的に基づいている。図５は、本開示の例による、二重駐車車両を含むシナリオの第１および第２の予測確率の図であり、第２の予測確率はアクションデータに部分的に基づいている。図６は、本開示の例による、自律車両の前方でターンするオブジェクトを含むシナリオの第１および第２の予測確率の図であり、第２の予測確率はアクションデータに部分的に基づいている。図７は、本開示の例による、ジャンクションを横断する自律車両を含むシナリオの第１および第２の予測確率の図であり、第２の予測確率はアクションデータに部分的に基づいている。図８は、本開示の例による、ブロックされたジャンクションに進入する自律車両を含むシナリオの第１および第２の予測確率の図であり、第２の予測確率はアクションデータに部分的に基づいている。図９は、本開示の例による、別のジャンクションを横断する自律車両を含むシナリオの第１および第２の予測確率の図であり、第２の予測確率はアクションデータに部分的に基づいている。図１０は、本開示の例による、センサデータおよびアクションデータを受信し、マルチチャネル画像を生成し、予測確率を評価し、予測確率に基づいて車両を制御するための例示的なプロセスを示す。

環境および車両のアクションのトップダウン表現に基づいて予測を決定するための技術について、本明細書で説明する。第１の車両（自律車両など）のセンサは、環境のセンサデータをキャプチャでき、これは、第２の車両または歩行者などの車両から離れたオブジェクトを含み得る。トップダウンビューでオブジェクトおよび／または環境のさまざまなパラメータをエンコードするマルチチャネル画像（全体を通して単に画像と呼ばれ得る）を、センサデータ、マップデータ、および／またはアクションデータに基づいて生成できる。センサデータを使用して、オブジェクトに関連付けられたバウンディングボックスおよび速度情報、マップデータ、ならびにその他の意味情報（例えば、制限速度、レーン幅、レーン端、停止線、信号機、信号機の状態など）を表すマルチチャネル画像の１つまたは複数のチャネルを生成できる。アクションデータを使用して、第１の車両のターゲットレーン、軌道などを表すマルチチャネル画像の１つまたは複数のチャネル（たとえば、交差点を通過する車両、レーン変更、方向転換などを含むアクションに対応し得る）を生成できる。時間の経過に伴う環境を表す複数の画像を生成し、将来のオブジェクトの可能な位置に関連付けられた予測確率を出力するように構成された予測システムに入力することができる。予測確率を特定の候補アクションに基づいて生成または決定でき、予測確率を評価して、自律車両を制御する候補アクションを選択または決定できる。

密集した都市環境での自動運転は、オブジェクト間の多方向の相互作用を解決するためによく使用される複雑な推論のために、困難である。この推論は時間が重要であり得、絶えず進化し得る。本明細書で説明する技術は運転中のシナリオを対象としており、これは信号のない都市の交差点含み得るが、これに限定されない。これらのジャンクションでは、複数のオブジェクト（車両、歩行者、自転車など）が同じ共有スペースをめぐって競合することが多いため、交差点をうまくナビゲートするためにオブジェクトの意図を予測することが有効である。本明細書で説明する技術は、環境の履歴のいくつかのスナップショットが与えられた場合に、ジャンクションを通り横断するオブジェクトの運転動作を予測することを対象としている。一部の技術は、本明細書で説明するように、意味セグメンテーションスタイルのアプローチを使用して、予測確率（ヒートマップなど）として将来を予測できるディープ畳み込みニューラルネットワーク（ＣＮＮ）アーキテクチャを公式化する。

いくつかの例では、オブジェクトに関連付けられた予測確率は、異なる一連の操作にわたるガウス分布に限定され得ないが、代わりに、オブジェクトが将来存在する場所の時間の経過とともにインデックス付けされたヒートマップを含み得る（たとえば、任意の分布で）。いくつかの例では、ヒートマップの輝度は、セルまたはピクセルが時間内に指定されたインスタンス（例えば、占有グリッド）にて任意のオブジェクトによって占有される確率を表し得る。いくつかの例では、ヒートマップは、オブジェクトごとの任意の軌道分布と、明示的な操作仕様を使用せずに個別の操作（候補アクションなど）にわたる分布の両方をキャプチャし得る。いくつかの例では、このアプローチは多くの将来のモードを単一のヒートマップに自然に集約する。いくつかの例では、自律車両の意図に関するいくつかの信号を使用して、このマルチモダリティを解決できる。そのような例（例えば、アクションの意図を条件とする場合）では、そのようなヒートマップは、よりしっかりと密集した確率分布を含み得る。

車両（自律車両または自律ロボットなど）が交差点を安全に運転するために、世の中の他のオブジェクトの動作について推論すべきである。図１に関連して以下で論じられる例では、自律車両は交差点を横断し得る。自律車両は、対向するオブジェクトに譲るか否かを推測できる場合、安全にジャンクションを通過できる。いくつかの例では、本明細書で説明する技術は、予測確率（例えば、ヒートマップ）を、自律車両の意図（アクションデータとして表される）に条件づけることを含み得る。ヒートマップを自律車両の意図に条件付けすることにより、本明細書で説明する技術は、予測されるヒートマップのマルチモダリティを最小化することを含むことができる。すなわち、環境内のオブジェクトの予測は、自律車両によって実行することが提案された候補アクションに基づくことができ、そのような予測は、追加のオブジェクトに関して改善された予測を含み得る。機械学習モデルの出力を計画システムで使用して、ヒートマップ出力に基づいてコスト関数を決定し、ヒートマップ出力のコストを最小化する自律車両の最適なアクションを検索できる。

上記のように、技術は、時間の経過とともに環境を表す複数のマルチチャネル画像を生成することを含むことができる。画像または複数の画像を、将来のオブジェクトの可能な位置に関連付けられた予測確率を出力するように構成された予測システム（例えば、機械学習モデル）に入力できる。予測確率は、複数の候補アクションの候補アクションに関連付けることができる。個々の候補アクションを評価し、候補アクションに関連付けられたリスク、コスト、および／またはリワード（reward）を決定でき、候補アクションを、候補アクションの評価に少なくとも部分的に基づいて選択または決定できる。自律車両を、選択または決定された候補アクションに少なくとも部分的に基づいて制御できる。

自律車両によってキャプチャされるセンサデータは、ｌｉｄａｒデータ、ｒａｄａｒデータ、画像データ、飛行時間データ（time of flight data）、ｓｏｎａｒデータなどを含むことができる。いくつかのケースでは、センサデータを、環境内のオブジェクトのタイプ（例えば、車両、歩行者、自転車、動物、駐車中の自動車、樹木、建物など）を決定するように構成される知覚システムに対して提供できる。さらに、知覚システムは、センサデータに基づいて、環境内のオブジェクトに関する動き情報を決定できる。センサデータおよびセンサデータに基づく任意のデータを、環境のトップダウンビューで表すことができる。たとえば、画像は、環境内のオブジェクトの位置、ならびに、オブジェクトの範囲（例えば、オブジェクトの長さおよび幅）およびオブジェクトの分類（例えば、車両、歩行者など）を表す２次元のバウンディングボックスとしてオブジェクトを表すことができる。速度情報などの動き情報は、バウンディングボックスに関連付けられた速度ベクトルとして表すことができるが、他の表現も想定される。

いくつかのケースでは、予測システムに入力される画像は、マルチチャネル画像の個々のチャネルで表すことができ、各チャネルは、オブジェクトおよびオブジェクトが位置する環境に関するさまざまな情報を表す。たとえば、チャネルはセンサデータに基づいて決定、またはそうでなければ、システムで利用可能なマップデータで受信／エンコードされ得る道路ネットワーク情報（例えば、レーン、横断歩道、停止線、レーン仕切り、一時停止標識、交差点、信号機などを示す意味ラベル）、信号機の状態（例えば、赤信号、黄信号、緑信号など）、オブジェクトに関連付けられたバウンディングボックス、ｘ方向およびｙ方向のオブジェクトの速度、ｘ方向およびｙ方向のオブジェクトの加速度、オブジェクトの点滅状態（左折、右折、ブレーキ、後進、ハザード、ライトなしなど）など、の１つまたは複数を表し得るが、これらに限定されない。

いくつかの例では、計画システムは自律車両が環境内で実行する１つまたは複数の候補アクションを生成する、またはそうでなければ決定できる。例えば、第１の候補アクションは、現在のレーンに留まることを含み得、一方、第２の候補アクションは、現在のレーンの左または右へのレーン変更を含み得る。別の例として、第３の候補アクションはジャンクションを通り横断することを含み得、一方、第４の候補アクションはジャンクションでの左または右の調整を含み得る。いくつかの例では、候補アクションは、マルチチャネル画像において、強調表示、図解、注釈付け、またはその他の表示として、車両が環境内で辿るターゲットレーンまたは候補軌道を表すことができる。

いくつかの例では、候補アクションは、１つまたは複数のサブゴールに関連付けられ得る。例えば、サブゴールは、目標速度または加速度、平均速度または加速度、最大あるいは最小速度または加速度などの速度情報または加速度情報を含み得る。いくつかの例では、サブゴールは、ステアリング角度、オブジェクトからの距離、基準線からの距離などを含み得るが、これらに限定されない。いくつかの例では、サブゴールは、マルチチャネル画像のチャネルとして表すことができる。

いくつかの例では、複数のチャネルを予測システムに入力して、予測確率を生成できる。いくつかの例では、画像を予測システムに直接入力して（たとえば、画像に基づいて複数のチャネルを生成することなく）、予測確率を生成できる。

いくつかの例では、チャネルの数をより少ないチャネルに減らし得る。非限定的な例として、単純な３チャネル（例えば、ＲＧＢ）画像を使用して、複数の意味情報を表し得る。そのような例では、例えば、赤のチャネルを使用してバウンディングボックスを示し得、赤の値の輝度は、速度、加速度などに関連付け得る。そのような例では、第２のチャネルは、速度制限などを示す輝度でレーン幅をエンコードし得る。さらに、そのような例では、第３のチャネルは、特定の候補アクションに関連付けられたターゲットレーンを識別することによって候補アクションをエンコードし得る。

いくつかの例では、予測システムは、１つまたは複数の予測軌道を生成するために使用できるデータを出力するようにトレーニングされた機械学習モデルを含むことができる。たとえば、機械学習モデルは、将来の１つまたは複数の時間（例えば、１秒、２秒、３秒など）において、オブジェクト（例えば、サードパーティの車両）に関連付けられた座標（例えば、ｘ座標およびｙ座標）を出力できる。いくつかの例では、機械学習モデルは、オブジェクトに関連付けられた座標、および各座標に関連付けられた確率情報を出力できる。いくつかの例では、機械学習モデルは、畳み込みニューラルネットワーク（ＣＮＮ）を含むことができ、これは長短期記憶（ＬＳＴＭ）層などの１つまたは複数のリカレントニューラルネットワーク（ＲＮＮ）層を含み得るが、これらに限定されない。いくつかの例では、機械学習モデルは予測確率に関連付けられたヒートマップを出力できる。いくつかの例では、少なくとも１つの予測軌道を、ヒートマップに少なくとも部分的に基づいて決定できる。

ヒートマップは、自律車両に近接する環境の個別化された領域を表すことができる。たとえば、ヒートマップは、自律車両の周囲の１００メートル×１００メートルの領域を表す６４ｘ６４グリッド（またはＪｘＫサイズのグリッド）を表すことができる。もちろん、ヒートマップは任意のサイズの領域を表すことができ、任意の数の個別の部分の領域を表すことができる。いくつかのケースでは、ヒートマップの一部をヒートマップのセルと呼ぶことができる。各セルは、オブジェクトがヒートマップに対応する時間に環境内の対応する場所にいる確率を表す予測確率を含むことができる。いくつかの例では、機械学習モデルは複数のヒートマップを出力でき、複数のヒートマップのヒートマップは、将来の特定の時間（例えば、０．５秒、１秒、３秒、５秒、１０秒など）における環境に関連付けられた確率予測（例えば、オブジェクトおよび／または自律車両）を表すことができる。

いくつかの例では、１つまたは複数のヒートマップを、少なくとも１つの予測軌道の代わりにまたは加えて、計画システムに提供できる。

いくつかの例では、本明細書で説明する技術は、相互作用を考慮して、ツリー検索の解釈可能な限界コストを提示する、１つまたは複数の確率的マップとして可能なシナリオを生成することを含むことができる。いくつかの例では、この技術は、ネットワーク入力を介した自律車両の意図に条件づけること（たとえば、自律車両の軌道を制約することなく、マルチチャネル画像の１つまたは複数のチャネルとして）を含む。さらに、本開示の態様は、自律車両の周囲のオブジェクトならびに自律車両自体の将来の状態を、時間の経過とともに積み重ねられたヒートマップとして予測できる機械学習アルゴリズム（例えば、畳み込みニューラルネットワーク）を含む。上記のように、機械学習モデルから出力されるヒートマップ（または予測確率）は、自律車両の１つまたは複数の候補アクションを条件とすることができる。さらに、技術は、自律車両の意図をゴールおよびサブゴールに個別化することを含むことができ、プランニングシステムが自律車両の最良の（または最適な）候補アクションを検索することを可能にする。さらに、本開示の態様は、自律車両と環境内の他のオブジェクトとの間の異なるタイプの相互作用を示すデータを含む。

本明細書で説明する技術は、いくつかの追加の手段でコンピューティングデバイスの機能を改善できる。いくつかのケースでは、環境と環境内のオブジェクトをトップダウンビューとして表すことは、予測確率を生成することおよび／または候補アクションから選択することを目的として、環境の単純化された表現を表すことができる。いくつかのケースでは、画像は環境の特定の特徴を抽出せずに環境を表すことができ、これは、予測システムの生成およびその後の少なくとも１つの予測軌道の生成が単純化され得る。いくつかのケースでは、予測確率を評価することは、自律車両が環境を横断するためのより正確および／または安全な軌道を、自律車両が生成することを可能にし得る。たとえば、第１の候補アクションに関連付けられた予測確率を評価して、衝突または衝突寸前の可能性を決定でき、環境を安全に横断するために、自律車両が別の候補アクション（例：車線変更、停止など）を選択または決定することを可能にし得る。本明細書に記載の少なくともいくつかの例では、意図されたアクションに加えて環境のトップダウンエンコーディングに基づく条件付け予測が、オブジェクトに関連付けられた確率分布関数の拡大を最小化（改善）し、システムのより安全な意思決定をもたらし得る。コンピュータの機能に対するこれらおよびその他の改善を本明細書で説明する。

本明細書で説明される技術を、いくつかのやり方で実装できる。例示的な実装形態について、以下の図面を参照しながら以下に説明する。自律車両のコンテキストで説明されるが、本明細書で説明される方法、装置、およびシステムは、様々なシステム（例えば、センサシステム、またはロボットプラットフォーム）に適用することができ、自律車両に限定されない。一例において、同様の技術は、そのようなシステムが様々な操作を実行することが安全であるかどうかの指示を提供し得る運転者制御車両において利用され得る。別の例において、技術を、航空もしくは航海のコンテキストにおいて、またはシステムに対して知られていない動作に関連付けられ得るオブジェクトもしくはエンティティを含む任意のシステムにおいて、利用できる。さらに、センサデータは、画像データ（例えば、ステレオカメラ、飛行時間データ（time-of-flight data）など）、ｌｉｄａｒデータ、ｒａｄａｒデータ、ｓｏｎａｒデータなどのような任意の２次元、３次元、または多次元データを含むことができる。加えて、本明細書で説明される技術は、実データ（例えば、センサを使用してキャプチャされた）、シミュレートデータ（例えば、シミュレータによって生成された）、またはその２つの任意の組合せで使用できる。

図１は、開示の例による、オブジェクトデータおよびアクションデータを受信し、環境を表すマルチチャネル画像を機械学習モデルに入力し、オブジェクトデータおよびアクションデータに基づく予測確率を受信するための例示的なプロセス１００の挿絵付きフロー図である。

操作１０２において、プロセスは、環境内のオブジェクトを表すオブジェクトデータを受信することを含むことができる。いくつかの例では、オブジェクトデータを、自律車両の知覚システムから受信できる。例えば、オブジェクトデータは、環境、速度および／または加速度情報、分類情報などに関連付けられた１つまたは複数のバウンディングボックスを含むことができるが、これに限定されない。いくつかの例では、操作１０２は、環境のセンサデータをキャプチャすることを含むことができる。いくつかの例では、センサデータを、自律車両の１つまたは複数のセンサによってキャプチャできる。例えば、センサデータは、ｌｉｄａｒセンサ、ｒａｄａｒセンサ、画像センサ、飛行時間センサ（time of flight sensor）、ｓｏｎａｒセンサなどのうちの１つまたは複数によってキャプチャされるデータを含むことができる。少なくともいくつかの例では、追加の環境データ（例えば、レーン、基準線、横断歩道、交通デバイスおよび／または標識などの部分をエンコードする環境のマップデータ）を受信し得る。

例１０４は、自律車両１０６が環境を横断している環境を示している。いくつかの例では、自律車両１０６はプロセス１００の操作を実行でき、これは環境のセンサデータをキャプチャすることを含むことができる。説明を目的として、センサデータをキャプチャする（または利用する）車両は、ドライバー（または乗員）の車両の常時制御を期待せず、全体行程の全ての安全上重要な機能を実行可能な車両について説明する米国国家高速道路交通安全局が発行するレベル５分類に従って操作するように構成された自律車両とすることができる。このような例では、全ての駐車機能を含む開始から停止までの全ての機能を制御するように、車両を構成できるので、無人化できる。これは単なる例であり、本明細書で説明するシステムおよび方法は、ドライバーが常に手動で制御する必要がある車両から、部分的または完全に自律的に制御されているものまでを含む任意の地上、空中、または水上車両に組み込むことができる。車両に関連付けられた追加の詳細は、本開示全体を通して説明される。

オブジェクト１０８も環境内に配置されている。いくつかの例では、オブジェクト１０８は、車両、歩行者、自転車、動物などを表すことができる。例１０４に示される環境は、運転可能領域および運転不可能領域を含むことができる。いくつかの例では、操作１０２は、環境内の自律車両１０６を位置推定すること、および、環境に関連付けられたマップデータにアクセスすることを含むことができる。たとえば、マップデータは、レーン標示、レーン境界、１つまたは複数のレーン参照１１０（たとえば、レーンに関連付けられた中心線および／または利用可能な（たとえば、合法的な）レーン間のルートを示す）などのマップ要素を含むことができる。マップ要素の追加の例は、１つまたは複数のレーン要素、自転車専用レーン要素、横断歩道要素、交差要素、レーン分割要素、信号機要素、一時停止の標識要素、停止線要素、譲歩記号要素、譲歩線要素、駐車レーン要素、ドライブウェイ要素、スピードバンプ要素、ジョイウォーキング領域（仮想横断歩道など）、軌道の通過点（既知の軌道など）、乗客のピックアップポイント、標識位置要素、ジオフェンス要素などを含むことができるが、これらに限定されない。

いくつかの例では、操作１０２でキャプチャされたセンサデータを使用して、オブジェクト１０８に関する情報、限定ではないがオブジェクトのタイプ（例えば、車両、歩行者、自転車、動物などのオブジェクトの分類を示す意味情報）を含む、を決定できる。いくつかの例では、操作１０２は、本明細書で説明されるように、オブジェクト１０８のタイプ、オブジェクト１０８に関連付けられたバウンディングボックス、および／またはオブジェクトに関連付けられた動き情報を決定することを含むことができる。

操作１１２において、プロセスは、環境内の自律車両の候補アクションに関連付けられたアクションデータを受信することを含むことができる。例１１４は、候補アクション１１６（例えば、譲歩アクションなどの第１の候補アクション）および候補アクション１１８（例えば、「交差点を通過する」アクションなどの第２の候補アクション）を示す。

すなわち、候補アクション１１６は、自律車両１０６の計画システムからの、オブジェクト１０８に譲歩し、オブジェクト１０８が交差点を通り横断するまで交差点を通り横断することを控えるという指示（または、一定期間の経過などの一部の他のトリガー）を含むことができる。

候補アクション１１８は、オブジェクト１０８がジャンクションを横断することを可能にする前に、例１０４に示されるジャンクションを横断することを含むことができる。

いくつかの例では、アクションデータはさまざまなやり方で表すことができる。いくつかの例では、例１０４は、アクションデータを現在のレーン１２０およびターゲットレーン１２２として示している。いくつかの例では、本明細書で説明されるように、候補アクション１１６および１１８に関連付けられた情報は、現在のレーン１２０および／またはターゲットレーン１２２、ならびに、速度プロファイルおよび／または加速度プロファイル（例えば、サブゴール）、を介して表すことができる。

操作１２４において、プロセスは、環境のトップダウンビューを表すマルチチャネル画像を機械学習モデルに入力することを含むことができ、マルチチャネル画像はオブジェクトデータおよびアクションデータに基づいている。そのようなマルチチャネル画像の例は、例１２６および１２８に示されている。

例１２６は、第１の候補アクション１１６に関連付けられた第１のマルチチャネル画像を表す。例えば、例１２６は、第１のチャネル１３２、第２のチャネル１３４、および第３のチャネル１３６を含む。いくつかの例では、第１のチャネル１３２は、環境内の自律車両１０６および／またはオブジェクト１０８のバウンディングボックス、位置、範囲（例えば、長さおよび幅）などを表すことができる。いくつかの例では、第２のチャネル１３４は、候補アクション１１６に関連付けられたアクションデータを表すことができる。例えば、第２のチャネル１３４は、候補アクション１１６に関連付けられた現在のレーン１２０および／またはターゲットレーン１２２を示すことができる。いくつかの例では、第３のチャネル１３６は、追加のアクションデータを表すことができ、このケースでは、候補アクション１１６を実施する自律車両１０６に関連付けられた速度情報１４０（例えば、Ｖ１）に対応する。いくつかの例では、速度情報１４０は、瞬間速度、平均速度などを含むことができる。例えば、候補アクション１１６が譲歩行動を示すところでは、速度情報１４０は比較的低い速度を表すことができる（または、自律車両１０６がオブジェクト１０８に譲歩する間の停止速度を表すことができる）。速度のコンテキストで説明しているが、速度情報１４０は、加速度（たとえば、アクション全体の平均、アクションに関連付けられた最大加速度など）、ステアリング角度、基準線または障害物からの距離などに関連付けられた情報を表すことができる。

例１２８は、第２の候補アクション１１８に関連付けられた第２のマルチチャネル画像を表す。いくつかの例では、例１２８のいくつかの態様は、例１２６のいくつかの態様と等しくすることができる。例えば、例１２８は、第１のチャネル１３２、第２のチャネル１３４、および第３のチャネル１４２を含むことができる。いくつかの例では、第３のチャネルは、第２の候補アクション１１８に関連付けられ得る速度情報１４４を含むことができる。例えば、第２の候補アクション１１８がオブジェクト１０８の前に交差点を通り横断する自律車両１０６を表し得るところでは、速度情報１４４（例えば、Ｖ２）は、第１の候補アクション１１６に関連付けられた第２の速度情報１４０よりも高い平均速度（または速度プロファイル）を表し得る。上記のように、速度のコンテキストで説明しているが、速度情報１４４は、加速度（たとえば、アクション全体の平均、アクションに関連付けられた最大加速度など）、ステアリング角度、基準線または障害物からの距離などに関連付けられた情報を表すことができる。

もちろん、例１２８は、第２の候補アクション１１８が第１の候補アクション１１６とは異なる位置を表す場合（たとえば、第１の候補アクション１１６が直進を表し、第２の候補アクション１１８が左または右折を表す場合）、第２のチャネル１３４で表されるアクションデータとは異なるアクションデータを含み得る。

いくつかの例では、自律車両１０６の意図をエンコード（例えば、チャネル１３４を介して）することを、自律車両１０６の正確な軌道を指定することなく、部分的な将来の情報として提供できる。いくつかの例では、１）入口レーン（例えば、現在のレーン１２０）と出口レーン（例えば、ターゲットレーン１２２）をペイントする、またはそうでなければ示すことによって、２）高いおよび低い将来の平均加速度ならびに速度を（例えば、チャネル１３６および／または１４２として）示す個別のブロブ（blob）を提供することによって、意図をエンコードすることができる。

上記の第１の意図信号（例えば、第２のチャネル１３４）は、特定の候補アクションに関連付けられたターゲットレーン１２２を使用する。ターゲットレーン１２２を提供することにより、技術は、自律車両１０６に関連付けられた計画された軌道に基づくものを優先して、各ジャンクション出口に対するようなマルチモーダル出力を削除できる。

上記の第２の意図（例えば、チャネル１３６および１４２）は、サブゴールを示し、自律車両１０６の意図された速度および／または加速度プロファイルを含み得る。いくつかのケースでは、このサブゴールの意図は、指定された予測地平までの将来の自律車両１０６の平均加速度の個別化された値を提供する。いくつかのケースでは、サブゴールの意図は、自律車両が近い将来に何をするかを示している。たとえば、急な減速は、自律車両が一部の他のオブジェクトのためにブレーキすることを意味する。急な加速は、オブジェクトがジャンクションを通過するためにスピードを上げていることを意味する。同様の意図はまた、自律車両１０６の速度次元に適用される。意図はマルチモーダル出力を削除するように設計されているが、同時に、自律車両１０６および／またはオブジェクト１０８の出力を単一の軌道に制約しない。

理解できるように、例１２６および１２８は、環境内の様々な時点での環境を表す複数のマルチチャネル画像を含むことができる。例えば、例１２６および／または１２８は、自律車両１０６およびオブジェクト１０８（および歩行者や車両などの他のオブジェクト）の履歴を、過去４秒間にわたって０．５秒間隔で表すことができるが、任意の数のインスタンスおよび期間を使用して環境を表すことができる。

いくつかの例では、例１２６および／または１２８は、最新の時間ステップ（例えば、時間ｔ₀）および／または経時的（例えば、時間ｔ_-mから時間ｔ₀）な方向指示器、ブレーキライト、ハザードライトなどの補助入力を表すチャネルを含むことができる。追加のチャネルは、自律車両１０６および／またはオブジェクト１０８の運動学的情報（運動学的データ、モーション情報、またはモーションデータとも呼ばれる）（たとえば、一定期間の平均速度または加速度、前の時点での瞬間速度または加速度、ホイール角度、ターン速度、ヨー、ピッチ、ロールなど）、意味情報（例えば、車両分類、ターンシグナルインジケータ、ブレーキライトインジケータ、二重駐車車両表示など）、閉塞グリッド（例えば、自律車両１０６の１つまたは複数のセンサから不可視の環境のエリア、または閉塞すると予測されるエリアなどを示す）などを含み得るが、これらに限定されない。

理解できるように、操作１２４は、本明細書で説明されるように、マルチチャネル画像を生成または決定することを含むことができる。マルチチャネル画像の生成または決定の例は、「Trajectory Prediction on Top-Down Scenes」と題され、２０１８年１０月４日に出願された米国特許出願番号１６／１５１，６０７に関連して説明されている。米国特許出願番号１６／１５１，６０７は、その全体が参照によって本明細書に組み込まれている。

操作１４６にて、プロセスは、機械学習モデルから、およびマルチチャネル画像に基づいて、オブジェクトおよび／または自律車両に関連付けられた予測確率を受信することを含むことができる。理解できるように、マルチチャネル画像は本明細書で論じられるように、アクションデータに基づくことができるので、予測確率はアクションデータに基づくことができる。

例１４８および１５０はそれぞれ機械学習モデルの出力を示しています。いくつかの例では、例１４８および１５０は、オブジェクト１０８がそれぞれのヒートマップに対応する時間におよびそれぞれの候補アクションに基づいて、環境内の対応する位置にいるであろう確率を示す予測確率を表す（例えば、環境のトップダウンの観点から）ことができるヒートマップを含む。すなわち、つまり、例１４８は、時間ｔ₀の後の時間ｔ_1Aを表すことができ、「Ａ」の指定は第１の候補アクション１１６に対応する。例１５０は、時間ｔ₀の後の時間ｔ_1Bを表すことができ、「Ｂ」指定は第２の候補アクション１１８に対応する。例１４８および１５０は、将来の自律車両１０６および／またはオブジェクト１０８のヒートマップおよび／または予測確率を表すことができる。もちろん、ヒートマップの例１４８および１５０は、任意の期間における予測確率を表すことができ、本明細書で説明されるエクスプレス時間に限定されない。

例１４８は、予測確率１５２、１５４、１５６、および１５６を表す。いくつかの例では、予測確率１５２および１５４は、第１の候補アクション１１６を実行する自律車両１０６に少なくとも部分的に基づく、環境内のオブジェクト１０８の可能な位置を表す。予測確率１５６および１５８は、アクションデータ（たとえば、チャネル１３４および１３６）を条件とする自律車両１０６の可能な位置を表す。

例１５０は、予測確率１６０、１６２、および１６４を表します。いくつかの例では、予測確率１６０は、第２の候補アクション１１８を実行する自律車両１０６に少なくとも部分的に基づく、環境内のオブジェクト１０８の可能な位置を表す。予測確率１６２および１６４は、アクションデータ（たとえば、チャネル１３４および１４２）を条件とする自律車両１０６の可能な位置を表す。

さらに、プロセス１００は、候補アクションを評価すること、および／または候補アクションに少なくとも部分的に基づいて自律車両１０６を制御することを含むことができる。例えば、プロセス１００は、自律車両１０６を表すバウンディングボックスの重複の量と、オブジェクト１０８に関連付けられた予測確率と、を決定することを含むことができる。いくつかの例では、プロセスは、自律車両１０６の候補軌道を評価して、予測される将来の動きと予測確率１５６、１５８、１６２、および／または１６４との間の重複を決定することを含むことができる。

図２Ａは、本明細書に記載の技術を実施するための例示的なシステム２００のブロック図を示している。少なくとも１つの例では、システム２００は、車両２０２を含むことができる。

車両２０２は、１つまたは複数の車両コンピューティングデバイス２０４（１つの車両コンピューティングデバイス２０４または複数の車両コンピューティングデバイス２０４とも呼ばれる）、１つまたは複数のセンサシステム２０６、１つまたは複数のエミッタ２０８、１つまたは複数の通信接続部２１０、少なくとも１つの直接接続部２１２、および１つまたは複数のドライブシステム２１４を含むことができる。

車両コンピューティングデバイス２０４は、１つまたは複数のプロセッサ２１６および１つまたは複数のプロセッサ２１６と通信可能に結合されたメモリ２１８を含むことができる。図示の例では、車両２０２は自律車両であるが、車両２０２は任意の他のタイプの車両とすることができる。図示の例では、車両コンピューティングデバイス２０４のメモリ２１８は、位置推定コンポーネント２２０、知覚コンポーネント２２２、１つまたは複数のマップ２２４、１つまたは複数のシステムコントローラ２２６、画像生成コンポーネント２３０および機械学習コンポーネント２３２を含む予測コンポーネント２２８、および軌道生成コンポーネント２３６および評価コンポーネント２３８を含む計画コンポーネント２３４を格納する。例示の目的でメモリ２１８に存在するものとして図２に示されているが、位置推定コンポーネント２２０、知覚コンポーネント２２２、１つまたは複数のマップ２２４、１つまたは複数のシステムコントローラ２２６、予測コンポーネント２２８、画像生成コンポーネント２３０、機械学習コンポーネント２３２、計画コンポーネント２３４、軌道生成コンポーネント２３６、および評価コンポーネント２３８は、追加的に、または代替的に、車両２０２（例えば、遠隔に格納された）にアクセス可能であり得ることが企図されている。

少なくとも１つの例では、位置推定コンポーネント２２０は、センサシステム２０６からデータを受信して、車両２０２の位置および／または方向（例えば、１つまたは複数のｘ、ｙ、ｚ位置、ロール、ピッチ、またはヨー）を決定する機能を含むことができる。例えば、位置推定コンポーネント２２０は、環境のマップを含み、および／または要求／受信でき、マップ内の自律車両の位置および／または方向を継続的に決定できる。いくつかの例では、位置推定コンポーネント２２０は、ＳＬＡＭ（同時位置推定およびマッピング）、ＣＬＡＭＳ（較正、位置推定およびマッピングを同時に）、相対ＳＬＡＭ、バンドル調整、非線形最小二乗最適化などを利用して、画像データ、ＬＩＤＡＲデータ、ｒａｄａｒデータ、ＩＭＵデータ、ＧＰＳデータ、ホイールエンコーダデータなどを受信し、自律車両の位置を正確に決定できる。いくつかの例では、位置推定コンポーネント２２０は、本明細書で説明するように、車両２０２の様々なコンポーネントにデータを提供し、軌道を生成するための、および／またはマップデータを生成もしくは受信するための自律車両の初期位置を決定できる。

いくつかの例では、知覚コンポーネント２２２は、オブジェクトの検出、セグメンテーション、および／または分類を実行する機能を含むことができる。いくつかの例では、知覚コンポーネント２２２は、車両２０２に近接するエンティティの存在および／またはエンティティタイプ（例えば、自動車、歩行者、自転車、動物、建物、木、路面、縁石、歩道、不明など）としてのエンティティの分類を示す処理済みセンサデータを提供できる。追加または代替の例では、知覚コンポーネント２２２は、検出されたエンティティ（例えば、追跡されたオブジェクト）に、および／またはエンティティが位置している環境に関連付けられた１つまたは複数の特性を示す処理されたセンサデータを提供できる。いくつかの例では、エンティティに関連付けられた特性は、ｘ位置（グローバルおよび／またはローカル位置）、ｙ位置（グローバルおよび／またはローカル位置）、ｚ位置（グローバルおよび／またはローカル位置）、方向（たとえば、ロール、ピッチ、ヨー）、エンティティタイプ（たとえば、分類）、エンティティの速度、エンティティの加速度、エンティティの範囲（サイズ）などを含むことができるが、これらに限定されない。環境に関連付けられた特性は、環境内の別のエンティティの存在、環境内の別のエンティティの状態、時刻、曜日、季節、気象条件、暗闇／光の表示などを含むことができるが、これらに限定されない。

メモリ２１８は、環境内でナビゲートするために車両２０２によって使用できる１つまたは複数のマップ２２４をさらに含むことができる。この説明を目的として、マップは、これらに限定されないが、トポロジー（交差点など）、車道、山脈、道路、地形、および一般的な環境などの環境についての情報を提供することが可能である、２次元、３次元、またはＮ次元でモデル化された任意の数のデータ構造とすることができる。いくつかの例では、マップは、テクスチャ情報（例えば、色情報（例えば、ＲＧＢ色情報、ラボ色情報、ＨＳＶ／ＨＳＬ色情報）など）、強度情報（例えば、ＬＩＤＡＲ情報、ＲＡＤＡＲ情報など）、空間情報（たとえば、メッシュに投影された画像データ、個々の「サーフェル」（たとえば、個々の色および／または強度に関連付けられたポリゴン））、および反射率情報（例えば、鏡面反射率情報、再帰反射率情報、ＢＲＤＦ情報、ＢＳＳＲＤＦ情報など）を、含むことができるが、これらに限定されない。一例では、マップは環境の３次元メッシュを含むことができる。いくつかの例では、マップの個々のタイルが環境の個別の部分を表すように、マップをタイルフォーマットで格納でき、本明細書で説明するように、必要に応じて作業メモリにロードできる。少なくとも１つの例では、１つまたは複数のマップ２２４は、少なくとも１つのマップ（例えば、画像および／またはメッシュ）を含むことができる。いくつかの例では、車両２０２はマップ２２４に少なくとも部分的に基づいて制御できる。すなわち、マップ２２４を、位置推定コンポーネント２２０、知覚コンポーネント２２２、予測コンポーネント２２８、および／または計画コンポーネント２３４に関連して使用し、車両２０２の位置を決定し、環境内のオブジェクトを識別し、オブジェクトおよび／または車両２０２に関連付けられた予測確率を生成し、および／または環境内をナビゲートするためのルートおよび／または軌道を生成できる。

いくつかの例では、１つまたは複数のマップ２２４は、ネットワーク２４０を介してアクセス可能なリモートコンピューティングデバイス（コンピューティングデバイス２４２など）に格納できる。いくつかの例では、複数のマップ２２４は、例えば、特性（例えば、エンティティタイプ、時刻、曜日、季節など）に基づいて格納できる。複数のマップ２２４を格納することは同様のメモリ要件を有することができるが、マップ内のデータにアクセスできる速度を増加させる。

少なくとも１つの例示において、車両コンピューティングデバイス２０４は、１つまたは複数のシステムコントローラ２２６を含むことができ、これは、車両２０２のステアリング、推進、ブレーキ、安全性、エミッタ、通信、およびその他のシステムを制御するよう構成できる。これらのシステムコントローラ２２６は、ドライブシステム２１４の対応するシステムおよび／または車両２０２の他のコンポーネントと通信および／または制御できる。

概して、予測コンポーネント２２８は、環境内のオブジェクトの予測された軌道を生成できる。例えば、予測コンポーネント２２８は、車両２０２からの閾値距離内で、車両、歩行者、動物などの１つまたは複数の予測軌道を生成できる。いくつかの例では、予測コンポーネント２２８は、オブジェクトのトレースを測定し、観察および予測された動作に基づいてオブジェクトの軌道を生成できる。

いくつかの例では、画像生成コンポーネント２３０は、シーンのトップダウンビューを表す画像を生成する機能を含むことができる。画像生成コンポーネント２３０によって生成されたそのような画像の例は、例１０４、１２６、および１２８として図１に示されている。

いくつかの例では、画像生成コンポーネント２３０は、車両２０２の周りのエリアを表す画像を生成できる。いくつかの例では、エリアは、センサから可視のエリア（例えば、センサ範囲）、後退地平線（a receding horizon）、アクション（例えば、交差点を横断する）に関連付けられたエリアなどに少なくとも部分的に基づくことができる。いくつかの例では、画像は、車両２０２の周りの１００メートル×１００メートルのエリアを表し得るが、任意のエリアが企図される。画像生成コンポーネント２３０は、知覚コンポーネント２２２から環境内のオブジェクトに関するデータを受信でき、位置推定コンポーネント２２０、知覚コンポーネント２２２、および１つまたは複数のマップ２２４から環境自体に関するデータを受信できる。画像生成コンポーネント２３０は、環境内のオブジェクト（たとえば、本明細書で説明するように、バウンディングボックスで表される）、オブジェクトに関する意味情報（例えば、分類タイプ）、動き情報（例えば、速度情報、加速度情報など）などを含む環境のトップダウンビューを生成できる。画像生成コンポーネント２３０は、オブジェクトおよび環境の様々な属性を表す画像内に画像要素（例えば、記号または他の表現）をさらに生成することができ、１つまたは複数の速度ベクトル、１つまたは複数の加速度ベクトル、照明インジケータ（たとえば、それぞれのインジケーターステータスとして表される、オブジェクトのブレーキライト、オブジェクトのターンシグナルライトなど）、信号機情報（信号機の状態など）、レーン情報（たとえば、レーンが左折専用レーンであるか、右折専用レーンであるかなど）、などを含むが、これらに限定されない。

さらに、画像生成コンポーネント２３０は、本明細書で説明されるように、アクションデータを含む１つまたは複数のチャネルを生成できる。例えば、アクションデータは、候補アクションに関連付けられた現在のレーンおよび／またはターゲットレーンを識別することを含むことができる。

いくつかの例では、画像生成コンポーネント２３０は、本明細書で詳細に説明されるように、環境の意味情報を含む１つまたは複数の画像を生成できる。

いくつかの例では、画像生成コンポーネント２３０は、環境内のオブジェクトのトレースを表す１つまたは複数の画像を生成できる。画像生成コンポーネント２３０によって生成された画像は、本明細書で説明されるように、予測確率で生成するために使用できる環境および環境内のオブジェクトの状態に関する事前情報を表すことができる。

本明細書で説明される例のいずれかにおいて、画像生成コンポーネント２３０は、複数のチャネルを有する画像を生成し得、各チャネルは、いくつかの情報（意味的またはその他の）を表す。

いくつかの例では、機械学習コンポーネント２３２（機械学習モデルコンポーネント２３２とも呼ばれる）は、本明細書で説明されるように、画像生成コンポーネント２３０によって生成された画像を受信する、および予測確率を含む１つまたは複数のヒートマップを生成する機能を含むことができる。

いくつかの例では、機械学習コンポーネント２３２は、モデルに入力されたトップダウン画像に基づいて１つまたは複数のヒートマップを出力するようにトレーニングされた１つまたは複数の機械学習モデルを含むことができる。いくつかの例では、機械学習コンポーネント２３２は、畳み込みニューラルネットワーク（ＣＮＮ）を含むことができ、これは、１つまたは複数のリカレントニューラルネットワーク（ＲＮＮ）層、例えば、長短期記憶（ＬＳＴＭ）層、を含んでもよい、または含まなくてもよい。

いくつかの例では、機械学習コンポーネント２３２によって出力されたヒートマップは、自律車両に近接する環境の個別化された領域を表すことができる。たとえば、ヒートマップは、自律車両の周囲の１００メートル×１００メートルの領域を表す６４ｘ６４グリッド（またはＪｘＫサイズのグリッド）を表すことができる。いくつかの例では、ヒートマップによって表されるエリアは、機械学習コンポーネント２３２に入力された画像によって表されるエリアに対応できる。もちろん、ヒートマップは任意のサイズの領域を表すことができ、任意の数の個別の部分の領域を表すことができる。いくつかのケースでは、ヒートマップの一部をヒートマップのセルと呼ぶことができる。各セルは、オブジェクトがヒートマップに対応する時間において、環境内の対応する位置にいる確率を表す予測確率を含むことができる。いくつかの例では、機械学習モデルは複数のヒートマップを出力でき、複数のヒートマップのヒートマップは、将来の特定の時間（例えば、０．５秒、１秒、３秒、５秒、１０秒など）におけるオブジェクトに関連付けられた確率予測を表すことができる。

いくつかの例では、機械学習コンポーネント２３２を、任意の数の入力画像に基づいて任意の数のヒートマップを生成するようにトレーニングできる。例えば、機械学習コンポーネント２３２は、Ｎ個の入力画像を受信でき、Ｍ個のヒートマップを出力できる。

一般に、計画コンポーネント２３４は環境を通り横断するために車両２０２が辿る経路を決定できる。

いくつかの例では、軌道生成コンポーネント２３６は、様々なルートおよび軌道ならびに様々な詳細レベルを決定する機能を含むことができる。例えば、軌道生成コンポーネント２３６は、第１の位置（例えば、現在の位置）から第２の位置（例えば、ターゲット位置）へ進行するルートを決定できる。本説明を目的に、ルートは２つの位置の間を走行するための一連の通過点にできる。非限定的な例として、通過点は、道路、交差点、全地球測位システム（ＧＰＳ）座標などを含む。さらに、軌道生成コンポーネント２３６は、第１の位置から第２の位置への経路の少なくとも一部に沿って自律車両をガイドするための命令を生成できる。少なくとも１つの例では、軌道生成コンポーネント２３６は一連の通過点内の第１の通過点から一連の通過点の第２の通過点まで自律車両をどのようにガイドするかを決定できる。いくつかの例では、命令は軌道または軌道の一部とすることができる。いくつかの例では、ｒｅｃｅｄｉｎｇｈｏｒｉｚｏｎ技術に従って、複数の軌道を実質的に同時に（例えば、技術的許容範囲内で）生成でき、複数の軌道のうちの１つが車両２０２の走行ために選択される。

いくつかの例では、評価コンポーネント２３８は、１つまたは複数の候補アクションおよび／または候補軌道を評価する機能を含むことができる。例えば、各アクションに関連付けられた予測確率を含むヒートマップの各セットについて、評価コンポーネント２３８は、１つまたは複数のコスト、リスクの量、および／またはリワード（reward）を決定できる。いくつかの例では、評価コンポーネント２３８は、車両２０２の候補位置と、環境内のオブジェクトに関連付けられた予測確率との間の重複の量を決定できる。いくつかの例では、評価コンポーネント２３８は、車両２０２の表現（例えば、バウンディングボックスまたは拡張バウンディングボックス）と、オブジェクトに関連付けられた予測確率および／または拡張予測確率との間の距離を決定できる。少なくともいくつかの例では、そのような拡張（入力としてのバウンディングボックスへの、または出力される予測確率への）は、将来のオブジェクトのおそらくの位置の周りの領域を人為的に増やすために、安全要素に基づき得る。いくつかの例では、評価コンポーネント２３８は、車両２０２の軌道が、車両２０２に関連付けられた予測確率（拡張された予測確率を含み得る）に関連付けられた領域を通り横断するかどうかを決定できる。評価コンポーネント２３８は、将来の個々のタイムステップで、および／または候補アクションに関連付けられた一部のまたは全てのタイムステップについて累積的に、コスト、リスク、および／またはリワード（reward）を決定できる。したがって、評価コンポーネント２３８は、異なる候補アクションのコスト、リスク、および／またはリワード（reward）を比較でき、車両を制御するためのアクションを選択できる。

候補アクションの評価の例は、「Probabilistic Risk Assessment for Trajectory Evaluation」と題され、２０１８年１１月３０日に出願された米国特許出願番号１６／２０６，８７７に関連して説明される。米国特許出願第１６／２０６，８７７号は、その全体が参照によって本明細書に組み込まれている。

評価コンポーネント２３８によって考慮されるべき追加のコストは、位置ベースのコスト（例えば、車両２０２に関連付けられた予測確率とオブジェクトとの間の距離に基づく）、速度コスト（たとえば、予測確率に関連付けられた領域を通り横断する間の速度を適用することに基づく）、加速度コスト（例えば、軌道候補アクション全体に加速度限界を適用する）、オブジェクトが道路の規則に従い得るという期待などを含むことができるが、これらに限定されない。

いくつかの例では、機械学習コンポーネント２３２は、ヒートマップを計画コンポーネント２３４に直接提供でき、次に、車両２０２が実行するアクションを選択または決定でき、および／または車両２０２が辿る軌道を生成できる。

いくつかの例では、本明細書で説明されるコンポーネントの一部または全ての態様は、任意のモデル、アルゴリズム、および／または機械学習アルゴリズムを含むことができる。例えば、いくつかの例では、メモリ２１８（および以下で説明されるメモリ２４６）の中のコンポーネントをニューラルネットワークとして実装できる。

本明細書で説明されるように、例示的なニューラルネットワークは、入力データを一連の接続された層に通して出力を生成する生物学的に着想を得たアルゴリズムである。ニューラルネットワークの各層は別のニューラルネットワークを含むことができ、または任意の数の層を含むことができる（畳み込みかどうかに関係なく）。本開示のコンテキストで理解できるように、ニューラルネットワークは、機械学習を利用でき、これは、学習されたパラメータに基づいて出力が生成されるそのようなアルゴリズムの広範囲のクラスを指すことができる。

ニューラルネットワークのコンテキストで説明したが、任意のタイプの機械学習を本開示と一致させて使用できる。例えば、機械学習アルゴリズムは、回帰アルゴリズム（例えば、通常の最小二乗回帰（ＯＬＳＲ）、線形回帰、ロジスティック回帰、ステップワイズ回帰、多変量適応回帰スプライン（ＭＡＲＳ）、局所的に推定されたスカープロット平滑化（ＬＯＥＳＳ））、インスタンスベースのアルゴリズム（例えば、リッジ回帰、最小絶対収縮および選択演算子（ＬＡＳＳＯ）、弾性ネット、最小角度回帰（ＬＡＲＳ））、決定木アルゴリズム（例えば、分類および回帰木（ＣＡＲＴ）、反復二分法３（ＩＤ３）、カイ二乗自動相互作用検出（ＣＨＡＩＤ）、決定切り株、条件付き決定木））、ベイジアンアルゴリズム（例えば、単純ベイズ、ガウス単純ベイズ、多項単純ベイズ、平均１依存推定量（ＡＯＤＥ）、ベイジアン信念ネットワーク（ＢＮＮ）、ベイジアンネットワーク）、クラスタリングアルゴリズム（例えば、ｋ平均、ｋ中央値、期待値最大化（ＥＭ）、階層的クラスタリング）、相関ルール学習アルゴリズム（例えば、パーセプトロン、バックプロパゲーション、ホップフィールドネットワーク、動径基底関数ネットワーク（ＲＢＦＮ））、ディープラーニングアルゴリズム（例えばディープボルツマンマシン（ＤＢＭ）、ディープブリーフネットワーク（ＤＢＮ）、重畳型ニューラルネットワーク（ＣＮＮ）、スタック・オートエンコーダ）、次元数削減アルゴリズム（例えば主成分分析（ＰＣＡ）、主成分回帰（ＰＣＲ）、部分最小二乗回帰（ＰＬＳＲ）、サモンマッピング、多次元スケーリング（ＭＤＳ）、射影追跡、線形判別分析（ＬＤＡ）、混合判別分析（ＭＤＡ）、二次判別分析（ＱＤＡ）、柔軟判別分析（ＦＤＡ））、アンサンブルアルゴリズム（例えば、ブースティング、ブートストラップ集計（バギング）、アダブースト、スタック一般化（ブレンディング）、勾配ブースティングマシン（ＧＢＭ）、勾配ブースティング回帰ツリー（ＧＢＲＴ）、ランダムフォレスト）、ＳＶＭ（サポートベクターマシン）、教師あり学習、教師なし学習、半教師あり学習などの方法を含むことができるが、これらに限定されない。

アーキテクチャの追加の例は、ＲｅｓＮｅｔ５０、ＲｅｓＮｅｔ１０１、ＶＧＧ、ＤｅｎｓｅＮｅｔ、ＰｏｉｎｔＮｅｔなどのニューラルネットワークを含む。

少なくとも１つの例では、センサシステム２０６は、ｌｉｄａｒセンサ、ｒａｄａｒセンサ、超音波トランスデューサー、ｓｏｎａｒセンサ、位置センサ（例えば、ＧＰＳ、コンパスなど）、慣性センサ（例えば、慣性測定ユニット（ＩＭＵｓ）、加速度計、磁力計、ジャイロスコープなど）、カメラ（例えばＲＧＢ、ＩＲ、強度、深度など）、飛行時間センサ（time of flight sensor）、マイク、ホイールエンコーダ、環境センサ（例えば温度センサ、湿度センサ、光センサ、圧力センサなど）など、を含むことができる。センサシステム２０６は、これらまたは他のタイプのセンサのそれぞれの複数のインスタンスを含むことができる。例えば、ｌｉｄａｒセンサは、車両２０２の角部、前部、後部、側部、および／または上部に位置する個々のｌｉｄａｒセンサを含むことができる。別の例として、カメラセンサは、車両２０２の外部および／または内部の周りの様々な位置に配置された複数のカメラを含むことができる。センサシステム２０６は車両コンピューティングデバイス２０４に入力を提供できる。追加的または代替的に、センサシステム２０６は、所定の期間が経過した後、ほぼ実時間で、特定の周波数にて1つまたは複数のコンピューティングデバイスに、1つまたは複数のネットワーク２４０を介して、センサデータを送信できる。

車両２０２はまた、上記のように、光および／または音を放出するための１つまたは複数のエミッタ２０８を含むことができる。この例示のエミッタ２０８は車両２０２の乗客と通信する内部オーディオおよびビジュアルエミッタを含む。限定ではなく例として、内部エミッタは、スピーカー、光、記号、ディスプレイ画面、タッチ画面、触覚エミッタ（例えば、振動および／またはフォースフィードバック）、機械的アクチュエータ（例えば、シートベルトテンショナ、シートポジショナ、ヘッドレストポジショナなど）などを含むことができる。この例示のエミッタ２０８はまた外部エミッタを含む。限定ではなく例として、この例示の外部エミッタは、走行の方向または車両のアクションの他のインジケータ（例えば、インジケータライト、標識、ライトアレイなど）を信号で送るためのライト、および音響ビームステアリング技術を備える、１つまたは複数の歩行者または他の近くの車両と音声で通信するための1つまたは複数のオーディオエミッタ（例えば、スピーカー、スピーカーアレイ、ホーンなど）を含む。

車両２０２はまた、車両２０２と１つまたは複数の他のローカルもしくはリモートコンピューティングデバイスとの間の通信を可能にする１つまたは複数の通信接続部２１０を含むことができる。例えば、通信接続部２１０は車両２０２および／またはドライブシステム２１４上の他のローカルコンピューティングデバイスとの通信を容易にできる。また、通信接続部２１０は、車両が他の近くのコンピューティングデバイス（例えば、他の近くの車両、交通信号など）と通信することを可能にできる。通信接続部２１０はまた、車両２０２が遠隔操作コンピューティングデバイスまたは他の遠隔サービスと通信することを可能にする。

通信接続部２１０は、車両コンピューティングデバイス２０４を別のコンピューティングデバイスまたはネットワーク２４０などのネットワークに接続するための物理的および／または論理的インターフェースを含むことができる。例えば、通信接続部２１０は、ＩＥＥＥ８０２．１１規格によって定義された周波数を介するようなＷｉ－Ｆｉベースの通信、Ｂｌｕｅｔｏｏｔｈなどの短距離無線周波数、セルラー通信（例えば、２Ｇ、３Ｇ、４Ｇ、４ＧＬＴＥ、５Ｇなど）、またはそれぞれのコンピューティングデバイスが他のコンピューティングデバイスとインターフェースで接続することを可能にする任意の適切な有線または無線通信プロトコルを可能にできる。

少なくとも１つの例では、車両２０２は、１つまたは複数のドライブシステム２１４を含むことができる。いくつかの例では、車両２０２は、単一のドライブシステム２１４を有することができる。少なくとも１つの例では、車両２０２が複数のドライブシステム２１４を有する場合、個々のドライブシステム２１４を車両２０２の両端部（例えば前部および後部など）に配置できる。少なくとも１つの例では、ドライブシステム２１４はドライブシステム２１４および／または車両２０２の周囲の状態を検出するための１つまたは複数のセンサシステムを含むことができる。限定ではなく例として、センサシステムは、ドライブシステムのホイールの回転を感知するための１つまたは複数のホイールエンコーダ（例えば、ロータリーエンコーダ）、ドライブシステムの方向および加速度を測定するための慣性センサ（例えば、慣性測定ユニット、加速度計、ジャイロスコープ、磁力計など）、カメラまたはその他の画像センサ、ドライブシステムの周囲のオブジェクトを音響的に検出するための超音波センサ、ｌｉｄａｒセンサ、ｒａｄａｒセンサなど、を含むことができる。一部のセンサ、ホイールエンコーダなど、はドライブシステム２１４に固有とすることができる。いくつかのケースでは、ドライブシステム２１４上のセンサシステムは車両２０２の対応するシステム（例えば、センサシステム２０６）と重複または補足できる。

ドライブシステム２１４は、高電圧バッテリー、車両を推進するモーター、バッテリーからの直流を他の車両システムで使用する交流に変換するインバーター、ステアリングモーターおよびステアリングラック（電動とすることができる）を含むステアリングシステム、油圧または電気アクチュエータを含むブレーキシステム、油圧および／または空気圧コンポーネントを含むサスペンションシステム、トラクションの損失を軽減し制御を維持するブレーキ力分散用の安定性制御システム、ＨＶＡＣシステム、照明（例えば車両の外部環境を照らすヘッド／テールライトなどの照明）、および1つまたは複数の他のシステム（例えば冷却システム、安全システム、車載充電システム、ＤＣ／ＤＣコンバーター、高電圧ジャンクション、高電圧ケーブル、充電システム、充電ポートなどのその他の電装コンポーネント）を含む多くの車両システムを含むことができる。さらに、ドライブシステム２１４は、センサシステムからデータを受信および前処理し、様々な車両システムの操作を制御することができるドライブシステムコントローラを含むことができる。いくつかの例では、ドライブシステムコントローラは、１つまたは複数のプロセッサおよび１つまたは複数のプロセッサと通信可能に結合されたメモリを含むことができる。メモリはドライブシステム２１４の様々な機能を実行する１つまたは複数のコンポーネントを格納できる。さらに、ドライブシステム２１４はまた、それぞれのドライブシステムによる１つまたは複数の他のローカルまたはリモートコンピューティングデバイスとの通信を可能にする１つまたは複数の通信接続部を含む。

少なくとも１つの例では、直接接続部２１２は１つまたは複数のドライブシステム２１４を車両２０２の本体と結合するための物理的インターフェースを提供できる。例えば、直接接続部２１２は、ドライブシステム２１４と車両との間のエネルギー、流体、空気、データなどの転送を可能にすることができる。いくつかの例では、直接接続部２１２はさらにドライブシステム２１４を車両２０２の本体に着脱可能に固定できる。

いくつかの例では、車両２０２はネットワーク２４０を介してセンサデータを１つまたは複数のコンピューティングデバイス２４２に送信できる。いくつかの例では、車両２０２は未処理のセンサデータをコンピューティングデバイス２４２に送信できる。他の例では、車両２０２は処理済みセンサデータおよび／またはセンサデータの表現をコンピューティングデバイス２４２に送信できる。いくつかの例では、車両２０２は、所定の期間の経過後、ほぼ実時間などで、特定の周波数でセンサデータをコンピューティングデバイス２４２に送信できる。いくつかの例では、車両２０２はセンサデータ（未処理または処理済み）を１つまたは複数のログファイルとしてコンピューティングデバイス２４２に送信できる。

コンピューティングデバイス２４２は、プロセッサ２４４およびトレーニングコンポーネント２４８を格納するメモリ２４６を含むことができる。

いくつかの例では、トレーニングコンポーネント２４８は、予測確率を含む１つまたは複数のヒートマップを出力するように機械学習モデルをトレーニングする機能を含むことができる。例えば、トレーニングコンポーネント２４８は、環境のトップダウンビューを表す画像のセットを受信できる。いくつかのケースでは、画像のセットは、５秒、７秒、１０秒、２０秒などの期間にわたって環境を通り横断するオブジェクトを表すことができる。画像のセットの少なくとも一部は、機械学習モデルをトレーニングするための入力として使用でき、画像のセットの少なくとも一部は、機械学習モデルをトレーニングするためのグラウンドトゥルース情報として使用できる。非限定的な例として、画像のシーケンスの第１のセット（例えば、３、４、５、またはそれ以上）を機械学習モデルに入力し得る。いくつかの例では、車両２０２の意図、ゴール、サブゴールなども、トレーニングのために入力できる（例えば、マルチチャネル画像のチャネルとしてエンコードされ得るように）。次に、第１のセットの直前にある一連の画像の第２のセットの画像（またはそこに関連付けられた軌道情報、たとえば、画像から位置および／または速度を抽出することによる）を、モデルをトレーニングするためのグラウンドトゥルースとして使用できる。したがって、オブジェクトが環境を横断する記録された軌道の画像を提供することによって、予測コンポーネント２２８は、本明細書で説明されるように、予測確率を含む１つまたは複数のヒートマップを出力するようにトレーニングされ得る。

いくつかの例では、トレーニングコンポーネント２４８は、シミュレータによって生成されたトレーニングデータを含むことができる。たとえば、シミュレートされたトレーニングデータは、車両が環境内のオブジェクトと衝突した、または環境内のオブジェクトと衝突寸前だった例を表して、追加のトレーニング例を提供できる。

トレーニングコンポーネント２４８の追加の詳細は、図２Ｂに関連して、ならびに本開示全体を通して、以下で説明される。

トレーニングのためのデータの追加の例は、図３に関連して、ならびに本開示全体を通して説明される。

車両２０２のプロセッサ２１６およびコンピューティングデバイス２４２のプロセッサ２４４は、本明細書で説明されるように、データを処理し操作を実施するための命令を実行可能な任意の適切なプロセッサとすることができる。限定ではなく例として、プロセッサ２１６および２４４は、1つまたは複数の中央処理装置（ＣＰＵ）、グラフィック処理装置（ＧＰＵ）、または電子データを処理して当該電子データをレジスタまたはメモリに格納できる他の電子データに変換する任意の他のデバイスまたはデバイスの一部、を備えることができる。いくつかの例で、集積回路（例えば、ＡＳＩＣなど）、ゲートアレイ（例えば、ＦＰＧＡなど）、および他のハードウェアデバイスはまた、それらがエンコードされた命令を実装するよう構成される限り、プロセッサとみなすことができる。

メモリ２１８および２４６は、非一時的コンピュータ可読媒体の例である。メモリ２１８および２４６は、本明細書に記載の方法および様々なシステムに起因する機能を実装する、オペレーティングシステムおよび１つもしくは複数のソフトウェアアプリケーション、命令、プログラム、ならびに／またはデータを格納できる。様々な実装形態では、メモリを、スタティックランダムアクセスメモリ（ＳＲＡＭ）、シンクロナスダイナミックＲＡＭ（ＳＤＲＡＭ）、不揮発性／フラッシュタイプメモリ、または情報を格納可能な任意の他のタイプのメモリなど、任意の適切なメモリ技術を用いて実装できる。本明細書で説明されるアーキテクチャ、システム、および個々の要素は、多くの他の論理的、プログラム的、および物理的なコンポーネントを含むことができ、添付図面に示されるそれらは、本明細書での説明に関連する単なる例にすぎない。

いくつかの例では、メモリ２１８および２４６は、少なくとも作業メモリおよび記憶メモリを含むことができる。例えば、作業メモリは、プロセッサ２１６および２４４によって操作されるデータを格納するために使用される、限られた容量の高速メモリ（例えば、キャッシュメモリ）であり得る。いくつかの例では、メモリ２１８および２４６は、データの長期記憶に使用される比較的大容量の低速メモリであり得る記憶メモリを含むことができる。いくつかのケースでは、プロセッサ２１６および２４４は、ストレージメモリに格納されているデータを直接操作できず、本明細書で説明するように、データに基づいて操作を実行するために、データを作業メモリにロードする必要があり得る。

図２は分散システムとして示されているが、代替の例では、車両２０２のコンポーネントをコンピューティングデバイス２４２に関連付けることができ、および／またはコンピューティングデバイス２４２のコンポーネントを車両２０２に関連付けることができる、という事に留意すべきである。すなわち、車両２０２はコンピューティングデバイス２４２に関連付けられた機能のうちの１つまたは複数を実行でき、逆もまた同様である。

図２Ｂは、本明細書で説明される技術を実装する、機械学習モデルをトレーニングするための例示的なトレーニングコンポーネントのブロック図２５０を示す。

いくつかの例では、トレーニングデータ２５８は、環境を通り横断する際に車両によってキャプチャされるデータを含むことができる。そのようなトレーニングデータは、自律車両がトレーニングデータ２５８をキャプチャした場合、そのような自律車両によって実行される行動を表し得る、アクションデータ２６２を含むことができる。いくつかの例では、入力２５２は、アクションデータ２６２およびトレーニングデータ２５８に、少なくとも部分的に基づくことができる。

１つまたは複数のマルチチャネル画像を含む入力２５２を、機械学習コンポーネント２３２に入力できる。いくつかの例では、機械学習コンポーネント２３２は、ＲｅｓＮｅｔアーキテクチャを含むことができる。いくつかの例では、機械学習コンポーネント２３２は、ベースバックボーンとしてＲｅｓＮｅｔアーキテクチャを含むことができる。いくつかの例では、アクションデータを入力２５２に沿って入力でき、アクションデータをアクションデータ２６２として表すことができる。

いくつかの例では、出力特徴マップを１×１の畳み込みに通して、最終的なチャネル次元を取得でき、これは、入力解像度に一致するように双線形にアップサンプリングして（例えば、アップサンプリングコンポーネント２５４を介して）、出力２５６（例えば、ヒートマップおよび／または予測確率）として表すことができる。

いくつかの例では、機械学習コンポーネント２３２からの出力ロジットは、シグモイドクロスエントロピー損失を使用してトレーニングデータ２５８（例えば、占有マップを表すグラウンドトゥルース）と比較できる。

クロスエントロピー損失および／または確率質量コンポーネント２６０は、出力ロジットをトレーニングデータ２５８と比較する機能を含むことができる。次いで、結果として得られる損失行列は、以下の関数

に従って、トレーニングデータ２５８内の占有および非占有ピクセルの間でバランスを取ることができ、ここで、Ｌ_iは、将来の第ｉのステップでのシグモイドクロスエントロピー損失から得られる損失行列であり、Ｎは、予測される将来のステップの数である。用語１_occupiedおよび１_unoccupiedは、将来のオブジェクトの占有および非占有マップを表すインジケーターマトリックスであり、用語ｎ_occupiedおよびｎ_unoccupiedは、将来の占有および非占有セルの数を表す。占有間のバランスをとることは、同数（またはほぼ等しい）の占有および非占有勾配がバックプロパゲーションを通過すること、および予測コンポーネント２２８が全てのセルが占有されているとして、または全てのセルが占有されていないとして予測することに偏らないこと、を確実にする。

上記の式（１）で指定された密なセグメンテーションのコストは、シーン内のエンティティの総数を保存し得ない。いくつかの例では、クロスエントロピー損失および／または確率質量コンポーネント２６０は、シーン内の予測コンポーネント２２８によって予測される総確率質量（例えば、ヒートマップに関連付けられた確率の合計）と、

としての占有セルの実際の数との間の差を最小化するための追加コストを含むことができ、ここでφ_iは将来のステップｉでの占有マップを表す。確率質量コンポーネントを追加することにより、予測コンポーネント２２８は、追加の確率質量を作成することなく、利用可能なセル間で総確率質量を分配できる。たとえば、自律車両が２つの可能なモードを有する場合、次いで、ネットワークは２つのモード間で占有の確率を分配し、任意の追加の占有確率を追加し得ない。

さらに、シーンの質量を制約することまたはそうでなければ管理することは、環境にオブジェクトを追加するためのネットワークの可用性を制限し、これは処理を単純化し得る。

図３は、本開示の例による、予測システムへの入力および予測システムをトレーニングするためのトレーニングデータの例示的な図３００を示す。

例えば、マルチチャネル画像３０２は、予測コンポーネント２２８への入力を表し、過去のオブジェクトを表す。たとえば、各画像に関連付けられた時間は、右下隅に示されている（たとえば、ｔ_-8、ｔ_-7、ｔ_-6、ｔ_-5、ｔ_-4、ｔ_-3、ｔ_-2、ｔ_-1、およびｔ₀）。上記のように、各フレームはさらにいくつかのチャネルで構成され得る。

たとえば、個々のチャネルは、バウンディングボックス（例えば、バウンディングボックスは車両３０４またはオブジェクト３０６を表し、バウンディングボックスの色またはチャネルはバウンディングボックスに関連付けられたオブジェクトの分類を表す、）、ｘ方向およびｙ方向のバウンディングボックスの速度（速度が、バウンディングボックスに対応する別のチャネル（例えば、チャネル１３６および１４２）のエリアを表すエリアにエンコードされた数として表すことができ、ｘ速度およびｙ速度が異なるチャネルで表される）、ｘ方向およびｙ方向内のオブジェクトの加速度（加速度は１つのチャネルまたは複数のチャネルのベクトルとして表すことができ、ｘ加速度とｙ加速度は異なるチャネルで表される）、バウンディングボックスに関連付けられたブリンカーステータス（左折、右折、ブレーキング、リバース、ハザード、ライトなしなど）、道路ネットワーク情報（例えば、レーンを示す意味ラベル、基準線（例えば、基準線３０８）、横断歩道、停止標識、交差点、信号機など）、信号機の状態（例えば、赤色光、黄色光、緑色光など）など、の１つまたは複数を表し得るが、これらに限定されない。いくつかの例では、複数のチャネルを予測システムに入力して、少なくとも１つのヒートマップを生成できる。

さらに、アクションデータは、現在のレーン３１０およびターゲットレーン３１２として表すことができる。いくつかの例では、アクションデータは、時間ｔ_-7からｔ₀までの環境を表す１つまたは複数の画像にエンコードできる。

トップダウン特徴は、上記の特徴画像の一部または全てをスタックすることにより、画像ブロブとして表される。いくつかの例では、マルチチャネル画像３０２の解像度は、センサ解像度の解像度に基づいて、ピクセルあたり１５ｃｍに設定できる。いくつかの例では、マルチチャネル画像３０２の単一のフレームは、５０メートル×５０メートルのサイズのエリアに対応できるが、任意のエリアを選択できる。いくつかの例では、マルチチャネル画像３０２は、車両３０４（例えば、自律車両）が左から右に向く、および構成可能な水平オフセットでマルチチャネル画像３０２のほぼ中央に位置するように回転および平行移動できる。いくつかの例では、マルチチャネル画像によって表される環境は予測のための信号のないジャンクションを表し得、そのケースでは、各レーンの信号状態はトップダウン表現に含まれ得ない。

トレーニングデータ３１４は、環境内の全てのオブジェクトおよび車両のグラウンドトゥルースを表す。トレーニングデータ３１４は、将来の任意の数のフレームを含むことができる。図３は、時間ｔ₁、ｔ₂、ｔ₃、ｔ₄、ｔ₅、ｔ₆、ｔ₇、およびｔ₈におけるトレーニングデータを示している。トレーニングデータ３１４は、例えば、機械学習コンポーネント２３２をトレーニングする目的で、図２のトレーニングデータ２５８に対応できる。

図４は、本開示の例による、２つの二重駐車車両を含むシナリオの第１および第２の予測確率の図４００であり、第２の予測確率はアクションデータに部分的に基づいている。

予測確率４０２は、予測コンポーネント２２８の出力を示す一連の８つのフレーム（ｔ₁乃至ｔ₈とラベル付けされている）を指し、それにより、予測確率４０２は、アクションデータに部分的に基づいていない。予測確率４０２の第１のフレーム（フレームｔ₁として示されている）において、シナリオは、車両４０６ならびにオブジェクト４０８および４１０を表す。矢印４１２は、環境に関連付けられた交通の方向を示している。トラフィックの方向の同様の表示は、この開示全体を通して使用される。

シナリオのオブジェクト４０８および４１０は、２台の二重駐車車両を表している。予測確率４１４は、時間ｔ₁における車両４０６に関連付けられた予測確率を表す予測コンポーネント２２８によって出力される。予測確率４１６および４１８は、それぞれ、オブジェクト４０８および４１０に関連付けられている。予測確率４０２は、予測コンポーネント２２８によって決定されるように、時間の経過とともに進展するように示されている。

予測確率４０４は、予測コンポーネント２２８の出力を示す一連の８つのフレーム（ｔ₁乃至ｔ₈とラベル付けされている）を指し、これにより、予測確率は、アクションデータ４２０（灰色の影付きレーンとして示されている）に部分的に基づいている。予測確率４２２は車両４０６に関連付けられ、一方、予測確率４２４および４２６はそれぞれオブジェクト４０８および４１０に関連付けられる。予測確率４０４は、予測コンポーネント２２８によって決定されるように、時間の経過とともに進展するように示されている。

図５は、本開示の例による、二重駐車車両を含むシナリオの第１および第２の予測確率の図５００であり、第２の予測確率はアクションデータに部分的に基づいている。

予測確率５０２は、予測コンポーネント２２８の出力を示す一連の８つのフレーム（ｔ₁乃至ｔ₈とラベル付けされている）を指し、それにより、予測確率５０２は、アクションデータに部分的に基づいていない。予測確率５０２の第１のフレーム（フレームｔ₁として示されている）において、シナリオは、車両５０６ならびにオブジェクト５０８、５１０、および５１２を表す。

オブジェクト５０８は二重駐車車両を表す。オブジェクト５１０および５１２は車両５０６に対する対向交通を表す。

注目すべきことに、予測確率５０２は、車両５０６に関連付けられた非連続の予測確率を表す。例えば、時間ｔ６において、予測確率５１４および５１６は、車両５０６に関連付けられている。時間ｔ７において、予測確率５１８および５２０は、車両５０６に関連付けられている。そして、時間ｔ₈において、予測確率５２２および５２４は、車両５０６に関連付けられている。予測確率５０２は、予測コンポーネント２２８によって決定されるように、時間の経過とともに進展するように示されている。

予測確率５０４は、予測コンポーネント２２８の出力を示す一連の８つのフレーム（ｔ₁乃至ｔ₈とラベル付けされている）を指し、これにより、予測確率はアクションデータ５２６（灰色の影付きレーンとして示されている）に部分的に基づいている。

注目すべきことに、車両５０６に関連付けられた予測確率５０４は非隣接エリアを示さず、代わりに、オブジェクト５０８の周りを横断する車両５０６を表す。予測確率５０４は、予測コンポーネント２２８によって決定されるように、時間の経過とともに進展するように示されている。

図６は、本開示の例による、自律車両の前でターンするオブジェクトを含むシナリオの第１および第２の予測確率の図６００であり、第２の予測確率はアクションデータに部分的に基づいている。

予測確率６０２は、予測コンポーネント２２８の出力を示す一連の８つのフレーム（ｔ₁乃至ｔ₈とラベル付けされている）を指し、それにより、予測確率６０２はアクションデータに部分的に基づいていない。予測確率６０２の第１のフレーム（フレームｔ₁として示されている）において、シナリオは車両６０６およびオブジェクト６０８を表す。

オブジェクト６０８は車両６０６の前のレーンにターンする車両を表す。

注目すべきことに、フレームｔ２の領域６１０（およびフレームｔ₃乃至ｔ₈の対応する領域）に関連付けられた予測確率はオブジェクト６０８に関連付けられ、一方、予測確率６１２は車両６０６に関連付けられている。予測確率６０２は予測コンポーネント２２８によって決定されるように、時間の経過とともに進展するように示されている。

予測確率６０４は予測コンポーネント２２８の出力を示す一連の８つのフレーム（ｔ₁乃至ｔ₈とラベル付けされている）を指し、これにより、予測確率はアクションデータ６１４および６１６（灰色の影付きレーンとして示されている）に部分的に基づいている。アクションデータ６１４は現在の（または出口）レーンに対応でき、一方、アクションデータ６１６はターゲット（または入口）レーンに対応できる。

フレームｔ２の領域６１８（およびフレームｔ₃乃至ｔ₈の対応する領域）に関連付けられた予測確率は、オブジェクト６０８に関連付けられ、一方、予測確率６２０は車両６０６に関連付けられている。予測確率６０４は、予測コンポーネント２２８によって決定されるように、時間の経過とともに進展するように示されている。

図７は、本開示の例による、ジャンクションを横断する自律車両を含むシナリオの第１および第２の予測確率の図７００であり、第２の予測確率はアクションデータに部分的に基づいている。

予測確率７０２は、予測コンポーネント２２８の出力を示す一連の８つのフレーム（ｔ₁乃至ｔ₈とラベル付けされている）を指し、それにより、予測確率７０２は、アクションデータに部分的に基づいていない。予測確率７０２の第１のフレーム（フレームｔ₁として示されている）において、シナリオは、車両７０６およびオブジェクト７０８を表す。

図７のシナリオは車両６０６の前のレーンにターンする車両を表すオブジェクト７０８の前のジャンクションを横切る車両７０６を表す。

注目すべきことに、予測確率７１０、７１２、７１４、および７１６（例えば、それぞれの破線の内側の）は、車両７０６に関連付けられた予測確率を表し、予測確率のマルチモーダル出力を示している。予測確率７０２は、予測コンポーネント２２８によって決定されるように、時間の経過とともに進展するように示されている。

予測確率７０４は、予測コンポーネント２２８の出力を示す一連の８つのフレーム（ｔ₁乃至ｔ₈とラベル付けされている）を指し、これにより、予測確率はアクションデータ７１８および７２０（灰色の影付きレーンとして示されている）に部分的に基づいている。アクションデータ７１８は現在の（または出口）レーンに対応でき、一方、アクションデータ７２０はターゲット（または入口）レーンに対応できる。

予測確率７２２、７２４、７２６、および７２８は、オブジェクト７０８に関連付けられ、一方、それぞれの残りの予測確率は車両７０６に関連付けられる。したがって、予測確率７０４は車両７０６に関連付けられた位置のより鮮明な（crisper）予測を表し、これはより正確な予測を導くことができる。予測確率７０４は予測コンポーネント２２８によって決定されるように、時間の経過とともに進展するように示されている。

図８は、本開示の例による、ブロックされたジャンクションに進入する自律車両を含むシナリオの第１および第２の予測確率の図８００であり、第２の予測確率はアクションデータに部分的に基づいている。

予測確率８０２は、予測コンポーネント２２８の出力を示す一連の８つのフレーム（ｔ₁乃至ｔ₈とラベル付けされている）を指し、それにより、予測確率８０２はアクションデータに部分的に基づいていない。予測確率８０２の第１のフレーム（フレームｔ₁として示されている）において、シナリオは、車両８０６ならびにオブジェクト８０８、８１０、および８１２を表す。

図８のシナリオは、右にターンして、オブジェクト８０８および１２０に続こうとしていることを意図している、ジャンクションにおける車両８０６を表す。

注目すべきことに、予測確率８１４、８１６、８１８、および８２０（例えば、それぞれの破線の内側の）は車両８０６に関連付けられた予測確率を表し、予測確率のマルチモーダル出力を示している。予測確率８０２は予測コンポーネント２２８によって決定されるように、時間の経過とともに進展するように示されている。

予測確率８０４は予測コンポーネント２２８の出力を示す一連の８つのフレーム（ｔ₁乃至ｔ₈とラベル付けされている）を指し、これにより、予測確率はアクションデータ８２２および８２４（灰色の影付きレーンとして示されている）に部分的に基づいている。アクションデータ８２２は現在の（または出口）レーンに対応でき、一方、アクションデータ８２４はターゲット（または入口）レーンに対応できる。

予測確率８２６、８２８、８３０、および８３２は、車両８０６に関連付けられており、一方、それぞれの残りの予測確率はオブジェクト８０８、８１０、または８１２に関連付けられている。したがって、予測確率８０４は車両８０６に関連付けられた位置のより鮮明な（crisper）予測を表し、これはより正確な予測を導くことができる。予測確率８０４は、予測コンポーネント２２８によって決定されるように、時間の経過とともに進展するように示されている。

図９は、本開示の例による、別のジャンクションを横断する自律車両を含むシナリオの第１および第２の予測確率の図９００であり、第２の予測確率はアクションデータに部分的に基づいている。

予測確率９０２は、予測コンポーネント２２８の出力を示す一連の８つのフレーム（ｔ₁乃至ｔ₈とラベル付けされている）を指し、それにより、予測確率９０２は、アクションデータに部分的に基づいていない。予測確率９０２の第１のフレーム（フレームｔ₁として示されている）において、シナリオは、車両８０６ならびにオブジェクト８０８、８１０、および８１２を表す。

図９のシナリオは、ジャンクションを横切ることを意図しているジャンクションにおける車両９０６を表す。この例では、車両９０６のターゲットレーンがブロックされていないため、車両９０６はゴールに向かって進む。無条件のケース（例えば、予測確率９０２によって表される）では、車両９０６が右、左、または直進することができるが、車両９０６がどれをするかわからないということ、をネットワークは提案する。

注目すべきことに、予測確率９１４、９１６、９１８、および９２０（例えば、それぞれの破線の内側の）は、車両９０６に関連付けられた予測確率を表し、予測確率の分散モーダル出力を示している。予測確率９０２は、予測コンポーネント２２８によって決定されるように、時間の経過とともに進展するように示されている。

予測確率９０４は、予測コンポーネント２２８の出力を示す一連の８つのフレーム（ｔ₁乃至ｔ₈とラベル付けされている）を指し、これにより、予測確率は、アクションデータ９２２および９２４（灰色の影付きレーンとして示されている）に部分的に基づいている。アクションデータ９２２は、現在の（または出口）レーンに対応でき、一方、アクションデータ９２４は、ターゲット（または入口）レーンに対応できる。

予測確率９２６、９２８、９３０、および９３２は、車両９０６に関連付けられ、一方、それぞれの残りの予測確率は、オブジェクト９０８、９１０、または９１２に関連付けられている。したがって、予測確率９０４は、車両９０６に関連付けられた位置のより鮮明な（crisper）予測を表し、これは、より正確な予測を導くことができる。予測確率９０４は、のように時間の経過とともに進展するように示されている。

図１、２Ｂ、および１０は、本開示の実施形態による例示的なプロセスを示している。これらのプロセスは論理フローグラフとして図示され、各操作は、ハードウェア、ソフトウェア、またはそれらの組み合わせにおいて実装できる一連の操作を表す。ソフトウェアのコンテキストにおいては、操作は、１つまたは複数のプロセッサで実行したときに、列挙した操作を実行する、１つまたは複数のコンピュータ可読記録媒体に格納されたコンピュータ実行可能命令を表す。一般に、コンピュータ実行可能命令は、特定の機能を実行する、または特定の抽象的データタイプを実装する、ルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを含む。操作が記載される順序は、制限として解釈されることを意図するものではなく、任意の数の記載される操作を、任意の順序および／または並行して組み合わせて、プロセスを実行できる。

図１０は、本開示の例による、センサデータおよびアクションデータを受信し、マルチチャネル画像を生成し、予測確率を評価し、予測確率に基づいて車両を制御するための例示的なプロセス１０００を示す。例えば、プロセス１０００の一部または全ては、本明細書で説明されるように、図２における１つまたは複数のコンポーネントによって実行できる。例えば、プロセス１０００の一部または全ては、車両コンピューティングデバイス２０４および／またはコンピューティングデバイス２４２によって実行できる。

操作１００２にて、プロセスは、環境のオブジェクトデータを受信することを含むことができ、オブジェクトデータはオブジェクトを表す。いくつかの例では、オブジェクトデータは、自律車両の知覚システムによって出力されたデータを表すことができる。例えば、オブジェクトデータは、バウンディングボックス情報、速度／加速度情報、分類などを含むことができるが、これらに限定されない。いくつかの例では、操作１００２は、自律車両のセンサを使用して環境のセンサデータをキャプチャすることを含むことができる。例えば、センサデータは、ｌｉｄａｒセンサ、ｒａｄａｒセンサ、画像センサ、飛行時間センサ（time of flight sensor）、ｓｏｎａｒセンサなどのうちの１つまたは複数によってキャプチャされるデータを含むことができる。いくつかの例では、操作１００２は、複数のセンサを使用してセンサデータをキャプチャし、センサデータを融合または組み合わせて、環境の詳細および有益な表現にすることを含むことができる。少なくともいくつかの例では、環境に関する追加のデータ（横断歩道の位置、レーンの境界など）をエンコードし得る追加のデータを受信し得る（マップデータなど）。

操作１００４で、プロセスは、車両が環境内で実行するための候補アクションに関連付けられたアクションデータを受信することを含むことができる。いくつかの例では、アクションデータは、現在のレーン、ターゲットレーン、および／または各アクションに関連付けられた速度プロファイルまたは加速度プロファイルなどの速度あるいは加速度情報を含むことができる。候補アクションの例は、レーン内アクション、左折アクション、右折アクション、レーン変更アクション、停止アクション、譲歩アクション、合流アクションなどを含み得が、これらに限定されない。

操作１００６で、プロセスは、センサデータおよびアクションデータに少なくとも部分的に基づいて、環境のトップダウンビューを表すマルチチャネル画像を生成することを含むことができる。そのようなマルチチャネル画像の例は本開示を通し説明される。たとえば、マルチチャネル画像は、オブジェクトを、バウンディングボックス、オブジェクトの速度、環境内のオブジェクトの位置などとして表すことができる。いくつかの例では、マルチチャネル画像は、加速度情報（速度情報の代わりに、またはそれに加えて）を含むことができる。

いくつかの例では、アクションデータは、マルチチャネル画像のチャネルにエンコードされた、現在のレーンおよびターゲットレーン、速度情報または加速度情報として表すことができる。

マルチチャネル画像に含めることができる追加情報は、バウンディングボックスに関連付けられたオブジェクトの分類、ｘ方向、ｙ方向、および／またはｚ方向のバウンディングボックスの速度（速度は１つのチャネルまたは複数のチャネルで数値またはベクトルとして表すことができ、ｘ速度、ｙ速度、および／またはｚ方向は異なるチャネルで表される）、ｘ方向、ｙ方向、および／またはｚ方向のオブジェクトの加速度（加速度は、１つのチャネルまたは複数のチャネルで数値またはベクトルとして表すことができ、ｘ加速度、ｙ加速度、および／またはｚ加速度は異なるチャネルで表される）、車両のポーズ（例えば、ｘ、ｙ、ｚ、ロール、ピッチ、ヨー）、ポーズの変化率、バウンディングボックスに関連付けられたブリンカーステータス（例えば、左折、右折、ブレーキ、後進、ハザード、ライトなしなど）、道路ネットワーク情報（例えば、レーン、横断歩道、一時停止標識、交差点、信号機などを示す意味ラベル）、信号機の状態（例えば、赤色光、黄色光、緑色光など）などを含むことができるが、これらに限定されない。そのようなマルチチャネル画像では、オブジェクトおよび環境に関する意味情報は、本明細書で詳細に説明されるように、１つまたは複数のチャネルにエンコードされ得る。

本明細書で説明されるように、操作１００６は、時間の経過に伴う環境内のオブジェクトの動作を表す複数の画像を生成することを含むことができる。

操作１００８で、プロセスは、候補アクションが考慮されたことを決定することを含むことができる。例えば、操作１００８は、マルチチャネル画像が複数の候補アクションの各候補アクションに対して生成されたかどうかを決定することを含むことができる。全てではない（または実質的に全てではない）候補アクションが考慮された場合（たとえば、操作１００８で「いいえ」）、プロセスは、操作１００６に戻り、追加のマルチチャネル画像を生成できる。全ての候補アクションが考慮された場合（たとえば、操作１００８で「はい」）、プロセスは操作１０１０に進む。もちろん、いくつかの例では、実装形態に応じて、操作を並行して実行できる。

操作１０１０で、プロセスは、マルチチャネル画像を機械学習モデルに入力することを含むことができる。そのような機械学習モデルは、複数の予測確率を生成するように（たとえば、ヒートマップとして）トレーニングできる。機械学習モデル、ヒートマップ、および予測確率の追加の詳細については、本開示全体で説明される。

操作１０１２において、プロセスは、機械学習モデルから、オブジェクトおよび／または車両に関連付けられた予測確率を受信することを含むことができる。機械学習モデル、ヒートマップ、および予測確率の追加の詳細については、本開示全体で説明される。

操作１０１４において、プロセスは、予測確率に少なくとも部分的に基づいて、候補アクションを評価することを含むことができる。本明細書で説明するように、操作１０１４は、候補アクションに関連付けられた１つまたは複数のコスト、リスク、および／またはリワード（reward）を決定することを含むことができる。例えば、候補アクションを評価して、候補アクションに関連付けられた軌道について、候補軌道に沿った自律車両に関連付けられた領域と１つまたは複数の予測確率との間の重複の量を決定できる。いくつかの例では、自律車両に関連付けられた領域とオブジェクトの予測確率との間の重複の量は、そのような候補アクションに関連付けられたリスクの量を表すことができる。いくつかの例では、自律車両に関連付けられた領域と自律車両の予測確率との間の重複の量は、自律車両が予測確率内にとどまる程度を表すことができる。いくつかの例では、候補アクションを、自律車両に関連付けられた予想される位置とオブジェクトに関連付けられた予測確率との間の１つまたは複数の距離に基づいて評価できる。

操作１０１４は、評価に少なくとも部分的に基づいて候補アクションを選択する、またはそうでなければ、決定することをさらに含むことができる。たとえば、候補アクションに関連付けられたコストを比較でき、最低のコストに関連付けられた候補アクションを選択して、自律車両を制御できる。

操作１０１６において、プロセスは、予測確率に少なくとも部分的に基づいて車両を制御することを含むことができる。いくつかの例では、操作１０１６は、自律車両の軌道を決定することを含むことができる。いくつかの例では、本明細書で説明するように、軌道は車両によって実行されるように選択された候補アクションに基づくことができ、予測確率を評価することなく生成された軌道と比較してより安全および／またはより滑らかな軌道を表すことができる。いくつかの例では、操作１０１６は、環境を横断するために自律車両のステアリング、ブレーキ、および／または加速のうちの１つまたは複数を制御することを含むことができる。

したがって、本明細書で説明する操作は、予測を改善し、計画システムが可能な将来を検索する方法を提供する。

［例示的な発明内容］
Ａ：１つまたは複数のプロセッサと、命令が実行されると、前記システムに自律車両のセンサによってキャプチャされた環境のセンサデータを受信することと、前記自律車両が前記環境内で実行する候補アクションに関連付けられたアクションデータを受信することとであって、前記候補アクションは、レーン内アクション、ターンアクション、またはレーン変更アクションの１つまたは複数を含み、前記アクションデータは前記候補アクションを示している、ことと、前記センサデータおよび前記アクションデータに少なくとも部分的に基づいて、前記環境のトップダウンビューを表すマルチチャネル画像を生成することであって、前記マルチチャネル画像は、前記自律車両に近接する前記環境内の車両に関連付けられたバウンディングボックス、前記車両に関連付けられた１つまたは複数の運動学的情報または意味情報、および前記自律車両に関連付けられた前記候補アクションを表す、ことと、前記マルチチャネル画像を、前記車両に関連付けられた可能な位置の予測確率を含むヒートマップを生成するようにトレーニングされた機械学習モデル内へ、入力することと、前記ヒートマップに少なくとも部分的に基づいて、前記候補アクションに関連付けられたコストを決定することと、前記候補アクションに関連付けられた前記コストに少なくとも部分的に基づいて、前記自律車両が前記環境を横断するための軌道を決定することと、を含む操作を実行させる、前記１つまたは複数のプロセッサによって実行可能な前記命令を格納する１つまたは複数のコンピュータ可読媒体と、を含むシステム。

Ｂ：前記自律車両に関連付けられた前記候補アクションを表す前記マルチチャネル画像を生成することは、前記候補アクションに関連付けられた前記環境内のターゲットレーンを表す前記マルチチャネル画像のチャネルを生成することを含み、前記ターゲットレーンは、前記自律車両が占有する予定のレーンを表す、
段落Ａに記載のシステム。

Ｃ：前記自律車両に関連付けられた前記候補アクションを表す前記マルチチャネル画像を生成することは、前記候補アクションに関連付けられた前記自律車両の目標速度または目標加速度を表す前記マルチチャネル画像のチャネルを生成することを含む、段落ＡまたはＢに記載のシステム。

Ｄ：前記予測確率は、将来の時間に関連付けられた占有グリッドとして表され、前記占有グリッドのセルは、将来の時間にて、前記車両が前記セルに関連付けられた領域に存在する確率を示す、段落Ａ乃至Ｃのいずれかに記載のシステム。

Ｅ：前記候補アクションが第１候補アクションであり、前記ヒートマップが第１のヒートマップであり、前記予測確率が第１の予測確率であり、前記コストは第１のコストであり、前記操作が、前記センサデータおよび第２の候補行動に少なくとも部分的に基づいて、前記車両に関連付けられた第２の予測確率を含む第２のヒートマップを決定することと、前記第２のヒートマップに少なくとも部分的に基づいて、第２のコストを決定することと、前記第１のコストおよび前記第２のコストに少なくとも部分的に基づいて、前記第１候補アクションまたは前記第２の候補行動から選択された行動を選択することと、前記選択された行動に少なくとも部分的に基づく前記軌道を決定することと、をさらに含む、
段落Ａ乃至Ｄのいずれかに記載のシステム。

Ｆ：環境内のオブジェクトを表すオブジェクトデータを受信することと、車両が前記環境内で実行するための候補アクションに関連付けられたアクションデータを受信することと、前記オブジェクトデータおよび前記アクションデータに少なくとも部分的に基づいて、前記環境のトップダウンビューを表すマルチチャネル画像を生成することであって、前記マルチチャネル画像は、前記オブジェクト、前記オブジェクトに関連付けられたモーション情報、および前記車両に関連付けられた前記候補アクションを表す、ことと、前記マルチチャネル画像を機械学習モデル内へ入力することと、前記機械学習モデルから、前記オブジェクトに関連付けられた予測確率を受信することと、前記予測確率に少なくとも部分的に基づいて、前記車両が前記環境を横断するように、制御することと、を含む方法。

Ｇ：前記予測確率は第１の予測確率であり、前記方法は前記機械学習モデルから前記車両に関連付けられた第２の予測確率を受信すること、をさらに含む、段落Ｆに記載の方法。

Ｈ：前記候補アクションは、レーン内アクション、レーン変更アクション、またはターンアクションの少なくとも１つを含み、前記車両に関連付けられた前記候補アクションを表す前記マルチチャネル画像を生成することは、前記候補アクションに関連付けられたターゲットレーンを表す前記マルチチャネル画像のチャネルを生成することを含む、
段落ＦまたはＧに記載の方法。

Ｉ：前記チャネルは第１のチャネルであり、前記車両に関連付けられた前記候補アクションを表す前記マルチチャネル画像を生成することは、前記候補アクションに関連付けられた前記車両の目標の速度または目標の加速度を表す前記マルチチャネル画像の第２のチャネルをさらに含む、段落Ｈに記載の方法。

Ｊ：前記マルチチャネル画像は、前記環境内の追加のオブジェクトの追加のオブジェクト情報を含む１つまたは複数のチャネルをさらに含み、前記マルチチャネル画像は現在の時間より前の１つまたは複数の前回の時間に関連付けられた複数のマルチチャネル画像の１つである、段落Ｆ乃至Ｉのいずれかに記載の方法。

Ｋ：前記機械学習モデルから、前記現在の時間の後の１つまたは複数の将来の時間における前記環境を表す複数の予測確率を、受信すること、をさらに含むに段落Ｊ記載の方法。

Ｌ：前記予測確率は現在の時間の後の第１の時間に関連付けられた第１の予測確率であり、前記方法は、前記機械学習モデルから前記オブジェクトに関連付けられた第２の予測確率を受信することをさらに含み、前記第２の予測確率は前記第１の時間の後の第２の時間に関連付けられており、前記第１の予測確率に関連付けられた第１の確率の量は前記第２の予測確率に関連付けられた第２の確率の量の閾値量内である、段落Ｆ乃至Ｋのいずれかに記載の方法。

Ｍ：前記オブジェクトデータが画像データ、ｌｉｄａｒデータ、ｒａｄａｒデータ、または飛行時間データ（time-of-flight data）の少なくとも１つに少なくとも部分的に基づいている、段落Ｆ乃至Ｌのいずれかに記載の方法。

Ｎ：前記機械学習モデルは畳み込みニューラルネットワークを含む、段落Ｆ乃至Ｍのいずれかに記載の方法。

Ｏ．前記アクションデータは第１のアクションデータであり、前記候補アクションは第１の候補アクションであり、前記マルチチャネル画像は第１のマルチチャネル画像であり、前記環境の前記トップダウンビューは前記環境の第１のトップダウンビューであり、前記予測確率は前記第１の候補アクションに関連付けられた第１の予測確率であり、前記方法は前記車両が前記環境内で実行するための第２の候補アクションに関連付けられた第２のアクションデータを受信することと、前記オブジェクトデータおよび前記第２のアクションデータに少なくとも部分的に基づいて、前記環境の第２のトップダウンビューを表す第２のマルチチャネル画像を生成することと、前記第２のマルチチャネル画像を前記機械学習モデル内に入力することと、前記機械学習モデルから、前記オブジェクトに関連付けられた第２の予測確率を受信することと、をさらに含む、段落Ｆ乃至Ｎのいずれかに記載の方法。

Ｐ．前記第１の予測確率に関連付けられた第１のコストを決定することと、前記第２の予測確率に少なくとも部分的に基づいて、第２のコストを決定することと、選択されたアクションとして、ならびに前記第１のコストおよび記第２のコストに少なくとも部分的に基づいて、前記第１の候補アクションまたは前記第２の候補アクションの１つを選択することと、前記選択されたアクションに少なくとも部分的に基づいて、前記車両が前記環境を横断するように制御することと、をさらに含む、段落Ｏに記載の方法。

Ｑ：実行されると、１つまたは複数のプロセッサに、環境内のオブジェクトを表すオブジェクトデータを受信することと、車両が前記環境内で実行するための候補アクションに関連付けられたアクションデータを受信することであって、前記候補アクションは、レーン内アクション、ターンアクションまたはレーン変更アクションの１つまたは複数を含み、前記アクションデータは前記候補アクションを示している、ことと、前記オブジェクトデータおよび前記アクションデータに少なくとも部分的に基づいて、前記オブジェクト、前記オブジェクトに関連付けられたモーション情報、および前記車両に関連付けられた前記候補アクションを表すマルチチャネル画像を生成することと、前記マルチチャネル画像を機械学習モデル内へ入力することと、前記機械学習モデルから、前記オブジェクトに関連付けられた予測確率を受信することと、前記予測確率および前記候補アクションに少なくとも部分的に基づいて、前記車両が前記環境を横断するように制御することと、を含む操作を実行させる、命令を格納する１つまたは複数の非一時的コンピュータ可読媒体。

Ｒ：前記車両に関連付けられた前記候補アクションを表す前記マルチチャネル画像を生成することは、前記候補アクションに関連付けられたターゲットレーンを表す前記マルチチャネル画像のチャネルを生成することを含み、前記ターゲットレーンは前記車両が占有する予定のレーンを示す、段落Ｑに記載の非一時的コンピュータ可読媒体。

Ｓ：前記チャネルは第１のチャネルであり、前記車両に関連付けられた前記候補アクションを表す前記マルチチャネル画像を生成することは、前記候補アクションに関連付けられた前記車両の目標の速度または目標の加速度を表す前記マルチチャネル画像の第２のチャネル生成することをさらに含む、段落ＱまたはＳに記載の非一時的コンピュータ可読媒体。

Ｔ：前記アクションデータは第１のアクションデータであり、前記候補アクションは第１の候補アクションであり、前記マルチチャネル画像は第１のマルチチャネル画像であり、前記予測確率は前記第１の候補アクションに関連付けられた第１の予測確率であり、前記操作は前記車両が前記環境内で実行するための第２の候補アクションに関連付けられた第２のアクションデータを受信することと、前記オブジェクトデータおよび前記第２のアクションデータに少なくとも部分的に基づいて、前記オブジェクト、前記モーション情報、および前記第２の候補アクションを表す第２のマルチチャネル画像を生成することと、前記第２のマルチチャネル画像を前記機械学習モデル内に入力することと、前記機械学習モデルから、前記オブジェクトに関連付けられた第２の予測確率を受信することと、をさらに含む、段落Ｑ乃至Ｔのいずれかに記載の非一時的コンピュータ可読媒体。

上述の例示の発明内容は１つの特定の実装形態に関して説明しているが、この文書のコンテキストでは、例示の発明内容はまた、方法、デバイス、システム、コンピュータ可読媒体、および／またはその他の実装形態を介して実装できることを理解されたい。さらに、例示Ａ乃至Ｔのいずれかは、単独でまたは他の１つまたは複数の例示Ａ乃至Ｔと組み合わせて実装され得る。

［結論］
本明細書で説明する技術の1つまたは複数の例について説明したが、様々な変更、追加、置換、およびそれらの同等物が、本明細書で説明する技術の範囲内に含まれる。

例示の説明では、本明細書の一部を形成する添付の図面を参照するが、これは例示として請求される主題の具体的な例を示す。他の例を使用でき、構造的変更などの変更または代替を行うことできることを理解されたい。そのような例示、変更または代替は、意図して請求される主題に関する範囲から必ずしも逸脱するものではない。本明細書のステップは特定の順序で提示できるが、いくつかのケースでは、説明したシステムおよび方法の機能を変更することなく、特定の入力を異なる時間または異なる順序で提供するように、順序を変更できる。開示された手順をまた異なる順序で実行できる。さらに、本明細書にある様々な計算は開示された順序で実行される必要はなく、計算の代替順序を使用する他の例を容易に実装できる。並べ替えに加えて、計算はまた、同じ結果となるサブ計算に分解できる。

Claims

環境内のオブジェクトを表すオブジェクトデータを受信することと、
車両が前記環境内で実行するための候補アクションに関連付けられたアクションデータを受信することと、
前記オブジェクトデータおよび前記アクションデータに少なくとも部分的に基づいて、前記環境のトップダウンビューを表すマルチチャネル画像を生成することであって、前記マルチチャネル画像は、前記オブジェクト、前記オブジェクトに関連付けられたモーション情報、および前記車両に関連付けられた前記候補アクションを表す、ことと、
前記マルチチャネル画像を機械学習モデル内へ入力することと、
前記機械学習モデルから、前記オブジェクトに関連付けられた予測確率を受信することと、
前記予測確率に少なくとも部分的に基づいて、前記車両が前記環境を横断するように、制御することと、
を含む方法。
前記予測確率は第１の予測確率であり、前記方法は
前記機械学習モデルから前記車両に関連付けられた第２の予測確率を受信すること、
をさらに含む、請求項１に記載の方法。
前記候補アクションは、
レーン内アクション、
レーン変更アクション、または
ターンアクションの少なくとも１つを含み、
前記車両に関連付けられた前記候補アクションを表す前記マルチチャネル画像を生成することは、
前記候補アクションに関連付けられたターゲットレーンを表す前記マルチチャネル画像の第１のチャネル、または
前記候補アクションに関連付けられた前記車両の目標の速度または目標の加速度を表す前記マルチチャネル画像の第２のチャネルの少なくとも１つを生成することを含む、
請求項１または請求項２に記載の方法。
前記マルチチャネル画像は、前記環境内の追加のオブジェクトの追加のオブジェクト情報を含む１つまたは複数のチャネルをさらに含み、
前記マルチチャネル画像は現在の時間より前の１つまたは複数の前回の時間に関連付けられた複数のマルチチャネル画像の１つである、請求項１乃至請求項３のいずれか一項に記載の方法。
前記機械学習モデルから、前記現在の時間の後の１つまたは複数の将来の時間における前記環境を表す複数の予測確率を、受信すること、をさらに含む請求項４に記載の方法。
前記予測確率は現在の時間の後の第１の時間に関連付けられた第１の予測確率であり、前記方法は、
前記機械学習モデルから前記オブジェクトに関連付けられた第２の予測確率を受信することをさらに含み、前記第２の予測確率は前記第１の時間の後の第２の時間に関連付けられており、
前記第１の予測確率に関連付けられた第１の確率の量は前記第２の予測確率に関連付けられた第２の確率の量の閾値量内である、
請求項１乃至請求項５のいずれか一項に記載の方法。
前記オブジェクトデータが画像データ、ｌｉｄａｒデータ、ｒａｄａｒデータ、または飛行時間データ（time-of-flight data）の少なくとも１つに少なくとも部分的に基づいている、または
前記機械学習モデルは畳み込みニューラルネットワークを含む、
うちの少なくとも１つの請求項１乃至請求項６のいずれか一項に記載の方法。
前記予測確率は将来の時間に関連付けられた占有グリッドとして表され、
前記占有グリッドのセルは、前記将来の時間における前記車両が前記セルに関連付けられた領域内にいる確率を示している、
請求項１乃至請求項７のいずれか一項に記載の方法。
前記アクションデータは第１のアクションデータであり、
前記候補アクションは第１の候補アクションであり、
前記マルチチャネル画像は第１のマルチチャネル画像であり、
前記環境の前記トップダウンビューは前記環境の第１のトップダウンビューであり、
前記予測確率は前記第１の候補アクションに関連付けられた第１の予測確率であり、
前記方法は
前記車両が前記環境内で実行するための第２の候補アクションに関連付けられた第２のアクションデータを受信することと、
前記オブジェクトデータおよび前記第２のアクションデータに少なくとも部分的に基づいて、前記環境の第２のトップダウンビューを表す第２のマルチチャネル画像を生成することと、
前記第２のマルチチャネル画像を前記機械学習モデル内に入力することと、
前記機械学習モデルから、前記オブジェクトに関連付けられた第２の予測確率を受信することと、
をさらに含む、請求項１乃至請求項８のいずれか一項に記載の方法。
前記第１の予測確率に関連付けられた第１のコストを決定することと、
前記第２の予測確率に少なくとも部分的に基づいて、第２のコストを決定することと、
選択されたアクションとして、ならびに前記第１のコストおよび記第２のコストに少なくとも部分的に基づいて、前記第１の候補アクションまたは前記第２の候補アクションの１つを選択することと、
前記選択されたアクションに少なくとも部分的に基づいて、前記車両が前記環境を横断するように制御することと、
をさらに含む、請求項９に記載の方法。
コンピュータ上で実行されると、請求項１乃至請求項１０のいずれか１項に記載の方法を実施する、コード化された命令を含むコンピュータプログラム製品。
１つまたは複数のプロセッサと、
命令が実行されると、システムに
環境内のオブジェクトを表すオブジェクトデータを受信することと、
車両が前記環境内で実行するための候補アクションに関連付けられたアクションデータを受信することであって、前記候補アクションは、レーン内アクション、ターンアクションまたはレーン変更アクションの１つまたは複数を含み、前記アクションデータは前記候補アクションを示している、ことと、
前記オブジェクトデータおよび前記アクションデータに少なくとも部分的に基づいて、前記オブジェクト、前記オブジェクトに関連付けられたモーション情報、および前記車両に関連付けられた前記候補アクションを表すマルチチャネル画像を生成することと、
前記マルチチャネル画像を機械学習モデル内へ入力することと、
前記機械学習モデルから、前記オブジェクトに関連付けられた予測確率を受信することと、
前記予測確率および前記候補アクションに少なくとも部分的に基づいて、前記車両が前記環境を横断するように制御することと、
を含む操作を実行させる、前記１つまたは複数のプロセッサによって実行可能な前記命令を格納する１つまたは複数の非一時的コンピュータ可読媒体と、
を含むシステム。
前記車両に関連付けられた前記候補アクションを表す前記マルチチャネル画像を生成することは、前記候補アクションに関連付けられたターゲットレーンを表す前記マルチチャネル画像のチャネルを生成することを含み、前記ターゲットレーンは前記車両が占有する予定のレーンを示す、請求項１２に記載のシステム。
前記チャネルは第１のチャネルであり、前記車両に関連付けられた前記候補アクションを表す前記マルチチャネル画像を生成することは、前記候補アクションに関連付けられた前記車両の目標の速度または目標の加速度を表す前記マルチチャネル画像の第２のチャネル生成することをさらに含む、請求項１３に記載のシステム。
前記アクションデータは第１のアクションデータであり、
前記候補アクションは第１の候補アクションであり、
前記マルチチャネル画像は第１のマルチチャネル画像であり、
前記予測確率は前記第１の候補アクションに関連付けられた第１の予測確率であり、
前記操作は
前記車両が前記環境内で実行するための第２の候補アクションに関連付けられた第２のアクションデータを受信することと、
前記オブジェクトデータおよび前記第２のアクションデータに少なくとも部分的に基づいて、前記オブジェクト、前記モーション情報、および前記第２の候補アクションを表す第２のマルチチャネル画像を生成することと、
前記第２のマルチチャネル画像を前記機械学習モデル内に入力することと、
前記機械学習モデルから、前記オブジェクトに関連付けられた第２の予測確率を受信することと、
をさらに含む、請求項１２乃至請求項１４のいずれか一項に記載のシステム。