JP7459224B2

JP7459224B2 - アンカー軌道を使用したエージェント軌道予測

Info

Publication number: JP7459224B2
Application number: JP2022500054A
Authority: JP
Inventors: チャイ，ユーニン; サップ，ベンジャミン; バンサール，マヤンク; アングエロフ，ドラゴミール
Original assignee: ウェイモエルエルシー
Priority date: 2019-07-03
Filing date: 2020-07-02
Publication date: 2024-04-01
Anticipated expiration: 2040-07-02
Also published as: EP3977227A1; JP2022539250A; EP3977227A4; US20230234616A1; CN114080634B; US20210001897A1; US11618481B2; WO2021003379A1; CN114080634A; US12097889B2; KR20220030270A

Description

本明細書は、環境内のエージェントの将来の軌道を予測することに関する。

環境は実世界の環境であり得、エージェントは、例えば、環境内の車両であり得る。エージェントの将来の軌道を予測することは、自律型車両などによる運動計画に必要なタスクである。

自律型車両は、自動運転する車、船舶、および航空機を含む。自律型車両は、様々な車載センサおよびコンピュータシステムを使用して近くの物体を検出し、その検出を使用して制御およびナビゲーション決定を行う。

一部の自律型車両は、ニューラルネットワーク、他のタイプの機械学習モデル、またはその両方を様々な予測タスク、例えば、画像内の物体分類のために実装する車載コンピュータシステムを有する。例えば、ニューラルネットワークを使用して、車載カメラで撮像された画像が近くの車の画像である可能性が高いと判定することができる。ニューラルネットワーク、略して、ネットワークは、複数の操作の層を使用して、１つ以上の入力から１つ以上の出力を予測する機械学習モデルである。ニューラルネットワークは、通常、入力層と出力層との間に位置する１つ以上の隠れ層を含む。各層の出力は、ネットワーク内の別の層、例えば、次の隠れ層または出力層への入力として使用される。

ニューラルネットワークの各層は、層への入力に対して実行される１つ以上の変換操作を指定する。一部のニューラルネットワーク層は、ニューロンと称される操作を有する。各ニューロンは１つ以上の入力を受信し、別のニューラルネットワーク層で受信される出力を生成する。多くの場合、各ニューロンは、他のニューロンから入力を受信し、各ニューロンは１つ以上の他のニューロンに出力を提供する。

ニューラルネットワークのアーキテクチャは、ネットワークに含まれる層およびその特性、ならびにネットワークの各層のニューロンの接続方法を指定する。換言すれば、アーキテクチャは、どの層がそれらの出力をどの他の層への入力として提供するか、およびどのようにその出力を提供するかを指定する。

各層の変換操作は、変換操作を実装するソフトウェアモジュールがインストールされたコンピュータによって実行される。したがって、操作を実行するとして記述されている層は、層の変換操作を実装するコンピュータが操作を実行することを意味する。

各層は、層のパラメータセットの現在の値を使用して１つ以上の出力を生成する。したがって、ニューラルネットワークをトレーニングすることは、継続的に、入力に対する順方向パスの実行、勾配値の計算、および計算された勾配値を使用した、例えば、勾配降下を使用した各層のパラメータセットの現在の値の更新を伴う。ニューラルネットワークがトレーニングされると、最終的なパラメータセットを使用して、生成システムで予測を行うことができる。

本明細書は、概して、環境内のエージェントの将来の軌道を予測する、１つ以上の場所にある１つ以上のコンピュータ上のコンピュータプログラムとして実装されるシステムを説明する。

第１の態様によれば、環境内の車両の近傍のエージェントの将来の軌道を予測するためのシステムが提供される。システムは、エージェントを特徴付ける埋め込みを取得し、軌道予測ニューラルネットワークを使用して埋め込みを処理して、現在の時点の後のエージェントの将来の軌道を特徴付ける軌道予測出力を生成する。軌道予測出力は、エージェントの将来の軌道と、複数のアンカー軌道の各々との予測類似度を特徴付けるデータを含む。各アンカー軌道は、エージェントの可能な将来の軌道を特徴付け、各々がそれぞれの将来の時点に対応する、環境内の複数のウェイポイント空間的場所のシーケンスを指定するデータを含む。システムは、車両の計画システムに軌道予測出力を提供して、車両の将来の軌道を計画する計画決定を生成する。

本明細書に記載の主題は、特定の実施形態において、以下の利点のうちの１つ以上を実現するように実施することができる。

本明細書において説明されているシステムは、エージェントの将来の軌道と、複数の「アンカー」軌道の各々との予測類似度を特徴付ける軌道予測出力を生成することができる。各アンカー軌道は、例えば、Ｕターンの実行、車線変更、または停止など、エージェントの可能性のある高レベルの意図に暗黙的に対応する。各アンカー軌道について、軌道予測出力は、エージェントがアンカー軌道に対応する意図をどのように実行することができるかの不確実性をさらに特徴付けることができる。

システムは、ニューラルネットワークモデルを通じた１回の順方向パスを使用して、エージェントの軌道予測出力を効率的に生成することができ、軌道予測出力は、例えば、確率分布パラメータのセットによってコンパクトに表すことができる。対照的に、一部の従来の軌道予測システムは、本明細書で説明されるシステムによって生成される軌道予測出力を表すために必要なパラメータの数よりも数桁大きいパラメータの数によって表される出力を生成する。さらに、一部の従来の軌道システムは、単一の軌道予測出力を生成するのではなく、エージェントの複数の異なる可能な将来の軌道を特徴付ける出力を繰り返し生成する。したがって、本明細書において説明されるシステムは、単一のコンパクトな軌道予測出力を生成することにより、消費する計算リソース（例えば、メモリリソース）を、一部の従来の軌道予測システムよりも少なくすることができる。

本明細書において説明されているシステムは、一部の従来の軌道予測システムよりも正確にエージェントの将来の軌道を特徴付ける軌道予測出力を生成することができる。例えば、エージェントの将来の軌道に固有の不確実性を特徴付けることにより、システムは、エージェントの単一の最も可能性の高い将来の軌道を予測する一部の従来のシステムよりも正確に軌道予測出力を生成することができる。別の例として、可能な将来の軌道の分布のモードを捕捉するアンカー軌道のセットに基づいて軌道予測出力を生成することにより、システムは、一部の従来のシステムで経験されるような「モード崩壊」を回避することができる。モード崩壊を経験する従来のシステムは、エージェントの将来の軌道の単一の決定論的推定とほとんど異ならない、エージェントの複数の予測される将来の軌道を生成することができる。

本明細書の主題の１つ以上の実施形態の詳細を、添付の図面および以下の説明に記載する。主題の他の特徴、態様、および利点は、説明、図面、および特許請求の範囲から、明らかになるであろう。

例示的なシステムの図である。エージェントの軌道予測の生成の図である。軌道予測出力を生成するための例示的なプロセスの流れ図である。軌道予測システムをトレーニングするための例示的なプロセスの流れ図である。

様々な図面の中の同様の参照番号および名称は、同様の要素を示す。

本明細書は、自律型車両または半自律型車両などの車両が、本明細書において「軌道予測システム」と称される、トレーニングされた機械学習モデルを使用して、環境内の車両の近傍の１つ以上の周囲のエージェントの各々の、それぞれの軌道予測出力をどのように生成することができるかを説明する。

本明細書では、「周囲のエージェント」は、一般性を失うことなく、車両、自転車、歩行者、船舶、ドローン、または環境内の任意の他の移動物体を指すことができる。

本明細書では、車両によって生成されたトレーニング例を使用して、軌道予測システムを効果的にトレーニングし、どのように正確かつ確実に予測を行うことができるかについても説明する。

図１は、例示的なシステム１００の図である。システム１００は、車載システム１１０と、トレーニングシステム１２０と、を含む。

車載システム１１０は、車両１０２に車載されて配置されている。図１の車両１０２は自動車として図示されているが、車載システム１０２は、任意の適切なタイプの車両に車載して配置することができる。車両１０２は、環境内をナビゲートするために完全自律型運転決定を判定および実行する完全自律型車両であり得る。車両１０２はまた、人間の運転者を支援するために予測を使用する半自律型車両であり得る。例えば、人間の運転者が別の車両と衝突しそうであることを予測が示す場合、車両１０２は、自律的にブレーキをかけることができる。

車載システム１１０は、１つ以上のセンササブシステム１３０を含む。センササブシステム１３０は、電磁放射の反射を受信する構成要素の組み合わせ、例えば、レーザ光の反射を検出するライダシステム、無線波の反射を検出するレーダシステム、および可視光の反射を検出するカメラシステムを含む。

所与のセンサによって生成されたセンサデータは、概して、反射された放射の距離、方向、および強度を示す。例えば、センサは、特定の方向に電磁放射の１つ以上のパルスを送信することができ、反射の強度と反射が受信された時間を測定することができる。距離は、パルスとそれに対応する反射の間にかかった時間を判定することによって計算することができる。センサは、角度、方位角、またはその両方で特定の空間を継続的に掃引することができる。例えば、方位角での掃引は、センサが同じ視線に沿った複数の物体を検出することを可能にし得る。

車両１０２のセンササブシステム１３０または他の構成要素はまた、１つ以上のセンサからの１つ以上の生のセンサ測定値のグループを、別のエージェントの測度であるとして分類することもできる。センサ測定値のグループは、捕捉されているセンサ測定値の種類に応じて、様々な方法のいずれかで表すことができる。例えば、生のレーザセンサ測定値の各グループは、３次元の点群として表すことができ、各点が、強度と、特定の二次元または三次元座標空間内の位置と、を有する。いくつかの実装態様では、位置は、範囲と標高とのペアとして表される。カメラセンサ測定値の各グループは、画像パッチ、例えば、ＲＧＢ画像パッチとして表すことができる。

センササブシステム１３０が、生のセンサ測定値の１つ以上のグループをそれぞれの他のエージェントの測度として分類すると、センササブシステム１３０は、生のセンサ測定値を生データ１３２のセットにコンパイルし、生データ１３２をデータ表現システム１４０に送信することができる。

同じく車両１０２に車載されているデータ表現システム１４０は、センサシステム１３０から生のセンサデータ１３２を受信し、シーンデータ１４２を生成する。シーンデータ１４２は、現在の時点での車両１０２を取り巻く環境の現在の状態を特徴付ける。

例えば、シーンデータは、環境内のすべての周囲のエージェントについて、現在の時点での現在の状態、および、１つ以上のそれぞれの以前の時点での以前の状態を特徴付けることができる。換言すれば、シーンデータは、環境内のすべての周囲のエージェントについての、現在の時点までの環境内のエージェントの以前の軌道を特徴付けるデータを含むことができる。ある時点でのエージェントの状態は、その時点でのエージェントの場所、および、任意選択的に、その時点での運動パラメータの所定のセットの値を含むことができる。特定の例として、運動パラメータは、エージェントの進行方向、エージェントの速度、および／またはエージェントの加速度を含むことができる。いくつかの実装態様では、シーンデータはまた、現在の時点での車両の現在の状態、および、１つ以上のそれぞれの以前の時点での車両の以前の状態を特徴付けるデータも含む。一部の実装態様では、シーンデータは、環境の特徴を特徴付けるデータも含む。これらの特徴は、（ｉ）現在の時点での、例えば、信号機の状態などの環境の動的な特徴、（ｉｉ）例えば、車線の接続性、車線の種類、一端停止線、制限速度などのうちの１つ以上を特徴付ける道路グラフデータなどの環境の静的な特徴、または（ｉｉｉ）両方を含むことができる。

特定の例として、シーンデータは、トップダウンの視点から環境を特徴付ける三次元データ表現とすることができる。換言すれば、シーンデータは、その時点での環境内の周囲のエージェントの描写を含む、各時点についての環境の１つ以上のトップダウンレンダリング画像を含むことができる。例えば、シーンデータは、各時点の環境の単一のトップダウンレンダリング画像を含むことができ、所与の時点のトップダウンレンダリング画像では、周囲のエージェントは、所与の時点でのそれらの場所および動きに基づいて、トップダウンレンダリング画像内の境界ボックスとして描写することができる。境界ボックスは、それぞれの物体の境界またはエッジを識別する画像内のピクセルのボックスである。いくつかの実装態様では、トップダウンレンダリング画像はまた、現在の時点での道路車線および他の道路グラフ特徴または環境の他の機能を描写するための追加のレンダリング画像も含む。

データ表現システム１４０は、同じく車両１０２に車載されている軌道予測システム１５０にシーンデータ１４２を提供する。

軌道予測システム１５０は、シーンデータ１４２を処理して、周囲のエージェントのうちの１つ以上の各々について、それぞれの軌道予測出力１５２を生成する。所与のエージェントの軌道予測出力１５２は、現在の時点の後のエージェントの将来の軌道を特徴付ける。

より詳細には、所与のエージェントの軌道予測出力１５２は、エージェントの将来の軌道と、複数のアンカー軌道の各々との予測類似度を特徴付けるデータを含む。各アンカー軌道は、現在の時点の後のエージェントの異なる可能な将来の軌道を特徴付け、各々が、将来の時点の後であるそれぞれの将来の時点でのエージェントの可能な位置に対応する環境内の複数のウェイポイント空間的場所のシーケンスを指定するデータを含む。換言すれば、各アンカー軌道は、現在の時点の後に周囲のエージェントが通過し得る、環境内のウェイポイント場所の異なるシーケンスを識別する。

軌道予測出力の生成については、図２および図３を参照して下記により詳細に説明する。

車載システム１１０はまた、計画システム１６０も含む。計画システム１６０は、例えば、車両１０２が将来通る経路を特徴付ける計画車両経路を生成することによって、車両１０２の自律的または半自律的な運転決定を行うことができる。

車載システム１００は、軌道予測システム１５０によって生成された軌道予測出力１５２を、例えば、計画システム１６０および／またはユーザインターフェースシステム１６５などの、車両１０２の他の１つ以上の車載システムに提供することができる。

計画システム１６０が軌道予測出力１５２を受信すると、計画システム１６０は、軌道予測出力１５２を使用して、車両の将来の軌道を計画する計画決定を生成する、すなわち、新しい計画車両経路を生成することができる。例えば、軌道予測出力１５２は、特定の周囲のエージェントが特定の将来の時点で車両１０２の前に割り込み、潜在的に衝突を引き起こす可能性があるという予測を含み得る。この例では、計画システム１６０は、潜在的な衝突を回避する新しい計画車両経路を生成し、例えば、車両のステアリングを自律的に制御することによって、車両１０２を新しい計画経路に従わせ、潜在的な衝突を回避することができる。

ユーザインターフェースシステム１６５が軌道予測出力１５２を受信すると、ユーザインターフェースシステム１６５は、軌道予測出力１５２を使用して、運転者が車両１０２を安全に操作するのを支援するための情報を、車両１０２の運転者に提示することができる。ユーザインターフェースシステム１６５は、任意の適切な手段によって、例えば、車両１０２のスピーカシステムを通じて送信されるオーディオメッセージによって、またはエージェント内の視覚的表示システム（例えば、車両１０２のダッシュボード上のＬＣＤディスプレイ）に表示される警告によって、エージェント１０２の運転者に情報を提示することができる。特定の例では、軌道予測出力１５２は、特定の周囲のエージェントが車両１０２の前に割り込み、潜在的に衝突を引き起こす可能性があるという予測を含み得る。この例では、ユーザインターフェースシステム１６５は、衝突を回避するために車両１０２の軌道を調整するように指示する警告メッセージを車両１０２の運転者に提示するか、または特定の周囲のエージェントと衝突する可能性があることを車両１０２の運転者に通知することができる。

軌道予測出力１５２を生成するために、軌道予測システム１５０は、トレーニングシステム１２０内の軌道予測モデルパラメータストア１９０から取得される、トレーニングされたパラメータ値１９５、すなわち、軌道予測システム１５０のトレーニングされたモデルパラメータ値を使用することができる。

トレーニングシステム１２０は、通常、１つ以上の場所に数百または数千のコンピュータを有する分散型コンピューティングシステムであり得るデータセンタ１２４内でホストされる。

トレーニングシステム１２０は、軌道予測システムをトレーニングするために、すなわち、軌道予測システム１５０のトレーニングされたパラメータ値１９５を判定するために使用されるすべてのトレーニングデータを記憶するトレーニングデータストア１７０を含む。トレーニングデータストア１７０は、実世界で動作するエージェントから生のトレーニング例を受信する。例えば、トレーニングデータストア１７０は、車両１０２およびトレーニングシステム１２０と通信している１つ以上の他のエージェントから生のトレーニング例１５５を受信することができる。生のトレーニング例１５５は、トレーニングシステム１２０によって処理されて、新しいトレーニング例を生成することができる。生のトレーニング例１５５は、新しいトレーニング例の入力として使用することができるシーンデータ、すなわち、シーンデータ１４２のようなシーンデータを含むことができる。生のトレーニング例１５５はまた、１つ以上の将来の時点での車両１０２を取り巻く環境の状態を特徴付ける結果データを含むことができる。この結果データを使用して、シーンデータによって特徴付けられる時点での車両の近傍の１つ以上のエージェントのグラウンドトゥルース軌道を生成することができる。各グラウンドトゥルース軌道は、将来の時点で対応するエージェントが通過する実際の軌道（結果データから導出されるもの）を識別する。例えば、グラウンドトゥルース軌道は、エージェントが複数の将来の時点の各々で移動するエージェント中心の座標系の空間的場所を識別することができる。

トレーニングデータストア１７０は、同じくトレーニングシステム１２０においてホストされるトレーニングエンジン１８０にトレーニング例１７５を提供する。トレーニングエンジン１８０は、トレーニング例１７５を使用して、軌道予測システム１５０によって使用されるモデルパラメータを更新し、更新されたモデルパラメータ１８５を軌道予測モデルパラメータストア１９０に提供する。軌道予測システム１５０のパラメータ値が完全にトレーニングされると、トレーニングシステム１２０は、例えば、有線またはワイヤレス接続を介して、トレーニングされたパラメータ値１９５を軌道予測システム１５０に送信することができる。

軌道予測システム１５０のトレーニングは、図４を参照して下記により詳細に説明される。

図２は、埋め込みニューラルネットワーク２１０および軌道予測ニューラルネットワーク２２０を使用した、車両の近傍のエージェントの軌道予測の生成の図である。例えば、ニューラルネットワークは、車両に車載された軌道予測システム、例えば、図１に描写される軌道予測システム１５０の一部とすることができる。

埋め込みニューラルネットワーク２１０は、車両を取り巻く環境の現在の状態を特徴付ける入力シーンデータ２０２（埋め込みニューラルネットワーク入力とも称される）を受信する。

埋め込みニューラルネットワーク２１０は、シーンデータ２０２を処理して、シーン内の個々のエージェントの状態およびエージェント間の相互作用を符号化するシーン特徴２１２を出力として生成するフィードフォワードニューラルネットワークである。シーン特徴２１２は、埋め込みニューラルネットワーク出力とも称される。

例えば、シーンデータ２０２がトップダウンの視点から環境を特徴付ける三次元データ表現である場合、埋め込みニューラルネットワーク２１０は、畳み込みニューラルネットワーク、すなわち、１つ以上の畳み込みニューラルネットワーク層を含むニューラルネットワークであり得、シーン特徴２１２もまた、トップダウンの視点から環境を特徴付ける三次元データ表現であり得る。例えば、シーンデータ２０２およびシーン特徴２１２は、同じ空間解像度を有することができるが、シーン特徴２１２は、より多数の深度チャネルを有することができる。別の例として、シーンデータ２０２およびシーン特徴２１２は、異なる空間解像度を有することができ、シーン特徴２１２は、より多数の深度チャネルを有する。特定の例として、埋め込みニューラルネットワーク２１０は、ブロックの入力からの残りの接続が各々に後続する畳み込みニューラルネットワーク層の複数のブロックを含むＲｅｓＮｅｔアーキテクチャを有することができる。

次に、システムは、シーン特徴２１２から、軌道予測が生成されるべきである車両の近傍の各エージェントのそれぞれの埋め込みを生成することができる。エージェントの埋め込みは、現在の時点までのエージェントを特徴付ける。

エージェントの埋め込みを生成するために、システムは、シーン特徴２１２からの「指向性クロップ」２１４を実行する。特に、システムは、エージェントに対応するシーン特徴２１２の部分をクロップし、シーン特徴２１２のクロップされた部分に基づいて、エージェントを特徴付ける埋め込みを判定する。所与のエージェントに対応するシーン特徴２１２の部分は、例えば、シーン特徴２１２内のエージェントの場所を中心とするシーン特徴２１２の固定サイズ部分であり得る。より詳細には、システムはシーン特徴２１２のクロップされた部分をエージェント中心の座標系に対して回転させて埋め込みを生成するため、クロップは「指向性」クロップと称される。例えば、システムは微分可能双線形ワーピングを使用してこの回転を実行することができる。

関心のあるすべてのエージェントのすべての埋め込みは、シーン特徴２１２から生成されるため、システムは、埋め込みニューラルネットワーク２１０を通る単一の順方向パスのみを使用して、関心のあるすべてのエージェントの埋め込みを生成することができる。すなわち、所与のエージェントの埋め込みニューラルネットワーク入力は、所与のエージェントを特徴付けるだけでなく、現在の時点までの環境内の他の１つ以上のエージェントの軌道もさらに特徴付け、したがって、埋め込みニューラルネットワーク２１０を通る単一の順方向パスを使用して、すべてのエージェントの埋め込みを生成することができる。

所与のエージェントの軌道予測を生成するために、システムは、軌道予測ニューラルネットワーク２２０（図２では「エージェント中心ＣＮＮ」と称される）を使用して、エージェントの埋め込みを処理する。

軌道予測ニューラルネットワーク２２０は、埋め込みを処理して、エージェントの将来の軌道と、複数のアンカー軌道の各々との、すなわち、固定数のアンカー軌道の各々との予測類似度を特徴付けるデータを含む軌道予測出力を生成するように構成されたニューラルネットワークである。

各アンカー軌道は、エージェントの可能な将来の軌道を特徴付け、各々がそれぞれの将来の時点でのエージェントの可能な位置に対応する、環境内の複数のウェイポイント空間的場所のシーケンスを指定するデータを含む。すなわち、各アンカー軌道は、現在の時点の後にエージェントが通過し得る、環境を通る異なる可能な将来の経路を定義する。

概して、固定数に含まれるアンカー軌道は既定されており、任意の所与の現在の時間からエージェントによって実行され得る可能な挙動の異なるセットを表す。すなわち、アンカー軌道はすべてのエージェントについて同じであり、シーンデータ２０２または環境内の現在のシーンに関する任意の他の情報に依存しない。アンカー軌道もエージェント中心の座標系にあるため、現在のシーンでのエージェントの現在の位置に関係なく、アンカー軌道の同じセットを任意のエージェントに使用することができる。

概して、アンカー軌道は、軌道予測システムのトレーニングの前に既定される。

特定の例として、システムは、軌道予測システムをトレーニングするために使用されるエージェント軌道のトレーニングセットに基づいて、アンカー軌道の一部またはすべてを判定することができる。例えば、システムはトレーニングセット内の軌道を固定数のクラスタにクラスタ化し、各クラスタから代表的な軌道をアンカー軌道として選択することができる。

別の例として、システムは、可能な軌道の空間から軌道を均一にサンプリングすることによって、固定数のアンカー軌道内のアンカー軌道の一部またはすべてを判定することができる。

図２の例は、シーンデータ２０２内で特徴付けられるエージェント２２２の３つのアンカー軌道２３０、２４０、および２５０を視覚化する。図２の例から分かるように、軌道予測出力は、軌道２３０に０．５の確率、軌道２４０に０．３の確率、および軌道２５０に０．１の確率を割り当てている（固定数のアンカー軌道のうちの残りの軌道は、０．１の組み合わせ確率を有する）。所与のアンカー軌道が割り当てられる確率は、所与のアンカー軌道がエージェントの将来の軌道に最も類似したアンカー軌道になる可能性を表すことができる。

いくつかの実装態様では、軌道予測出力はまた、各アンカー軌道について、アンカー軌道の各ウェイポイント空間的場所について、ウェイポイント空間的場所に依存する確率分布を特徴付けるデータも含むことができる。所与のウェイポイント空間的場所の確率分布は、エージェントがウェイポイント空間的場所に対応する将来の時点でウェイポイント空間的場所の近傍のそれぞれの空間的位置を占めるそれぞれの可能性を定義する。すなわち、エージェントがアンカー軌道に従うとすると、確率分布は、エージェントの実際の将来の軌道のアンカー軌道からの予測される可能な偏差の空間を表す。換言すれば、所与のアンカー軌道について、所与の将来の時点での確率分布は、所与のアンカー軌道のウェイポイント空間的場所からのエージェントの可能な偏差の空間を表し、より高い確率が割り当てられた場所は、より低い確率が割り当てられた場所よりも偏差の可能性が高くなる。

したがって、これらの実装態様では、軌道予測出力は、Ｋ個のアンカー軌道ごとに１つずつ、Ｋ個の確率または他の類似度スコアを含む。各アンカー軌道がＴ個の将来の時点を含む場合、軌道予測出力はまた、Ｋ個のアンカー軌道ごとに、およびＴ個の将来の時点の各々で、確率分布を特徴付けるデータも含む。したがって、確率分布を特徴付けるデータがＤ個の値を含む場合、所与のエージェントの軌道予測出力はＫ＋Ｋ×Ｔ×Ｄ個の値を含む。

特に、任意の所与のウェイポイント空間的場所について、ウェイポイント空間的場所に依存する確率分布を特徴付けるデータは、ウェイポイント空間的場所に依存するパラメトリック確率分布のパラメータを定義するデータを含む。

特定の例として、ウェイポイント空間的場所に依存するパラメトリック確率分布は正規確率分布とすることができ、正規確率分布のパラメータを定義するデータは、（ｉ）ウェイポイント空間的場所からの正規確率分布の平均のオフセットを指定するオフセットパラメータ、および（ｉｉ）正規確率分布の共分散パラメータを含むことができる。例えば、共分散パラメータは、エージェント中心の座標系内で２ｘ２共分散行列を定義することができる。この例では、軌道予測出力は、各アンカー軌道のそれぞれの類似度スコアを含み、各アンカー軌道の将来の各時点について、軌道予測出力は、５つの値、すなわち、ｘ次元に沿った平均オフセット、ｘ次元に沿った平均オフセット、ｙ次元に沿った平均オフセット、共分散行列を定義する３つのパラメータを含むことができる。したがって、軌道予測出力は、Ｋ個の類似度スコア、および、Ｋ個のアンカー軌道内の将来の時点での確率分布を定義するＫｘＴｘ５個の値を含む。

別の特定の例として、共分散を固定することができ、所与の将来の時点での正規分布のパラメータを定義するデータは、所与の将来の時点のオフセットパラメータのみを含むことができる。

図２の例では、確率分布によって定義される不確実性は、道路の幾何形状を考慮しており、時間の経過とともに軌道の各々について増大していることが分かる。

ニューラルネットワーク２２０は、軌道予測出力を構成するＫ＋ＫｘＴｘＤ個の値に埋め込みをマッピングするように構成された畳み込み層のセットを含むことができる。代替的に、ニューラルネットワーク２２０は、異なる将来の時点での確率分布を自己回帰的に、すなわち、１つ以上の再帰型ニューラルネットワーク層または他の自己回帰ニューラルネットワーク層を使用して、畳み込み層の出力を将来の各時点の確率分布パラメータに順次マッピングすることによって、生成することができる。

図３は、車両の近傍のエージェントの軌道予測出力を生成するための例示的なプロセス３００の流れ図である。便宜上、プロセス３００は、１つ以上の場所に位置する１つ以上のコンピュータのシステムによって実行されるものとして説明される。例えば、軌道予測システム、例えば、本明細書に従って適切にプログラムされた図１の軌道予測システム１５０が、プロセス３００を実行することができる。

任意の所与の時点で、システムは、車両の近傍の１つ以上のエージェントの各々に対してプロセス３００を実行することができる。例えば、システムは、センササブシステムによって車両の近傍にいると識別された各エージェントに対して、または、例えば、車両の計画システムによって軌道予測が必要とされるエージェントの適切なサブセットなどの、識別されたエージェントの適切なサブセットに対して、プロセス３００を実行することができる。

システムは、現在の時点までの環境における車両の近傍のエージェントを特徴付ける埋め込みを取得する（ステップ３０２）。

例えば、上記のように、システムは、埋め込みニューラルネットワークを使用してシーンデータを処理してシーン特徴を生成し（ステップ３０４）、次いで、エージェントに対応するシーン特徴の部分をクロップして埋め込みを生成すること（ステップ３０６）によって、埋め込みを取得することができる。場合によっては、システムは、埋め込みを生成するために、埋め込みニューラルネットワークのクロップされた部分をエージェント中心の座標系に対して回転させる。上記のように、システムは、埋め込みニューラルネットワークを１回通過するだけで、もう１つのエージェントすべての埋め込みを生成することができる。

システムは、軌道予測ニューラルネットワークを使用して埋め込みを処理して、現在の時点の後のエージェントの将来の軌道を特徴付ける軌道予測出力を生成する（ステップ３０８）。

上記のように、軌道予測出力は、エージェントの将来の軌道と、複数のアンカー軌道の各々との予測類似度を特徴付けるデータを含む。例えば、軌道予測出力は、アンカー軌道の各々について、アンカー軌道がエージェントの将来の軌道に最も類似した軌道になる可能性を表す確率または他の類似度スコアを含むことができる。

軌道予測出力はまた、各アンカー軌道について、アンカー軌道の各ウェイポイント空間的場所についてウェイポイント空間的場所に依存する確率分布を特徴付けるデータも含むことができる。所与のウェイポイント空間的場所の確率分布は、エージェントがアンカー軌道内のウェイポイント空間的場所に対応する将来の時点でウェイポイント空間的場所の近傍のそれぞれの空間的位置を占める可能性を定義する。

システムは、車両の計画システムに軌道予測出力を提供して、車両の将来の軌道を計画する計画決定を生成する（ステップ３１０）。

図４は、軌道予測システムをトレーニングするための例示的なプロセス４００の流れ図である。便宜上、プロセス４００は、１つ以上の場所に位置する１つ以上のコンピュータのシステムによって実行されるものとして説明される。例えば、トレーニングシステム、例えば、本明細書に従って適切にプログラムされた図１のトレーニングシステム１２０は、プロセス４００を実行することができる。

システムは、グラウンドトゥルースエージェント軌道のトレーニングセットからサンプリングされた１つ以上のグラウンドトゥルースエージェント軌道からなるミニバッチ内の各グラウンドトゥルースエージェント軌道に対してプロセス４００を実行して、グラウンドトゥルースエージェント軌道ごとに、それぞれのモデルパラメータ更新を判定することができる。次に、システムは、それぞれのモデルパラメータ更新を組み合わせ、例えば、平均または加算して、組み合わせ更新を生成し、次に、例えば、Ａｄａｍオプティマイザ、ｒｍｓＰｒｏｐオプティマイザ、または確率的勾配降下オプティマイザなどの、トレーニングに使用されるオプティマイザに従って、組み合わせ更新をモデルパラメータの現在の値に適用することができる。

グラウンドトゥルースエージェント軌道の種々のミニバッチに対してこの方法でモデルパラメータ値を繰り返し更新することにより、システムは、正確な軌道予測出力を生成するように、軌道予測システムをトレーニングすることができる。

システムは、最初の時点でのエージェントのシーンデータ、および、最初の時点の後にエージェントがたどる実際の軌道を識別するエージェントのグラウンドトゥルースエージェント軌道を含むトレーニング例を取得する（ステップ４０２）。

システムは、上記の軌道予測システムを使用し、モデルパラメータの現在の値に従って、すなわち、埋め込みニューラルネットワークおよび軌道予測ニューラルネットワークのパラメータの現在の値に従って、シーンデータを処理して、軌道予測出力を生成する（ステップ４０４）。

システムは、アンカー軌道の各々について、アンカー軌道と、グラウンドトゥルース軌道との類似度を判定する（ステップ４０６）。例えば、システムは、アンカー軌道とグラウンドトゥルース軌道との間の類似度を、２つの軌道間の状態シーケンス空間におけるｌ２ノルム距離または他の適切な距離測度として計算することができる。

システムは、類似度、グラウンドトゥルース軌道、および軌道予測出力に基づく損失関数のモデルパラメータに関する勾配を計算することによって、モデルパラメータの現在の値への更新を判定する（ステップ４０８）。システムは、埋め込みニューラルネットワークと軌道予測ニューラルネットワークを共にトレーニングするため、システムは、損失関数の勾配を軌道予測ニューラルネットワークを通じて埋め込みニューラルネットワークへと逆伝播させることができる。

場合によっては、損失関数は、グラウンドトゥルース軌道とアンカー軌道のうちの１つとの間に厳しい課題を採用し、したがって、グラウンドトゥルース軌道に最も類似しているアンカー軌道のみに依存する。これらの場合、損失関数は以下を満たすことができる。

ここで、Ｋはアンカー軌道の総数であり、θはモデルパラメータであり、

は指数ｋがグラウンドトゥルース軌道に最も類似したアンカー軌道の指数

と同じである場合に１であり、指数ｋが指数

と同じでない場合は常に０である指示関数であり、π（ａ^ｋ｜ｘ^ｍ；θ）は、シーンデータｘ^ｍを所与として軌道予測出力内でアンカー軌道ｋに割り当てられる確率であり、Ｔは、アンカー軌道内の時点の総数であり、

は、

である平均および共分散パラメータ

を有する正規分布によってグラウンドトゥルース軌道内の時間ｔにおいてウェイポイント空間的場所

に割り当てられる確率であり、

は、アンカー軌道ｋ内の時点ｔにおけるウェイポイント空間的場所であり、

は、アンカー軌道ｋの軌道予測出力における、時点ｔでのウェイポイント空間的場所からの正規確率分布の平均のオフセットであり、

は、アンカー軌道ｋの軌道予測出力における時点ｔでのウェイポイント空間的場所の共分散パラメータである。

それ以外の場合、損失関数は、グラウンドトゥルース軌道とアンカー軌道のうちの１つとの間に楽な課題を採用し、したがって、すべてのアンカー軌道に依存し、任意の所与のアンカー軌道の損失への寄与は、所与のアンカー軌道とグラウンドトゥルース軌道との間の類似度に依存する。これらの場合、上記の損失関数の指示項は、軌道ｋとグラウンドトゥルース軌道との間の類似度に基づくアンカー軌道ｋの間の類似度に依存する重みをアンカー軌道ｋに割り当てる項に置き換えられる。

本明細書に記載の主題および機能的動作の実施形態は、デジタル電子回路内に、有形的に具現化されたコンピュータソフトウェアもしくはファームウェア内に、本明細書に開示された構造体およびそれらの構造上の等価物を含むコンピュータハードウェア内に、またはそれらのうちの１つ以上を組み合わせて、実装することができる。本明細書に記載の主題の実施形態は、１つ以上のコンピュータプログラムとして、すなわち、データ処理装置によって実行するために、またはデータ処理装置の操作を制御するために有形の非一時的記憶媒体に符号化されたコンピュータプログラム命令の１つ以上のモジュールとして実装することができる。コンピュータ記憶媒体は、機械可読記憶デバイス、機械可読記憶基板、ランダムもしくはシリアルアクセスメモリデバイス、またはそれらのうちの１つ以上の組み合わせであり得る。代替的に、または加えて、プログラム命令は、人工的に生成された伝播信号、例えば、データ処理装置によって実行するために好適な受信装置に送信される情報を符号化するために生成される機械生成の電気、光、または電磁信号に符号化され得る。

「データ処理装置」という用語は、データ処理ハードウェアを指し、データを処理するためのあらゆる種類の装置、デバイス、および機械を包含し、例として、プログラマブルプロセッサ、コンピュータ、または複数のプロセッサもしくはコンピュータが含まれる。装置はまた、例えば、ＧＰＵまたは別の種類の専用処理サブシステムなどの、既製もしくはカスタムメイドの並列処理サブシステムであってもよく、またはそれらをさらに含んでいてもよい。装置はまた、例えば、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）もしくはＡＳＩＣ（特定用途向け集積回路）などの専用論理回路であってもよく、またはそれをさらに含んでいてもよい。装置は、ハードウェアに加えて、コンピュータプログラムのための実行環境を作り出すコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、またはそれらのうちの１つ以上の組み合わせを構成するコードを任意選択的に含むことができる。

プログラム、ソフトウェア、ソフトウェアアプリケーション、アプリケーション、モジュール、ソフトウェアモジュール、スクリプト、もしくはコード）とも称され得るか、または記載され得る、コンピュータプログラムは、コンパイラ型もしくはインタープリタ型言語、または宣言型もしくは手続き型言語を含む、任意の形態のプログラミング言語で記述することができ、かつ独立型プログラム、またはモジュール、構成要素、サブルーチン、もしくはコンピューティング環境で使用するために好適な他のユニットを含む任意の形態で導入することができる。プログラムは、ファイルシステム内のファイルに対応する場合もあるが、必ずしもそうである必要はない。プログラムは、他のプログラムもしくはデータを保持するファイルの一部、例えば、マークアップ言語ドキュメントに格納された１つ以上のスクリプト、当該プログラム専用の単一ファイル、または複数の調整ファイル、例えば、１つ以上のモジュール、サブプログラム、もしくはコードの一部を格納するファイルに格納することができる。コンピュータプログラムは、１つのコンピュータまたは１つの場所に配置された複数のコンピュータ上で実行されるように展開されるか、複数の場所に分散されて、データ通信ネットワークで相互接続することができる。

１つ以上のコンピュータのシステムが特定の操作または動作を実行するように構成されているとは、システムがそれにインストールされており、ソフトウェア、ファームウェア、ハードウェア、またはそれらの組み合わせが動作中に、システムにその操作または動作を実行させることを意味する。１つ以上のコンピュータプログラムが特定の操作または動作を実行するように構成されているとは、１つ以上のプログラムが、データ処理装置によって実行されると、装置に操作または動作を実行させる命令を含むことを意味する。

本明細書で使用される「エンジン」または「ソフトウェアエンジン」は、入力とは異なる出力を提供するソフトウェア実装の入出力システムを指す。エンジンは、ライブラリ、プラットフォーム、ソフトウェア開発キット（「ＳＤＫ」）、またはオブジェクトなどの機能の符号化されたブロックであってもよい。各エンジンは、１つ以上のプロセッサと、コンピュータ可読媒体と、を含む、サーバ、携帯電話、タブレットコンピュータ、ノートブックコンピュータ、音楽プレーヤ、電子書籍リーダ、ラップトップもしくはデスクトップコンピュータ、ＰＤＡ、スマートフォン、または他の据え置き型もしくはポータブルデバイスなど、適切なタイプのコンピューティングデバイス上に実装することができる。さらに、エンジンのうちの２つ以上を、同じコンピューティングデバイス上で、または異なるコンピューティングデバイス上で実装することができる。

本明細書に記載のプロセスおよび論理フローは、１つ以上のプログラマブルコンピュータが１つ以上のコンピュータプログラムを実行して、入力データ上で動作し、かつ出力を生成することで機能を果たすことによって実行することができる。プロセスおよび論理フローはまた、ＦＰＧＡもしくはＡＳＩＣなどの専用論理回路によって、または専用論理回路と１つ以上のプログラムされたコンピュータとの組み合わせによって実行することができる。

コンピュータプログラムの実行に好適なコンピュータは、汎用もしくは専用のマイクロプロセッサもしくはその両方、または他の種類の中央処理装置に基づくことができる。概して、中央処理装置は、読み取り専用メモリもしくはランダムアクセスメモリ、またはその両方から命令およびデータを受信することになる。コンピュータの本質的な要素は、命令を遂行または実行するための中央処理装置ならびに命令およびデータを格納するための１つ以上のメモリデバイスである。中央処理装置およびメモリは、専用論理回路によって補完され、またはその回路に組み込むことができる。概して、コンピュータはまた、例えば、磁気、光磁気ディスク、もしくは、光ディスクなど、データを格納するための１つ以上の大容量記憶デバイスを含むか、または、それらからデータを受信するかもしくはそれらに送信するように動作可能に結合されるか、またはその両方を行うことになる。しかしながら、コンピュータは必ずしもそのようなデバイスを有する必要はない。さらに、コンピュータは別のデバイス、例えば、ほんの数例を挙げると、携帯電話、電子手帳（ＰＤＡ）、モバイルオーディオもしくはビデオプレーヤ、ゲームコンソール、全地球測位システム（ＧＰＳ）受信機、またはポータブル記憶デバイス、例えば、ユニバーサルシリアルバス（ＵＳＢ）フラッシュドライブなどに組み込むことができる。

コンピュータプログラム命令およびデータを格納するのに好適なコンピュータ可読媒体は、不揮発性メモリ、媒体、およびメモリデバイスのあらゆる形態を含み、例として、ＥＰＲＯＭ、ＥＥＰＲＯＭ、およびフラッシュメモリデバイスなどの半導体メモリデバイス、内蔵ハードディスクまたは取り外し可能なディスクなどの磁気ディスク、光磁気ディスク、ならびにＣＤ－ＲＯＭおよびＤＶＤ－ＲＯＭディスクを含む。

ユーザとの対話を提供するために、本明細書に記載の主題の実施形態は、コンピュータ上で実施することができ、コンピュータは、ユーザに情報を表示するための表示デバイス、例えば、ＣＲＴ（陰極線管）もしくはＬＣＤ（液晶ディスプレイ）モニタ、ならびにキーボードおよびマウス、トラックボールなどのポインティングデバイス、またはユーザがコンピュータに入力を提供することができる存在感応ディスプレイもしくは他の表面を有する。他の種類のデバイスを使用して、ユーザとの対話を提供することもでき、例えば、ユーザに提供されるフィードバックは、視覚的フィードバック、聴覚的フィードバック、または触覚的フィードバックなどの任意の形態の感覚的フィードバックであり得、ユーザからの入力は、音響、音声、または触覚入力を含む任意の形態で受信することができる。加えて、コンピュータは、ユーザが使用するデバイスにドキュメントを送信すること、およびそれから受信することによって、例えば、ウェブブラウザから受信した要求に応答して、ユーザのデバイス上のウェブブラウザにウェブページを送信することによって、ユーザと対話することができる。また、コンピュータは、テキストメッセージまたは他の形態のメッセージをスマートフォンなどのパーソナルデバイスに送信し、メッセージアプリケーションを実行し、代わりにユーザから応答メッセージを受信することにより、ユーザと対話することができる。

本明細書に記載の主題の実施形態は、例えば、データサーバとしての、バックエンド構成要素を含むか、またはミドルウェア構成要素、例えば、アプリケーションサーバを含むか、またはフロントエンド構成要素、例えば、ユーザがそれを通して本明細書に記載の主題の実装態様と対話し得るグラフィカルユーザインターフェース、ウェブブラウザ、もしくはアプリを有するユーザコンピュータを含む、コンピューティングシステム、または１つ以上のそのようなバックエンド、ミドルウェア、もしくはフロントエンド構成要素の任意の組み合わせに実装され得る。システムの構成要素は、デジタルデータ通信の任意の形態または媒体、例えば、通信ネットワークによって相互接続され得る。通信ネットワークの例には、ローカルエリアネットワーク（ＬＡＮ）およびワイドエリアネットワーク（ＷＡＮ）、例えば、インターネットが含まれる。

コンピューティングシステムは、クライアントと、サーバと、を含むことができる。クライアントおよびサーバは概して、互いにリモートであり、典型的には通信ネットワークを介して相互作用する。クライアントとサーバとの関係は、それぞれのコンピュータで実行され、かつ互いにクライアント－サーバの関係を有している、コンピュータプログラムによって生じる。いくつかの実施形態では、サーバは、例えば、クライアントとして機能するデバイスと対話するユーザにデータを表示し、当該ユーザからユーザ入力を受信する目的で、例えば、ＨＴＭＬページなどのデータをユーザデバイスに送信する。例えば、ユーザ対話の結果などの、ユーザデバイスで生成されたデータは、デバイスからサーバにおいて受信され得る。

本明細書は多くの特定の実装態様の詳細を含んでいるが、これらは、いずれかの発明の範囲、または請求され得る事項の範囲を限定するものとして解釈されるべきではなく、特定の発明の特定の実施形態に特有であり得る特徴に関する説明として解釈されるべきである。別々の実施形態の文脈で本明細書に記載された特定の特徴を、単一の実施形態で組み合わせて実装することもできる。逆に、単一の実施形態の文脈で記載された様々な特徴は、複数の実施形態で、別個に、または任意の好適な副次的組み合わせで実施することもできる。さらに、特徴は、特定の組み合わせで作用するものとして上記に説明され得、かつさらには、当初はそのように特許請求され得るが、場合によっては、特許請求された組み合わせからの１つ以上の特徴が、その組み合わせから削除される可能性もあり、特許請求された組み合わせが、副次的組み合わせまたは副次的組み合わせの変形を対象とすることもある。

同様に、動作が特定の順序で図面に描写されているが、これは、所望の結果を達成するために、かかる動作がその示された特定の順序、もしくは一連の順序で実行されるべきであること、または例証したすべての動作が実行されるべきであることを要求するものとして理解されるべきではない。特定の状況では、マルチタスクおよび並列処理が有利であり得る。さらに、上述した実施形態における様々なシステムモジュールおよび構成要素の分離は、すべての実施形態においてかかる分離を必要とするものとして理解されるべきではなく、記載されたプログラム構成要素およびシステムは、概して、単一のソフトウェア製品内に共に一体化され得るか、または複数のソフトウェア製品にパッケージ化され得ることを理解されたい。

主題の特定の実施形態を説明してきた。他の実施形態は、以下の特許請求の範囲内に存在する。例えば、特許請求の範囲に記載された動作は、異なる順序で実行することができ、かつ依然として望ましい結果を達成することができる。一例として、添付の図に描写されたプロセスは、望ましい結果を達成するために、必ずしも示された特定の順序、または連続した順序を必要としない。特定の場合によっては、マルチタスクおよび並列処理が有利であり得る。

特許請求の範囲：

Claims

１つ以上のデータ処理装置によって実行される方法であって、
現在の時点までの環境における車両の近傍のエージェントを特徴付ける埋め込みを取得することと、
軌道予測ニューラルネットワークを使用して前記埋め込みを処理して、前記現在の時点の後の前記エージェントの将来の軌道を特徴付ける軌道予測出力を生成することであって、
前記軌道予測出力が、前記エージェントの前記将来の軌道と、複数の既定のアンカー軌道の各々との予測類似度を特徴付けるデータを含み、前記複数の既定のアンカー軌道は、前記エージェントの以前の軌道を特徴付けるデータまたは前記環境内の現在のシーンに関する他の情報から独立しており、
各アンカー軌道が、前記エージェントの可能な将来の軌道を特徴付け、各々がそれぞれの将来の時点での前記エージェントの可能な位置に対応する、前記環境内の複数のウェイポイント空間的場所のシーケンスを指定するデータを含む、生成することと、
前記軌道予測出力を前記車両の計画システムに提供して、前記車両の将来の軌道を計画する計画決定を生成することと、を含む、方法。
前記軌道予測出力が、前記複数のアンカー軌道の各々について、
前記アンカー軌道の各ウェイポイント空間的場所について、前記エージェントが前記ウェイポイント空間的場所に対応する前記将来の時点で前記ウェイポイント空間的場所の近傍のそれぞれの空間的位置を占めるそれぞれの可能性を定義する、前記ウェイポイント空間的場所に依存する確率分布を特徴付けるデータをさらに含む、請求項１に記載の方法。
前記ウェイポイント空間的場所に依存する前記確率分布を特徴付ける前記データが、前記ウェイポイント空間的場所に依存するパラメトリック確率分布のパラメータを定義するデータを含む、請求項２に記載の方法。
前記ウェイポイント空間的場所に依存する前記パラメトリック確率分布が、正規確率分布であり、前記正規確率分布の前記パラメータを定義する前記データが、（ｉ）前記ウェイポイント空間的場所からの前記正規確率分布の平均のオフセットを指定するオフセットパラメータ、および（ｉｉ）前記正規確率分布の共分散パラメータを含む、請求項３に記載の方法。
前記軌道予測ニューラルネットワークが、１つ以上の畳み込みニューラルネットワーク層を含む、請求項１～４のいずれか一項に記載の方法。
前記軌道予測ニューラルネットワークが、１つ以上の再帰型ニューラルネットワーク層を含む、請求項１～５のいずれか一項に記載の方法。
前記現在の時点までの前記環境における前記車両の近傍の前記エージェントを特徴付ける前記埋め込みを取得することが、
埋め込みニューラルネットワークを使用して、前記現在の時点までの前記環境内の前記エージェントの以前の軌道を特徴付ける埋め込みニューラルネットワーク入力を処理して、埋め込みニューラルネットワーク出力を生成することと、
前記エージェントに対応する前記埋め込みニューラルネットワーク出力の部分をクロップすることと、
前記埋め込みニューラルネットワーク出力のクロップされた前記部分に基づいて、前記エージェントを特徴付ける前記埋め込みを判定することと、を含む、請求項１～６のいずれか一項に記載の方法。
前記埋め込みニューラルネットワーク入力が、前記現在の時点までの前記環境内の１つ以上の他のエージェントの軌道をさらに特徴付ける、請求項７に記載の方法。
前記埋め込みニューラルネットワーク入力が、（ｉ）信号機状態を含む前記環境の動的な特徴、ならびに（ｉｉ）車線の接続性、車線の種類、一端停止線、および制限速度のうちの１つ以上を含む、前記環境の静的な特徴をさらに特徴付ける、請求項７または８に記載の方法。
前記埋め込みニューラルネットワーク入力および前記埋め込みニューラルネットワーク出力が各々、トップダウンの視点から前記環境を特徴付けるそれぞれの三次元データ表現を含む、請求項７～９のいずれか一項に記載の方法。
前記埋め込みニューラルネットワークが、１つ以上の畳み込みニューラルネットワーク層を含む、請求項７～１０のいずれか一項に記載の方法。
前記埋め込みニューラルネットワーク出力の前記クロップされた部分に基づいて前記エージェントを特徴付ける前記埋め込みを判定することが、
前記埋め込みニューラルネットワーク出力の前記クロップされた部分をエージェント中心の座標系に対して回転させることを含む、請求項７～１１のいずれか一項に記載の方法。
前記アンカー軌道を既定することが、エージェント軌道のトレーニングセットからのエージェント軌道をクラスタ化することを含む、請求項１に記載の方法。
システムであって、
１つ以上のコンピュータと、
前記１つ以上のコンピュータによって実行されると、前記１つ以上のコンピュータに、請求項１～１３のいずれか一項に記載のそれぞれの方法の動作を実施させる命令を記憶している１つ以上の記憶デバイスと、を備える、システム。
１つ以上のコンピュータによって実行されると、前記１つ以上のコンピュータに、請求項１～１３のいずれか一項に記載のそれぞれの方法の動作を実施させる命令を記憶している、１つ以上の非一時的コンピュータ記憶媒体。