JP7399164B2

JP7399164B2 - 駐車スペース検出に適したスキューされたポリゴンを使用した物体検出

Info

Publication number: JP7399164B2
Application number: JP2021530949A
Authority: JP
Inventors: リー、ドンウー; クウォン、チュンヒュン; オー、サンミン; チェン、ウェンチャオ; －ジョンセオ、ヘイ; ニスター、デイビッド; ヘルバス、ベルタロドリゲス
Original assignee: エヌビディアコーポレーション
Priority date: 2019-03-16
Filing date: 2020-03-16
Publication date: 2023-12-15
Anticipated expiration: 2040-03-16
Also published as: WO2020190880A1; CN113632095A; US20200294310A1; US11195331B2; DE112020000369T5; JP2022523614A; US11941819B2; US20220092855A1

Description

本発明は、駐車スペース検出に適したスキューされたポリゴンを使用した物体検出に関するものである。

マシン（たとえば、トレーニングされたニューラル・ネットワークでプログラムされたコンピュータ）による正確な及び効率的画像処理（たとえば、認識及び分類のための）は、様々な状況において重要である。たとえば、自律型車両（たとえば、高度運転者支援システム（ＡＤＡＳ：ｄｒｉｖｅｒａｓｓｉｓｔａｎｃｅｓｙｓｔｅｍ）を備えた車両）又はドローンは、リアルタイムで画像データ（たとえば、カメラによってキャプチャされた車道及び／又は駐車場の画像を表す）を分析して運転操作（たとえば、ステアリング装置を左に向ける、ブレーキ・システムをアクティブにするなど）を策定することができる。１個のそのようなインスタンスにおいて、車両は、駐車操作を実行するときに、駐車スペースを検出するために、及び駐車スペースのプロパティ、たとえば、場所、サイズ、及び向き、を識別するために、画像データを分析することができる。このプロセスを容易にするために、車両は、画像内の駐車スペースの存在を検出するための畳み込みニューラル・ネットワーク（ＣＮＮ：ｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋ）を使用して実装される物体検出器を含み得る。

駐車スペースを検出するために使用される従来のＣＮＮは、検出出力の形態として、軸に平行な（axis-aligned）長方形のアンカ・ボックス（すべての４個の角度が直角である）を使用し得る。しかしながら、センサ・データ内に存在する駐車スペースは、センサの透視図法のために、長方形又は軸に平行ではないことがよくある。したがって、駐車スペースが検出された後には、センサ・データの中からそれぞれの駐車スペースの境界を正確に識別するために、追加処理が、必要である。たとえば、車両のカメラは、駐車スペースの画像をキャプチャすることができ、そして、カメラの視界の視点に基づいて、駐車スペースは、軸に平行な長方形として画像内に描かれないことがある。従来のＣＮＮは、検出出力の形態として軸に平行な長方形のアンカ・ボックスを提供することができ、その場合、画像内に駐車スペースを正確に描くための追加処理が必要である。従来のＣＮＮをトレーニングするとき、陽性サンプルは、ＣＮＮからのアンカ・ボックス出力とグラウンド・トゥルース出力との間の和集合の共通部分（ＩｏＵ：ＩｎｔｅｒｓｅｃｔｉｏｎｏｆＵｎｉｏｎ）を使用して識別され得る。アンカ・ボックス出力及びグラウンド・トゥルースがともに、軸に平行な長方形であるとき、ＩｏＵ計算は、単純になり得る。

米国特許出願第１６／１０１，１２３２号

本開示は、駐車スペース検出に適したスキューされたポリゴン（たとえば、四角形）を使用した物体検出に関する。たとえば、いくつかのインスタンスにおいて、少なくとも１個の畳み込みニューラル・ネットワーク（ＣＮＮ）が、画像データ内に表された１個又は複数の駐車スペースを検出する及び／又は描くために使用され得る。ＣＮＮ出力は、その後の操作を知らせるために、後処理され、ダウンストリーム・システム（たとえば、車両制御モジュール）に提供され得る。

本開示の態様は、駐車スペースを定義する画像において領域を正確に描くスキューされたポリゴンのコーナー・ポイント（たとえば、アンカ形状コーナー・ポイントへの変位値又はオフセット値としての）を決定するために、ＣＮＮを使用することができる。さらに、本開示は、アンカ形状のコーナー・ポイントが、駐車スポットへの入口を定義する、又は他の方法でこれに対応する、可能性を予測する信頼度値を出力するＣＮＮを実現する。信頼度値は、駐車スポットへの入口を定義するために、アンカ形状及び／又はスキューされたポリゴンのコーナー・ポイントのサブセットを選択するために使用され得る。本開示の実施例によれば、ＣＮＮは、駐車スペースの境界を描くコーナー・ポイントへの変位値を予測するステップとともに、アンカ形状の特定のコーナー・ポイントが駐車スペースへの入口に対応する可能性を予測するために使用され得る。

本開示はさらに、アンカ形状はトレーニングのための陽性サンプルとして使用されるべきかどうかを判定するために、ＣＮＮを使用して予測されたスキューされたポリゴンのコーナー・ポイントと駐車スポットのグラウンド・トゥルース・コーナー・ポイントとの間の距離（たとえば、最小総距離）の計算を提供する。たとえば、陽性サンプルは、距離が閾値未満であることに少なくとも部分的に基づいて、識別され得る。

駐車スペース検出に適したスキューされたポリゴンを使用した物体検出のための本システム及び方法について、参照によって本明細書に組み込まれている、添付の図面を参照して以下に詳しく説明する。

本開示のいくつかの実施例による、例示的物体検出システムを含む図である。本開示のいくつかの実施例による、１個又は複数の駐車スペースを識別するための例示的プロセスを示す流れ図である。本開示のいくつかの実施例による、物体検出器によって処理された画像データ、物体検出器の空間要素のグリッド、及び空間要素のうちの１個又は複数と関連付けられ得るアンカ形状のセットによって表され得る画像の図である。本開示のいくつかの実施例による、異なる空間要素解像度の視覚要素と重ね合わされた画像の図である。本開示のいくつかの実施例による、駐車スペースを検出するためのニューラル・ネットワークを含む図である。本開示のいくつかの実施例による、入口線描写及び駐車スペース描写を有する画像の図である。本開示のいくつかの実施例による、グラウンド・トゥルース・データと物体検出器のトレーニングのためのスキューされた四角形の使用のコーナー・ポイントとを有する画像の図である。本開示のいくつかの実施例による、駐車スペースのコーナー・ポイントを提供するためのマシン学習モデルをトレーニングする方法を示すブロック図である。本開示のいくつかの実施例による、駐車スペースのコーナー・ポイントを、ニューラル・ネットワークを使用して、判定するための方法を示すブロック図である。本開示のいくつかの実施例による、駐車スペースへの入口を、ニューラル・ネットワークを使用して、判定する方法を示すブロック図である。本開示のいくつかの実施例の実装において使用するのに適した例示的動作環境の図である。本開示のいくつかの実施例による、例示的自律型車両のイラストレーションである。本開示のいくつかの実施例による、図１１Ａの例示的自律型車両のカメラ位置及び視野の実例である。本開示のいくつかの実施例による、図１１Ａの例示的自律型車両の例示的システム・アーキテクチャのブロック図である。本開示のいくつかの実施例による、クラウドベースのサーバと図１１Ａの例示的自律型車両との間の通信のシステム図である。本開示のいくつかの実施例の実装において使用するのに適した例示的計算デバイスのブロック図である。

本開示は、駐車スペース検出に適したスキューされたポリゴン（たとえば、四角形）を使用する物体検出に関する。開示される手法は、駐車スペースが検出される運転操作（たとえば、自律運転、高度運転者支援システム（ＡＤＡＳ）など）、並びに画像及び／又はセンサ・データ内のスキューされたポリゴンに対応する物体（たとえば、建物、窓、ドア、車道、交差点、歯、不動産区域、エリア又は表面の領域など）を検出する他のアプリケーション（たとえば、ロボット工学、ビデオ分析、気象予報、医用画像など）に適し得る。

本開示は、その実例が図１１Ａ～１１Ｄに関して本明細書でさらに詳しく説明される、例示的自律型車両１１００（或いは「車両１１００」又は「自律型車両１１００」と本明細書で称される）に関して説明され得る。本開示は主に、自律型車両を使用する実例を示すが、ロボット、無人航空機、カメラ・システム、気象予報デバイス、医用画像デバイスなどの他のタイプのデバイスが、本明細書に記載の様々な手法を実装するために使用され得る。加えて、これらの手法は、自律型車両を制御するために、又は、ビデオ監視、ビデオ若しくは画像編集、駐車スペース占拠監視、識別、及び／若しくは検出、ビデオ若しくは画像サーチ若しくは検索、物体追跡、気象予報（たとえば、ＲＡＤＡＲデータを使用）、並びに／又は医用画像（たとえば、超音波又は磁気共鳴映像法（ＭＲＩ：ｍａｇｎｅｔｉｃｒｅｓｏｎａｎｃｅｉｍａｇｉｎｇ）データを使用）などの、これらに限定されない、他の目的のために、使用され得る。

駐車スペースが、主に、検出されている物体として説明されているが、開示される手法は、一般に、センサの視界において及び／又は画像データにおいてスキューされたポリゴン（たとえば、四角形又は他の形状）として現れ得る物体に適用され得る（たとえば、これらの物体は、現実世界において長方形であるが、視点により、スキューされた四角形に見え得る）。開示される手法は、スキューされた四角形及び４個のコーナー・ポイントを使用して説明されているが、開示される概念は、それらの形状を定義する任意の数の形状及びポイント（たとえば、コーナー・ポイント）に適用され得る。加えて、入口は主に、ポイント（たとえば、コーナー・ポイント）のうちの２個によって定義されるものとして、本明細書では定義されているが、他の実例において、入口は、任意の数のポイント（たとえば、コーナー・ポイント）を使用して定義され得る。さらに、本開示は、ニューラル・ネットワークを使用して実装された物体検出器に焦点を当てているが、いくつかの実施例では、他のタイプのマシン学習モデルが使用され得る。

駐車スペースのサイズ及び場所を一般に指示する軸に平行な長方形のアンカ・ボックスを予測するためにＣＮＮを使用し得る、従来の手法とは対照的に、本開示の態様は、駐車スペースを定義する画像において領域を正確に描くスキューされた四角形のコーナー・ポイントを判定する（たとえば、アンカ・ボックス・コーナー・ポイントへの変位値又はオフセット値として）ために、ＣＮＮを使用し得る。そのようなものとして、いくつかの実施例において、スキューされた四角形は、駐車スペースの境界を識別するための付加的な又は重要な処理を必要とせずにダウンストリーム・システムによって直接使用され得る。その後の処理を減らすことによって、開示される手法は、従来の手法よりも効率的に且つ速くなり得る。

さらに、従来の手法とは対照的に、本開示は、アンカ・ボックスのコーナー・ポイントが駐車スポットへの入口を定義する又は他の方法でこれに対応する可能性を予測する信頼度値を出力するＣＮＮを実現する。信頼度値は、駐車スポットへの入口を定義するために、アンカ・ボックス及び／又はスキューされた四角形のコーナー・ポイントのサブセットを選択するために使用され得る。本開示の実施例によれば、駐車スペースの境界を描くコーナー・ポイントへの変位値を予測するステップとともに、アンカ・ボックスの特定のコーナー・ポイントが駐車スペースへの入口に対応する可能性を予測するために、ＣＮＮを使用することによって、処理はさらに低減され得る。

別の態様において、従来のＣＮＮは、和集合の共通部分（ＩｏＵ）を使用して、軸に平行な長方形のアンカ・ボックス出力は陽性サンプルであるかどうかを判定するが、本開示は、アンカ・ボックスはトレーニングのための陽性サンプルとして使用されるべきかどうかを判定するために、ＣＮＮを使用して予測されたスキューされた四角形のコーナー・ポイントと駐車スポットのグラウンド・トゥルース・コーナー・ポイントとの間の最小総距離の計算を行う。たとえば、陽性サンプルは、最小総距離（たとえば、正規化後）が閾値未満であることに少なくとも部分的に基づいて、識別され得る。最小総距離の計算は、スキューされた四角形のＩｏＵの計算よりも単純になり得、結果として、処理時間は低減される。

例示的駐車スペース検出器
ここで図１を参照すると、図１は、本開示のいくつかの実施例による、例示的物体検出システム１００を含む図を示す。本明細書に記載されているこの及び他の配置は単に実例として説明されていることを理解されたい。他の配置及び要素（たとえば、マシン、インターフェース、機能、順番、機能のグループ分けなど）が、示されたものに加えて又はこれらに代わって使用されてもよく、いくつかの要素は、分かりやすくするために、ともに省略され得る。さらに、本明細書に記載の要素の多くは、個別の又は分散された構成要素として又は他の構成要素と併せて、並びに任意の適切な組合せ及び場所において、実装され得る機能エンティティである。１個又は複数のエンティティによって実行されるものとして本明細書に記載された様々な機能は、ハードウェア、ファームウェア、及び／又はソフトウェアによって実施され得る。たとえば、いくつかの機能は、メモリに記憶された命令を実行するプロセッサによって実施され得る。

１個又は複数の実施例において、物体検出システム１００は、たとえば、通信マネージャ１０４、物体検出器１０６、特徴判定器１０８、信頼性スコア・ジェネレータ１１０、変位値ジェネレータ１１２、スキューされた四角形ジェネレータ１１４、及び入口判定器１２６を含む。本開示で説明されるいくつかの実例は、四角形（たとえば、規則的、スキューされた、不規則的、ボックスなど）を使用し、記載されているシステム及び方法は、同様に、他のポリゴンを使用し得る。

通信マネージャ１０４は、物体検出システム１００によって受信される（たとえば、センサ・データ及び／又は画像データを含む）及び／又は物体検出システム１００によって提供される（たとえば、信頼性スコア、変位スコア、スキューされた四角形のコーナー・ポイント、及び／又はそこから導出された情報を含む）通信を管理するように構成され得る。加えて又は別法として、通信マネージャ１０４は、物体検出システム１００内の、たとえば、物体検出器１０６、信頼性スコア・ジェネレータ１１０、変位値ジェネレータ１１２、スキューされた四角形ジェネレータ１１４、入口判定器１２６、及び／又は物体検出システム１００に含まれ得る若しくは物体検出システム１００と通信し得る他の構成要素（たとえば、物体検出システム１００からの出力を使用するダウンストリーム・システム構成要素）のうちのいずれかの間の、通信を管理し得る。

図２を参照すると、図２は、本開示のいくつかの実施例による、１個又は複数の駐車スペースを識別するための例示的プロセス２００を示す流れ図である。物体検出器１０６は、通信マネージャ１０４から受信された入力データ、たとえば、任意の数の駐車スペース（又は駐車スペースがないこと）を表すセンサ・データ及び／又は画像データ、を分析するように及び入力データにおいてキャプチャされた任意の数の検出された物体を表す物体検出データを生成するように構成され得る。それを行うために、物体検出器１０６は、特徴判定器１０８、変位値ジェネレータ１１２、及び信頼性スコア・ジェネレータ１１０を使用することができる。特徴判定器１０８は、信頼性スコア・ジェネレータ１１０及び変位値ジェネレータ１１２への入力としての入力データの特徴を生成又は判定するように構成され得る。信頼性スコア・ジェネレータ１１０は、特徴判定器１０８からのデータに基づいて１個又は複数のアンカ・ボックスの信頼性スコア１１８を生成又は判定するように構成され得る。各アンカ・ボックスの信頼性スコア１１８は、それぞれのアンカ・ボックスが入力データにおいて検出された駐車スペースに対応する可能性を予測することができる。

変位値ジェネレータ１１２は、特徴判定器１０８からのデータに基づいて各アンカ・ボックスのコーナー・ポイントへの変位値１２２を生成又は判定するように構成され得る。スキューされた四角形ジェネレータ１１４は、物体検出器１０６からの様々な出力のいずれか、たとえば、各アンカ・ボックスの信頼度値１１８及び変位値１２２、を入力として受信することができる。スキューされた四角形ジェネレータ１１４は、任意の適切な技法、たとえば、非最大抑制（ＮＭＳ：Ｎｏｎ－ＭａｘｉｍｕｍＳｕｐｐｒｅｓｓｉｏｎ）、を使用して入力からスキューされた四角形を生成及び／又は判定することができる。これは、変位値１２２（たとえば、変位値ジェネレータ１１２によって提供される）及びアンカ・ボックスのコーナー・ポイントからスキューされた四角形の任意の数のアンカ・ボックス・コーナー・ポイントから判定するスキューされた四角形ジェネレータ１４４を含み得る。非限定的実例として、スキューされた四角形ジェネレータ１１４は、どのアンカ・ボックスが閾値（もしあるなら）を超える信頼度値１１８を有するかどうかを判定することができる。それらのアンカ・ボックスから、スキューされた四角形ジェネレータ１１４は、候補検出を１個又は複数の出力物体検出へとフィルタリング及び／又はクラスタ化し、それらの出力物体検出に対応する（たとえば、対応する変位値１２２を使用する）スキューされた四角形のコーナー・ポイントを判定することができる。

それぞれのアンカ・ボックスが入力データにおいて検出された駐車スペースに対応する可能性を予測する信頼性スコア１１８を信頼性スコア・ジェネレータ１１０が生成又は判定することに加えて或いはその代わりに、信頼性スコア・ジェネレータ１１０は、入力データにおいて表された駐車スペースへの検出された入口にそれぞれのコーナー・ポイントが対応する可能性を予測する信頼性スコア１１６を生成又は判定することができる。入口判定器１２６は、少なくとも信頼性スコア１１６を使用して１個又は複数の駐車スペースへの１個又は複数の入口を判定することができる。非限定的な一実例として、入口判定器１２６は、最も高い信頼度値１１６を有する（たとえば、それらの信頼度値１１６が閾値を超えることをオプションで必要とする）それぞれのスキューされた四角形のコーナー・ポイントのセット（たとえば、２個のコーナー・ポイント）を選択することによって、スキューされた四角形ジェネレータ１１４による各物体検出出力のための入口を定義することができる。選択されたコーナー・ポイントは、次いで、対応する駐車スペースへの入口（たとえば、選択されたコーナー・ポイントを繋ぐ入口線）を定義するために使用され得る。図２に破線で示すように、他の実例において、スキューされた四角形ジェネレータ１１４は、入口判定器１２６を有する物体検出システム１００において実装されなくてもよい、及び／又は駐車スペースへの入口若しくは他の検出された物体領域を識別及び／若しくは定義するために入口判定器１２６によって使用されなくてもよい。

物体検出システム１００は、本開示のいくつかの実施例によれば、図１０の例示的動作環境１０００において実装され得る。たとえば、図１の構成要素は、一般に、クライアント・デバイス１０２０、サーバ・デバイス１０６０、又はデータ・ストア１０５０の任意の組合せを使用して実装され得る。したがって、物体検出システム１００は、本明細書に記載の機能性を集合的に提供する分散型環境において配置された複数のデバイスを介して提供され得る、又は単一のデバイス（たとえば、車両１１００）で実施され得る。したがって、物体検出システム１００を説明するために使用されるいくつかの実例は、特定のデバイス及び／又は構成を参照し得るが、それらの実例は、より一般的に、本明細書に記載のデバイス及び構成の潜在的組合せのいずれかに適用され得ることが意図されている。たとえば、いくつかの実施例において、物体検出器１０６へのセンサ・データ入力の１個又は複数の部分を生成するために使用されるセンサ１０８０のうちの少なくともいくつかは、環境内の複数の車両及び／若しくは物体の間で分散され得る、並びに／又は、センサ１０８０のうちの少なくとも１個は、車両１１００に含まれ得る。

本明細書に記載のように、通信マネージャ１０４は、物体検出システム１００によって受信される（たとえば、センサ・データ及び／又は画像データを含む）及び／又は物体検出システム１００によって提供される通信（たとえば、信頼性スコア若しくは値、変位値、スキューされた四角形へのコーナー・ポイント、及び／又はそこから導出された情報を含む）を管理するように構成され得る。加えて又は別法として、通信マネージャ１０４は、物体検出システム１００内の通信を管理することができる。

通信が、ネットワーク通信として受信及び／又は提供される場合、通信マネージャ１０４は、１個若しくは複数のワイヤレス・アンテナ（図１１Ａのワイヤレス・アンテナ１１２６）及び／又はモデムを使用して１個又は複数のネットワークを介して通信することができるネットワーク・インターフェースを含み得る。たとえば、ネットワーク・インターフェースは、ロングターム・エボリューション（ＬＴＥ：Ｌｏｎｇ－ＴｅｒｍＥｖｏｌｕｔｉｏｎ）、広帯域符号分割多元接続（ＷＣＤＭＡ（登録商標）：ＷｉｄｅｂａｎｄＣｏｄｅ－ＤｉｖｉｓｉｏｎＭｕｌｔｉｐｌｅＡｃｃｅｓｓ）、ユニバーサル・モバイル・テレコミュニケーション・サービス（ＵＭＴＳ：ＵｎｉｖｅｒｓａｌＭｏｂｉｌｅＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎＳｅｒｖｉｃｅ）、グローバル・システム・フォー・モバイル・コミュニケーションズ（ＧＳＭ：ＧｌｏｂａｌＳｙｓｔｅｍｆｏｒＭｏｂｉｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓ）、ＣＤＭＡ２０００などを介する通信の能力を有し得る。ネットワーク・インターフェースはまた、ブルートゥース（登録商標）、ブルートゥース（登録商標）ＬＥ、Ｚ－Ｗａｖｅ、ＺｉｇＢｅｅなどのローカル・エリア・ネットワーク、及び／又はＬｏＲａＷＡＮ、ＳｉｇＦｏｘなどのロー・パワー・ワイドエリア・ネットワーク（ＬＰＷＡＮ：ＬｏｗＰｏｗｅｒＷｉｄｅ－ＡｒｅａＮｅｔｗｏｒｋ）を使用し、環境内の物体（たとえば、車両、モバイル・デバイスなど）の間の通信を可能にすることができる。しかしながら、通信マネージャ１０４は、ネットワーク・インターフェースを含まなくてもよい、たとえば、自律型車両（たとえば、車両１１００）で完全に実装された物体検出システム１００の場合など。いくつかの実例において、本明細書に記載の通信のうちの１個又は複数は、図１２のバス１２０２を介する計算デバイス１２００の構成要素間でもよい。

通信マネージャ１０４によって受信されるセンサ・データは、図１０のセンサ１０８０の任意の組合せを使用して、生成され得る。たとえば、センサ・データは、画像を表す画像データ、ビデオを表す画像データ（たとえば、ビデオのスナップショット）、及び／又はセンサの視界を表すセンサ・データ（たとえば、ＬＩＤＡＲセンサ１１６４からのＬＩＤＡＲデータ、ＲＡＤＡＲセンサ１１６０からのＲＡＤＡＲデータ、図１１Ｂのカメラからの画像データなど）を含み得る。

通信マネージャ１０４が物体検出器１０６に提供するセンサ・データ及び／又は画像データは、物理的又は仮想環境において生成され得、カメラの視界を表す画像データを含み得る。たとえば、本開示の態様において、通信マネージャ１０４は、物理的環境において車両１１００のカメラによって生成された画像データを物体検出器１０６に提供する。

物体検出器１０６及び／又は本明細書に記載の他の構成要素のために使用され得るマシン学習モデルのいくつかの実例は、特定のタイプのマシン学習モデル（たとえば、ニューラル・ネットワーク）を参照することがあるが、本明細書に記載のマシン学習モデルの実例には、たとえば、そして制限なしに、任意のタイプのマシン学習モデル、たとえば、線形回帰、ロジスティック回帰、決定木、サポート・ベクトル・マシン（ＳＶＭ：ｓｕｐｐｏｒｔｖｅｃｔｏｒｍａｃｈｉｎｅ）、ナイーブ・ベイズ、ｋ近傍法（Ｋｎｎ：ｋ－ｎｅａｒｅｓｔｎｅｉｇｈｂｏｒ）、Ｋ平均クラスタリング、ランダム・フォレスト、次元縮小アルゴリズム、勾配ブースティング・アルゴリズム、ニューラル・ネットワーク（たとえば、オートエンコーダ、畳み込み、再発、パーセプトロン、長／短期メモリ（ＬＳＴＭ：Ｌｏｎｇ／ＳｈｏｒｔＴｅｒｍＭｅｍｏｒｙ）、ホップフィールド、ボルツマン、ディープ・ビリーフ、デコンボリューション、敵対的生成、液体状態マシンなど）を使用するマシン学習モデル、及び／又は他のタイプのマシン学習モデル、が含まれ得ることが意図されている。

図３を参照すると、図３は、本開示のいくつかの実施例による、物体検出器によって処理された画像データ、物体検出器の空間要素のグリッド、及び空間要素のうちの１個又は複数に関連し得る１セットのアンカ・ボックスによって表され得る画像の図である。たとえば、図３は、物理的環境において車両１１００のカメラによって生成され得る及び画像データを分析して物体検出データを生成することができる物体検出器１０６に提供され得る画像３１０の描写を含む。物体検出データは、画像３１０内の物体（検出された物体と称されることもある）の、物体検出器１０６による、検出を表し得る。検出された物体は、画像３１０において描写された実際の物体に対応することもしないこともある。たとえば、検出された物体のうちのいくつかは、物体検出器１０６によって行われた誤検出に対応し得る。さらに、検出された物体のうちのいくつかは、画像３１０において描写された同じ物体に対応し得る。

物体検出器１０６は、センサ・データ（たとえば、画像データ）から抽出された特徴から物体検出データを生成するようにトレーニングされた１個又は複数のマシン学習モデルを含み得る。いくつかの実例において、物体検出器１０６は、視界及び／又は画像の各空間要素及び／又はその１個若しくは複数の対応するアンカ・ボックスの物体検出データ（たとえば、コーナー・ポイントへの信頼度値及び変位値を表す）のセットを決定するように構成される。様々な実例において、空間要素はまた、物体検出器１０６のグリッド・セル、出力セル、スーパーピクセル、及び／又は出力ピクセルを指し得る。

様々な実例において、空間要素は、空間要素領域のグリッドを形成し得る。たとえば、図３は、センサ・データ（たとえば、画像３１０を表す）に論理的に適用され得る物体検出器１０６の空間要素のグリッド３１２を視覚的に示す。図３において、グリッド３１２は、画像３１０を分かりにくくしないように、画像３１０とは別個に描写されており、重ね合わされた描写４０２は、図４において提供されている。グリッド・セル３１１などの空間要素は、グリッド内の場所によって定義され得る。たとえば、各グリッド・セルは、空間要素の空間要素領域を含み得る。他の実例において、グリッド・ベースの空間要素は、使用されなくてもよい。さらに、空間要素は、連続した空間要素領域を必ずしも定義しないことがあり、長方形の空間要素領域を必ずしも定義しないことがあり、並びに／又は視界及び／若しくは画像のすべての領域を包含しないことがある。

いくつかの実例において、単一の画像若しくはフレーム（たとえば、画像３１０）、又は画像若しくはフレームのセットについて、物体検出器１０６の各空間要素は、１個又は複数の対応するアンカ・ボックスの物体検出データを提供し得る。他の実例において、１個又は複数の空間要素は、物体検出データを提供しないことがある。物体検出データは、たとえば、視界及び／又は画像３１０内の駐車スペースに対応してもしなくてもよい、空間要素の各アンカ・ボックスの信頼度値１１８、変位値１２２、及び／又は信頼度値１１６を表し得る。

図３は、画像３１０に適用された各空間要素が、対応するセットのアンカ・ボックス３１４に関連付けられ得る、１セットのアンカ・ボックス３１４を示す。図示されているのは、８個のアンカ・ボックスであるが、任意の数のアンカ・ボックスが、空間要素のために使用され得、異なる空間要素のアンカ・ボックスは、形状、サイズ、数などにおいて互いに異なり得る。アンカ・ボックスは、様々なサイズ及び形状、たとえば、規則的長方形（たとえば、等角長方形）、でもよく、いくつかの従来のシステムとは対照的に、アンカ・ボックスはまた、１個又は複数のスキューされた四角形、たとえば、不規則的長方形（たとえば、合同な角のない）、ひし形、凧形、台形、平行四辺形、等脚台形、スキューされた四角形、又はその任意の組合せを含み得る。図３において、アンカ・ボックス３１４は、画像３１０を分かりにくくしないように、画像３１０とは別個に描写されており、重ね合わされた描写４０２は、図４において提供される。

本明細書に記載のように、図４は、画像３１０がグリッド３１２と重ね合わされた、重ね合わされた描写４０２を提供し、単一の空間要素のアンカ・ボックス３１４は、グリッド・セル３１１において配置されており、それは画像３１０に関する対応する場所を示す。本明細書に記載のように、信頼性スコア及び変位値は、各グリッド・セル及び／又は空間要素の各アンカ・ボックスについて生成され得る。例示を目的として、アンカ・ボックス３１４は、グリッド・セル３１１のみについて描写され、他の態様において、アンカ・ボックス３１４（又はその変更形態）は、グリッド３１２の複数のグリッド・セル、又はグリッド３１２の各グリッド・セルについて使用され得る。異なるグリッド・セル３１１のアンカ・ボックス３１４は、そのグリッド・セル３１１（又はより一般的には空間要素）に対応する場所にあってもよい。グリッド３１２は、空間要素の１個のサイズ又は解像度の一実例である。非限定的な一実例として、グリッド３１２は、６０個のグリッド・セルを有する１０ｘ６であり、そのようなものとして、各グリッド・セルが、８個のアンカ・ボックスと関連付けられた場合、信頼性スコア及び変位値は、４８０個の異なるアンカ・ボックスについて生成され得る。

他の態様において、空間要素領域のグリッド又は他の配置は、より多数の空間領域又はより少数の空間領域を有する異なるサイズ又は解像度を有することができ、その場合、アンカ・ボックスのスケールは、増やす（たとえば、より少数の、より大きな空間領域を有する、より粗いグリッドを有する）又は減らす（たとえば、より多数の、より小さな空間領域を有する、より細かいグリッドを有する）ことができる。たとえば、重ね合わされた描写４０４は、より粗い解像度グリッド４１２（たとえば、２ｘ２）と、アンカ・ボックス３１４と合同（たとえば、同じ形状及びサイズ）である、アンカ・ボックス３１４と類似する（たとえば、同じ形状及び／又は異なるサイズ）、又はアンカ・ボックス３１４と類似しない（たとえば、異なる形状及び／又は異なるサイズ）ことがある、異なるセットのアンカ・ボックス４１４とを重ね合わせた画像３１０を含む。本開示のいくつかの態様において、物体検出器は、空間要素領域（たとえば、グリッド）の複数の解像度を同じ入力データに適用することができ、各空間要素領域は、アンカ・ボックスのそれぞれのセットに対応する。いくつかある潜在的利点の中でも特に、複数の解像度の使用は、同じ画像内（たとえば、カメラにより近い駐車スペースは、視点に基づいてより大きく見え得、カメラからより遠い駐車スペースは、より小さく見え得る）でも異なる画像内でも、より大きな駐車スペース及びより小さな駐車スペースの両方について物体検出器１０６が正確である可能性を向上させることができる。いくつかのインスタンスにおいて、入力データを分析するために使用される空間要素領域（たとえば、グリッド）の実際のセットは、グリッド３１２及び４１２よりも解像度において有意に細かくなり得る。さらに、任意の数のセットの空間要素領域が、使用され得る。

本明細書に記載のように、物体検出器１０６によって提供される物体検出データに基づいて、スキューされた四角形ジェネレータ１１４は、１個又は複数の駐車スペースに対応する１個又は複数のスキューされた四角形を生成及び／又は識別することができ、入口判定器１２６は、１個又は複数の駐車スペースへの１個又は複数の入口を判定及び／又は識別することができる。

図５Ａを参照すると、図５Ａは、ニューラル・ネットワーク（たとえば、ＣＮＮ）を使用して実装される例示的物体検出器１０６の少なくとも一部分を描写する。たとえば、物体検出器１０６は、特徴バックボーン・ネットワーク５０６、たとえば、ＲｅｓＮｅｔ５０又は別の特徴バックボーン・ネットワーク、を含む。加えて、ニューラル・ネットワークは、特徴ピラミッド・ネットワーク５０８を含む。さらに、ニューラル・ネットワークは、分類サブネットワーク５１０を含む。

実施例において、特徴バックボーン・ネットワーク５０６及び特徴ピラミッド・ネットワーク５０８は、図１の特徴判定器１０８に対応し得、分類サブネットワーク５１０は、図１の信頼性スコア・ジェネレータ１１０に対応し得、回帰サブネットワーク５１２は、図１の変位値ジェネレータ１１２に対応し得る。しかしながら、図５Ａのニューラル・ネットワークの描写は、図示されたニューラル・ネットワークに物体検出器１０６を制限することを意図していない。加えて、分類サブネットワーク５１０は、信頼性スコア５１４を表すデータ（図２の信頼性スコア１１８に対応し得る）を出力するものとして示されている。簡単にするために図示されていないが、駐車スペースへの入口を検出する実施例において、分類サブネットワーク５１０は、加えて又は別法として、図１の信頼性スコア１１６を表すデータを出力し得る、或いは、別の分類サブネットワークが使用され得る。回帰サブネットワーク５１２は、変位値５１６（図２における変位値１２２に対応し得る）を表すデータを出力するものとして示されている。図５Ａにおいて物体検出器１０６に関して記載された出力は、各既定義のアンカ・ボックスについて提供され得る。

本開示のさらなる態様において、図１のスキューされた四角形ジェネレータ１１４に対応し得る、スキューされた四角形ジェネレータ５１８は、物体検出器１０６からの出力に基づいて１個又は複数のスキューされた四角形を生成及び／又は識別することができる。たとえば、変位値５１６（たとえば、Δｘ１、Δｙ１…、Δｘ４、Δｙ４）及び信頼度値５１４に基づいて、スキューされた四角形ジェネレータ５１８は、スキューされた四角形のコーナー・ポイント（たとえば、［ｘ’１、ｙ’１…、ｘ’４、ｙ’４］を含む調整されたコーナー・ポイント５２０）を生成するために、アンカ・ボックスを選択し、アンカ・ボックス５２２のコーナー位置又はポイント（たとえば、ｘ１、ｙ１…、ｘ４、ｙ４）を調整することができる。スキューされた四角形を表すデータ（たとえば、調整されたコーナー・ポイント５２０）が、様々なダウンストリーム構成要素又はシステムに提供され得る。図示するように、様々な実施例において、信頼度マップ分類が、たとえばアンカ・ボックスを陽性又は陰性駐車スペース検出として分類する（たとえば、バイナリ分類を使用して）ために、実行され得、スキューされた四角形ジェネレータ５１８は、この情報を活用することができる。たとえば、物体検出システム１００は、各アンカ・ボックスの信頼度値５１４を閾値と比較することができる。陽性検出は、信頼度値５１４が閾値より大きいときのアンカ・ボックスについて生じ得、陰性検出は、信頼度値が閾値未満であるときに、生じ得る。

非限定的実例として、スキューされた四角形ジェネレータ１１４は、クラスタリング・アルゴリズムを検出された物体の物体検出器１０６の出力に適用すること（たとえば、信頼度値５１４を使用して陰性検出をフィルタ処理で除去した後）によって、検出された物体の任意の数のクラスタを形成することによって、任意の数のスキューされた四角形を生成及び／又は判定することができる。検出された物体をクラスタ化するために、スキューされた四角形ジェネレータ１１４は、検出された物体（たとえば、候補のスキューされた四角形）の場所をともにクラスタ化することができる。これは、たとえば、検出された物体に関連する信頼度値５１４及び／又は本明細書に記載の他の検出された物体データに少なくとも部分的に基づいてもよい。いくつかの実例において、スキューされた四角形ジェネレータ１１４は、ＤＢＳＣＡＮ（Ｄｅｎｓｉｔｙ－ＢａｓｅｄＳｐａｔｉａｌＣｌｕｓｔｅｒｉｎｇｏｆＡｐｐｌｉｃａｔｉｏｎｓｗｉｔｈＮｏｉｓｅ：ノイズを有するアプリケーションの密度ベースの空間クラスタリング）アルゴリズムを使用する。他の実例は、ＮＭＳ又は修正済みグループ長方形アルゴリズムを含む。スキューされた四角形は、出力物体検出として各クラスタから選択、決定、及び／又は生成され得る（たとえば、１個若しくは複数のアルゴリズム及び／又はニューラル・ネットワークを使用して）。

調整されたコーナー・ポイント５２０を表すデータ及び／又はスキューされた四角形ジェネレータ１１４によって決定されたそれぞれのスキューされた四角形は、様々なダウンストリーム構成要素又はシステムに提供され得る。たとえば、１個のインスタンスにおいて、スキューされた四角形のコーナー・ポイントは、車両の駐車操作を調整するためなどに、２次元コーナー・ポイント座標を３次元座標に変換すること又はそのデータを他の方法で処理することによってコーナー・ポイントを直接使用することができる、車両制御モジュールに提供され得る。別の態様において、スキューされた四角形のコーナー・ポイントは、１個又は複数の駐車スペースの表現を表示するためのビデオ又は画像モニタを有する計器群制御モジュールに提供され得る。たとえば、コーナー・ポイントは、画像５０２及び／又は対応する画像或いは描かれたコーナー・ポイントを有する画像５０２に注釈を付けるために使用され得る－たとえば、調整されたコーナー・ポイント５２０を有するスキューされた四角形の描写（たとえば、点線で示された）５２６を有する図５Ａの注釈付きの画像５２５。

さらなる態様において、スキューされた四角形のコーナー・ポイント、変位値１２２、及び／又はアンカ・ボックスのコーナー・ポイントに対応する信頼度値（たとえば、信頼度値１１６）が、１個又は複数の駐車スペース（たとえば、スキューされた四角形ジェネレータ１１４によって識別される駐車スペース）への１個又は複数の入口を検出及び／又は定義するための入口判定器１２６への入力として提供され得る。たとえば、入口線は、アンカ・ボックスの信頼度値１１６の中から最も高い信頼度値を有する２個のコーナー・ポイント（たとえば、４個のうちの）を選択することによって、検出及び／又は定義され得る。いくつかの実例において、選択はさらに、信頼度値が閾値より大きいこと（たとえば、コーナー・ポイントが入口にそれぞれ対応しそうであることを示す）に基づき得る。駐車スペースへの入口は、選択されたコーナー・ポイントの場所を使用して、入口線として定義され得る、或いは他の方法で判定及び／又は定義され得る。

そのようなものとして、入口判定器１２６によって判定された入口情報は、様々なダウンストリーム構成要素又はシステムに提供され得る。たとえば、いくつかのインスタンスにおいて、入口に対応するものとして識別されたコーナー・ポイントは、２次元コーナー・ポイント座標を３次元座標に変換すること又はコーナー・ポイントを他の方法で処理することによってコーナー・ポイントを直接使用することができる、車両制御モジュールに提供され得る。別の態様において、コーナー・ポイントは、１個又は複数の駐車スペースへの１個又は複数の入口の表現を表示するためのビデオ又は画像モニタを有する計器群制御モジュールに提供され得る。たとえば、コーナー・ポイントは、画像５０２及び／又は対応する画像或いはコーナー・ポイント及び／又は入口が描かれた画像５０２に注釈を付けるために使用され得る－たとえば、図５Ｂの注釈付きの画像５３０は、駐車スペースへの入口線の描写（たとえば、破線によって示された）５３２を含み得る。オプションで、駐車スペース描写５３４（たとえば、点線）もまた、提供され得る。１個の実例において、入口及び／又は駐車スペースの描写は、色付きの線又は画像への他の適切な注釈を含み得る。

物体検出のためのマシン学習モデルのトレーニングの実例
物体検出器１０６は、様々な可能な手法を使用して、トレーニングされ得る。いくつかの実例において、物体検出器１０６は、完全に監視された方式でトレーニングされ得る。トレーニング画像はそれらのラベルとともに、ミニバッチにグループ分けされ得、ミニバッチのサイズは、調節可能なハイパーパラメータでもよい。各ミニバッチは、そのミニバッチ内の画像にトランスフォーメーションを適用することができるオンライン・データ拡張層に渡され得る。データ拡張は、トレーニング・データへの物体検出器１０６の可能な過剰適合を軽減するために使用され得る。データ拡張トランスフォーメーションは、空間トランスフォーメーション、たとえば、左右反転、ズーム・イン／アウト、ランダム変換など、色トランスフォーメーション、たとえば、色合い、彩度及びコントラスト調整、或いは付加ノイズを含み得る（しかし、これらに限定されない）。ラベルは、トレーニング画像に行われた対応するトランスフォーメーションを反映するようにトランスフォーメーションされ得る。

拡張された画像は、フォワード・パス計算を実行するために、物体検出器１０６に渡され得る。物体検出器１０６は、空間要素ごとの特徴抽出及び予測（たとえば、アンカ・ボックスに関連する予測）を実行し得る。損失関数は、様々な出力（たとえば、各アンカ・ボックスの信頼度値及び変位値）を予測するタスクにおいてエラーを同時に測定することができる。

様々な出力の構成要素損失は、ミニバッチ全体に適用される単一の損失関数に一緒に結合され得る。次いで、バックワード・パス計算が、トレーニング可能なパラメータに関するコスト関数の勾配を再帰的に計算するために生じ得る（通常は、少なくとも、物体検出器１０６の重み及びバイアス、しかし、たとえばバッチ正規化が使用されるとき、他のトレーニング可能なパラメータが存在し得るので、これに限定されない）。フォワード及びバックワード・パス計算は、通常は、深層学習フレームワーク及び下部のソフトウェア・スタックによって処理され得る。

物体検出器１０６のパラメータ更新が、次いで、生じ得る。オプティマイザが、トレーニング可能なパラメータへの調整を行うために使用され得る。実例は、確率勾配降下、又は慣性項を有する確率勾配降下を含む。オプティマイザに接続されるメイン・ハイパーパラメータは、学習率でもよい。オプティマイザに応じた他のハイパーパラメータもまた存在し得る。

データセット内の画像は、より速い収束につながり得る、トレーニング中の各エポックのランダムな順番で提示され得る。エポックは、データセットの各画像をトレーニング中の物体検出器１０６に一度示すために使用されるフォワード／バックワード・パス反復の数を指し得る。全プロセス「フォワード・パス－バックワード・パス－パラメータ更新」は、トレーニングされたパラメータの収束まで繰り返され得る。収束は、損失関数の値がトレーニング・セット及び検証セットの両方で十分に低い値まで下がることを観測するステップと、さらなる反復は損失を減らさないと判定するステップとによって、評価され得る。検証セットを介して計算される平均精度など、他のメトリクスが、収束を評価するために使用され得る。

トレーニング中に、検証が、定期的に実行され得、これは、検証セット（トレーニング・セットとは別個の）内の画像にわたる損失関数の平均値をチェックすることを含み得る。本明細書に記載のように、物体検出器１０６のそれぞれの出力（たとえば、各アンカ・ボックスの信頼性スコア、各アンカ・ボックスの変位値など）は、トレーニングのために使用される別個の損失関数に関連付けられ得る。任意の適切な損失関数が、使用され得る。

本開示の一態様によれば、駐車スペースのグラウンド・トゥルース・データは、駐車スペースのコーナーの場所を含み得、コーナーの場所は、スキューされた四角形を形成又は定義し得る。さらに、陽性トレーニング・サンプルは、マッチング・コストが閾値未満であることなどに基づいて、アンカ・ボックスのスキューされた四角形のコーナーがグラウンド・トゥルース・コーナーの場所に十分類似しているときに、物体検出器１０６の出力から識別され得る。本開示の一態様において、様々なタイプのアンカ・ボックスが、ニューラル・ネットワークをトレーニングする及び陽性サンプルを識別するために使用され得る。たとえば、１個の態様において、既定義のアンカ・ボックスは、長方形（たとえば、長方形）を含み得る。さらに、既定義のアンカ・ボックスは、回転された長方形を含み得る。追加で又は代わりに、アンカ・ボックスのうちの１個又は複数は、スキューされた及び回転された長方形を含み得る。スキューされた長方形の実例には、不規則な長方形（たとえば、非合同な角）、ひし形、凧形、台形、平行四辺形、等脚台形、スキューされた四角形、及びその任意の組合せが含まれる。既定義のアンカ・ボックスは、グラウンド・トゥルース・ラベリングから手動で設計又は取得され得、物体検出器１０６をトレーニングするために使用されるグラウンド・トゥルース変位値を計算するために使用され得る。グラウンド・トゥルース・ラベリングから取得されたアンカ・ボックスは、「データ駆動型アンカ・ボックス」と称され得、グラウンド・トゥルース・サンプルをクラスタ化する又は他の方法で分析することによって生成される。たとえば、グラウンド・トゥルース・サンプル（たとえば、スキューされた四角形を含む）は、１個又は複数の画像について生成され得る。グラウンド・トゥルース・サンプルは、次いで、１個又は複数のクラスタにクラスタ化され得、少なくとも１個のデータ駆動型アンカ・ボックスが、１個又は複数のクラスタのうちの各クラスタのサンプルから生成、選択、及び／又は決定され得る。いくつかの実例において、データ駆動型アンカ・ボックスは、クラスタのサンプルのうちの１個又は複数から計算された形状（たとえば、平均又はクラスタの他の方法で統計的に導出された形状に対応する）を有し得る。様々な実例において、スペクトル・クラスタリングが、形状相似関数を使用してグラウンド・トゥルース・サンプルのアフィニティ・マトリックスを計算すること、及びｋクラスタを有するアフィニティ・マトリックスを使用するスペクトル・クラスタリングを実行することなどによって、実行され得、ｋは、生成されることになるクラスタの数である。

１個の態様において、物体検出器１０６の出力から陽性サンプルを識別するために使用されるマッチング・コストは、物体検出器１０６による出力である対応する変位値及びグラウンド・トゥルース・コーナーの場所によって調整されるものとしての既定義のアンカ・ボックス・コーナー間の最小総距離に少なくとも部分的に基づく。比較されているコーナー・ポイントは、規則的長方形を定義しなくてもよい（及びスキューされた四角形を代わりに定義してもよい）ので、これは、和集合の共通部分（ＩＯＵ）に基づいて陽性サンプルを決定するステップとは対照的であり、ＩＯＵよりも単純になり得る。

最小総距離は、様々な方式で計算され得る。たとえば、図６を参照すると、描写された駐車スペース６０２のグラウンド・トゥルース・コーナー・ポイント（Ｂ１、Ｂ２、Ｂ３、及びＢ４）が示された、画像６１０が描写されている。画像６１０は、物体検出器１０６へのトレーニング入力として使用され得る。結果として、物体検出器１０６は、図示するように、アンカ・ボックスの調整されたコーナー・ポイント（Ａ１、Ａ２、Ａ３、及びＡ４）を計算するために使用されるアンカ・ボックスのコーナー・ポイントへの変位値を提供し得る。図６は、この図を単純化するために単一のアンカ・ボックスのみのコーナー・ポイントを示しており、他の態様において、類似の情報が、本明細書に記載の各アンカ・ボックスについて使用され得る。

本開示の１個の態様において、最小総距離を計算することは、最小平均距離を計算することを含む。たとえば、第１の総距離は、（Ａ１、Ｂ１）、（Ａ２、Ｂ２）、（Ａ３、Ｂ３）、及び（Ａ４、Ｂ４）の間の距離を判定すること、次いで、それらの距離から第１の総距離を統計的に導出すること、たとえば平均を使用すること、によって、計算され得る。第２の、第３の、及び第４の総距離もまた、各データ・セット（たとえば、各可能な組合せの）のコーナー・ポイント間の関連付けを変更することによって、計算され得る－たとえば、（Ａ１、Ｂ２）、（Ａ２、Ｂ３）、（Ａ３、Ｂ４）、及び（Ａ４、Ｂ１）を使用する第２の総距離と、（Ａ１、Ｂ３）、（Ａ２、Ｂ４）、（Ａ３、Ｂ１）、及び（Ａ４、Ｂ２）を使用する第３の総距離と、（Ａ１、Ｂ４）、（Ａ２、Ｂ１）、（Ａ３、Ｂ２）、及び（Ａ４、Ｂ３）を使用する第４の総距離。最小総距離が、次いで、様々な総距離の中から選択され得、アンカ・ボックスは陽性トレーニング・サンプルである（たとえば、ＩＯＵに類似する）かどうかを判定するために使用され得る。たとえば、陽性サンプルは、平均総距離が閾値未満であることに少なくとも部分的に基づいて、選択され得る。他の態様において、平均平均距離（ａｖｅｒａｇｅｍｅａｎｄｉｓｔａｎｃｅ）、又は他の統計的定量化が、選択され得、マッチング・コストは閾値未満であるかどうかを判定するために使用され得る。

本開示のいくつかの態様において、最小総距離が、アンカ・ボックスはトレーニングのための陽性サンプルに対応するかどうかを判定するために、物体検出器１０６に関連する任意の数のアンカ・ボックスについて判定され得る。信頼度値１１８は、陽性サンプルであるとして考えることからアンカ・ボックスをフィルタ処理するために使用され得る。たとえば、最小総距離は、そのアンカ・ボックスに関連する信頼度値１１８に少なくとも部分的に基づいて、アンカ・ボックスについて判定され得る。いくつかの実例において、最小総距離が、閾値を超える信頼度値１１８を有する（たとえば、陽性検出を示す）各アンカ・ボックスについて判定され得る。

本開示のさらなる態様において、各アンカ・ボックスの最小総距離は、グラウンド・トゥルース・コーナー・ポイント（たとえば、グラウンド・トゥルースのスキューされた四角形）によって定義されたサイズ及び／又はエリアに少なくとも部分的に基づいて正規化され得る。最小総距離の正規化は、たとえば、異なるアンカ・ボックス・サイズ及び／又は空間要素領域（たとえば、グリッド）解像度が用いられる、アンカ・ボックスのサイズ差を説明するために使用され得る。本開示によれば、マッチング・コスト（たとえば、正規化された最小総距離に少なくとも部分的に基づく）が、ある特定の（たとえば、あらかじめ定められた）閾値未満であるとき、アンカ・ボックスは、陽性サンプルとして識別され得る。陽性サンプルは、次いで、トレーニングされている物体検出器１０６（たとえば、ＣＮＮ）のパラメータを更新するために使用され得る。

ここで図７を参照すると、図７は、本開示のいくつかの実施例による、駐車スペースのコーナー・ポイントを提供するようにマシン学習モデルをトレーニングするための方法７００を示す流れ図である。方法７００の各ブロック、及び本明細書に記載の他の方法は、ハードウェア、ファームウェア、及び／又はソフトウェアの任意の組合せを使用して実行され得る計算プロセスを含む。たとえば、様々な機能が、メモリに記憶された命令を実行するプロセッサによって、実施され得る。方法７００はまた、コンピュータ記憶媒体に記憶されたコンピュータ使用可能命令として実施され得る。方法７００は、いくつか例を挙げると、独立型アプリケーション、サービス又はホスト型サービス（独立型の又は別のホスト型サービスと組み合わせた）、或いは別の製品へのプラグインによって提供され得る。本明細書に記載の方法は、本明細書に記載のものを含むが、これらに限定されない、任意の１個のシステム、又は任意の組合せのシステムによって、追加で又は別法として、実行され得、特定に実例に制限されない。

方法７００は、ブロックＢ７０２において、駐車スペースを表す画像データをニューラル・ネットワークに適用することを含む。たとえば、画像５０２は、物体検出器１０６に適用され得、画像５０２は、少なくとも１個の駐車スペースを描写する。

方法７００は、ブロックＢ７０４において、画像データから生成された及びアンカ形状のコーナー・ポイントへの変位値を表すデータを、ニューラル・ネットワークを使用して、受信することを含む。たとえば、回帰サブネットワーク５１２は、既定義のアンカ・ボックス５２２に関連する及び画像５０２を表す画像データから生成された変位値５１６を出力することができる。

方法７００は、ブロックＢ７０６において、スキューされたポリゴンのコーナー・ポイントをアンカ形状のコーナー・ポイントへの変位値から判定することを含む。たとえば、スキューされた四角形ジェネレータ５１８（又は少なくともトレーニングのために使用される他の構成要素）は、既定義のアンカ・ボックス５２２に関連する変位値５１６からスキューされた四角形の調整されたコーナー・ポイント５２０を判定することができる。

方法７００は、ブロックＢ７０８において、スキューされたポリゴンのコーナー・ポイントと駐車スペースのグラウンド・トゥルース・コーナー・ポイントとの間の第１の距離を計算することを含む。たとえば、最小総距離は、図６に記載のように、（Ａ１、Ａ２、Ａ３、及びＡ４）と（Ｂ１、Ｂ２、Ｂ３、及びＢ４）との間で計算され得る。

方法７００は、ブロックＢ７１０において、第１の距離に基づいてサンプル格付けを決定することを含む。たとえば、サンプル格付けは、最小総距離又はそのいくつかの派生物（たとえば、グラウンド・トゥルース・サイズに基づいて正規化された）でもよい。

方法７００は、ブロックＢ７１２において、サンプル格付けが閾値を超える（たとえば、未満である）ことに基づいて、陽性トレーニング・サンプルとしてアンカ形状を使用してニューラル・ネットワークのパラメータを更新することを含む。たとえば、アンカは、マッチング・コスト（たとえば、サンプル格付けに基づく）が閾値未満であるとき、陽性サンプルとして定義され得る。

ここで図８を参照すると、図８は、本開示のいくつかの実施例による、駐車スペースのコーナー・ポイントを、ニューラル・ネットワークを使用して、判定するための方法８００を示す流れ図である。方法８００は、ブロックＢ８０２において、環境内の少なくとも１個のセンサの視界を表すセンサ・データをニューラル・ネットワークに適用することを含む。たとえば、画像５０２を表すセンサ・データは、物体検出器１０６に適用され得、その画像は、車両１１００のカメラの視界を表す。

方法８００は、ブロックＢ８０４において、センサ・データから生成された第１のデータ及び第２のデータをニューラル・ネットワークから受信することを含み、第１のデータは、アンカ形状のコーナー・ポイントへの変位値を表し、第２のデータは、アンカ形状が少なくとも１個のセンサの視界内の駐車スペースに対応する可能性を予測する信頼度値を表す。たとえば、回帰サブネットワーク５１２は、既定義のアンカ・ボックス５２２に関連する変位値５１６を表す及び画像５０２を表すセンサ・データから生成されたデータを出力することができる。加えて、分類サブネットワーク５１０は、アンカ・ボックス５２２が画像５０２内の駐車スペースに対応する可能性を予測する信頼性スコア５１４を表すデータを出力することができる。

方法８００は、ブロックＢ８０６において、信頼度値が閾値を超えることに基づいて、スキューされたポリゴンのコーナー・ポイントをアンカ形状のコーナー・ポイントへの変位値から判定することを含む。たとえば、スキューされた四角形ジェネレータ５１８は、図５Ａに示すように、閾値を超える信頼度値５１４に少なくとも部分的に基づいて既定義のアンカ・ボックス５２２に関連する変位値５１６からスキューされた四角形の調整されたコーナー・ポイント５２０を表すデータを判定することができる。

ここで図９を参照すると、図９は、本開示のいくつかの実施例による、駐車スペースへの入口を、ニューラル・ネットワークを使用して、判定するための方法９００を示す流れ図である。方法９００は、ブロックＢ９０２において、環境内の少なくとも１個のセンサの視界を表すセンサ・データをニューラル・ネットワークに適用することを含む。たとえば、画像５０２を表すセンサ・データは、物体検出器１０６に適用され得、センサ・データは、車両１１００のカメラの視界を表す。

方法９００は、ブロックＢ９０４において、画像データから生成された第１のデータ及び第２のデータをニューラル・ネットワークから受信することを含む。第１のデータは、アンカ形状のコーナー・ポイントへの変位値を表し、第２のデータは、アンカ形状のコーナー・ポイントが少なくとも１個のセンサの視界において駐車スペースへの入口を定義する可能性を予測する信頼度値を表す。たとえば、回帰サブネットワーク５１２は、既定義のアンカ・ボックス５２２に関連する変位値５１６を表す及びセンサ・データから生成されたデータを出力することができる。加えて、分類サブネットワーク５１０（又は別の類似のネットワーク）は、アンカ・ボックスのコーナー・ポイントが駐車スペースへの入口の少なくとも一部分を表す可能性を予測する図２の信頼性スコア１１６を出力することができる。

方法９００は、ブロックＢ９０６において、信頼度値に基づいてアンカ形状のコーナー・ポイントのサブセットを選択することを含む。たとえば、入口判定器１２６は、最も高い信頼性スコア１１６を有するコーナー・ポイントを判定及び／又は選択するために、コーナー・ポイントをフィルタ処理することができる。

方法９００は、ブロックＢ９０８において、サブセットのコーナー・ポイントから駐車スペースへの入口を識別することを含む。たとえば、最も高い信頼性スコアを有する２個のコーナー・ポイントが、選択されると、入口判定器１２６は、駐車スペースの入口及び／又は入口線を定義して、指定され得る。

例示的動作環境
物体検出システム１００及び／又はネットワーク５０２は、本開示のいくつかの実施例によれば、図１０の例示的動作環境１０００において実装され得る。

図示されていない他の構成要素の中でも特に、動作環境１０００は、クライアント・デバイス１０２０、ネットワーク１０４０、サーバ・デバイス１０６０、センサ１０８０、及びデータ・ストア１０５０を含む。図１０に示された動作環境１０００は１個の適切な動作環境の一実例であることを理解されたい。図１０に示されたそれぞれの構成要素は、たとえば、図１２に関して説明される計算デバイス１２００のうちの１個又は複数などの任意のタイプの計算デバイスを介して実装され得る。これらの構成要素は、ワイヤード、ワイヤレス、又はその両方でもよい、ネットワーク１０４０を介して互いに通信し得る。ネットワーク１０４０は、複数のネットワーク、又はネットワークのネットワークを含み得るが、本開示の態様を分かりにくくしないように単純な形で示されている。実例として、ネットワーク１０４０は、１個又は複数のワイド・エリア・ネットワーク（ＷＡＮ）、１個又は複数のローカル・エリア・ネットワーク（ＬＡＮ）、インターネットなどの１個又は複数のパブリック・ネットワーク、及び／又は１個又は複数のプライベート・ネットワークを含み得る。ネットワーク１０４０が、ワイヤレス電気通信ネットワークを含む場合、構成要素、たとえば、基地局、通信塔、或いはアクセス・ポイント（並びに他の構成要素）、は、ワイヤレス接続を提供し得る。任意の実例において、少なくとも１個のネットワーク１０４０は、さらに後述される、図１１Ｄのネットワーク１１９０に対応し得る。

任意の数のクライアント・デバイス１０２０、サーバ・デバイス１０６０、センサ１０８０、及びデータ・ストア１０５０が、本開示の範囲内で動作環境１０００内で使用され得ることを理解されたい。それぞれが、単一のデバイス又は分散型環境において協力する複数のデバイスとして構成され得る。

クライアント・デバイス１０２０は、図１２に関して本明細書に記載の例示的計算デバイス１２００の構成要素、特徴、及び機能性のうちの少なくともいくつかを含み得る。実例として、及び限定ではなく、クライアント・デバイス１０２０は、パーソナル・コンピュータ（ＰＣ）、ラップトップ・コンピュータ、モバイル・デバイス、スマートフォン、タブレット・コンピュータ、スマート・ウォッチ、ウェアラブル・コンピュータ、パーソナル・デジタル・アシスタント（ＰＤＡ）、ＭＰ３プレイヤ、全地球測位システム（ＧＰＳ：ＧｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍ）又はデバイス、ビデオ・プレイヤ、ハンドヘルド通信デバイス、ゲーミング・デバイス又はシステム、娯楽システム、車両コンピュータ・システム、組み込み型システム・コントローラ、リモート制御、器具、民生用電子デバイス、ワークステーション、これらの描写されたデバイスの任意の組合せ、或いは任意の他の適切なデバイスとして実施され得る。任意の実例において、少なくとも１個のクライアント・デバイス１０２０は、本明細書でさらに詳しく説明される車両、たとえば、図１１Ａ～１１Ｄの車両１１００、の一部でもよい。

クライアント・デバイス１０２０は、１個又は複数のプロセッサと、１個又は複数のコンピュータ可読媒体とを含み得る。コンピュータ可読媒体は、１個又は複数のプロセッサによって実行可能なコンピュータ可読命令を含み得る。命令は、１個又は複数のプロセッサによって実行されるとき、１個又は複数のプロセッサに本明細書に記載の方法の任意の組合せ及び／又は部分を実行させる及び／又は図１の物体検出システム１００の機能性の任意の部分を実装させることができる。

サーバ・デバイス１０６０はまた、１個又は複数のプロセッサと、１個又は複数のコンピュータ可読媒体とを含み得る。コンピュータ可読媒体は、１個又は複数のプロセッサによって実行可能なコンピュータ可読命令を含む。命令は、１個又は複数のプロセッサによって実行されるとき、１個又は複数のプロセッサに本明細書に記載の方法の任意の組合せ及び／又は部分を実行させる及び／又は図１の物体検出システム１００の機能性の任意の部分を実装させることができる。任意の実例において、少なくとも１個のサーバ・デバイス１０６０は、本明細書でさらに詳しく説明される、図１１Ｄのサーバ１１７８に対応し得る。

データ・ストア１０５０は、１個又は複数のコンピュータ可読媒体を含み得る。コンピュータ可読媒体は、１個又は複数のプロセッサによって実行可能なコンピュータ可読命令を含み得る。命令は、１個又は複数のプロセッサによって実行されるとき、１個又は複数のプロセッサに本明細書に記載の方法の任意の組合せ及び／又は部分を実行させる及び／又は図１の物体検出システム１００の機能性の任意の部分を実装させることができる。データ・ストア１０５０（又はコンピュータ・データ・ストレージ）は、単一の構成要素として描写されているが、１個又は複数のデータ・ストア（たとえば、データベース）として実施されてもよく、少なくとも部分的にクラウド内でもよい。データ・ストア１０５０のうちの１個又は複数は、図１１Ｃのデータ・ストアのうちの１個又は複数に対応し得る。

サーバ・デバイス１０６０及びクライアント・デバイス１０２０の外部に描かれているが、データ・ストア１０５０は、サーバ・デバイス１０６０及び／又はクライアント・デバイス１０２０の任意の組合せで少なくとも部分的に実施され得る（たとえば、メモリ１２０４（図１２）のように）。たとえば、いくつかの情報は、クライアント・デバイス１０２０に記憶され得、他の及び／又は重複情報は、外部に記憶され得る（たとえば、サーバ・デバイス１０６０に）。したがって、データ・ストア１０５０内の情報は、ストレージのための１個又は複数のデータ・ストア（外部でホストされ得る）にわたり任意の適切な方式で分散され得ることを理解されたい。たとえば、データ・ストア１０５０は、サーバ・デバイス１０６０の１個若しくは複数のコンピュータ可読媒体のうちの少なくともいくつか及び／又はクライアント・デバイス１０２０の１個若しくは複数のコンピュータ可読媒体のうちの少なくともいくつかを含み得る。

センサ１０８０は、環境の少なくともいくつかの態様を表すセンサ・データを生成する能力を有する少なくとも１個のセンサを含む。たとえば、センサ１０８０は、図１Ａのセンサ・データ１０２を生成し得る。センサ１０８０は、全地球的航法衛星システム（ＧＮＳＳ：ｇｌｏｂａｌｎａｖｉｇａｔｉｏｎｓａｔｅｌｌｉｔｅｓｙｓｔｅｍ）センサ（たとえば、全地球測位システム（ＧＰＳ）センサ）、ＲＡＤＡＲセンサ、超音波センサ、ＬＩＤＡＲセンサ、慣性計測装置（ＩＭＵ：ｉｎｅｒｔｉａｌｍｅａｓｕｒｅｍｅｎｔｕｎｉｔ）センサ（たとえば、加速度計、ジャイロスコープ、磁気コンパス、磁力計など）、マイクロフォン、ステレオ・カメラ、ワイドビュー・カメラ（たとえば、魚眼カメラ）、赤外線カメラ、サラウンド・カメラ（たとえば、３６０度カメラ）、長距離及び／若しくは中距離カメラ、スピード・センサ（たとえば、車両１１００のスピードを測定するための）、振動センサ、ステアリング・センサ、ブレーキ・センサ（たとえば、ブレーキ・センサ・システムの一部としての）、並びに／又は他のセンサ・タイプの任意の組合せを含み得る。

図１１Ａ～１１Ｃを参照すると、センサ・データ１０２は、たとえば、及び限定ではなく、全地球的航法衛星システム（ＧＮＳＳ）センサ１１６８（たとえば、全地球測位システム・センサ）、ＲＡＤＡＲセンサ１１６０、超音波センサ１１６２、ＬＩＤＡＲセンサ１１６４、慣性計測装置（ＩＭＵ）センサ１１６６（たとえば、加速度計、ジャイロスコープ、磁気コンパス、磁力計など）、マイクロフォン１１９６、ステレオ・カメラ１１６８、ワイドビュー・カメラ１１７０（たとえば、魚眼カメラ）、赤外線カメラ１１７２、サラウンド・カメラ１１７４（たとえば、３６０度カメラ）、長距離及び／若しくは中距離カメラ１１９８、スピード・センサ１１４４（たとえば、車両１１００のスピードを測定するための）、振動センサ１１４２、ステアリング・センサ１１４０、ブレーキ・センサ（たとえば、ブレーキ・センサ・システム１１４６の一部としての）、並びに／又は他のセンサ・タイプによって生成され得る。

いくつかの実例において、センサ・データ１０２は、前向きの及び／又は横側を向いたカメラ、たとえば、ワイドビュー・カメラ１１７０、サラウンド・カメラ１１７４、ステレオ・カメラ１１６８、及び／又は長距離若しくは中距離カメラ１１９８、によって生成され得る。いくつかの実例において、複数のカメラ又は他のセンサが、複数の視界（たとえば、図１１Ｂの長距離カメラ１１９８、前向きのステレオ・カメラ１１６８、及び／又は前向きのワイドビュー・カメラ１１７０の視界）を組み込むために使用され得る。

例示的自律型車両
図１１Ａは、本開示のいくつかの実施例による、例示的自律型車両１１００の図である。自律型車両１１００（或いは本明細書で「車両１１００」と称される）は、旅客車両、たとえば、乗用車、トラック、バス、及び／又は別のタイプの１人若しくは複数の乗客を乗せた車両を含み得るが、これらに限定されない。自律型車両は、一般に、米国運輸省道路交通安全局（ＮＨＴＳＡ：ＮａｔｉｏｎａｌＨｉｇｈｗａｙＴｒａｆｆｉｃＳａｆｅｔｙＡｄｍｉｎｉｓｔｒａｔｉｏｎ）、米国運輸省の部署、及び自動車技術者協会（ＳＡＥ：ＳｏｃｉｅｔｙｏｆＡｕｔｏｍｏｔｉｖｅＥｎｇｉｎｅｅｒｓ）「ＴａｘｏｎｏｍｙａｎｄＤｅｆｉｎｉｔｉｏｎｓｆｏｒＴｅｒｍｓＲｅｌａｔｅｄｔｏＤｒｉｖｉｎｇＡｕｔｏｍａｔｉｏｎＳｙｓｔｅｍｓｆｏｒＯｎ－ＲｏａｄＭｏｔｏｒＶｅｈｉｃｌｅ」（２０１８年６月１１日に公開された規格番号Ｊ３０１６－２０１８０６、２０１６年９月３０日に公開された規格番号Ｊ３０１６－２０１６０９、及びこの規格の前の及び未来のバージョン）によって定義される、自動化レベルに関して記述される。車両１１００は、自律運転レベルのレベル３～レベル５のうちの１個又は複数による機能の能力を有し得る。たとえば、車両１１００は、実施例に応じて、条件付き自動化（レベル３）、高度自動化（レベル４）、及び／又は完全自動化（レベル５）の能力を有し得る。

車両１１００は、車両のシャシ、車体、車輪（たとえば、２、４、６、８、１８など）、タイヤ、車軸、及び他の構成要素などの構成要素を含み得る。車両１１００は、内部燃焼エンジン、ハイブリッド動力装置、完全な電気式エンジン、及び／又は別の推進システム・タイプなど、推進システム１１５０を含み得る。推進システム１１５０は、車両１１００の推進力を有効にするために、トランスミッションを含み得る、車両１１００のドライブ・トレインに接続され得る。推進システム１１５０は、スロットル／加速装置１１５２からの信号の受信に応答して制御され得る。

ハンドルを含み得る、ステアリング・システム１１５４は、推進システム１１５０が動作しているときに（たとえば、車両が移動中のときに）車両１１００のかじを取る（たとえば、所望の進路又はルートに沿って）ために使用され得る。ステアリング・システム１１５４は、ステアリング・アクチュエータ１１５６から信号を受信することができる。ハンドルは、完全自動化（レベル５）機能のオプションでもよい。

ブレーキ・センサ・システム１１４６は、ブレーキ・アクチュエータ１１４８及び／又はブレーキ・センサからの信号の受信に応答して車両ブレーキを動作させるために使用され得る。

１個又は複数のシステム・オン・チップ（ＳｏＣ：ｓｙｓｔｅｍｏｎｃｈｉｐ）１１０４（図１１Ｃ）及び／又はＧＰＵを含み得る、コントローラ１１３６は、車両１１００の１個若しくは複数の構成要素及び／又はシステムに信号（たとえば、コマンドの表現）を提供することができる。たとえば、コントローラは、１個又は複数のブレーキ・アクチュエータ１１４８を介して車両ブレーキを動作させて、１個又は複数のステアリング・アクチュエータ１１５６を介してステアリング・システム１１５４を動作させて、１個又は複数のスロットル／加速装置１１５２を介して推進システム１１５０を動作させるために、信号を送ることができる。コントローラ１１３６は、センサ信号を処理する、並びに律的運転を可能にするために及び／又は運転者の車両１１００の運転を支援するために動作コマンド（たとえば、コマンドを表す信号）を出力する、１個又は複数の搭載された（たとえば、統合された）計算デバイス（たとえば、スーパーコンピュータ）を含み得る。コントローラ１１３６は、自律運転機能のための第１のコントローラ１１３６、機能的安全性機能のための第２のコントローラ１１３６、人工知能機能（たとえば、コンピュータ・ビジョン）のための第３のコントローラ１１３６、インフォテインメント機能のための第４のコントローラ１１３６、緊急状態における冗長性のための第５のコントローラ１１３６、及び／又は他のコントローラを含み得る。いくつかの実例では、単一のコントローラ１１３６が、前述の機能のうちの２個以上を処理することができ、２個以上のコントローラ１１３６が、単一の機能、及び／又はその任意の組合せを処理することができる。

コントローラ１１３６は、１個又は複数のセンサから受信したセンサ・データ（たとえば、センサ入力）に応答して車両１１００の１個若しくは複数の構成要素及び／又はシステムを制御するための信号を提供することができる。センサ・データは、たとえば、そして制限なしに、全地球的航法衛星システム・センサ１１５８（たとえば、グローバル・ポジショニング・システム・センサ）、ＲＡＤＡＲセンサ１１６０、超音波センサ１１６２、ＬＩＤＡＲセンサ１１６４、慣性計測装置（ＩＭＵ：ｉｎｅｒｔｉａｌｍｅａｓｕｒｅｍｅｎｔｕｎｉｔ）センサ１１６６（たとえば、加速度計、ジャイロスコープ、磁気コンパス、磁力計など）、マイクロフォン１１９６、ステレオ・カメラ１１６８、ワイドビュー・カメラ１１７０（たとえば、魚眼カメラ）、赤外線カメラ１１７２、サラウンド・カメラ１１７４（たとえば、３６０度カメラ）、長距離及び／又は中距離カメラ１１９８、スピード・センサ１１４４（たとえば、車両１１００のスピードを測定するための）、振動センサ１１４２、ステアリング・センサ１１４０、ブレーキ・センサ（たとえば、ブレーキ・センサ・システム１１４６の一部としての）、及び／又は他のセンサ・タイプから受信され得る。

コントローラ１１３６のうちの１個又は複数のコントローラは、車両１１００の計器群１１３２から入力（たとえば、入力データによって表される）を受信し、出力（たとえば、出力データ、表示データなどによって表される）をヒューマン・マシン・インターフェース（ＨＭＩ：ｈｕｍａｎ－ｍａｃｈｉｎｅｉｎｔｅｒｆａｃｅ）ディスプレイ１１３４、可聴式アナンシエータ、ラウドスピーカ、及び／又は車両１１００の他の構成要素を介して提供することができる。出力は、車両ベロシティ、スピード、時間、マップ・データ（たとえば、図１１ＣのＨＤマップ１１２２）、位置データ（たとえば、マップ上などの、車両の１１００の位置）、方向、他の車両の位置（たとえば、占有グリッド）、コントローラ１１３６によって把握されるものとしての物体及び物体の状況に関する情報などの、情報を含み得る。たとえば、ＨＭＩディスプレイ１１３４は、１個又は複数の物体（たとえば、道路標識、警告標識、交通信号の変化など）の存在、及び／又は車両が行った、行っている、又は行うであろう運転操作（たとえば、今、車線変更をしていること、３．２２ｋｍ（２マイル）内の出口３４Ｂを出ることなど）に関する情報を表示することができる。

車両１１００はさらに、１個若しくは複数のワイヤレス・アンテナ１１２６及び／又はモデムを使用して１個若しくは複数のネットワークを介して通信することができるネットワーク・インターフェース１１２４を含む。たとえば、ネットワーク・インターフェース１１２４は、ＬＴＥ、ＷＣＤＭＡ（登録商標）、ＵＭＴＳ、ＧＳＭ、ＣＤＭＡ２０００などを介する通信の能力を有し得る。ワイヤレス・アンテナ１１２６はまた、ブルートゥース（登録商標）、ブルートゥース（登録商標）ＬＥ、Ｚ－Ｗａｖｅ、ＺｉｇＢｅｅなどのローカル・エリア・ネットワーク、及び／又はＬｏＲａＷＡＮ、ＳｉｇＦｏｘなどのロー・パワー・ワイドエリア・ネットワーク（ＬＰＷＡＮ：ｌｏｗｐｏｗｅｒｗｉｄｅ－ａｒｅａｎｅｔｗｏｒｋ）を使用し、環境内の物体（たとえば、車両、モバイル・デバイスなど）の間の通信を可能にすることができる。

図１１Ｂは、本開示のいくつかの実施例による、図１１Ａの例示的自律型車両１１００のカメラ位置及び視野の実例である。カメラ及びそれぞれの視野は、１個の例示的実施例であり、制限することは意図されていない。たとえば、追加の及び／又は代替カメラが含まれ得る、及び／又はカメラは車両１１００の異なる位置に置かれ得る。

カメラのカメラ・タイプは、車両１１００の構成要素及び／又はシステムと使用するようになされ得るデジタル・カメラを含み得るが、これに限定されない。カメラは、自動車安全整合性レベル（ＡＳＩＬ：ａｕｔｏｍｏｔｉｖｅｓａｆｅｔｙｉｎｔｅｇｒｉｔｙｌｅｖｅｌ）Ｂにおいて及び／又は別のＡＳＩＬにおいて動作することができる。カメラ・タイプは、実施例に応じて、６０フレーム／秒（ｆｐｓ）、１１２０ｆｐｓ、２４０ｆｐｓなど、任意の画像キャプチャ・レートの能力を有し得る。カメラは、ロール・シャッタ、グローバル・シャッタ、別のタイプのシャッタ、又はその組合せを使用する能力を有し得る。いくつかの実例では、カラー・フィルタ・アレイは、ＲＣＣＣ（ｒｅｄｃｌｅａｒｃｌｅａｒｃｌｅａｒ）カラー・フィルタ・アレイ、ＲＣＣＢ（ｒｅｄｃｌｅａｒｃｌｅａｒｂｌｕｅ）カラー・フィルタ・アレイ、ＲＢＧＣ（ｒｅｄｂｌｕｅｇｒｅｅｎｃｌｅａｒ）カラー・フィルタ・アレイ、ＦｏｖｅｏｎＸ３カラー・フィルタ・アレイ、Ｂａｙｅｒセンサ（ＲＧＧＢ）カラー・フィルタ・アレイ、モノクロ・センサ・カラー・フィルタ・アレイ、及び／又は別のタイプのカラー・フィルタ・アレイを含み得る。一部の実施例では、ＲＣＣＣ、ＲＣＣＢ、及び／又はＲＢＧＣカラー・フィルタ・アレイを有するカメラなどのクリア画素カメラは、光感度を上げるための取り組みにおいて使用され得る。

いくつかの実例では、カメラのうちの１個又は複数が、高度運転者支援システム（ＡＤＡＳ：ａｄｖａｎｃｅｄｄｒｉｖｅｒａｓｓｉｓｔａｎｃｅｓｙｓｔｅｍ）機能（たとえば、冗長又はフェイルセーフ設計の一部として）を実行するために使用され得る。たとえば、多機能モノ・カメラは、車線逸脱警報、交通標識アシスト及びインテリジェント・ヘッドランプ制御を含む機能を提供するために設置され得る。カメラのうちの１個又は複数（たとえば、すべてのカメラ）が、画像データ（たとえば、ビデオ）を同時に記録及び提供することができる。

カメラのうちの１個又は複数は、カメラの画像データ・キャプチャ能力を妨げることがある自動車内からの迷光及び反射（たとえば、フロントガラスのミラーにおいて反射されたダッシュボードからの反射）を取り除くために、カスタム設計された（３Ｄ印刷された）部品などの取付部品において取り付けられ得る。サイドミラー取付部品を参照すると、サイドミラー部品は、カメラ取付板がサイドミラーの形状に合うように、カスタム３Ｄ印刷され得る。いくつかの実例では、カメラは、サイドミラー内に統合され得る。サイドビュー・カメラについては、カメラはまた、キャビンの各角にある４個の支柱内に統合され得る。

車両１１００の前の環境の部分を含む視野を有するカメラ（たとえば、前向きのカメラ）は、前向きの進路及び障害物の識別を助け、１個若しくは複数のコントローラ１１３６及び／又は制御ＳｏＣの助けにより、占有グリッドの生成及び／又は好ましい車両進路の決定に不可欠な情報の提供の提供を助けるための、サラウンド・ビューのために使用され得る。前向きのカメラは、緊急ブレーキ、歩行者検出、及び衝突回避を含む、ＬＩＤＡＲと同じＡＤＡＳ機能の多くを実行するために使用され得る。前向きのカメラはまた、車線逸脱警報（「ＬＤＷ（ＬａｎｅＤｅｐａｒｔｕｒｅＷａｒｎｉｎｇ）」）、自律的クルーズ制御（「ＡＣＣ（ＡｕｔｏｎｏｍｏｕｓＣｒｕｉｓｅＣｏｎｔｒｏｌ）」）、及び／又は交通標識認識などの他の機能を含むＡＤＡＳ機能及びシステムのために使用され得る。

様々なカメラが、たとえば、ＣＭＯＳ（ｃｏｍｐｌｅｍｅｎｔａｒｙｍｅｔａｌｏｘｉｄｅｓｅｍｉｃｏｎｄｕｃｔｏｒ）カラー画像化装置を含む単眼カメラ・プラットフォームを含む、前向きの構成において使用され得る。別の実例は、周辺（たとえば、歩行者、交差する交通又は自転車）からのビューに入る物体を把握するために使用され得るワイドビュー・カメラ１１７０でもよい。図１１Ｂにはワイドビュー・カメラは１個だけ示されているが、車両１１００には任意の数のワイドビュー・カメラ１１７０が存在し得る。加えて、長距離カメラ１１９８（たとえば、ロングビュー・ステレオ・カメラ・ペア）が、特に、ニューラル・ネットワークがまだトレーニングされていない物体について、深度ベースの物体検出のために使用され得る。長距離カメラ１１９８はまた、物体検出及び分類、並びに基本物体追跡のために使用され得る。

１個又は複数のステレオ・カメラ１１６８もまた、前向きの構成に含まれ得る。ステレオ・カメラ１１６８は、単一のチップ上に統合されたＣＡＮ又はイーサネット（登録商標）・インターフェースを有するプログラマブル論理（ＦＰＧＡ）及びマルチコア・マイクロプロセッサを提供し得る、拡張可能な処理ユニットを備えた統合された制御ユニットを含み得る。そのようなユニットは、画像内のすべてのポイントの距離推定値を含む、車両の環境の３Ｄマップを生成するために使用され得る。代替ステレオ・カメラ１１６８は、２個のカメラ・レンズ（左と右に１個ずつ）と、車両から対象物体までの距離を測定する及び生成された情報（たとえば、メタデータ）を使用して自律的緊急ブレーキ及び車線逸脱警報機能をアクティブにすることができる画像処理チップとを含み得る、コンパクト・ステレオ・ビジョン・センサを含み得る。他のタイプのステレオ・カメラ１１６８が、本明細書に記載のものに加えて、又はそれらの代わりに、使用されてもよい。

車両１１００の側面に対する環境の部分を含む視野を有するカメラ（たとえば、サイドビュー・カメラ）が、占有グリッドを作成及び更新するために並びに側面衝撃衝突警報を生成するために使用される情報を提供する、サラウンド・ビューのために使用され得る。たとえば、サラウンド・カメラ１１７４（たとえば、図１１Ｂに示されるような４個のサラウンド・カメラ１１７４）は、車両１１００上に位置付けられ得る。サラウンド・カメラ１１７４は、ワイドビュー・カメラ１１７０、魚眼カメラ、３６０度カメラ、及び／又は同類のものを含み得る。たとえば、４個の魚眼カメラが、車両の前、後ろ、及び側面に配置され得る。代替配置において、車両は、３個のサラウンド・カメラ１１７４（たとえば、左、右、及び後部）を使用してもよく、第４のサラウンド・ビュー・カメラとして１個又は複数の他のカメラ（たとえば、前向きのカメラ）を活用してもよい。

車両１１００の後ろに対する環境の部分を含む視野を有するカメラ（たとえば、後方確認カメラ）が、駐車支援、サラウンド・ビュー、後部衝突警報、並びに占有グリッドの作成及び更新のために使用され得る。本明細書に記載のように、前向きのカメラ（たとえば、長距離及び／又は中距離カメラ１１９８、ステレオ・カメラ１１６８）、赤外線カメラ１１７２など）としても適したカメラを含むがこれらに限定されない、多種多様なカメラが使用され得る。

図１１Ｃは、本開示のいくつかの実施例による、図１１Ａの例示的自律型車両１１００の例示的システム・アーキテクチャのブロック図である。本明細書に記載されているこの及び他の配置は単に実例として説明されていることを理解されたい。他の配置及び要素（たとえば、マシン、インターフェース、機能、順番、機能のグループ分けなど）が、示されたものに加えて又はこれらに代わって使用されてもよく、いくつかの要素はともに除外されてもよい。さらに、本明細書に記載の要素の多くは、個別の又は分散された構成要素として又は他の構成要素と併せて、並びに任意の適切な組合せ及び場所において、実装され得る機能エンティティである。エンティティによって実行されるものとして本明細書に記載された様々な機能は、ハードウェア、ファームウェア、及び／又はソフトウェアによって実施され得る。たとえば、様々な機能が、メモリに記憶された命令を実行するプロセッサによって実施され得る。

図１１Ｃの車両１１００の構成要素、特徴、及びシステムのそれぞれは、バス１１０２を介して接続されるものとして図示されている。バス１１０２は、コントローラ・エリア・ネットワーク（ＣＡＮ）データ・インターフェース（或いは、「ＣＡＮバス」と称される）を含み得る。ＣＡＮは、ブレーキ、加速度、ブレーキ、ステアリング、フロントガラス・ワイパなどの作動など、車両１１００の様々な特徴及び機能の制御を助けるために使用される車両１１００内のネットワークでもよい。ＣＡＮバスは、それぞれが独自の一意の識別子（たとえば、ＣＡＮＩＤ）を有する、数ダース又は数百ものノードを有するように構成され得る。ＣＡＮバスは、ハンドル角度、対地速度、１分間のエンジン回転（ＲＰＭ：ｒｅｖｏｌｕｔｉｏｎｓｐｅｒｍｉｎｕｔｅ）、ボタン位置、及び／又は他の車両状況指標を見つけるために読み取られ得る。ＣＡＮバスは、ＡＳＩＬＢ準拠でもよい。

バス１１０２は、ＣＡＮバスであるものとして本明細書に記載されているが、これは制限することを意図されていない。たとえば、ＣＡＮバスに加えて、又はこのその代替として、ＦｌｅｘＲａｙ及び／又はイーサネット（登録商標）が使用されてもよい。加えて、単一の線が、バス１１０２を表すために使用されているが、これは制限することを意図されていない。たとえば、１個若しくは複数のＣＡＮバス、１個若しくは複数のＦｌｅｘＲａｙバス、１個若しくは複数のイーサネット（登録商標）・バス、及び／又は異なるプロトコルを使用する１個若しくは複数の他のタイプのバスを含み得る、任意の数のバス１１０２が存在し得る。いくつかの実例では、２個以上のバス１１０２が、異なる機能を実行するために使用され得る、及び／又は冗長性のために使用され得る。たとえば、第１のバス１１０２は衝突回避機能のために使用されてもよく、第２のバス１１０２は作動制御のために使用されてもよい。任意の実例において、各バス１１０２は、車両１１００の構成要素のいずれかと通信し得、２個以上のバス１１０２が同じ構成要素と通信し得る。いくつかの実例では、車両内の各ＳｏＣ１１０４、各コントローラ１１３６、及び／又は各コンピュータは、同じ入力データ（たとえば、車両１１００のセンサからの入力）へのアクセスを有し得、ＣＡＮバスなどの共通バスに接続され得る。

車両１１００は、図１１Ａに関して本明細書で説明されるものなど、１個又は複数のコントローラ１１３６を含み得る。コントローラ１１３６は、様々な機能のために使用され得る。コントローラ１１３６は、車両１１００の様々な他の構成要素及びシステムのいずれかに連結されてもよく、車両１１００、車両１１００の人工知能、車両１１００のためのインフォテインメント、及び／又は同類のものの制御のために使用され得る。

車両１１００は、システム・オン・チップ（ＳｏＣ）１１０４を含み得る。ＳｏＣ１１０４は、ＣＰＵ１１０６、ＧＰＵ１１０８、プロセッサ１１１０、キャッシュ１１１２、加速装置１１１４、データ・ストア１１１６、及び／又は図示されていない他の構成要素及び特徴を含み得る。ＳｏＣ１１０４は、様々なプラットフォーム及びシステム内の車両１１００を制御するために使用され得る。たとえば、ＳｏＣ１１０４は、１個又は複数のサーバ（たとえば、図１１Ｄのサーバ１１７８）からネットワーク・インターフェース１１２４を介してマップのリフレッシュ及び／又は更新を取得することができるＨＤマップ１１２２を有するシステム（たとえば、車両１１００のシステム）において結合され得る。

ＣＰＵ１１０６は、ＣＰＵクラスタ又はＣＰＵ複合体（或いは、「ＣＣＰＬＥＸ」とも称される）を含み得る。ＣＰＵ１１０６は、複数のコア及び／又はＬ２キャッシュを含み得る。たとえば、一部の実施例では、ＣＰＵ１１０６は、コヒーレント・マルチプロセッサ構成内の８個のコアを含み得る。一部の実施例では、ＣＰＵ１１０６は、４個のデュアルコア・クラスタを含むことができ、各クラスタが専用のＬ２キャッシュ（たとえば、２ＭＢＬ２キャッシュ）を有する。ＣＰＵ１１０６（たとえば、ＣＣＰＬＥＸ）は、ＣＰＵ１１０６のクラスタの任意の組合せが任意の所与の時間にアクティブになることを可能にする同時クラスタ動作をサポートするように構成され得る。

ＣＰＵ１１０６は、以下の特徴のうちの１個又は複数を含む電力管理能力を実装することができる：個別ハードウェア・ブロックが、動的電力を節約するためにアイドル状態のときに自動的にクロック・ゲーティングされ得る、各コア・クロックは、ＷＦＩ／ＷＦＥ命令の実行により命令をコアがアクティブに実行していないときにゲーティングされ得る、各コアは、独立してパワー・ゲーティングされ得る、各コア・クラスタは、すべてのコアがクロック・ゲーティングされる若しくはパワー・ゲーティングされるときに、独立してクロック・ゲーティングされ得る、及び／又は、各コア・クラスタは、すべてのコアがパワー・ゲーティングされるときに、独立してパワー・ゲーティングされ得る。ＣＰＵ１１０６は、電力状態を管理するための強化されたアルゴリズムをさらに実装することができ、そこでは、許容される電力状態及び予想されるウェイクアップ時間が指定され、ハードウェア／マイクロ・コードが、コア、クラスタ、及びＣＣＰＬＥＸに入力するための最良の電力状態を決定する。処理コアは、作業がマイクロ・コードにオフロードされたソフトウェアにおける簡略化された電力状態入力シーケンスをサポートすることができる。

ＧＰＵ１１０８は、統合されたＧＰＵ（或いは本明細書において「ｉＧＰＵ」と称される）を含み得る。ＧＰＵ１１０８は、プログラマブルになり得、並行のワークロードに効率的になり得る。一部の実例では、ＧＰＵ１１０８は、強化されたテンソル命令セットを使用することができる。ＧＰＵ１１０８は、１個又は複数のストリーミング・マイクロプロセッサを含み得、そこで、各ストリーミング・マイクロプロセッサは、Ｌ１キャッシュ（たとえば、少なくとも９６ＫＢ記憶容量を有するＬ１キャッシュ）を含み得、ストリーミング・マイクロプロセッサのうちの２個以上が、キャッシュ（たとえば、５１２ＫＢ記憶容量を有するＬ２キャッシュ）を共用し得る。一部の実施例では、ＧＰＵ１１０８は、少なくとも８個のストリーミング・マイクロプロセッサを含み得る。ＧＰＵ１１０８は、計算アプリケーション・プログラミング・インターフェース（ＡＰＩ）を使用することができる。加えて、ＧＰＵ１１０８は、１個若しくは複数の並行のコンピューティング・プラットフォーム及び／又はプログラミング・モデル（たとえば、ＮＶＩＤＩＡのＣＵＤＡ）を使用することができる。

ＧＰＵ１１０８は、自動車の及び組み込まれた使用事例における最高のパフォーマンスのために電力最適化され得る。たとえば、ＧＰＵ１１０８は、ＦｉｎＦＥＴ（Ｆｉｎｆｉｅｌｄ－ｅｆｆｅｃｔｔｒａｎｓｉｓｔｏｒ）上に製造され得る。しかしながら、これは制限することを意図されておらず、ＧＰＵ１１０８は、他の半導体製造プロセスを使用し、製造され得る。各ストリーミング・マイクロプロセッサは、複数のブロックに区切られたいくつかの混合精度処理コアを組み込むことができる。限定ではなく、たとえば、６４ＰＦ３２コア及び３２ＰＦ６４コアは、４個の処理ブロックに区切られてもよい。そのような実例では、各処理ブロックは、１６ＦＰ３２コア、８ＦＰ６４コア、１６ＩＮＴ３２コア、深層学習行列演算のための２個の混合精度ＮＶＩＤＩＡテンソル・コア、Ｌ０命令キャッシュ、ワープ・スケジューラ、発送ユニット、及び／又は６４ＫＢレジスタ・ファイルを割り当てられ得る。加えて、ストリーミング・マイクロプロセッサは、計算及びアドレス指定演算の混合を有するワークロードの効率的な実行を提供するための独立した並行の整数及び浮動小数点データ進路を含み得る。ストリーミング・マイクロプロセッサは、並行スレッドの間のより高い細粒度の同期及び連携を可能にするために、独立したスレッド・スケジューリング能力を含み得る。ストリーミング・マイクロプロセッサは、プログラミングを単純化しつつ性能を向上させるために、結合されたＬ１データ・キャッシュ及び共用メモリ・ユニットを含み得る。

ＧＰＵ１１０８は、一部の実例では、９００ＧＢ／秒のピーク・メモリ帯域幅に関して、提供するための高帯域幅メモリ（ＨＢＭ：ｈｉｇｈｂａｎｄｗｉｄｔｈｍｅｍｏｒｙ）及び／又は１６ＧＢＨＢＭ２メモリ・サブシステムを含み得る。いくつかの実例では、ＨＢＭメモリに加えて、又はこれの代わりに、グラフィックス・ダブル・データ・レート・タイプ５同期ランダム・アクセス・メモリ（ＧＤＤＲ５：ｇｒａｐｈｉｃｓｄｏｕｂｌｅｄａｔａｒａｔｅｔｙｐｅｆｉｖｅｓｙｎｃｈｒｏｎｏｕｓｒａｎｄｏｍ－ａｃｃｅｓｓｍｅｍｏｒｙ）などの同期グラフィックス・ランダム・アクセス・メモリ（ＳＧＲＡＭ：ｓｙｎｃｈｒｏｎｏｕｓｇｒａｐｈｉｃｓｒａｎｄｏｍ－ａｃｃｅｓｓｍｅｍｏｒｙ）が使用され得る。

ＧＰＵ１１０８は、メモリ・ページに最も頻繁にアクセスするプロセッサへのそれらのメモリ・ページのより正確な移動を可能にするためにアクセス・カウンタを含む統一されたメモリ技術を含むことができ、それにより、プロセッサ間で共用される記憶範囲の効率を向上させる。いくつかの実例では、アドレス変換サービス（ＡＴＳ：ａｄｄｒｅｓｓｔｒａｎｓｌａｔｉｏｎｓｅｒｖｉｃｅ）サポートが、ＧＰＵ１１０８がＣＰＵ１１０６ページ・テーブルに直接アクセスすることを可能にするために使用され得る。そのような実例では、ＧＰＵ１１０８メモリ管理ユニット（ＭＭＵ：ｍｅｍｏｒｙｍａｎａｇｅｍｅｎｔｕｎｉｔ）がミスを経験するとき、アドレス変換要求が、ＣＰＵ１１０６に送信され得る。応答して、ＣＰＵ１１０６は、アドレスの仮想対現実マッピングのためのそのページ・テーブルを調べることができ、ＧＰＵ１１０８に変換を送り返す。そのようなものとして、統一されたメモリ技術は、ＣＰＵ１１０６とＧＰＵ１１０８との両方のメモリの単一統一仮想アドレス空間を可能にすることができ、それによりＧＰＵ１１０８へのアプリケーションのＧＰＵ１１０８プログラミング及び移植を単純化する。

加えて、ＧＰＵ１１０８は、他のプロセッサのメモリへのＧＰＵ１１０８のアクセスの頻度を記録することができるアクセス・カウンタを含み得る。アクセス・カウンタは、メモリ・ページが最も頻繁にそのページにアクセスしているプロセッサの物理メモリに移動されることを確実にするのを助けることができる。

ＳｏＣ１１０４は、本明細書に記載のものを含む任意の数のキャッシュ１１１２を含み得る。たとえば、キャッシュ１１１２は、ＣＰＵ１１０６とＧＰＵ１１０８との両方に利用可能な（たとえば、ＣＰＵ１１０６とＧＰＵ１１０８との両方に接続された）Ｌ３キャッシュを含み得る。キャッシュ１１１２は、キャッシュ・コヒーレンス・プロトコル（たとえば、ＭＥＩ、ＭＥＳＩ、ＭＳＩなど）を使用することなどによって、線の状態を記録することができるライトバック・キャッシュを含み得る。Ｌ３キャッシュは、より小さいキャッシュ・サイズが使用されてもよいが、実施例に応じて、４ＭＢ以上を含み得る。

ＳｏＣ１１０４は、１個又は複数の加速装置１１１４（たとえば、ハードウェア加速装置、ソフトウェア加速装置、又はその組合せ）を含み得る。たとえば、ＳｏＣ１１０４は、最適化されたハードウェア加速装置及び／又は大きなオンチップ・メモリを含み得る、ハードウェア加速クラスタを含み得る。大きなオンチップメモリ（たとえば、４ＭＢのＳＲＡＭ）は、ハードウェア加速クラスタがニューラル・ネットワーク及び他の演算を加速することを可能にし得る。ハードウェア加速クラスタは、ＧＰＵ１１０８を補完するために及びＧＰＵ１１０８のタスクの一部をオフロードするために（たとえば、他のタスクを実行するためのＧＰＵ１１０８のより多くのサイクルを解放するために）使用され得る。一実例として、加速装置１１１４は、加速に適するように十分に安定している対象ワークロード（たとえば、知覚、畳み込みニューラル・ネットワーク（ＣＮＮ：ｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋ）など）のために使用され得る。本明細書では、「ＣＮＮ」という用語は、領域ベースの又は領域的畳み込みニューラル・ネットワーク（ＲＣＮＮ：ｒｅｇｉｏｎａｌｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋ）及び高速ＲＣＮＮ（たとえば、物体検出のために使用されるものとしての）を含む、すべてのタイプのＣＮＮを含み得る。

加速装置１１１４（たとえば、ハードウェア加速クラスタ）は、深層学習加速装置（ＤＬＡ：ｄｅｅｐｌｅａｒｎｉｎｇａｃｃｅｌｅｒａｔｏｒ）を含み得る。ＤＬＡは、深層学習アプリケーション及び推論のために１秒あたり追加の１０兆の動作を提供するように構成することができる１個又は複数のテンソル処理ユニット（ＴＰＵ：Ｔｅｎｓｏｒｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）を含み得る。ＴＰＵは、画像処理機能（たとえば、ＣＮＮ、ＲＣＮＮなどの）を実行するように構成及び最適化された加速装置でもよい。ＤＬＡはさらに、特定のセットのニューラル・ネットワーク・タイプ及び浮動小数点演算、並びに推論のために最適化され得る。ＤＬＡの設計は、汎用ＧＰＵよりも１ミリメートルあたりより多くのパフォーマンスを提供することができ、ＣＰＵのパフォーマンスを大きく超える。ＴＰＵは、たとえば、特徴と重みとの両方についてＩＮＴ８、ＩＮＴ１６、及びＦＰ１６データ・タイプをサポートする、単一インスタンス畳み込み機能、並びにポストプロセッサ機能を含む、いくつかの機能を実行することができる。

ＤＬＡは、以下を含むがこれらに限定されない、様々な機能のいずれかのために処理済み又は未処理のデータでニューラル・ネットワーク、特にＣＮＮ、を迅速に及び効率的に実行することができる：カメラ・センサからのデータを使用する物体識別及び検出のためのＣＮＮ、カメラ・センサからのデータを使用する距離推定のためのＣＮＮ、マイクロフォンからのデータを使用する緊急車両検出及び識別及び検出のためのＣＮＮ、カメラ・センサからのデータを使用する顔認識及び車両所有者識別のためのＣＮＮ、及び／又は、セキュリティ及び／又は安全性関連イベントのためのＣＮＮ。

ＤＬＡは、ＧＰＵ１１０８の任意の機能を実行することができ、そして、推論加速装置を使用することによって、たとえば、設計者は、任意の機能のためにＤＬＡ又はＧＰＵ１１０８のいずれかを対象にすることができる。たとえば、設計者は、ＤＬＡ上のＣＮＮ及び浮動小数点演算の処理に重点的に取り組み、他の機能をＧＰＵ１１０８及び／又は他の加速装置１１１４に任せることができる。

加速装置１１１４（たとえば、ハードウェア加速クラスタ）は、或いはコンピュータ・ビジョン加速装置と本明細書で称され得るプログラマブル・ビジョン加速装置（ＰＶＡ：ｐｒｏｇｒａｍｍａｂｌｅｖｉｓｉｏｎａｃｃｅｌｅｒａｔｏｒ）を含み得る。ＰＶＡは、高度運転者支援システム（ＡＤＡＳ：ａｄｖａｎｃｅｄｄｒｉｖｅｒａｓｓｉｓｔａｎｃｅｓｙｓｔｅｍ）、自律運転、及び／又は拡張現実（ＡＲ：ａｕｇｍｅｎｔｅｄｒｅａｌｉｔｙ）及び／又は仮想現実（ＶＲ：ｖｉｒｔｕａｌｒｅａｌｉｔｙ）アプリケーションのためのコンピュータ・ビジョン・アルゴリズムを加速するように設計及び構成され得る。ＰＶＡは、パフォーマンスと柔軟性との間のバランスをもたらすことができる。たとえば、各ＰＶＡは、たとえば、任意の数の縮小命令セット・コンピュータ（ＲＩＳＣ：ｒｅｄｕｃｅｄｉｎｓｔｒｕｃｔｉｏｎｓｅｔｃｏｍｐｕｔｅｒ）コア、直接メモリ・アクセス（ＤＭＡ：ｄｉｒｅｃｔｍｅｍｏｒｙａｃｃｅｓｓ）、及び／又は任意の数のベクトル・プロセッサを含み得るが、これらに限定されない。

ＲＩＳＣコアは、画像センサ（たとえば、本明細書に記載のカメラのうちのいずれかのカメラの画像センサ）、画像信号プロセッサ、及び／又は同類のものと相互作用することができる。それぞれのＲＩＳＣコアは、任意の量のメモリを含み得る。ＲＩＳＣコアは、実施例に応じて、いくつかのプロトコルのいずれかを使用することができる。いくつかの実例では、ＲＩＳＣコアは、リアルタイム・オペレーティング・システム（ＲＴＯＳ：ｒｅａｌ－ｔｉｍｅｏｐｅｒａｔｉｎｇｓｙｓｔｅｍ）を実行することができる。ＲＩＳＣコアは、１個若しくは複数の集積回路デバイス、特定用途向け集積回路（ＡＳＩＣ）、及び／又はメモリ・デバイスを使用して、実装され得る。たとえば、ＲＩＳＣコアは、命令キャッシュ及び／又はしっかりと結合されたＲＡＭを含み得る。

ＤＭＡは、ＣＰＵ１１０６から独立したシステム・メモリにＰＶＡの構成要素がアクセスすることを可能にし得る。ＤＭＡは、多次元アドレス指定及び／又は循環アドレス指定をサポートすることを含むがこれに限定されないＰＶＡに最適化をもたらすために使用される任意の数の特徴をサポートすることができる。いくつかの実例では、ＤＭＡは、ブロック幅、ブロック高さ、ブロック深度、水平ブロック・ステッピング、垂直ブロック・ステッピング、及び／又は深度ステッピングを含み得る、６次元まで又はそれ以上のアドレス指定をサポートすることができる。

ベクトル・プロセッサは、コンピュータ・ビジョン・アルゴリズムのプログラミングを効率的に柔軟に実行する及び信号処理能力を提供するように設計され得るプログラマブル・プロセッサでもよい。いくつかの実例では、ＰＶＡは、ＰＶＡコア及び２個のベクトル処理サブシステム・パーティションを含み得る。ＰＶＡコアは、プロセッサ・サブシステム、ＤＭＡエンジン（たとえば、２個のＤＭＡエンジン）、及び／又は他の周辺装置を含み得る。ベクトル処理サブシステムは、ＰＶＡの１次的処理エンジンとして動作することができ、ベクトル処理ユニット（ＶＰＵ：ｖｅｃｔｏｒｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）、命令キャッシュ、及び／又はベクトル・メモリ（たとえば、ＶＭＥＭ）を含み得る。ＶＰＵコアは、たとえば、単一の命令、複数のデータ（ＳＩＭＤ）、超長命令語（ＶＬＩＷ：ｖｅｒｙｌｏｎｇｉｎｓｔｒｕｃｔｉｏｎｗｏｒｄ）デジタル信号プロセッサなど、デジタル信号プロセッサを含み得る。ＳＩＭＤ及びＶＬＩＷの組合せは、スループット及びスピードを高めることができる。

それぞれのベクトル・プロセッサは、命令キャッシュを含み得、専用のメモリに連結され得る。結果として、一部の実例では、それぞれのベクトル・プロセッサは、他のベクトル・プロセッサから独立して実行するように構成され得る。他の実例において、特定のＰＶＡに含まれるベクトル・プロセッサは、データ並列処理を用いるように構成され得る。たとえば、一部の実施例では、単一のＰＶＡに含まれる複数のベクトル・プロセッサは、同じコンピュータ・ビジョン・アルゴリズムを、しかし画像の異なる領域上で、実行することができる。他の実例において、特定のＰＶＡに含まれるベクトル・プロセッサは、異なるコンピュータ・ビジョン・アルゴリズムを、同じ画像上で、同時に実行することができ、或いは順次画像又は画像の部分で異なるアルゴリズムを実行することさえできる。特に、任意の数のＰＶＡは、ハードウェア加速クラスタに含まれ得、任意の数のベクトル・プロセッサは、それぞれのＰＶＡに含まれ得る。加えて、ＰＶＡは、全体的システム安全性を高めるために、追加のエラー訂正コード（ＥＣＣ：ｅｒｒｏｒｃｏｒｒｅｃｔｉｎｇｃｏｄｅ）メモリを含み得る。

加速装置１１１４（たとえば、ハードウェア加速クラスタ）は、加速装置１１１４のための高帯域幅、低レイテンシＳＲＡＭを提供するための、コンピュータ・ビジョン・ネットワーク・オンチップ及びＳＲＡＭを含み得る。いくつかの実例では、オンチップ・メモリは、たとえば、そして制限ではなく、ＰＶＡとＤＬＡとの両方によってアクセス可能でもよい、８個のフィールド構成可能なメモリ・ブロックから成る、少なくとも４ＭＢのＳＲＡＭを含み得る。各ペアのメモリ・ブロックは、高度周辺バス（ＡＰＢ：ａｄｖａｎｃｅｄｐｅｒｉｐｈｅｒａｌｂｕｓ）インターフェース、構成回路、コントローラ、及びマルチプレクサを含み得る。任意のタイプのメモリが、使用され得る。ＰＶＡ及びＤＬＡは、メモリへの高速アクセスを有するＰＶＡ及びＤＬＡを提供するバックボーンを介してメモリにアクセスすることができる。バックボーンは、（たとえば、ＡＰＢを使用して）ＰＶＡ及びＤＬＡをメモリに相互接続するコンピュータ・ビジョン・ネットワーク・オンチップを含み得る。

コンピュータ・ビジョン・ネットワーク・オンチップは、ＰＶＡとＤＬＡとの両方が作動可能及び有効信号を提供することを、任意の制御信号／アドレス／データの送信の前に、決定するインターフェースを含み得る。そのようなインターフェースは、制御信号／アドレス／データを送信するための別個のフェーズ及び別個のチャネル、並びに連続的データ転送のためのバーストタイプの通信を提供することができる。このタイプのインターフェースは、ＩＳＯ２６２６２又はＩＥＣ６１２５０８規格に従うことができるが、他の規格及びプロトコルが使用されてもよい。

いくつかの実例では、ＳｏＣ１１０４は、２０１８年８月１０日に出願された米国特許出願第１６／１０１，１２３２号に記載されるような、リアルタイム・レイトレーシング・ハードウェア加速装置を含み得る。リアルタイム・レイトレーシング・ハードウェア加速装置は、ＲＡＤＡＲ信号解釈のための、音響伝播合成及び／又は分析のための、ＳＯＮＡＲシステムのシミュレーションのための、一般波伝播シミュレーションのための、ローカリゼーション及び／又は他の機能を目的とするＬＩＤＡＲデータに対する比較のための、及び／又は他の使用のための、リアルタイム視覚化シミュレーションを生成するために、（たとえば、世界モデル内の）物体の位置及び規模を迅速に効率的に決定するために使用され得る。

加速装置１１１４（たとえば、ハードウェア加速装置クラスタ）は、自律運転のための多様な用途を有する。ＰＶＡは、ＡＤＡＳ及び自律型車両における極めて重要な処理段階に使用され得るプログラマブル・ビジョン加速装置でもよい。ＰＶＡの能力は、低電力及び低レイテンシにおいて、予測可能な処理を必要とするアルゴリズムの領域にふさわしい。言い換えれば、ＰＶＡは、低レイテンシ及び低電力とともに予測可能な実行時間を必要とする、小さなデータ集合上でも、半高密度の又は高密度の通常の計算で上手く機能する。それ故に、ＰＶＡは、物体検出及び整数計算での動作において効率的であるので、自律型車両のためのプラットフォームとの関連で、ＰＶＡは、クラシック・コンピュータ・ビジョン・アルゴリズムを実行するように設計される。

たとえば、本技術の１個の実施例によれば、ＰＶＡは、コンピュータ・ステレオ・ビジョンを実行するために使用される。半グローバルなマッチングベースのアルゴリズムが、一部の実例では使用され得るが、これは制限することを意図されていない。レベル３～５の自律運転のための多数のアプリケーションは、動き推定／ステレオ・マッチング・オンザフライ（たとえば、ＳＦＭ（ｓｔｒｕｃｔｕｒｅｆｒｏｍｍｏｔｉｏｎ）、歩行者認識、レーン検出など）を必要とする。ＰＶＡは、２個の単眼カメラからの入力でコンピュータ・ステレオ・ビジョン機能を実行することができる。

いくつかの実例では、ＰＶＡは、高密度のオプティカル・フローを実行するために使用され得る。処理されたＲＡＤＡＲを提供するために未加工のＲＡＤＡＲデータを処理する（たとえば、４Ｄ高速フーリエ変換を使用して）ことによる。他の実例において、ＰＶＡは、たとえば、飛行データの未加工の時間を処理して飛行データの処理済み時間を提供することにより、飛行深度処理の時間に使用される。

ＤＬＡは、たとえば、各物体検出の信頼性の測定値を出力するニューラル・ネットワークを含む、制御及び運転安全性を強化するために任意のタイプのネットワークを実行するために使用され得る。そのような信頼性値は、確率として、又は他の検出と比較した各検出の相対的「重み」を提供するものとして、解釈され得る。この信頼性値は、どの検出が誤判定検出ではなくて真陽性検出と考えられるべきであるかに関するさらなる決定をシステムが行うことを可能にする。たとえば、システムは、信頼性の閾値を設定し、真陽性検出としての閾値を超える検出のみを考慮することができる。自動非常ブレーキ（ＡＥＢ：ａｕｔｏｍａｔｉｃｅｍｅｒｇｅｎｃｙｂｒａｋｉｎｇ）システムにおいて、誤判定検出は、車両に非常ブレーキを自動で実行させることになり、これは明らかに望ましくない。したがって、最も確信のある検出のみが、ＡＥＢのトリガとして考えられるべきである。ＤＬＡは、信頼性値を退行するニューラル・ネットワークを実行し得る。ニューラル・ネットワークは、境界ボックス次元、（たとえば、別のサブシステムから）取得されたグラウンド・プレーン推定、ニューラル・ネットワーク及び／又は他のセンサ（たとえば、ＬＩＤＡＲセンサ１１６４又はＲＡＤＡＲセンサ１１６０）から取得された物体の車両１１００方位、距離、３Ｄ位置推定と相関する慣性計測装置（ＩＭＵ：ｉｎｅｒｔｉａｌｍｅａｓｕｒｅｍｅｎｔｕｎｉｔ）センサ１１６６出力、その他など、少なくともいくつかのサブセットのパラメータをその入力として受け取ることができる。

ＳｏＣ１１０４は、データ・ストア１１１６（たとえば、メモリ）を含み得る。データ・ストア１１１６は、ＳｏＣ１１０４のオンチップ・メモリでもよく、ＧＰＵ及び／又はＤＬＡで実行されることになるニューラル・ネットワークを記憶することができる。いくつかの実例では、データ・ストア１１１６は、冗長性及び安全性のためにニューラル・ネットワークの複数のインスタンスを記憶するのに十分な大きさの容量を有し得る。データ・ストア１１１２は、Ｌ２又はＬ３キャッシュ１１１２を備え得る。データ・ストア１１１６の参照は、本明細書に記載のような、ＰＶＡ、ＤＬＡ、及び／又は他の加速装置１１１４に関連するメモリの参照を含み得る。

ＳｏＣ１１０４は、１個又は複数のプロセッサ１１１０（たとえば、組み込まれたプロセッサ）を含み得る。プロセッサ１１１０は、ブート電力及び管理能力及び関連するセキュリティ施行を処理するための専用のプロセッサ及びサブシステムでもよいブート及び電力管理プロセッサを含み得る。ブート及び電力管理プロセッサは、ＳｏＣ１１０４ブート・シーケンスの一部でもよく、実行時間電力管理サービスを提供することができる。ブート電力及び管理プロセッサは、クロック及び電圧プログラミング、システム低電力状態移行の支援、ＳｏＣ１１０４熱及び温度センサの管理、及び／又はＳｏＣ１１０４電力状態の管理を提供することができる。各温度センサは、その出力頻度が温度に比例するリング発振器として実装されてもよく、ＳｏＣ１１０４は、リング発振器を使用してＣＰＵ１１０６、ＧＰＵ１１０８、及び／又は加速装置１１１４の温度を検出することができる。温度が、閾値を超えたと判定された場合、ブート及び電力管理プロセッサは、温度障害ルーティンに入り、ＳｏＣ１０１４をより低い電力状態に置く及び／又は車両１１００をショーファーの安全停止モードにする（たとえば、車両１１００を安全停止させる）ことができる。

プロセッサ１１１０は、オーディオ処理エンジンの機能を果たし得る１セットの組み込まれたプロセッサをさらに含み得る。オーディオ処理エンジンは、複数のインターフェースを介するマルチチャネル・オーディオの完全なハードウェア・サポートとオーディオＩ／Ｏインターフェースの広く柔軟な範囲とを可能にするオーディオ・サブシステムでもよい。いくつかの実例では、オーディオ処理エンジンは、専用のＲＡＭを有するデジタル信号プロセッサを有する専用のプロセッサ・コアである。

プロセッサ１１１０は、低電力センサ管理及びウェイク使用事例をサポートするための必要なハードウェア特徴を提供することができる常時オンのプロセッサ・エンジンをさらに含み得る。常時オンのプロセッサ・エンジンは、プロセッサ・コア、しっかりと結合されたＲＡＭ、支援周辺装置（たとえば、タイマ及び割り込みコントローラ）、様々なＩ／Ｏコントローラ周辺装置、及びルーティング論理を含み得る。

プロセッサ１１１０は、自動車のアプリケーションの安全性管理を処理するために専用のプロセッサ・サブシステムを含む安全性クラスタ・エンジンをさらに含み得る。安全性クラスタ・エンジンは、２個以上のプロセッサ・コア、しっかりと結合されたＲＡＭ、サポート周辺装置（たとえば、タイマ、割り込みコントローラなど）、及び／又はルーティング論理を含み得る。安全性モードにおいて、２個以上のコアは、ロックステップ・モードにおいて動作し、それらの動作の間の何らかの差を検出するための比較論理を有する単一のコアとして機能することができる。

プロセッサ１１１０は、リアルタイム・カメラ管理を処理するための専用のプロセッサ・サブシステムを含み得るリアルタイム・カメラ・エンジンをさらに含み得る。

プロセッサ１１１０は、カメラ処理パイプラインの一部であるハードウェア・エンジンである画像信号プロセッサを含み得る高ダイナミック・レンジ信号プロセッサをさらに含み得る。

プロセッサ１１１０は、プレイヤ・ウインドウのための最終的画像を生み出すためにビデオ再生アプリケーションによって必要とされるビデオ処理後機能を実装する処理ブロック（たとえば、マイクロプロセッサに実装された）でもよいビデオ画像合成器を含み得る。ビデオ画像合成器は、ワイドビュー・カメラ１１７０で、サラウンド・カメラ１１７４で、及び／又はキャビン内監視カメラ・センサでレンズ歪み補正を実行することができる。キャビン内監視カメラ・センサは好ましくは、キャビン内イベントを識別し、適切に応答するように構成された、高度ＳｏＣの別のインスタンス上で実行するニューラル・ネットワークによって監視される。キャビン内システムは、セルラ・サービスをアクティブにする及び電話をかける、電子メールを書き取らせる、車両の目的地を変更する、車両のインフォテインメント・システム及び設定をアクティブにする又は変更する、或いは音声起動型ウェブ・サーフィンを提供するために、読唇術を実行することができる。ある特定の機能は、自律モードで動作しているときにのみ運転者に利用可能であり、そうでない場合には無効にされる。

ビデオ画像合成器は、空間的ノイズ低減及び時間的ノイズ低減の両方のための強化された時間的ノイズ低減を含み得る。たとえば、動きがビデオ内で生じた場合、ノイズ低減は、隣接するフレームによって提供される情報の重みを減らし、空間的情報に適切に重みを加える。画像又は画像の一部が動きを含まない場合、ビデオ画像合成器によって実行される時間的ノイズ低減は、前の画像からの情報を使用して現在の画像におけるノイズを減らすことができる。

ビデオ画像合成器はまた、入力ステレオ・レンズ・フレーム上でステレオ・レクティフィケーションを実行するように構成され得る。ビデオ画像合成器はさらに、オペレーティング・システム・デスクトップが使用中であるときにユーザ・インターフェース合成のために使用することができ、ＧＰＵ１１０８は、新しい表面を連続してレンダリングために必要とされない。ＧＰＵ１１０８の電源が入れられ、３Ｄレンダリングをアクティブに行っているときでも、ビデオ画像合成器は、ＧＰＵ１１０８をオフロードしてパフォーマンス及び反応性を向上させるために使用され得る。

ＳｏＣ１１０４は、カメラからビデオ及び入力を受信するためのモバイル・インダストリ・プロセッサ・インターフェース（ＭＩＰＩ：ｍｏｂｉｌｅｉｎｄｕｓｔｒｙｐｒｏｃｅｓｓｏｒｉｎｔｅｒｆａｃｅ）カメラ・シリアル・インターフェース、高速インターフェース、及び／又は、カメラ及び関連画素入力機能のために使用され得るビデオ入力ブロックをさらに含み得る。ＳｏＣ１１０４は、ソフトウェアによって制御され得る、及び特定の役割にコミットされていないＩ／Ｏ信号を受信するために使用され得る、入力／出力コントローラをさらに含み得る。

ＳｏＣ１１０４は、周辺装置、オーディオ・コーデック、電力管理、及び／又は他のデバイスとの通信を可能にするために、広範囲の周辺インターフェースをさらに含み得る。ＳｏＣ１１０４は、（たとえば、ギガビット・マルチメディア・シリアル・リンク及びイーサネット（登録商標）を介して接続された）カメラからのデータ、センサ（たとえば、イーサネット（登録商標）を介して接続され得るＬＩＤＡＲセンサ１１６４、ＲＡＤＡＲセンサ１１６０など）、バス１１０２からのデータ（たとえば、車両１１００のスピード、ハンドル位置など）、（たとえば、イーサネット（登録商標）又はＣＡＮバスを介して接続された）ＧＮＳＳセンサ１１５８からのデータを処理するために使用され得る。ＳｏＣ１１０４は、独自のＤＭＡエンジンを含み得る及びルーティン・データ管理タスクからＣＰＵ１１０６を解放するために使用され得る専用の高性能大容量記憶コントローラをさらに含み得る。

ＳｏＣ１１０４は、自動化レベル３～５に広がる柔軟なアーキテクチャを有する終端間プラットフォームでもよく、それによって、多様性及び冗長性のためにコンピュータ・ビジョン及びＡＤＡＳ技法を活用し、効率的に使用し、深層学習ツールとともに、柔軟な、信頼できる運転ソフトウェア・スタックのためのプラットフォームを提供する、総合的機能的安全性アーキテクチャを提供する。ＳｏＣ１１０４は、従来のシステムよりも高速で、信頼でき、さらにエネルギ効率がよく、空間効率がよくなり得る。たとえば、加速装置１１１４が、ＣＰＵ１１０６と結合されるとき、ＧＰＵ１１０８、及びデータ・ストア１１１６は、レベル３～５の自律型車両のための高速で効率的なプラットフォームを提供することができる。

したがって、本技術は、従来のシステムによって達成することができない能力及び機能性をもたらす。たとえば、コンピュータ・ビジョン・アルゴリズムは、多種多様な視覚的データにわたり多種多様な処理アルゴリズムを実行するために、Ｃプログラミング言語などの高レベルのプログラミング言語を使用して構成され得る、ＣＰＵで実行され得る。しかしながら、ＣＰＵは、しばしば、たとえば、実行時間及び電力消費に関連するものなど、多数のコンピュータ・ビジョン・アプリケーションの性能要件を満たすことができない。具体的には、多数のＣＰＵは、車両内ＡＤＡＳアプリケーションの要件及び実際のレベル３～５の自律型車両の要件である、リアルタイムでの複合物体検出アルゴリズムを実行することができない。

従来のシステムとは対照的に、ＣＰＵ複合体、ＧＰＵ複合体、及びハードウェア加速クラスタを提供することによって、本明細書に記載の技術は、複数のニューラル・ネットワークが同時に及び／又は連続して実行されることと、レベル３～５の自律運転機能を可能にするために結果が結合されることとを可能にする。たとえば、ＤＬＡ又はｄＧＰＵ（たとえば、ＧＰＵ１１２０）で実行するＣＮＮは、ニューラル・ネットワークが具体的にトレーニングされていない標識を含む、交通標識をスーパーコンピュータが読み取る及び理解することを可能にする、テキスト及び単語認識を含み得る。ＤＬＡは、標識の意味論的理解を識別、解釈、及び提供することと、ＣＰＵ複合体で実行する進路計画立案モジュールに意味論的理解を渡すこととを行うことができる、ニューラル・ネットワークをさらに含み得る。

別の実例として、複数のニューラル・ネットワークは、レベル３、４、又は５の運転に必要とされるように、同時に実行され得る。たとえば、電光とともに、「注意：点滅光は、凍った状態を示す」から成る警告標識は、いくつかのニューラル・ネットワークによって独立して又は集合的に解釈され得る。標識自体は、第１の配備されたニューラル・ネットワーク（たとえば、トレーニングされてあるニューラル・ネットワーク）によって交通標識として識別され得、テキスト「点滅光は、凍った状態を示す」は、点滅光が検出されるときには凍った状態が存在することを車両の進路計画立案ソフトウェア（好ましくはＣＰＵ複合体上で実行する）に知らせる、第２の配備されたニューラル・ネットワークによって解釈され得る。点滅光は、点滅光の存在（又は無いこと）を車両の進路計画立案ソフトウェアに知らせ、複数のフレームを介して第３の配備されたニューラル・ネットワークを動作させることによって識別され得る。すべての３個のニューラル・ネットワークは、ＤＬＡ内及び／又はＧＰＵ１１０８上などで、同時に実行することができる。

いくつかの実例では、顔認識及び車両所有者識別のためのＣＮＮは、カメラ・センサからのデータを使用して車両１１００の正規の運転者及び／又は所有者の存在を識別することができる。常時オンのセンサ処理エンジンは、所有者が運転席側のドアに近づくときに車両を解錠する及び明かりをつけるために、並びに、セキュリティ・モードにおいて、所有者が車両を離れるときに車両の動作を停止させるために、使用され得る。このようにして、ＳｏＣ１１０４は、盗難及び／又は車の乗っ取りに対するセキュリティをもたらす。

別の実例では、緊急車両検出及び識別のためのＣＮＮは、マイクロフォン１１９６からのデータを使用して緊急車両サイレンを検出及び識別することができる。一般分類子を使用してサイレンを検出する及び特徴を手動で抽出する従来のシステムとは対照的に、ＳｏＣ１１０４は、環境の及び都市の音の分類、並びに視覚的データの分類のためにＣＮＮを使用する。好ましい一実施例では、ＤＬＡ上で実行するＣＮＮは、（たとえば、ドップラー効果を使用することによって）緊急車両の相対的終速度を識別するようにトレーニングされる。ＣＮＮはまた、ＧＮＳＳセンサ１１５８によって識別されるように、車両が稼働しているローカル・エリアに特有の緊急車両を識別するようにトレーニングされ得る。それ故に、たとえば、欧州で稼働しているとき、ＣＮＮは、欧州のサイレンを検出しようとすることになり、そして、米国にあるとき、ＣＮＮは、北米のサイレンのみを識別しようとすることになる。緊急車両が検出された後は、制御プログラムが、緊急車両が通過するまで、超音波センサ１１６２の支援を受けて、車両を減速する、道の端に停止させる、車両を駐車する、及び／又は車両をアイドリングさせる、緊急車両安全性ルーティンを実行するために使用され得る。

車両は、高速相互接続（たとえば、ＰＣＩｅ）を介してＳｏＣ１１０４に連結され得るＣＰＵ１１１８（たとえば、個別のＣＰＵ、又はｄＣＰＵ）を含み得る。ＣＰＵ１１１８は、たとえば、Ｘ８６プロセッサを含み得る。ＣＰＵ１１１８は、たとえば、ＡＤＡＳセンサとＳｏＣ１１０４との間の潜在的に不整合の結果を調停すること、及び／又はコントローラ１１３６及び／又はインフォテインメントＳｏＣ１１３０の状況及び調子を監視することを含む、様々な機能のいずれかを実行するために使用され得る。

車両１１００は、高速相互接続（たとえば、ＮＶＩＤＩＡのＮＶＬＩＮＫ）を介してＳｏＣ１１０４に連結され得るＧＰＵ１１２０（たとえば、個別のＧＰＵ、又はｄＧＰＵ）を含み得る。ＧＰＵ１１２０は、冗長及び／又は異なるニューラル・ネットワークを実行することなどによって、付加的人工知能機能をもたらすことができ、車両１１００のセンサからの入力（たとえば、センサ・データ）に少なくとも部分的に基づいてニューラル・ネットワークをトレーニング及び／又は更新するために使用され得る。

車両１１００は、１個又は複数のワイヤレス・アンテナ１１２６（たとえば、セルラ・アンテナ、ブルートゥース（登録商標）・アンテナなど、異なる通信プロトコルのための１個又は複数のワイヤレス・アンテナ）を含み得るネットワーク・インターフェース１１２４をさらに含み得る。ネットワーク・インターフェース１１２４は、インターネットを介するクラウドとの（たとえば、サーバ１１７８及び／又は他のネットワーク・デバイスとの）、他の車両との、及び／又は計算デバイス（たとえば、乗客のクライアント・デバイス）とのワイヤレス接続を使用可能にするために使用され得る。他の車両と通信するために、直接リンクが２個の車両の間に確立され得る、及び／又は、間接リンクが（たとえば、ネットワークを通じて及びインターネットを介して）確立され得る。直接リンクは、車両対車両通信リンクを使用し、提供され得る。車両対車両通信リンクは、車両１１００に近接する車両（たとえば、車両１１００の前の、横の、及び／又は後ろの車両）に関する車両１１００情報を提供することができる。この機能は、車両１１００の共同適応クルーズ制御機能の一部でもよい。

ネットワーク・インターフェース１１２４は、変調及び復調機能を提供する及びコントローラ１１３６がワイヤレス・ネットワークを介して通信することを可能にする、ＳｏＣを含み得る。ネットワーク・インターフェース１１２４は、ベースバンドから無線周波数へのアップコンバージョン、及び無線周波数からベースバンドへのダウンコンバージョンのための無線周波数フロントエンドを含み得る。周波数コンバージョンは、よく知られているプロセスを通して実行することができ、及び／又はスーパーヘテロダイン・プロセスを用いて実行することができる。いくつかの実例では、無線周波数フロントエンド機能は、別個のチップによって提供され得る。ネットワーク・インターフェースは、ＬＴＥ、ＷＣＤＭＡ（登録商標）、ＵＭＴＳ、ＧＳＭ、ＣＤＭＡ２０００、ブルートゥース（登録商標）、ブルートゥース（登録商標）ＬＥ、Ｗｉ－Ｆｉ、Ｚ－Ｗａｖｅ、ＺｉｇＢｅｅ、ＬｏＲａＷＡＮ、及び／又は他のワイヤレス・プロトコルを介して通信するためのワイヤレス機能を含み得る。

車両１１００は、チップ外の（たとえば、ＳｏＣ１１０４外の）ストレージを含み得るデータ・ストア１１２８をさらに含み得る。データ・ストア１１２８は、ＲＡＭ、ＳＲＡＭ、ＤＲＡＭ、ＶＲＡＭ、フラッシュ、ハードディスク、及び／又は、少なくとも１ビットのデータを記憶することができる他の構成要素及び／又はデバイスを含む、１個又は複数の記憶素子を含み得る。

車両１１００は、ＧＮＳＳセンサ１１５８をさらに含み得る。ＧＮＳＳセンサ１１５８（たとえば、ＧＰＳ及び／又は支援されたＧＰＳセンサ）は、マッピング、知覚、占有グリッド生成、及び／又は進路計画策定機能を支援する。たとえば、シリアル（ＲＳ－２３２）ブリッジへのイーサネット（登録商標）を有するＵＳＢコネクタを使用するＧＰＳを含むが、これに限定されない、任意の数のＧＮＳＳセンサ１１５８が、使用され得る。

車両１１００は、ＲＡＤＡＲセンサ１１６０をさらに含み得る。ＲＡＤＡＲセンサ１１６０は、暗闇及び／又は厳しい気象条件においても、長距離車両検出のために車両１１００によって使用され得る。ＲＡＤＡＲ機能安全性レベルは、ＡＳＩＬＢでもよい。一部の実例では、ＲＡＤＡＲセンサ１１６０は、未加工のデータにアクセスするためのイーサネット（登録商標）へのアクセスを用いて、制御のために及び物体追跡データにアクセスするために（たとえば、ＲＡＤＡＲセンサ１１６０によって生成されたデータを送信するために）ＣＡＮ及び／又はバス１１０２を使用することができる。多種多様なＲＡＤＡＲセンサ・タイプが、使用され得る。たとえば、そして制限なしに、ＲＡＤＡＲセンサ１１６０は、前部、後部、及び側部ＲＡＤＡＲ使用に適し得る。一部の実例では、パルス・ドップラーＲＡＤＡＲセンサが使用される。

ＲＡＤＡＲセンサ１１６０は、狭い視野を有する長距離、広い視野を有する短距離、短距離側部カバレッジなど、異なる構成を含み得る。いくつかの実例では、長距離ＲＡＤＡＲは、適応クルーズ制御機能のために使用され得る。長距離ＲＡＤＡＲシステムは、２５０ｍの範囲内など、２個以上の独立したスキャンによって実現される広い視野を提供することができる。ＲＡＤＡＲセンサ１１６０は、静的物体と動く物体との区別を助けることができ、緊急ブレーキ・アシスト及び前方衝突警報のためのＡＤＡＳシステムによって使用され得る。長距離ＲＡＤＡＲセンサは、複数の（たとえば、６つ以上の）固定ＲＡＤＡＲアンテナと高速ＣＡＮ及びＦｌｅｘＲａｙインターフェースとを有するモノスタティック・マルチモーダルＲＡＤＡＲを含み得る。６つのアンテナを有する一実例では、中央の４個のアンテナは、隣接レーン内の交通からの干渉を最小限にして高速で車両１１００の周囲を記録するように設計された、集束ビーム・パターンを作成し得る。他の２個のアンテナは、視野を広げることができ、車両１１００のレーンに入る又はこれを去る車両を迅速に検出することを可能にする。

一実例として、中距離ＲＡＤＡＲシステムは、１４６０ｍ（前）又は８０ｍ（後）までの範囲、及び４２度（前）又は１４５０度（後）までの視野を含み得る。短距離ＲＡＤＡＲシステムは、後部バンパの両端に設置されるように設計されたＲＡＤＡＲセンサを含み得るが、これに限定されない。後部バンパの両端に設置されるとき、そのようなＲＡＤＡＲセンサ・システムは、車両の後ろ及び隣の死角を常に監視する２個のビームを作成することができる。

短距離ＲＡＤＡＲシステムは、死角検出及び／又はレーン変更アシストのためにＡＤＡＳシステムにおいて使用され得る。

車両１１００は、超音波センサ１１６２をさらに含み得る。車両１１００の前部、後部、及び／又は側部に位置付けられ得る、超音波センサ１１６２は、駐車アシストのために及び／又は占有グリッドの作成及び更新のために使用され得る。多種多様な超音波センサ１１６２が使用され得、異なる超音波センサ１１６２が、異なる範囲の検出（たとえば、２．５ｍ、４ｍ）のために使用され得る。超音波センサ１１６２は、ＡＳＩＬＢの機能的安全性レベルにおいて動作することができる。

車両１１００はＬＩＤＡＲセンサ１１６４を含み得る。ＬＩＤＡＲセンサ１１６４は、物体及び歩行者検出、緊急ブレーキ、衝突回避、及び／又は他の機能のために使用され得る。ＬＩＤＡＲセンサ１１６４は、機能的安全性レベルＡＳＩＬＢでもよい。いくつかの実例では、車両１１００は、（たとえば、ギガビット・イーサネット（登録商標）・スイッチにデータを提供するために）イーサネット（登録商標）を使用することができる複数の（たとえば、２個、４個、６個などの）ＬＩＤＡＲセンサ１１６４を含み得る。

いくつかの実例では、ＬＩＤＡＲセンサ１１６４は、物体及び３６０度視野のそれらの距離のリストを提供する能力を有し得る。市販のＬＩＤＡＲセンサ１１６４は、たとえば、２ｃｍ～３ｃｍの精度を有し、１４００Ｍｂｐｓイーサネット（登録商標）接続のサポートを有して、約１４００ｍの広告された範囲を有し得る。いくつかの実例では、１個又は複数の非突出したＬＩＤＡＲセンサ１１６４が、使用され得る。そのような実例では、ＬＩＤＡＲセンサ１１６４は、車両１１００の前部、後部、側部、及び／又は角に組み込まれ得る小さいデバイスとして実装され得る。そのような実例では、ＬＩＤＡＲセンサ１１６４は、低反射物体についても２００ｍの範囲を有し、１４２０度水平及び３５度垂直視野まで提供することができる。前部に取り付けられたＬＩＤＡＲセンサ１１６４は、４５度と１３５度との間の水平視野向けに構成され得る。

いくつかの実例では、３ＤフラッシュＬＩＤＡＲなどのＬＩＤＡＲ技術もまた使用され得る。３ＤフラッシュＬＩＤＡＲは、約２００ｍまで車両の周囲を照らすために、送信元としてレーザーのフラッシュを使用する。フラッシュＬＩＤＡＲユニットは、車両から物体までの範囲に順番に対応する、レーザー・パルス走行時間及び各画素上の反射光を記録する、レセプタを含む。フラッシュＬＩＤＡＲは、周囲の高精度の及び歪みのない画像があらゆるレーザー・フラッシュで生成されることを可能にし得る。いくつかの実例では、４個のフラッシュＬＩＤＡＲセンサが、車両１１００の各側面に１個ずつ、配備され得る。利用可能な３ＤフラッシュＬＩＤＡＲシステムは、送風機以外に動く部分を有さないソリッドステート３Ｄステアリング・アレイＬＩＤＡＲカメラ（たとえば、非スキャン型ＬＩＤＡＲデバイス）を含む。フラッシュＬＩＤＡＲデバイスは、１フレームにつき５ナノ秒クラスＩ（目に安全な）レーザー・パルスを使用することができ、３Ｄ範囲点群及び共記載された強度データの形で反射レーザー光をキャプチャし得る。フラッシュＬＩＤＡＲを使用することによって、また、フラッシュＬＩＤＡＲは、動く部分を有さないソリッドステート・デバイスであるので、ＬＩＤＡＲセンサ１１６４は、モーション・ブラー、振動、及び／又は衝撃の影響を受けにくくなり得る。

車両は、ＩＭＵセンサ１１６６をさらに含み得る。一部の実例では、ＩＭＵセンサ１１６６は、車両１１００の後部車軸の中央に位置付けられ得る。ＩＭＵセンサ１１６６は、たとえば、加速度計、磁力計、ジャイロスコープ、磁気コンパス、及び／又は他のセンサ・タイプを含み得るが、これらに限定されない。いくつかの実例では、６軸アプリケーションなどにおいて、ＩＭＵセンサ１１６６は、加速度計及びジャイロスコープを含み得るが、９軸アプリケーションにおいて、ＩＭＵセンサ１１６６は、加速度計、ジャイロスコープ、及び磁力計を含み得る。

一部の実施例では、ＩＭＵセンサ１１６６は、マイクロ電気機械システム（ＭＥＭＳ：ｍｉｃｒｏ－ｅｌｅｃｔｒｏ－ｍｅｃｈａｎｉｃａｌｓｙｓｔｅｍ）慣性センサ、高感度ＧＰＳレシーバ、及び高度カルマン・フィルタリング・アルゴリズムを結合して位置、ベロシティ、及び姿勢の推定値を提供するミニチュア、高性能ＧＰＳ支援型慣性航行システム（ＧＰＳ／ＩＮＳ：ＧＰＳ－ＡｉｄｅｄＩｎｅｒｔｉａｌＮａｖｉｇａｔｉｏｎＳｙｓｔｅｍ）として実装され得る。そのようなものとして、一部の実例では、ＩＭＵセンサ１１６６は、ＧＰＳからＩＭＵセンサ１１６６までのベロシティの変化を直接観測すること及び関連付けることによって、磁気センサからの入力を必要とせずに進行方向を車両１１００が推定することを可能にし得る。いくつかの実例では、ＩＭＵセンサ１１６６及びＧＮＳＳセンサ１１５８は、単一の統合されたユニットにおいて結合され得る。

車両は、車両１１００内及び／又は周囲に置かれたマイクロフォン１１９６を含み得る。マイクロフォン１１９６は、中でも、緊急車両検出及び識別のために使用され得る。

車両は、ステレオ・カメラ１１６８、ワイドビュー・カメラ１１７０、赤外線カメラ１１７２、サラウンド・カメラ１１７４、長距離及び／又は中距離カメラ１１９８、及び／又は他のカメラ・タイプを含む、任意の数のカメラ・タイプをさらに含み得る。カメラは、車両１１００の全外面の周りの画像データをキャプチャするために使用され得る。使用されるカメラのタイプは、車両１１００の実施例及び要件に応じて決まり、任意の組合せのカメラ・タイプが、車両１１００の周りの必要なカバレッジを実現するために使用され得る。加えて、カメラの数は、実施例に応じて異なり得る。たとえば、車両は、６個のカメラ、７個のカメラ、１０個のカメラ、１２個のカメラ、及び／又は別の数のカメラを含み得る。カメラは、一実例として、ギガビット・マルチメディア・シリアル・リンク（ＧＭＳＬ：ＧｉｇａｂｉｔＭｕｌｔｉｍｅｄｉａＳｅｒｉａｌＬｉｎｋ）及び／又はギガビット・イーサネット（登録商標）をサポートし得るが、これに限定されない。それぞれのカメラは、図１１Ａ及び図１１Ｂに関連して本明細書においてさらに詳しく説明される。

車両１１００は、振動センサ１１４２をさらに含み得る。振動センサ１１４２は、車軸など、車両の構成要素の振動を測定することができる。たとえば、振動の変化は、道路の表面の変化を示し得る。別の実例では、２個以上の振動センサ１１４２が使用されるとき、振動の差は、道路表面の摩擦又は滑りを判定するために使用され得る（たとえば、振動の差が電力駆動車軸と自由回転車軸との間であるとき）。

車両１１００は、ＡＤＡＳシステム１１３８を含み得る。一部の実例では、ＡＤＡＳシステム１１３８は、ＳｏＣを含み得る。ＡＤＡＳシステム１１３８は、自律／適応／自動クルーズ制御（ＡＣＣ：ａｕｔｏｎｏｍｏｕｓ／ａｄａｐｔｉｖｅ／ａｕｔｏｍａｔｉｃｃｒｕｉｓｅｃｏｎｔｒｏｌ）、共同適応クルーズ制御（ＣＡＣＣ：ｃｏｏｐｅｒａｔｉｖｅａｄａｐｔｉｖｅｃｒｕｉｓｅｃｏｎｔｒｏｌ）、前方衝突警報（ＦＣＷ：ｆｏｒｗａｒｄｃｒａｓｈｗａｒｎｉｎｇ）、自動緊急ブレーキ（ＡＥＢ：ａｕｔｏｍａｔｉｃｅｍｅｒｇｅｎｃｙｂｒａｋｉｎｇ）、車線逸脱警報（ＬＤＷ：ｌａｎｅｄｅｐａｒｔｕｒｅｗａｒｎｉｎｇ）、レーン・キープ・アシスト（ＬＫＡ：ｌａｎｅｋｅｅｐａｓｓｉｓｔ）、死角警報（ＢＳＷ：ｂｌｉｎｄｓｐｏｔｗａｒｎｉｎｇ）、後部交差交通警報（ＲＣＴＷ：ｒｅａｒｃｒｏｓｓ－ｔｒａｆｆｉｃｗａｒｎｉｎｇ）、衝突警報システム（ＣＷＳ：ｃｏｌｌｉｓｉｏｎｗａｒｎｉｎｇｓｙｓｔｅｍ）、レーン・センタリング（ＬＣ：ｌａｎｅｃｅｎｔｅｒｉｎｇ）、及び／又は他の特徴及び機能を含み得る。

ＡＣＣシステムは、ＲＡＤＡＲセンサ１１６０、ＬＩＤＡＲセンサ１１６４、及び／又はカメラを使用し得る。ＡＣＣシステムは、縦ＡＣＣ及び／又は横ＡＣＣを含み得る。縦ＡＣＣは、車両１１００の直ぐ前の車両までの距離を監視及び制御し、前方の車両からの安全距離を維持するために車両速度を自動的に調整する。横ＡＣＣは、距離の保持を実行し、必要なときにレーンを変更するように車両１１００にアドバイスする。横ＡＣＣは、ＬＣＡ及びＣＷＳなどの他のＡＤＡＳアプリケーションに関連する。

ＣＡＣＣは、ワイヤレス・リンクを介して他の車両からネットワーク・インターフェース１１２４及び／又はワイヤレス・アンテナ１１２６を介して、或いは間接的にネットワーク接続を介して（たとえば、インターネットを介して）、受信することができる、他の車両からの情報を使用する。直接リンクは、車両対車両（Ｖ２Ｖ：ｖｅｈｉｃｌｅ－ｔｏ－ｖｅｈｉｃｌｅ）通信リンクによって提供され得、一方、間接リンクは、インフラストラクチャ対車両（Ｉ２Ｖ：ｉｎｆｒａｓｔｒｕｃｔｕｒｅ－ｔｏ－ｖｅｈｉｃｌｅ）通信リンクでもよい。一般に、Ｖ２Ｖ通信概念は、直前の車両（たとえば、車両１０００と同じレーン内にある、車両１１００の直ぐ前の車両）に関する情報を提供し、一方、Ｉ２Ｖ通信概念は、さらに前の交通に関する情報を提供する。ＣＡＣＣシステムは、Ｉ２Ｖ情報ソースとＶ２Ｖ情報ソースとのいずれか又は両方を含み得る。車両１１００の前方の車両の情報を所与として、ＣＡＣＣは、より高信頼になり得、ＣＡＣＣは、交通の流れをよりスムーズにし、道路の渋滞を減らす可能性を有する。

運転者が修正行動を取ることができるように、ＦＣＷシステムは、危険を運転者に警告するように設計される。ＦＣＷシステムは、ディスプレイ、スピーカ、及び／又は振動部品など、運転者フィードバックに電気的に連結された、専用のプロセッサ、ＤＳＰ、ＦＰＧＡ、及び／又はＡＳＩＣに連結された、前向きのカメラ及び／又はＲＡＤＡＲセンサ１１６０を使用する。ＦＣＷシステムは、音響、視覚的警報、振動及び／又はクイック・ブレーキ・パルスなどの形で、警報を提供することができる。

ＡＥＢシステムは、別の車両又は他の物体との差し迫った前方衝突を検出し、運転者が指定された時間又は距離パラメータ内に修正行動を取らない場合に、ブレーキを自動的に適用することができる。ＡＥＢシステムは、専用のプロセッサ、ＤＳＰ、ＦＰＧＡ、及び／又はＡＳＩＣに連結された、前向きのカメラ及び／又はＲＡＤＡＲセンサ１１６０を使用することができる。ＡＥＢシステムが危険を検出するとき、ＡＥＢシステムは通常は、先ず、衝突を回避するための修正行動を取るように運転者に警告し、運転者が修正行動を取らない場合、ＡＥＢシステムは、予測される衝突の影響を防ぐ、又は少なくとも軽減するための努力の一環としてブレーキを自動的に適用することができる。ＡＥＢシステムは、ダイナミック・ブレーキ・サポート及び／又は衝突切迫ブレーキなどの技法を含み得る。

ＬＤＷシステムは、ハンドル又はシートの振動など、視覚的、可聴式、及び／又は触覚的警報を提供して、車両１１００が車線区分線を越えたときに運転者に警告する。ＬＤＷシステムは、運転者が、方向指示器を起動することによって、意図的な車線逸脱を指示するときには、起動しない。ＬＤＷシステムは、ディスプレイ、スピーカ、及び／又は振動部品など、運転者フィードバックに電気的に連結された、専用のプロセッサ、ＤＳＰ、ＦＰＧＡ、及び／又はＡＳＩＣに連結された、前側を向いたカメラを使用することができる。

ＬＫＡシステムは、ＬＤＷシステムの変更形態である。ＬＫＡシステムは、車両１１００が車線をはみ出し始めた場合に車両１１００を修正するためにステアリング入力又はブレーキを提供する。

ＢＳＷシステムは、自動車の死角において車両の運転者に検出及び警告する。ＢＳＷシステムは、合流又はレーンの変更が安全ではないことを指示するために視覚的、可聴式、及び／又は触覚的警告を提供することができる。システムは、運転者が方向指示器を使用するときに、付加的警告を提供することができる。ＢＳＷシステムは、運転者フィードバック、たとえば、ディスプレイ、スピーカ、及び／又は振動部品、に電気的に結合された、専用プロセッサ、ＤＳＰ、ＦＰＧＡ、及び／又はＡＳＩＣに結合された、後ろ側を向いたカメラ及び／又はＲＡＤＡＲセンサ１１６０を使用することができる。

ＲＣＴＷシステムは、車両１１００がバックしているときにリアカメラの範囲外で物体が検出されたときに視覚的、可聴式、及び／又は触覚的通知を提供することができる。いくつかのＲＣＴＷシステムは、衝突を回避するために車両ブレーキが適用されることを確実にするために、ＡＥＢを含む。ＲＣＴＷシステムは、運転者フィードバック、たとえば、ディスプレイ、スピーカ、及び／又は振動部品、に電気的に結合された、専用プロセッサ、ＤＳＰ、ＦＰＧＡ、及び／又はＡＳＩＣに結合された、１個又は複数の後ろを向いたＲＡＤＡＲセンサ１１６０を使用することができる。

従来のＡＤＡＳシステムは、運転者に警告し、安全状態が本当に存在するかどうかを運転者が判定し、それに応じて行動することを可能にするので、従来のＡＤＡＳシステムは、通常は壊滅的ではないが、運転者を悩ませている及び気を散らせていることがある誤判定結果を生み出す傾向にあることがあった。しかしながら、自律型車両１１００では、結果が矛盾する場合には、車両１１００自体が、１次的コンピュータ又は２次的コンピュータ（たとえば、第１のコントローラ１１３６又は第２のコントローラ１１３６）からの結果を聞き入れるかどうかを決定しなければならない。たとえば、一部の実施例では、ＡＤＡＳシステム１１３８は、知覚情報をバックアップ・コンピュータ合理性モジュールに提供するためのバックアップ及び／又は２次的コンピュータでもよい。バックアップ・コンピュータ合理性モニタは、ハードウェア構成要素で冗長な多様なソフトウェアを実行して、知覚及び動的運転タスクにおいて障害を検出することができる。ＡＤＡＳシステム１１３８からの出力は、監督ＭＣＵに提供され得る。１次的コンピュータ及び２次的コンピュータからの出力が矛盾する場合、監督ＭＣＵは、安全な動作を確実にするためにその矛盾をどのように調整するかを決定する必要がある。

いくつかの実例では、１次的コンピュータは、選択された結果における１次的コンピュータの信頼性を指示する、信頼性スコアを監督ＭＣＵに提供するように構成され得る。信頼性スコアが閾値を超えた場合、監督ＭＣＵは、２次的コンピュータが矛盾する又は不整合の結果を与えるかどうかにかかわらず、１次的コンピュータの指示に従い得る。信頼性スコアが閾値を満たさない場合、及び１次的及び２次的コンピュータが異なる結果を示す（たとえば、矛盾する）場合、監督ＭＣＵは、コンピュータの間で調停して適切な結果を決定することができる。

監督ＭＣＵは、２次的コンピュータが誤ったアラームを提供する状態を、１次的コンピュータ及び２次的コンピュータからの出力に少なくとも部分的に基づいて、判定するようにトレーニング及び構成されたニューラル・ネットワークを実行するように構成され得る。したがって、監督ＭＣＵ内のニューラル・ネットワークは、２次的コンピュータの出力が信頼され得るとき、及びそれが信頼され得ないときを学習することができる。たとえば、２次的コンピュータがＲＡＤＡＲベースのＦＣＷシステムであるとき、監督ＭＣＵ内のニューラル・ネットワークは、アラームをトリガする下水溝の鉄格子又はマンホールの蓋など、実際には危険ではない金属製の物をいつＦＣＷが識別しているかを学習することができる。同様に、２次的コンピュータがカメラベースのＬＤＷシステムであるとき、監督ＭＣＵ内のニューラル・ネットワークは、自転車に乗った人又は歩行者が存在し、車線逸脱が、実際には、最も安全な操作であるときに、ＬＤＷを無視することを学習することができる。監督ＭＣＵ上で実行中のニューラル・ネットワークを含む実施例では、監督ＭＣＵは、関連メモリを有するニューラル・ネットワークを実行するのに適したＤＬＡ又はＧＰＵのうちの少なくとも１個を含み得る。好ましい実施例において、監督ＭＣＵは、ＳｏＣ１１０４の構成要素を備え得る、及び／又はＳｏＣ１１０４の構成要素として含まれ得る。

他の実例において、ＡＤＡＳシステム１１３８は、コンピュータ・ビジョンの従来のルールを使用するＡＤＡＳ機能を実行する２次的コンピュータを含み得る。そのようなものとして、２次的コンピュータは、古典的コンピュータ・ビジョン・ルール（ｉｆ－ｔｈｅｎ）を使用することができ、監督ＭＣＵ内のニューラル・ネットワークの存在は、信頼性、安全性及び性能を向上させることができる。たとえば、多様な実装形態及び意図的な非同一性は、特にソフトウェア（又はソフトウェア－ハードウェア・インターフェース）機能によって引き起こされる障害に対して、システム全体をよりフォールトトレラントにする。たとえば、１次的コンピュータで実行中のソフトウェア内にソフトウェア・バグ又はエラーが存在し、２次的コンピュータで実行中の同一でないソフトウェア・コードが同じ総合的結果を提供する場合、監督ＭＣＵは、総合的結果は正しく、１次的コンピュータ上のソフトウェア又はハードウェア内のバグは重大なエラーを引き起こしていないというより大きな確信を有し得る。

いくつかの実例では、ＡＤＡＳシステム１１３８の出力は、１次的コンピュータの知覚ブロック及び／又は１次的コンピュータの動的運転タスク・ブロックに供給され得る。たとえば、ＡＤＡＳシステム１１３８が、直ぐ前の物体が原因で、前方衝突警報を示した場合、知覚ブロックは、物体を識別するときに、この情報を使用することができる。他の実例において、２次的コンピュータは、本明細書に記載のように、トレーニングされ、それ故に誤判定のリスクを減らす、独自のニューラル・ネットワークを有し得る。

車両１１００は、インフォテインメントＳｏＣ１１３０（たとえば、車両内のインフォテインメント・システム（ＩＶＩ：ｉｎ－ｖｅｈｉｃｌｅｉｎｆｏｔａｉｎｍｅｎｔｓｙｓｔｅｍ））をさらに含み得る。ＳｏＣとして図示及び記述されているが、インフォテインメント・システムは、ＳｏＣでなくてもよく、２個以上の個別の構成要素を含み得る。インフォテインメントＳｏＣ１１３０は、オーディオ（たとえば、音楽、携帯情報端末、ナビゲーション命令、ニュース、無線など）、ビデオ（たとえば、ＴＶ、映画、ストリーミングなど）、電話（たとえば、ハンズフリー通話）、ネットワーク接続（たとえば、ＬＴＥ、ＷｉＦｉなど）、及び／又は情報サービス（たとえば、ナビゲーション・システム、後方駐車支援、無線データシステム、燃料レベル、総移動距離、ブレーキ燃料レベル、オイル・レベル、ドアを開ける／閉じる、エア・フィルタ情報などの車両関連情報）を車両１１００に提供するために使用され得るハードウェア及びソフトウェアの組合せを含み得る。たとえば、インフォテインメントＳｏＣ１１３０は、無線、ディスク・プレイヤ、ナビゲーション・システム、ビデオ・プレイヤ、ＵＳＢ及びブルートゥース（登録商標）接続、カーピュータ、車内エンターテインメント、ＷｉＦｉ、ハンドル・オーディオ制御装置、ハンズ・フリー音声制御、ヘッドアップ・ディスプレイ（ＨＵＤ：ｈｅａｄｓ－ｕｐｄｉｓｐｌａｙ）、ＨＭＩディスプレイ１１３４、テレマティックス・デバイス、制御パネル（たとえば、様々な構成要素、特徴、及び／又はシステムを制御する及び／又はこれと相互に作用するための）、及び／又は他の構成要素でもよい。インフォテインメントＳｏＣ１１３０は、ＡＤＡＳシステム１１３８からの情報、計画された車両操作などの自律運転情報、軌道、周囲環境情報（たとえば、交差点情報、車両情報、道路情報など）、及び／又は他の情報など、車両のユーザへの情報（たとえば、視覚的及び／又は可聴式の）を提供するためにさらに使用され得る。

インフォテインメントＳｏＣ１１３０は、ＧＰＵ機能性を含み得る。インフォテインメントＳｏＣ１１３０は、バス１１０２（たとえば、ＣＡＮバス、イーサネット（登録商標）など）を介して、車両１１００の他のデバイス、システム、及び／又は構成要素と通信することができる。いくつかの実例では、インフォテインメント・システムのＧＰＵが、１次的コントローラ１１３６（たとえば、車両１１００の１次的及び／又はバックアップ・コンピュータ）が故障した場合に、いくつかのセルフドライブ機能を実行することができるように、インフォテインメントＳｏＣ１１３０は、監督ＭＣＵに連結され得る。そのような実例では、インフォテインメントＳｏＣ１１３０は、本明細書に記載のように、車両１１００をショーファーの安全停止モードにすることができる。

車両１１００は、計器群１１３２（たとえば、デジタル・ダッシュ、電子計器群、デジタル計器パネルなど）をさらに含み得る。計器群１１３２は、コントローラ及び／又はスーパーコンピュータ（たとえば、個別のコントローラ又はスーパーコンピュータ）を含み得る。計器群１１３２は、スピードメーター、燃料レベル、油圧、タコメーター、オドメーター、方向指示器、ギアシフト位置インジケータ、シート・ベルト警告灯、パーキングブレーキ警告灯、エンジン故障灯、エアバッグ（ＳＲＳ）システム情報、照明制御装置、安全システム制御装置、ナビゲーション情報など、１セットの器具類を含み得る。いくつかの実例では、情報は、インフォテインメントＳｏＣ１１３０及び計器群１１３２の間で表示及び／又は共有され得る。言い換えれば、計器群１１３２は、インフォテインメントＳｏＣ１１３０の一部として含まれてもよく、逆もまた同様である。

図１１Ｄは、本開示のいくつかの実施例による、図１１Ａのクラウドベースのサーバと例示的自律型車両１１００との間の通信のシステム図である。システム１１７６は、サーバ１１７８、ネットワーク１１９０、及び、車両１１００を含む車両を含み得る。サーバ１１７８は、複数のＧＰＵ１１８４（Ａ）～１２８４（Ｈ）（本明細書でＧＰＵ１１８４と総称される）、ＰＣＩｅスイッチ１１８２（Ａ）～１１８２（Ｈ）（本明細書でＰＣＩｅスイッチ１１８２と総称される）、及び／又はＣＰＵ１１８０（Ａ）～１１８０（Ｂ）（本明細書でＣＰＵ１１８０と総称される）を含み得る。ＧＰＵ１１８４、ＣＰＵ１１８０、及びＰＣＩｅスイッチは、たとえば、ＮＶＩＤＩＡによって開発されたＮＶＬｉｎｋインターフェース１１８８及び／又はＰＣＩｅ接続１１８６などの、これらに限定されない、高速相互接続で相互に接続され得る。いくつかの実例では、ＧＰＵ１１８４は、ＮＶＬｉｎｋ及び／又はＮＶＳｗｉｔｃｈＳｏＣを介して接続され、ＧＰＵ１１８４及びＰＣＩｅスイッチ１１８２は、ＰＣＩｅ相互接続を介して接続される。８個のＧＰＵ１１８４、２個のＣＰＵ１１８０、及び２個のＰＣＩｅスイッチが図示されているが、これは制限を意図されていない。実施例に応じて、それぞれのサーバ１１７８は、任意の数のＧＰＵ１１８４、ＣＰＵ１１８０、及び／又はＰＣＩｅスイッチを含み得る。たとえば、サーバ１１７８は、それぞれ、８個、１６個、３２個、及び／又はそれ以上のＧＰＵ１１８４を含み得る。

サーバ１１７８は、最近開始された道路工事など、予想外の又は変更された道路状態を示す画像を表す画像データを、ネットワーク１１９０を介して、車両から、受信することができる。サーバ１１７８は、ニューラル・ネットワーク１１９２、更新されたニューラル・ネットワーク１１９２、及び／又は、交通及び道路状態に関する情報を含むマップ情報１１９４をネットワーク１１９０を介して車両に送信することができる。マップ情報１１９４の更新は、建設現場、くぼみ、迂回路、洪水、及び／又は他の障害物に関する情報など、ＨＤマップ１１２２の更新を含み得る。いくつかの実例では、ニューラル・ネットワーク１１９２、更新されたニューラル・ネットワーク１１９２、及び／又はマップ情報１１９４は、環境において任意の数の車両から受信されたデータにおいて表された新しいトレーニング及び／又は経験から、及び／又は（たとえば、サーバ１１７８及び／又は他のサーバを使用する）データセンタにおいて実行されたトレーニングに少なくとも部分的に基づいて、生じた可能性がある。

サーバ１１７８は、トレーニング・データに少なくとも部分的に基づいてマシン学習モデル（たとえば、ニューラル・ネットワーク）をトレーニングするために使用され得る。トレーニング・データは、車両によって生成され得る、及び／又は（たとえば、ゲーム・エンジンを使用して）シミュレーションにおいて生成され得る。いくつかの実例では、トレーニング・データは、タグ付けされる（たとえば、ニューラル・ネットワークが、監督された学習の恩恵を受ける場合）及び／又は他の事前処理を受けるが、他の実例において、トレーニング・データは、タグ付け及び／又は事前処理されない（たとえば、ニューラル・ネットワークが、監督された学習を必要としない場合）。マシン学習モデルがトレーシングされた後は、マシン学習モデルは、車両によって使用され得（たとえば、ネットワーク１１９０を介して車両に送信される）、及び／又は、マシン学習モデルは、車両を遠隔監視するために、サーバ１１７８によって使用され得る。

いくつかの実例では、サーバ１１７８は、車両からデータを受信し、リアルタイムのインテリジェント推論のために最新のリアルタイムのニューラル・ネットワークにデータを適用することができる。サーバ１１７８は、ＮＶＩＤＩＡによって開発されたＤＧＸ及びＤＧＸステーション・マシンなど、ＧＰＵ１１８４によって電力供給される深層学習スーパーコンピュータ及び／又は専用のＡＩコンピュータを含み得る。しかしながら、一部の実例では、サーバ１１７８は、ＣＰＵ電源式データセンタのみを使用する深層学習インフラストラクチャを含み得る。

サーバ１１７８の深層学習インフラストラクチャは、高速のリアルタイム推論の能力を有することでき、その能力を使用して車両１１００内のプロセッサ、ソフトウェア、及び／又は関連ハードウェアの調子を評価及び検証することができる。たとえば、深層学習インフラストラクチャは、車両１１００がそのシーケンスの画像内に位置したシーケンスの画像及び／又は物体など、車両１１００からの定期的更新を受信することができる（たとえば、コンピュータ・ビジョン及び／又は他のマシン学習物体分類技法を介して）。深層学習インフラストラクチャは、物体を識別し、車両１１００によって識別された物体とそれらを比較するために、独自のニューラル・ネットワークを実行することができ、結果が一致せず、インフラストラクチャが、車両１１００内のＡＩは正常に機能していないという結論を下した場合、サーバ１１７８は、制御を推測し、乗客に通知し、安全な駐車操作を完了するように車両１１００のフェイルセーフ・コンピュータに命じる車両１１００への信号を送信することができる。

推論のために、サーバ１１７８は、ＧＰＵ１１８４及び１個又は複数のプログラマブル推論加速装置（たとえば、ＮＶＩＤＩＡのＴｅｎｓｏｒＲＴ３）を含み得る。ＧＰＵ電源式サーバ及び推論加速の組合せは、リアルタイムの反応性を可能にすることができる。パフォーマンスがさほど必要とされない場合など、他の実例では、ＣＰＵ、ＦＰＧＡ、及び他のプロセッサによって電力供給されるサーバが、推論のために使用され得る。

例示的計算デバイス
図１２は、物体検出器１０６及びネットワーク５０２の１個若しくは複数の部分などの、本開示のいくつかの実施例の実装において使用するのに適した例示的計算デバイス１２００のブロック図である。計算デバイス１２００は、以下のデバイスを間接的に又は直接的につなぐバス１２０２を含み得る：メモリ１２０４、１個又は複数の中央処理装置（ＣＰＵ）１２０６、１個又は複数のグラフィック処理ユニット（ＧＰＵ）１２０８、通信インターフェース１２１０、入力／出力（Ｉ／Ｏ）ポート１２１２、入力／出力構成要素１２１４、電力供給装置１２１６、及び１個又は複数の提示構成要素１２１８（たとえば、ディスプレイ）。

図１２の様々なブロックは、線でバス１２０２を介して接続しているように示されているが、これは制限することを意図されておらず、単に分かりやすくするためである。たとえば、一部の実施例では、表示デバイスなどの提示構成要素１２１８は、Ｉ／Ｏ構成要素１２１４と考えられ得る（たとえば、ディスプレイがタッチ・スクリーンである場合）。別の実例として、ＣＰＵ１２０６及び／又はＧＰＵ１２０８はメモリを含み得る（たとえば、メモリ１２０４は、ＧＰＵ１２０８、ＣＰＵ１２０６、及び／又は他の構成要素のメモリに加えた記憶デバイスを表し得る）。言い換えれば、図１２の計算デバイスは、単に例示である。「ワークステーション」、「サーバ」、「ラップトップ」、「デスクトップ」、「タブレット」、「クライアント・デバイス」、「モバイル・デバイス」、「ハンドヘルド・デバイス」、「ゲーム機」、「電子制御ユニット（ＥＣＵ：ｅｌｅｃｔｒｏｎｉｃｃｏｎｔｒｏｌｕｎｉｔ）」、「仮想現実システム」、及び／又は他のデバイス若しくはシステム・タイプなどのカテゴリはすべて、図１２の計算デバイスの範囲内にあることが意図されているので、これらは区別されない。

バス１２０２は、１個又は複数のバス、たとえば、アドレス・バス、データ・バス、制御バス、又はその組合せ、を表し得る。バス１２０２は、１個又は複数のバス・タイプ、たとえば、業界標準アーキテクチャ（ＩＳＡ：ｉｎｄｕｓｔｒｙｓｔａｎｄａｒｄａｒｃｈｉｔｅｃｔｕｒｅ）バス、拡張業界標準アーキテクチャ（ＥＩＳＡ：ｅｘｔｅｎｄｅｄｉｎｄｕｓｔｒｙｓｔａｎｄａｒｄａｒｃｈｉｔｅｃｔｕｒｅ）バス、ＶＥＳＡ（ｖｉｄｅｏｅｌｅｃｔｒｏｎｉｃｓｓｔａｎｄａｒｄｓａｓｓｏｃｉａｔｉｏｎ）バス、周辺構成要素相互接続（ＰＣＩ：ｐｅｒｉｐｈｅｒａｌｃｏｍｐｏｎｅｎｔｉｎｔｅｒｃｏｎｎｅｃｔ）バス、周辺構成要素相互接続エクスプレス（ＰＣＩｅ：ｐｅｒｉｐｈｅｒａｌｃｏｍｐｏｎｅｎｔｉｎｔｅｒｃｏｎｎｅｃｔｅｘｐｒｅｓｓ）バス、及び／又は別のタイプのバス、を含み得る。

メモリ１２０４は、様々なコンピュータ可読媒体のいずれかを含み得る。コンピュータ可読媒体は、計算デバイス１２００によってアクセスすることができる任意の利用可能な媒体でもよい。コンピュータ可読媒体は、揮発性及び不揮発性媒体の両方、及び取り外し可能な及び取り外し不可能な媒体を含み得る。例として、しかし限定ではなく、コンピュータ可読媒体は、コンピュータ記憶媒体及び通信媒体を備え得る。

コンピュータ記憶媒体は、コンピュータ可読命令、データ構造体、プログラム・モジュール、及び／又は他のデータ・タイプなどの情報の記憶のための任意の方法又は技術において実装された揮発性及び不揮発性媒体及び／又は取り外し可能な及び取り外し不可能な媒体の両方を含み得る。たとえば、メモリ１２０４は、（たとえば、オペレーティング・システムなど、プログラム及び／又はプログラム要素を表す）コンピュータ可読命令を記憶することができる。コンピュータ記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリ又は他のメモリ技術、ＣＤ－ＲＯＭ、デジタル多用途ディスク（ＤＶＤ：ｄｉｇｉｔａｌｖｅｒｓａｔｉｌｅｄｉｓｋ）又は他の光ディスク・ストレージ、磁気カセット、磁気テープ、磁気ディスク・ストレージ又は他の磁気記憶デバイス、或いは、所望の情報を記憶するために使用し得る及び計算デバイス１２００によってアクセスし得る任意の他の媒体を含み得るが、これらに限定されない。本明細書では、コンピュータ記憶媒体は、信号自体を含まない。

通信媒体は、搬送波などの変調データ信号又は他の移送機構においてコンピュータ可読命令、データ構造体、プログラム・モジュール、及び／又は他のデータ・タイプを実施することができ、任意の情報配信媒体を含む。「変調データ信号」という用語は、その特性セットのうちの１個又は複数を有する或いは信号内の情報をエンコードするような方式で変化した信号を指し得る。例として、しかし限定せず、通信媒体は、ワイヤード・ネットワーク又は直接ワイヤード接続などのワイヤード媒体と、音響、ＲＦ、赤外線及び他のワイヤレス媒体などのワイヤレス媒体とを含み得る。前述のいずれかの組合せもまた、コンピュータ可読媒体の範囲に含まれるべきである。

ＣＰＵ１２０６は、計算デバイス１２００の１個又は複数の構成要素を制御して本明細書に記載の方法及び／又はプロセス（たとえば、図２、５Ａ、及び７～９にあるプロセス）のうちの１個又は複数を実行するためにコンピュータ可読命令を実行するように構成され得る。ＣＰＵ１２０６は、多数のソフトウェア・スレッドを同時に処理する能力を有する１個又は複数の（たとえば、１個、２個、４個、８個、２８個、７２個などの）コアをそれぞれ含み得る。ＣＰＵ１２０６は、任意のタイプのプロセッサを含み得、実装された計算デバイス１２００のタイプに応じて、異なるタイプのプロセッサを含み得る（たとえば、モバイル・デバイスのためのより少数のコアを有するプロセッサ、及びサーバのためのより多数のコアを有するプロセッサ）。たとえば、計算デバイス１２００のタイプに応じて、プロセッサは、縮小命令セット計算（ＲＩＳＣ：ＲｅｄｕｃｅｄＩｎｓｔｒｕｃｔｉｏｎＳｅｔＣｏｍｐｕｔｉｎｇ）を使用して実装されたＡＲＭプロセッサ、又は複合命令セット計算（ＣＩＳＣ：ＣｏｍｐｌｅｘＩｎｓｔｒｕｃｔｉｏｎＳｅｔＣｏｍｐｕｔｉｎｇ）を使用して実装されたｘ８６プロセッサでもよい。計算デバイス１２００は、計算コプロセッサなど、１個又は複数のマイクロプロセッサ又は補助コプロセッサ内の１個又は複数のＣＰＵ１２０６を含み得る。

ＧＰＵ１２０８は、グラフィックス（たとえば、３Ｄグラフィックス）をレンダリングするために、計算デバイス１２００によって使用され得る。ＧＰＵ１２０８は、同時に数百又は数千のソフトウェア・スレッドを処理する能力を有する数百又は数千のコアを含み得る。ＧＰＵ１２０８は、レンダリング・コマンド（たとえば、ホスト・インターフェースを介して受信されたＣＰＵ１２０６からのレンダリング・コマンド）に応答して、出力画像のための画素データを生成することができる。ＧＰＵ１２０８は、画素データを記憶するためのグラフィックス・メモリ、たとえば表示メモリ、を含み得る。表示メモリは、メモリ１２０４の一部として含まれ得る。ＧＰＵ１２０８は、並行して動作する（たとえば、リンクを介して）２個以上のＧＰＵを含み得る。ともに結合されるとき、各ＧＰＵ１２０８は、出力画像の異なる部分の又は異なる出力画像の画素データ（たとえば、第１の画像の第１のＧＰＵ及び第２の画像の第２のＧＰＵ）を生成することができる。各ＧＰＵは、独自のメモリを含むことができ、又は他のＧＰＵとメモリを共有することができる。

計算デバイス１２００がＧＰＵ１２０８を含まない実例において、ＣＰＵ１２０６が、グラフィックスをレンダリングするために使用され得る。

通信インターフェース１２１０は、ワイヤード及び／又はワイヤレス通信を含む、電子通信ネットワークを介して計算デバイス１２００が他の計算デバイスと通信することを可能にする、１個又は複数のレシーバ、トランスミッタ、及び／又はトランシーバを含み得る。通信インターフェース１２１０は、ワイヤレス・ネットワーク（たとえば、Ｗｉ－Ｆｉ、Ｚ－Ｗａｖｅ、ブルートゥース（登録商標）、ブルートゥース（登録商標）ＬＥ、ＺｉｇＢｅｅなど）、ワイヤード・ネットワーク（たとえば、イーサネット（登録商標）を介して通信すること）、低電力ワイド・エリア・ネットワーク（たとえば、ＬｏＲａＷＡＮ、ＳｉｇＦｏｘなど）、及び／又はインターネットなどの、いくつかの異なるネットワークのうちのいずれかを介する通信を可能にするための構成要素及び機能を含み得る。

Ｉ／Ｏポート１２１２は、そのうちのいくつかは計算デバイス１２００に内蔵（たとえば、統合）され得る、Ｉ／Ｏ構成要素１２１４、提示構成要素１２１８、及び／又は他の構成要素を含む、他のデバイスに計算デバイス１２００が論理的に連結されることを可能にすることができる。例示的なＩ／Ｏ構成要素１２１４は、マイクロフォン、マウス、キーボード、ジョイスティック、ゲーム・パッド、ゲーム・コントローラ、サテライト・ディッシュ、スキャナ、プリンタ、ワイヤレス・デバイスなどを含む。Ｉ／Ｏ構成要素１２１４は、エア・ジェスチャ、音声、又は、ユーザによって生成される他の生理的入力を処理する自然ユーザ・インターフェース（ＮＵＩ：ｎａｔｕｒａｌｕｓｅｒｉｎｔｅｒｆａｃｅ）を提供することができる。場合によっては、入力は、さらなる処理のための適切なネットワーク要素に送信され得る。ＮＵＩは、音声認識、スタイラス認識、顔認識、生体認識、画面上での及び画面の隣でのジェスチャ認識、エア・ジェスチャ、頭部及び視標追跡、並びに計算デバイス１２００のディスプレイに関連するタッチ認識（さらに詳しく後述するような）の任意の組合せを実装し得る。計算デバイス１２００は、ジェスチャ検出及び認識のための、ステレオスコープ・カメラ・システム、赤外線カメラ・システム、ＲＧＢカメラ・システム、タッチ画面技術、及びこれらの組合せなど、深度カメラを含み得る。追加で、計算デバイス１２００は、動きの検出を可能にする加速度計又はジャイロスコープを含み得る（たとえば、慣性測定ユニット（ＩＭＵ：ｉｎｅｒｔｉａｍｅａｓｕｒｅｍｅｎｔｕｎｉｔ）の一部として）。いくつかの実例では、加速度計又はジャイロスコープの出力は、没入型拡張現実又は仮想現実をレンダリングするために、計算デバイス１２００によって使用され得る。

電力供給装置１２１６は、ハードワイヤード電力供給装置、バッテリ電力供給装置、又はその組合せを含み得る。電力供給装置１２１６は、計算デバイス１２００の構成要素が動作することを可能にするために計算デバイス１２００に電力を提供することができる。

提示構成要素１２１８は、ディスプレイ（たとえば、モニタ、タッチ画面、テレビジョン画面、ヘッドアップ表示装置（ＨＵＤ）、他のディスプレイタイプ、又はその組合せ）、スピーカ、及び／又は他の提示構成要素を含み得る。提示構成要素１２１８は、他の構成要素（たとえば、ＧＰＵ１２０８、ＣＰＵ１２０６など）からデータを受信し、データを（たとえば、画像、ビデオ、音響などとして）出力することができる。１個の態様において、提示構成要素は、駐車スペース、駐車スペースへの入口、又はその任意の組合せを線で描写する画像（たとえば、５２５）を表示し得る。

本開示は、コンピュータ又は、携帯情報端末若しくは他のハンドヘルド・デバイスなどの、他のマシンによって実行されている、プログラム・モジュールなどのコンピュータ実行可能命令を含む、コンピュータ・コード又はマシン使用可能命令との一般的関連において説明されることがある。一般に、ルーティン、プログラム、オブジェクト、構成要素、データ構造体などを含むプログラム・モジュールは、特定のタスクを実行する又は特定の抽象データ・タイプを実装するコードを指す。本開示は、ハンドヘルド・デバイス、家電製品、汎用コンピュータ、より特殊な計算デバイスなどを含む、様々な構成で実施され得る。本開示はまた、通信ネットワークを介してリンクされた遠隔処理デバイスによってタスクが実行される分散型コンピューティング環境において実施され得る。

本明細書では、２個以上の要素に関する「及び／又は」の記述は、１個の要素のみ、又は要素の組合せを意味すると解釈されるべきである。たとえば、「要素Ａ、要素Ｂ、及び／又は要素Ｃ」は、要素Ａのみ、要素Ｂのみ、要素Ｃのみ、要素Ａ及び要素Ｂ、要素Ａ及び要素Ｃ、要素Ｂ及び要素Ｃ、或いは、要素Ａ、Ｂ、及びＣを含み得る。加えて、「要素Ａ又は要素Ｂのうちの少なくとも１個」は、要素Ａの少なくとも１個、要素Ｂの少なくとも１個、或いは、要素Ａの少なくとも１個及び要素Ｂの少なくとも１個を含み得る。さらに、「要素Ａ及び要素Ｂのうちの少なくとも１個」は、要素Ａのうちの少なくとも１個、要素Ｂのうちの少なくとも１個、或いは、要素Ａのうちの少なくとも１個及び要素Ｂのうちの少なくとも１個を含み得る。

本開示の主題は、法定の要件を満たすために特異性を有して記述されている。しかしながら、その記述自体が本開示の範囲を制限することは意図されていない。そうではなくて、本発明者は、請求されている主題が、他の現在の又は未来の技術と併せて、異なるステップ又は本文書に記載されたものと類似のステップの組合せを含むように、他の形で実施され得ることを意図している。さらに、「ステップ」及び／又は「ブロック」という用語は、使用される方法の異なる要素を含意するように本明細書で使用され得るが、これらの用語は、個別のステップの順番が明示的に記載されていない限り及びそのように記載されているときを除いて本明細書で開示される様々なステップの間に何らかの特定の順番を暗示するものとして解釈されるべきではない。

Claims

駐車スペースを表す画像データをニューラル・ネットワークに適用するステップと、前記画像データから生成された及びアンカ形状のコーナー・ポイントへの変位値を表すデータを、前記ニューラル・ネットワークを使用して、受信するステップと、スキューされたポリゴンのコーナー・ポイントを前記アンカ形状の前記コーナー・ポイントへの前記変位値から判定するステップと、前記スキューされたポリゴンの前記コーナー・ポイントと前記駐車スペースのグラウンド・トゥルース・コーナー・ポイントとの間の第１の距離を計算するステップと、前記第１の距離に少なくとも部分的に基づいてサンプル格付けを決定するステップと、前記サンプル格付けが閾値未満であることに基づいて、陽性トレーニング・サンプルとして前記アンカ形状を使用して前記ニューラル・ネットワークのパラメータを更新するステップとを含む、コンピュータ実施方法。
前記第１の距離が、最小総距離を含み、前記サンプル格付けが、前記最小総距離の正規化されたバージョンである、請求項１に記載の方法。
前記サンプル格付けを決定するステップが、前記駐車スペースの前記グラウンド・トゥルース・コーナー・ポイントによって定義されたポリゴンのエリアに少なくとも部分的に基づいて前記第１の距離を正規化するステップを含む、請求項１に記載の方法。
前記スキューされたポリゴンが、第１のスキューされた四角形であり、前記アンカ形状が、第２のスキューされた四角形である、請求項１に記載の方法。
前記アンカ形状が、１個又は複数のグラウンド・トゥルース・サンプルから生成されたデータ駆動型アンカ・ボックスである、請求項１に記載の方法。
前記第１の距離が、前記駐車スペースの前記グラウンド・トゥルース・コーナー・ポイントを有する前記スキューされたポリゴンの前記コーナー・ポイントの異なる組合せの間の最小平均距離である、請求項１に記載の方法。
前記スキューされたポリゴンの前記コーナー・ポイントが、第１のコーナー（Ａ１）、第２のコーナー（Ａ２）、第３のコーナー（Ａ３）、及び第４のコーナー（Ａ４）を含み、前記駐車スペースの前記グラウンド・トゥルース・コーナー・ポイントの前記コーナー・ポイントが、第５のコーナー（Ｂ１）、第６のコーナー（Ｂ２）、第７のコーナー（Ｂ３）、及び第８のコーナー（Ｂ４）を含み、前記第１の距離を計算するステップが、距離（Ａ１、Ｂ１）、（Ａ２、Ｂ２）、（Ａ３、Ｂ３）、及び（Ａ４、Ｂ４）からの第１の正規化された総距離と、距離（Ａ１、Ｂ２）、（Ａ２、Ｂ３）、（Ａ３、Ｂ４）、及び（Ａ４、Ｂ１）からの第２の正規化された総距離と、距離（Ａ１、Ｂ３）、（Ａ２、Ｂ４）、（Ａ３、Ｂ１）、及び（Ａ４、Ｂ２）からの第３の正規化された総距離と、距離（Ａ１、Ｂ４）、（Ａ２、Ｂ１）、（Ａ３、Ｂ２）、及び（Ａ４、Ｂ３）からの第４の正規化された総距離とを計算するステップを含み、前記第１の距離が、前記第１の正規化された総距離、前記第２の正規化された総距離、前記第３の正規化された総距離、及び前記第４の正規化された総距離のうちで最小である、請求項１に記載の方法。
環境内の少なくとも１個のセンサの視界を表すセンサ・データをニューラル・ネットワークに適用するステップと、前記センサ・データから生成された第１のデータ及び第２のデータを前記ニューラル・ネットワークから受信するステップであって、前記第１のデータはアンカ形状のコーナー・ポイントへの変位値を表し、前記第２のデータは、前記アンカ形状が前記少なくとも１個のセンサの前記視界内の駐車スペースに対応する可能性を予測する信頼度値を表す、受信するステップと、前記信頼度値が閾値を超えることに少なくとも部分的に基づいて、前記アンカ形状の前記コーナー・ポイントへの前記変位値に対応するスキューされたポリゴンのコーナー・ポイントを判定するステップとを含む、コンピュータ実施方法。
前記アンカ形状が、前記ニューラル・ネットワークの空間要素に関連付けられた複数のアンカ形状のうちのものであり、前記ニューラル・ネットワークが、前記複数のアンカ形状の各所与のアンカ形状について、前記所与のアンカ形状のコーナー・ポイントへの変位値と、前記所与のアンカ形状が前記少なくとも１個のセンサの前記視界内の対応する駐車スペースに対応する、対応する可能性を予測する信頼度値と、を表すデータを出力する、請求項８に記載の方法。
前記アンカ形状が、前記ニューラル・ネットワークの空間要素のグリッドに関連付けられた複数のアンカ形状のうちのものであり、前記ニューラル・ネットワークが、前記複数のアンカ形状の各所与のアンカ形状について、前記所与のアンカ形状のコーナー・ポイントへの変位値と、前記所与のアンカ形状が前記少なくとも１個のセンサの視界内の対応する駐車スペースに対応する、対応する可能性を予測する信頼度値と、を表すデータを出力する、請求項８に記載の方法。
前記センサ・データが、カメラの視界を表す画像データを含む、請求項８に記載の方法。
前記アンカ形状が、前記ニューラル・ネットワークの１個又は複数の空間要素に関連付けられた複数のアンカ形状のうちのものであり、前記複数のアンカ形状が、スキューされたポリゴンの異なる形状を含む、請求項８に記載の方法。
前記スキューされたポリゴンが第１のスキューされた四角形であり、前記アンカ形状が第２のスキューされた四角形である、請求項８に記載の方法。
前記スキューされたポリゴンの前記コーナー・ポイントが前記少なくとも１個のセンサの前記視界内の前記駐車スペースへの入口を定義する可能性を予測する信頼度値を表す第３のデータを、前記ニューラル・ネットワークから受信するステップと、前記信頼度値に少なくとも部分的に基づいて前記アンカ形状の前記コーナー・ポイントのサブセットを選択するステップと、前記サブセットの前記コーナー・ポイントから前記駐車スペースへの前記入口を識別するステップとをさらに含む、請求項８に記載の方法。
前記スキューされたポリゴンの前記コーナー・ポイントに少なくとも部分的に基づいて自律型車両の１個又は複数の動作を制御するステップをさらに含む、請求項８に記載の方法。
環境内の少なくとも１個のセンサの視界を表すセンサ・データをニューラル・ネットワークに適用するステップと、画像データから生成された第１のデータ及び第２のデータを前記ニューラル・ネットワークから受信するステップであって、前記第１のデータが、アンカ形状のコーナー・ポイントへの変位値を表し、前記第２のデータが、前記アンカ形状の前記コーナー・ポイントが前記少なくとも１個のセンサの前記視界において駐車スポットへの入口を定義する可能性を予測する信頼度値を表す、受信するステップと、前記信頼度値に基づいて前記アンカ形状の前記コーナー・ポイントのサブセットを選択するステップと、前記サブセットの前記コーナー・ポイントから前記駐車スポットへの前記入口を識別するステップとを含む、コンピュータ実施方法。
スキューされたポリゴンのコーナー・ポイントを前記アンカ形状の前記コーナー・ポイントへの前記変位値から判定するステップと、前記スキューされたポリゴンの前記コーナー・ポイント及び前記駐車スポットへの前記入口に少なくとも部分的に基づいて自律型車両の１個又は複数の動作を制御するステップとをさらに含む、請求項１６に記載のコンピュータ実施方法。
前記アンカ形状が、スキューされたポリゴンである、請求項１６に記載の方法。
前記アンカ形状が、前記ニューラル・ネットワークの空間要素に関連付けられた複数のアンカ形状のうちのものであり、前記ニューラル・ネットワークが、前記複数のアンカ形状の各所与のアンカ形状について、前記所与のアンカ形状のコーナー・ポイントへの変位値と、前記所与のアンカ形状の前記コーナー・ポイントが前記少なくとも１個のセンサの前記視界における対応する駐車スポットへの所与の入口を定義する対応する可能性を予測する信頼度値と、を表すデータを出力する、請求項１６に記載の方法。
前記アンカ形状が、前記ニューラル・ネットワークの空間要素のグリッドに関連付けられた複数のアンカ形状のうちのものであり、前記ニューラル・ネットワークが、前記複数のアンカ形状の各所与のアンカ形状について、前記所与のアンカ形状のコーナー・ポイントへの変位値と、前記所与のアンカ形状の前記コーナー・ポイントが前記少なくとも１個のセンサの前記視界における対応する駐車スポットへの所与の入口を定義する対応する可能性を予測する信頼度値と、を表すデータを出力する、請求項１６に記載の方法。