JP7060625B2

JP7060625B2 - 自動運転車において３ｄｃｎｎネットワークを用いてソリューション推断を行うｌｉｄａｒ測位

Info

Publication number: JP7060625B2
Application number: JP2019567358A
Authority: JP
Inventors: ウェイシンルー，; ヤオヂョウ，; グォウェイワン，; シェンファホウ，; シーユーソン，
Original assignee: Baidu com Times Technology Beijing Co Ltd; Baidu USA LLC
Current assignee: Baidu com Times Technology Beijing Co Ltd; Baidu USA LLC
Priority date: 2019-01-30
Filing date: 2019-01-30
Publication date: 2022-04-26
Anticipated expiration: 2039-01-30
Also published as: WO2020154972A1; EP3714290B1; JP2021515724A; KR102292277B1; EP3714290A1; EP3714290A4; US11531110B2; US20210373161A1; CN111771141B; CN111771141A; KR20200096408A

Description

本願の実施形態は、主に自動運転車の操作に関し、具体的には、自動運転車の測位のための光検出および測距（ＬＩＤＡＲ）測位においてニューラルネットワークを用いてソリューション推断を行うことに関する。

自動運転車（ＡＤＶ）は、乗員（特に運転手）を、幾つかの運転関連の責務から解放することができる。自動運転モードで運行する時、車両は、車載センサ及び高精細度の地図を使用して各位置にナビゲートされることができ、故に車両を最小のマン・マシン・インタラショションの状況で、または乗客がまったくいない状況で運行させることができる。

安全運転のため、ＡＤＶは、その位置及び向きを精度よく且つ確実に推定する必要がある。理想としては、ＡＤＶの測位は、センチメートル及びサブディグリー（ｓｕｂ－ｄｅｇｒｅｅ）の方位角までの正確を必要とする。光検出および測距（ＬＩＤＡＲ）スキャナーを使用する従来の測位方法は、測位のパイプラインにおいて幾つかの段階が必要とすることが多い。従来技術のいくつかは、異なるシーンでの測位精度およびロバスト性に優れた性能を有するが、パイプラインにおけるいくつかの段階をハードコーディングし微調整ために多くのエンジニアリングの労力を必要とするとともに、いくつかのシーンに対して強い選好を有する。一方、ニューラルネットワークは、既に語義を処理するために用いられ、既に良好な結果が実現できたが、ニューラルネットワークは、３Ｄ幾何学に関するタスク（例えば、測位問題）を解決するには不足がある。

第一の態様においては、ＬＩＤＡＲ測位においてニューラルネットワークを用いてソリューション推断を行うコンピュータ実施の方法であって、ＡＤＶの予測ポーズに用いられる、オンラインポイントクラウドからのキーポイントと事前作成されたポイントクラウド地図上の対応するキーポイントとのマッチングコストを表す複数のサブボリュームを備えるコストボリュームを解空間内において作成することと、前記マッチングコストをリファインするように複数の畳み込みニューラルネットワークを用いて前記コストボリュームを正則化することと、正則化されたコストボリュームから前記予測ポーズの、前記自動運転車の位置を特定するために用いられる最適なオフセットを推定することと、を含むことを特徴とするコンピュータ実施の方法を提供する。

第二の態様においては、ＬＩＤＡＲ測位においてニューラルネットワークを用いてソリューション推断を行うポイントクラウド特徴を抽出するシステムであって、プロセッサと、プロセッサに接続され、命令を記憶するメモリと、を含み、前記命令は、前記プロセッサによって実行されると、ＡＤＶの予測ポーズに用いられる、オンラインポイントクラウドからのキーポイントと事前作成されたポイントクラウド地図上の対応するキーポイントとのマッチングコストを表す複数のサブボリュームを備えるコストボリュームを解空間内において作成することと、前記マッチングコストをリファインするように複数の畳み込みニューラルネットワークを用いて前記コストボリュームを正則化することと、正則化されたコストボリュームから前記予測ポーズの、前記自動運転車の位置を特定するために用いられる最適なオフセットを推定することと、を含む操作をプロセッサに実行させることを特徴とするシステムを提供する。

第三の態様においては、指令を記憶している非一時性機器可読メディアであって、前記指令は、プロセッサによって実行されると、前記プロセッサに、ＬＩＤＡＲ測位においてニューラルネットワークを用いてソリューション推断を行うためのポイントクラウド特徴を抽出する操作を実行させ、前記操作は、ＡＤＶの予測ポーズに用いられる、オンラインポイントクラウドからのキーポイントと事前作成されたポイントクラウド地図上の対応するキーポイントとのマッチングコストを表す複数のサブボリュームを備えるコストボリュームを解空間内において作成することと、前記マッチングコストをリファインするように複数の畳み込みニューラルネットワークを用いて前記コストボリュームを正則化することと、正則化されたコストボリュームから前記予測ポーズの、前記自動運転車の位置を特定するために用いられる最適なオフセットを推定することと、を含むことを特徴とする機器可読メディアを提供する。

本開示の実施態様は図面の各図において限定的ではなく例示的に示され、図面において同様の参照符号が同様の素子を示す。

本発明の一実施態様にかかる自動運転車両のネットワーク構成を示すブロック図である。一実施態様にかかる自動運転車両の一例を示すブロック図である。一実施態様にかかる自動運転車両とともに使用される感知・計画システムの例を示すブロック図である。一実施態様にかかる自動運転車両とともに使用される感知・計画システムの例を示すブロック図である。本発明の実施形態にかかる学習に基づくＬＩＤＡＲ測位システムを示す図である。実施形態にかかるポイントクラウド特徴を抽出するためのシステムを示す図である。実施形態にかかるポイントクラウド特徴を抽出するためのシステムの例示的な実施例を示す図である。実施形態にかかるポイントクラウド特徴を抽出する例示的なプロセスを示すフローチャートである。実施形態にかかるＬＩＤＡＲ測位においてニューラルネットワークを使用してソリューションを推断するシステムを示す図である。実施形態にかかるＬＩＤＡＲ測位においてニューラルネットワークを使用してソリューションを推断するシステムの例示的な実施例を示す図である。実施形態にかかるＬＩＤＡＲ測位においてニューラルネットワークを使用してソリューションを推断する例示的なプロセスを示すフローチャートである。実施形態にかかるＡＤＶの測位結果において時間平滑化を行うシステムを示す図である。実施形態にかかるＡＤＶの測位結果において時間平滑化を行うシステムの例示的な実施例を示す図である。本実施形態にかかるＡＤＶの測位結果において時間平滑化を行う例示的なプロセスを示すフローチャートである。実施形態にかかる学習に基づくＬＩＤＡＲ測位システム１４００の全体的アーキテクチャを示す図である。実施形態にかかる学習に基づくＬＩＤＡＲ測位システム１５００の全体的アーキテクチャをより詳細に示す図である。本発明の一実施態様とともに使用可能なデータ処理システムの例を示すブロック図である。

以下、検討する詳細を参照しながら本発明の各実施態様及び局面を記載して、図面において前記各実施態様を示す。下記記載及び図面は、本開示を説明するためのものであり、本発明を限定するためのものとして解釈されるべきではない。特定の詳細を多く記載することは、本開示の各実施態様を完全に理解するためである。しかしながら、本発明の実施態様を簡潔的に検討するために、周知または通常の詳細を記載しない場合がある。

本明細書において「一実施態様」または「実施態様」を言及することは、当該実施態様によって説明される特定の特徴、構成や特性が本発明の少なくとも１つの実施態様に含まれることを意味する。「一実施態様では」という語句の本明細書における各箇所での記載のすべては、必ずしも同一の実施態様を指すことに限定されない。

一実施形態によれば、本明細書では、ＡＤＶが使用する複数のニューラルネットワークを含む、学習に基づくＬＩＤＡＲ測位システムを説明する。学習に基づくＬＩＤＡＲ測位システムは、手作業で作成されたシステムをハードコーディングするために大量のエンジニアリングの労力を必要としなく、従来技術の手作業で作成された測位システムの性能とマッチングすることができる。

一実施形態では、学習に基づくＬＩＤＡＲ測位システムは、オンラインＬＩＤＡＲポイントクラウド、事前作成された３Ｄポイントクラウド地図及びＡＤＶの予測ポーズを入力として受信し、オンラインＬＩＤＡＲポイントクラウド及び事前作成された３Ｄポイントクラウド地図から特徴を学習して、解空間内にコストボリュームを作成することができる。学習に基づくＬＩＤＡＲ測位システムは、畳み込みニューラルネットワーク（ＣＮＮ）およびリカレントニューラルネットワーク（ＲＮＮ）をコストに適用して、ＡＤＶの最適なポーズを推定することができる。

学習に基づくＬＩＤＡＲ測位システムは、手作業で作成されたパイプラインを有する従来のシステムに匹敵する高精度（例えばセンチメートルレベル）の測位を実現することができる。学習に基づくＬＩＤＡＲ測位システムは、手作業で作成されたモジュールに依存せず、様々なディープニューラルネットワーク構造を使用して学習に基づく方法を確立する。ポイントクラウドの抽出された局所特徴記述子は、様々な実世界の運転シーンにおいてマッチングするために特に最適化されることができる。解空間内に構築されたコストボリュームに適用される畳み込みニューラルネットワークは、ＡＤＶの測位精度を著しく改善することができる。本明細書で使用されるように、一実施形態では、解空間は、問題の制約を満たす、該問題を最適化する１セットの可能なポイントである。例えば、ＡＤＶの最適なポーズを推定するために選択されたＬＩＤＡＲポイントは、解空間であると考えることができる。

一実施形態では、学習に基づくＬＩＤＡＲ測位システムは、オフライン方法を使用して自動または半自動で大量に収集可能なデータによって駆動される。大量のデータは、グランドトゥルース軌跡を含み、測位タスクを行うように測位システムを訓練するために使用されることができる。学習に基づくＬＩＤＡＲ測位システムは、データに対する手動マーキング作業を最小限にすることが求められ、それに応じて、費用対効果がより高い。

一実施形態では、予測ポーズは、ＡＤＶの慣性測定ユニット（ＩＭＵ）またはＡＤＶのビークルダイナミクスモデルによって生成されるこることができ、且つ、連続するＬＩＤＡＲフレーム間の増分運動が測定されることができる。予測ポーズは、ＡＤＶのグラウンドトゥルースポーズから外れ、オフセットを引き起こす恐れがある。したがって、オフセット回復は、車両位置を推定することと同等である。学習に基づくＬＩＤＡＲ測位システムは、オンラインポイントクラウドと事前作成された３Ｄポイントクラウド地図とのマッチングコストを最小化することによって、予測ポーズとグラウンドトゥルースポーズとの最適オフセットを生成することができる。一実施形態では、最適オフセットは、２Ｄ水平オフセットとヘディングオフセットとを含むことができる。

一実施形態では、オンラインポイントクラウドは、ＡＤＶに取り付けられたＬＩＤＡＲ装置からの複数のＬＩＤＡＲスキャンから累積された単一または複数の連続フレームであってもよい。オンラインポイントクラウドは、ＬＩＤＡＲポイントのローカル車両またはＬＩＤＡＲ座標系における座標および反射強度を含むベクトルである３ＤＬＩＤＡＲポイントのセットとして表すことができる。オンラインポイントクラウドは、ＡＤＶの動き補償を考慮に入れる。したがって、ＡＤＶのオンラインポイントクラウドは、ＡＤＶがＡポイントからＢポイントへ移動する場合に、ＡポイントとＢポイントで異なる。

一実施形態では、事前作成された３Ｄポイントクラウド地図は、グローバル座標を有するＬＩＤＡＲポイントの集合であってもよい。ＬＩＤＡＲポイントは、車両を調査またはマッピングすることによって収集されることができ、また、記憶効率のためにボクセルグリッドフィルタを使用してＬＩＤＡＲポイントをダウンサンプリングすることができる。また、トレーニングニューラルネットワークモデル（例えば、ＰｏｉｎｔＮｅｔ＋＋）を使用して、事前作成された３Ｄポイントクラウド地図から動的オブジェクト（例えば、自動車、自転車および歩行者）をセマンティックセグメンテーションによって除去することができる。

一実施形態では、自動車両（ＡＤＶ）を測位する際に使用されるポイントクラウド特徴を抽出するための方法は、ＡＤＶ上のＬＩＤＡＲ装置によって生成されるオンラインポイントクラウドから第１組のキーポイントを選択することと、ＡＤＶ上で実行される特徴学習ニューラルネットワークを使用して、第１組のキーポイントに対して第１組の特徴記述子を抽出することとを含む。該方法は、さらに事前作成されたポイントクラウド地図上で、第１組のキーポイントにおけるキーポイントにそれぞれ対応する第２組のキーポイントを特定することと、事前作成されたポイントクラウド地図から第２組の特徴記述子を抽出することと、第１組の特徴記述子、第２組の特徴記述子及びＡＤＶの予測ポーズに基づいてＡＤＶの位置及びオリエンテーションを推定することとをさらに含む。

一実施形態では、該方法は、抽出された第１組の特徴記述子および第２組の特徴記述子からコスト値を構築することをさらに含む。コストボリュームにおける各セル（すなわち、サブボリューム）は、第１組のキーポイントの１つと第２組のキーポイントにおける所定のオフセットを有する、対応するキーポイントとのマッチングコストを表す。最適オフセットを得るために複数の異なるタイプのニューラルネットワークによって使用されるように、コストボリュウームを削減し正則化することにより、ＡＤＶの最適なポーズを決定することができる。

一実施形態では、第１組のキーポイントおよび第２組のキーポイントのそれぞれは、ＬＩＤＡＲポイントである。第１組のキーポイントと第２組のキーポイントは、固定数のキーポイントを有する。第１組のキーポイントを選択する際に、ＡＤＶの予測ポーズを囲む所定の領域内のＬＩＤＡＲポイントをトラバースして、その隣接する領域に所定密度のＬＩＤＡＲポイントを有する複数の候補ＬＩＤＡＲポイントを特定することと、３Ｄ構造テンソルを使用して候補ＬＩＤＡＲポイントのそれぞれの線形性を評価することとを実行することができる。各候補ＬＩＤＡＲポイントの線形性は、かかる評価に基づいて値が割り当てられることができる。候補ＬＩＤＡＲポイントは、その割り当てられた値に基づいてソートされることができる。ソートされた候補ＬＩＤＡＲポイントに基づいて、固定数の候補ＬＩＤＡＲポイントを選択することができる。固定数の候補ＬＩＤＡＲポイントを選択する際に、新たに選択される各ＬＩＤＡＲポイントは、選択された１つ又は複数の既存のＬＩＤＡＲポイントと所定の距離を維持する必要がある。

一実施形態では、特徴学習ニューラルネットワークは、複数のミニチュアニューラルネットワークを含む。各ミニチュアニューラルネットワークは、第１組のキーポイントの１つに対して提供されることができる。各ミニチュアニューラルネットワークは、所定数の隣接するＬＩＤＡＲポイントを収集するように、キーポイントのｚ軸に沿ってシリンダーを適用することができ、各隣接するＬＩＤＡＲポイントは、反射強度とそのキーポイントに対する相対座標とを有する。各ミニチュアニューラルネットワークは、関連する隣接ＬＩＤＡＲポイントの相対座標及び反射強度に基づいて、キーポイントの特徴記述子をさらに抽出することができる。同様に、各ミニチュアニューラルネットワークは、第２組のキーポイントの１つに対して提供されることができ、且つ、キーポイントの隣接するＬＩＤＡＲポイントの相対座標および反射強度に基づいて、第２組のキーポイントにおけるキーポイントの特徴記述子を抽出するために使用されることができる。２×２回転行列及び２Ｄ並進ベクトルによって表される変換を用いて、事前作成されたポイントクラウド地図上の第２組のキーポイントのそれぞれの座標を算出することができる。

一実施形態では、第２組のキーポイントにおけるキーポイントに対して所定数の隣接ＬＩＤＡＲポイントを見つけない場合には、完全接続ネットワークを使用してキーポイントの特徴記述子を抽出することができ、ネットワークへの入力は単位ベクトルとすることができる。

一実施形態では、ＬＩＤＡＲ測位においてニューラルネットワークを使用してソリューション推断を行う方法は、解空間内にＡＤＶの予測ポーズに用いられる、オンラインポイントクラウドからのキーポイントと事前作成されたポイントクラウド地図上の対応するキーポイントとのマッチングコストを表す複数のサブボリュームを備えるコストボリュームを作成することを含む。該方法は、マッチングコストをリファインするように畳み込みニューラルネットワーク（ＣＮＮ）を使用してコストボリュームを正則化することと、正則化されたコストボリュームから予測ポーズの最適オフセットを推定することとをさらに含む。該最適オフセットは、ＡＤＶの位置を特定するために使用されることができる。

一実施形態では、ＣＮＮのそれぞれは、同一セットのパラメータを共有し、複数の畳み込み層を含む。畳み込み層の少なくとも１層は、バッチ正規化および正規化線形ユニット（ＲｅＬＵ）を用いる３Ｄ畳み込み層である。

一実施形態では、予測ポーズの解空間は、オンラインポイントクラウドから選択される１組のキーポイントにより定義される空間を含む。該１組のキーポイントのそれぞれは、所定数の隣接ポイントと関連付けられるとともに、該１組のキーポイントの残りのキーポイントと最小距離を有する。

一実施形態では、コストボリュームを作成することは、各対の対応する特徴記述子同士のメトリック距離を算出することを更に含む。メトリック距離は、多次元ベクトルであり、各要素は、記述子ペアのうち対応する一つからの距離を二乗することによって算出される。また、コストボリュームを作成する際に、解空間をキーポイントに対応する複数の離散空間に分割することができる。

対応するキーポイント及びそれに関連する隣接ＬＩＤＡＲポイントに占められた空間に基づき、それぞれの離散空間に対してｘ次元、ｙ次元およびヨー（Ｙａｗ）次元の大きさを決定することができる。その後、予測ポーズのための複数の特徴記述子及びそれぞれの離散空間に対するそれぞれの次元の大きさに基づいてコストボリュームを作成することができる。コストボリュームのそれぞれのサブボリュームは、オンラインポイントクラウドからのその関連する特徴記述子を有するキーポイント、変換及び事前作成されたポイントクラウド地図からの対応する特徴記述子と関連付けられることができる。

一実施形態では、ＡＤＶの測位結果において時間平滑化を行うための方法は、オンラインポイントクラウドにおける一連の連続する光検出および測距（ＬＩＤＡＲ）フレームのそれぞれに対して、オンラインポイントクラウドからの第１組のキーポイントと、事前作成されたポイントクラウド地図からの第２組のキーポイントとの全体的マッチングコストを表す確率オフセットを作成することを含む。この方法は、ｘ次元、ｙ次元およびヨー次元において確率オフセットを複数の確率ベクトルに圧縮することと、確率オフセットの各確率ベクトルを複数のリカレントニューラルネットワーク（ＲＮＮ）に提供することと、ＲＮＮによって複数の連続するＬＩＤＡＲフレーム上で測位結果の軌跡を生成することとをさらに含む。

一実施形態では、確率オフセットは、ＡＤＶの特定位置オフセットに対するオンラインポイントクラウドと事前作成されたポイントクラウド地図との全体的マッチングコストを表す複数のサブボリュームを含む。各ＲＮＮは、複数の長・短期記憶（ＬＳＴＭ）ユニットを含む。各確率ベクトルは、ＬＳＴＭユニットの１つに入力として提供される。ＲＮＮは、連続するＬＩＤＡＲフレームからの学習された履歴情報に基づいて、連続するＬＩＤＡＲフレーム上で測位結果の軌跡を平滑化する。ＡＤＶは、連続するＬＩＤＡＲフレーム上で複数の予測ポーズを有することができる。

自動運転車両
図１は、本発明の一実施態様にかかる自動運転車両のネットワーク構成を示すブロック図である。図１を参照すると、ネットワーク構成１００は、ネットワーク１０２を介して１つまたは複数のサーバ１０３～１０４に対して通信可能に接続する自動運転車両１０１を備える。１つの自動運転車両のみを示すが、複数の自動運転車両は、ネットワーク１０２を介して相互に接続し、および／またはサーバ１０３～１０４に接続可能である。ネットワーク１０２は、いずれのタイプのネットワークであってもよく、例えば、有線または無線のローカルエリアネットワーク（ＬＡＮ）、インターネットのような広域ネットワーク（ＷＡＮ）、セルラ網、衛星ネットワークまたはそれらの組み合せである。サーバ１０３～１０４は、いずれの形式のサーバまたはサーバークラスタであってもよく、例えば、Ｗｅｂサーバやクラウドサーバ、アプリケーションサーバ、バックエンドサーバまたはそれらの組み合せである。サーバ１０３～１０４は、データ解析サーバやコンテンツサーバ、交通情報サーバ、地図・関心点（ＭＰＯＩ）サーバまたは位置サーバなどであってもよい。

自動運転車両とは、自動運転モードにある可能に配置される車両を指し、前記自動運転モードで、車両は、運転者からの入力が非常に少なく又は完全にない状況で環境を通過するように案内される。そのような自動運転車両は、車両運転環境に関する情報を検出可能に配置される１つまたは複数のセンサを有するセンサシステムを備えることが可能である。前記車両及びかかるコントローラは、検出された情報を使用して前記環境を通過するように案内される。自動運転車両１０１は、マニュアルモード、全自動運転モードまたは一部自動運転モードで運転することが可能である。

一実施態様では、自動運転車両１０１は、感知・計画システム１１０と、車両制御システム１１１と、無線通信システム１１２と、ユーザインタフェースシステム１１３と、センサシステム１１５とを備えるが、これに限定されない。自動運転車両１０１は、通常の車両に含まれる一部の汎用的な部材、例えば、エンジン、車輪、ステアリングホイール、変速機などを備えることが可能であり、前記部材は、車両制御システム１１１および／または感知・計画システム１１０により多種の通信信号および／または命令で制御され、当該多種の通信信号および／または命令は、例えば、加速信号または命令、減速信号または命令、操舵信号または命令、ブレーキ信号または命令などである。

部材１１０～１１５同士は、インターコネクト、バス、ネットワークまたはそれらの組合せを介して通信可能に接続されることが可能である。例えば、部材１１０～１１５同士は、コントローラエリアネットワーク（ＣＡＮ）バスを介して通信可能に接続されることが可能である。ＣＡＮバスは、マイクロコントローラと装置とがホストなしのアプリケーションで相互に通信することを許容するように設計される車両バス規格である。それは、最初に自動車における多重化電気配線のために設計される、メッセージベースのプロトコルであるが、様々な他の環境にも適用される。

図２を参照すると、一実施態様では、センサシステム１１５は、１つまたは複数のカメラ２１１と、全地球測位システム（ＧＰＳ）ユニット２１２と、慣性計測ユニット（ＩＭＵ）２１３と、レーダユニット２１４と、光検出・測距（ＬＩＤＡＲ）ユニット２１５とを備えるが、これに限定されない。ＧＰＳユニット２１２は、自動運転車両の位置に関する情報を提供するように操作可能な送受信器を備えることが可能である。ＩＭＵユニット２１３は、慣性加速度に基づいて自動運転車両の位置及び方向変化を検知可能である。レーダユニット２１４は、電波信号により自動運転車両のローカル環境における対象を検知するシステムを表すことが可能である。一部の実施態様では、レーダユニット２１４は、対象に加え、対象の速度および／または前進方向を検知可能である。ＬＩＤＡＲユニット２１５は、激光により自動運転車両が所在する環境における対象を検知することが可能である。ＬＩＤＡＲユニット２１５は、他のシステム部材に加え、１つまたは複数のレーザ光源、レーザスキャナ及び１つまたは複数の検出器を備えることが可能である。カメラ２１１は、自動運転車両の周囲の環境の画像を撮像するための１つまたは複数の装置を備えることが可能である。カメラ２１１は、スチルカメラおよび／またはビデオカメラであってもよい。カメラは、機械的に移動可能なものであってもよく、例えば、カメラが回転および／または傾斜するステージに取り付けられることにより移動可能である。

センサシステム１１５は、例えば、ソナーセンサや赤外線センサ、操舵角センサ、スロットルセンサ、ブレーキセンサ、オーディオセンサ（例えば、マイクフォン）などの他のセンサを備えることが可能である。オーディオセンサは、自動運転車両の周囲の環境から音声を収音するように配置可能である。操舵角センサは、ステアリングホイール、車両の車輪またはそれらの組み合せの操舵角を検知するように配置可能である。スロットルセンサ及びブレーキセンサは、それぞれ車両のスロットル位置及びブレーキ位置を検知する。スロットルセンサ及びブレーキセンサは、集積式スロットル／ブレーキセンサに集積される場合もある。

一実施態様では、車両制御システム１１１は、ステアリングユニット２０１と、スロットルユニット２０２（加速ユニットともいう）と、ブレーキユニット２０３とを備えるが、これに限定されない。ステアリングユニット２０１は、車両の方向または前進方向を調整するためのものである。スロットルユニット２０２は、モータまたはエンジンの速度を制御することにより車両の速度及び加速度を制御するためのものである。ブレーキユニット２０３は、摩擦を与えることにより、車両の車輪またはタイヤを減速させて車両を減速させる。なお、図２に示す部材は、ハードウェア、ソフトウェアまたはそれらの組み合せで実現されることが可能である。

図１に戻って、無線通信システム１１２は、自動運転車両１０１と、例えば装置やセンサ、他の車両などの外部システムとの通信を可能にする。例えば、無線通信システム１１２は、１つまたは複数の装置と直接に無線通信を行い、または通信ネットワークを介して無線通信を行うことが可能であり、例えば、ネットワーク１０２を介してサーバ１０３～１０４と通信する。無線通信システム１１２は、いずれのセルラ通信ネットワークまたは無線ローカルエリアネットワーク（ＷＬＡＮ）、例えば、ＷｉＦｉを利用して他の部材やシステムと通信可能である。無線通信システム１１２は、例えば赤外線リンクやブルートゥース（登録商標）などを利用して装置（例えば、乗員の携帯機器、表示装置、車両１０１内のスピーカ）と直接に通信可能である。ユーザインタフェースシステム１１３は、車両１０１内で実現される周辺装置の部分であることが可能であり、例えばキーボード、タッチパネル式表示装置、マイクフォン及びスピーカなどを含む。

特に自動運転モードで操作される際に、自動運転車両１０１の機能の一部または全部は、感知・計画システム１１０により制御または管理されることが可能である。感知・計画システム１１０は、必要なハードウェア（例えば、プロセッサ、メモリ、記憶装置）及びソフトウェア（例えば、オペレーティングシステム、計画・ルーティングプログラム）を含み、センサシステム１１５、制御システム１１１、無線通信システム１１２および／またはユーザインタフェースシステム１１３から情報を受信して、受信した情報を処理し、開始点から目的地点までのルートまたは経路を計画した後、計画・制御情報に基づいて車両１０１を運転する。その代わりに、感知・計画システム１１０は、車両制御システム１１１に集積されてもよい。

例えば、乗員であるユーザは、例えばユーザインタフェースを介して行程の開始位置及び目的地を指定することが可能である。感知・計画システム１１０は、行程に関するデータを取得する。例えば、感知・計画システム１１０は、ＭＰＯＩサーバから位置・ルート情報を取得することが可能であり、前記ＭＰＯＩサーバは、サーバ１０３～１０４の一部であってもよい。位置サーバは位置サービスを提供するとともに、ＭＰＯＩサーバは地図サービス及び一部の位置のＰＯＩを提供する。その代わりに、そのような位置及びＭＰＯＩ情報は、感知・計画システム１１０の永続性記憶装置にローカルキャッシュされてもよい。

自動運転車両１０１がルートに沿って移動する際に、感知・計画システム１１０は、交通情報システムまたはサーバ（ＴＩＳ）からリアタイム交通情報を取得してもよい。なお、サーバ１０３～１０４は、第三者エンティティにより操作されることが可能である。その代わりに、サーバ１０３～１０４の機能は、感知・計画システム１１０に集積されてもよい。感知・計画システム１１０は、リアタイム交通情報、ＭＰＯＩ情報及び位置情報、並びにセンサシステム１１５により検出または検知されたリアタイムローカル環境データ（例えば、障害物、対象、周辺車両）に基づいて、最適ルートを計画して、計画したルートに応じて、例えば制御システム１１１を介して車両１０１を運転すること可能であり、これにより、安全で且つ効率よく指定の目的地に到達することができる。

サーバ１０３は、複数のクライアントについてデータ分析サービスを実行するデータ分析システムであってもよい。一実施態様では、データ解析システム１０３は、データ収集器１２１及び機械学習エンジン１２２を備える。データ収集器１２１は、種々の車両（自動運転車両または人間の運転者が運転する通常の車両）から運転統計データ１２３を収集する。運転統計データ１２３は、異なる時点で発行された運転命令（例えば、アクセル命令、ブレーキ命令、操舵命令）及び車両のセンサによって捕捉された車両の応答（例えば速度、加速、減速、方向）を示す情報を含む。運転統計データ１２３は、異なる時点での運転環境を記述する情報、例えば、ルート（開始位置及び目的地位置を備える）、ＭＰＯＩ、道路状況、気候状況などをさらに含むことが可能である。

運転統計データ１２３に基づいて、機械学習エンジン１２２は、様々な目的のためにルールセット、アルゴリズムおよび／または予測モデル１２４を生成または訓練する。例えば、アルゴリズム／モデル１２４は、以下により詳細に説明するＬＩＤＡＲ測位プロセスのためのアルゴリズムおよびモデルを含む。その後、アルゴリズム１２４は、自動運転中にリアルタイムで使用されるようにＡＤＶにアップロードすることができる。

図３Ａ及び図３Ｂは一実施態様にかかる自動運転車両とともに使用される感知・計画システムの例を示すブロック図である。システム３００は、図１の自動運転車両１０１の一部として実現されることが可能であり、感知・計画システム１１０と、制御システム１１１と、センサシステム１１５とを備えるが、これに限定されない。図３Ａ～図３Ｂを参照すると、感知・計画システム１１０は、測位モジュール３０１と、感知モジュール３０２と、予測モジュール３０３と、決定モジュール３０４と、計画モジュール３０５と、制御モジュール３０６と、ルーティングモジュール３０７とを備えるが、これに限定されない。

モジュール３０１～３０７の一部または全部は、ソフトウェア、ハードウェアまたはそれらの組み合せにより実現されることが可能である。例えば、それらのモジュールは、永続性記憶装置３５２にインストールされて、メモリ３５１にローディングされ、且つ１つまたは複数のプロセッサ（図示せず）により実行されることが可能である。なお、それらのモジュールの一部または全部は、図２の車両制御システム１１１の一部または全部モジュールに対して通信可能に接続され、または集積される。モジュール３０１～３０７の一部は、集積モジュールに集積されてもよい。

測位モジュール３０１は（例えば、ＧＰＳユニット２１２を使用する）、システム３００を含む自動運転車両の現在位置を特定し、ユーザの行程またはルートに関連する任意のデータを管理する。測位モジュール３０１（地図及びルートモジュールともいう）は、ユーザの行程やルートに関するデータ全体を管理する。ユーザは、例えばユーザインタフェースを介してログインして、行程の開始位置及び目的地を指定する。測位モジュール３０１は、システム３００を含む自動運転車両の地図・ルート情報３１１のような他のモジュールと通信して、行程に関するデータを取得する。例えば、測位モジュール３０１は、位置サーバと地図・ＰＯＩ（ＭＰＯＩ）サーバから位置・ルート情報を取得することが可能である。位置サーバが位置サービスを提供するとともに、ＭＰＯＩサーバが地図サービス及び一部の位置のＰＯＩを提供することにより、地図・ルート情報３１１の一部としてキャッシュされることが可能である。システム３００を含む自動運転車両がルートに沿って移動する際に、測位モジュール３０１は、交通情報システムまたはサーバからリアタイム交通情報を取得してもよい。

地図・ルート情報３１１は、感知モジュール３０２によって対象検出のために使用されてもよい。例えば、地図・ルート情報３１１から特徴を抽出し、抽出された特徴をポイントクラウドから抽出された特徴と組み合わせて、ＡＤＶを介して対象を検出することができる。

感知モジュール３０２は、センサシステム１１５により提供されるセンサデータ及び測位モジュール３０１により取得される測位情報に基づいて、周囲環境への感知を特定する。感知情報は、通常の運転者がその運転している車両の周囲から感知したものを示す。感知は、例えば対象式による車線配置、信号機信号、他の車両の相対位置、歩行者、建物、横断歩道や他の交通に関する標識（例えば、止まれ標識、道譲れ標識）などを含むことが可能である。車線構成は、例えば車線の形状（例えば直線または曲率）、車線の幅、道路における車線数、一方通行車線または双方向車線、合流車線または分流車線、出口車線などの１つまたは複数の車線を記述する情報を含む。

感知モジュール３０２は、コンピュータビジョンシステムまたはコンピュータビジョンシステムの機能を含むことが可能であり、１つまたは複数カメラにより撮像された画像を処理して解析することにより、自動運転車両環境における対象および／または特徴を認識する。前記対象は、交通信号、道路境界、他の車両、歩行者および／または障害物などを含むことが可能である。コンピュータビジョンシステムは、対象認識アルゴリズム、ビデオトラッキング及び他のコンピュータビジョン技術を使用することが可能である。一部の実施態様では、コンピュータビジョンシステムは、環境地図の描画、対象のトラッキングや、及び対象の速度の推定などを行うことが可能である。感知モジュール３０２は、レーダおよび／またはＬＩＤＡＲのような他のセンサにより提供される他のセンサデータに基づいて、対象を検出してもよい。

各対象に対して、予測モジュール３０３は、この場合の前記対象の挙動を予測する。前記予測は、ある時点で感知される運転環境の感知データに基づいて、地図・ルート情報３１１と交通規則３１２とのゼットに応じて実行される。例えば、対象が反対方向の車両であり、現在の運転環境が交差点を含むと、予測モジュール３０３は、該車両が前方に直進可能であるか、または旋回可能であるかを予測する。感知データは交差点に信号機がないことを示すと、予測モジュール３０３は、該車両が交差点に進入する前に完全に停車しなければいけない可能性がある、と予測することができる。感知データは該車両が左折専用車線または右折専用車線にあることを示すと、予測モジュール３０３は、それぞれ車両が左折または右折する可能性が高いと予測することができる。

決定モジュール３０４は、対象毎に対して、どのように対象を対処するかを决定する。例えば、特定の対象（例えば、交差ルートにある他の車両）及び対象を記述するメタデータ（例えば、速度、方向、操舵角）に対して、決定モジュール３０４は、前記対象に行き合う時にどうのように動作するか（例えば、追い越し、一時停止、停止、越え）を決定する。決定モジュール３０４は、例えば交通ルールや運転ルール３１２のルール集合に基づいて、そのような决定を行うことが可能であり、前記ルール集合が永続性記憶装置３５２に記憶されることが可能である。

ルーティングモジュール３０７は、開始点から終点までの１つまたは複数のルートや経路を提供するように配置される。例えば、ユーザから受信した開始位置から目的地位置までの所定の行程に対して、ルーティングモジュール３０７は、地図・ルート情報３１１を取得し、開始位置から目的地位置までのすべての可能なルートまたは経路を決定する。決定された開始位置から目的地位置までのルートのそれぞれに対して、ルーティングモジュール３０７は、地形図の形態で基準線を生成することができる。基準線は、他の車両、障害物または交通状況などのいかなる干渉もない理想的なルートまたは理想的な経路を示す。即ち、道路には他の車両、歩行者や障害物がないと、ＡＤＶは、正確または密接に基準線に追従すべきである。その後、決定モジュール３０４および／または計画モジュール３０５に地形図を提供してもよい。他のモジュールによって提供される他のデータ（例えば、測位モジュール３０１からの交通状況、感知モジュール３０２によって感知された運転環境および予測モジュール３０３によって予測された交通状況）に基づいて、決定モジュール３０４および／または計画モジュール３０５は、全ての可能な経路をチェックして、そのうちの１つの最適ルートを選択し、修正する。ある時点での特定の運転環境によっては、ＡＤＶを制御するための実際のルートまたは経路は、ルーティングモジュール３０７により提供される基準線に対して近接し、または相違する可能性がある。

感知された対象毎に対する决定に基づいて、計画モジュール３０５は、ルーティングモジュール３０７により提供された基準線を基にして、自動運転車両に対してルートまたは経路、及び運転パラメータ（例えば、距離、速度および／または旋回角度）を計画する。つまり、所定の対象に対して、決定モジュール３０４は、当該対象が何をすべきかを決定する一方、計画モジュール３０５は、どのようにするかを決定する。例えば、所定の対象に対して、決定モジュール３０４は、前記対象を越えることを決定することが可能である一方、計画モジュール３０５は、前記対象の左側か右側かで越えることを決定することが可能である。計画・制御データは、計画モジュール３０５により生成されて、システム３００を含む車両が次の移動サイクル（例えば、次のルート／経路セグメント）でどのように移動するかを記述する情報を含む。例えば、計画・制御データは、システム３００を含む車両が３０ｍｐｈの速度で１０メートル移動した後、２５ｍｐｈの速度で右側の車線に変更することを指示可能である。

計画・制御データに基づいて、制御モジュール３０６は、計画・制御データにより限定されるルートまたは経路に応じて、適当な命令または信号を車両制御システム１１１に発信することにより、自動運転車両を制御して運転する。前記計画・制御データは、ルートまたは経路に沿って、異なる時点で適当な車両配置または運転パラメータ（例えば、スロットル、ブレーキおよび操舵命令）を使用して車両をルートまたは経路の第１点から第２点に走行させるための充分な情報を含む。

一実施態様では、計画段階が複数の計画周期（運転周期ともいう）で実行され、例えば、１００ミリ秒（ｍｓ）の時間間隔で実行される。計画周期または運転周期のそれぞれに対して、計画・制御データに基づいて１つまたは複数の制御命令を発行する。即ち、１００ｍｓ毎に、計画モジュール３０５は、次のルートセグメントまたは経路セグメントを計画し、例えば、目標位置、及びＡＤＶがこの目標位置に到達するのに必要な時間を含む。その代わりに、計画モジュール３０５は、具体的な速度、方向および／または操舵角などを規定してもよい。一実施態様では、計画モジュール３０５は、次の所定の期間（例えば、５秒）に対してルートセグメントまたは経路セグメントを計画する。計画周期毎に、計画モジュール３０５は、前の周期で計画した目標位置に基づいて現在周期（例えば、次の５秒）のための目標位置を計画する。そして、制御モジュール３０６は、現在周期の計画・制御データに基づいて１つまたは複数の制御命令（例えばスロットル制御命令、ブレーキ制御命令、操舵制御命令）を生成する。

なお、決定モジュール３０４と計画モジュール３０５とは、集積モジュールに集積されることが可能である。決定モジュール３０４／計画モジュール３０５は、自動運転車両の運転経路を決定するために、ナビゲーションシステムまたはナビゲーションシステムの機能を含むことが可能である。例えば、ナビゲーションシステムは、自動運転車両が最終目的地への車道に基づく経路に沿って前進すると同時に、感知した障害物を実質的に回避するような経路に沿って、自動運転車両が移動することを実現するための一連の速度及び前進方向を決定すること可能である。目的地は、ユーザインタフェースシステム１１３を介したユーザ入力に基づいて設定可能である。ナビゲーションシステムは、自動運転車両が運転していると同時に、動的に運転経路を更新することが可能である。ナビゲーションシステムは、ＧＰＳシステム及び１つまたは複数の地図からのデータを合併して、自動運転車両用の運転経路を決定することが可能である。

なお、上記のように記載された部材の一部または全部は、ソフトウェア、ハードウェアまたはそれらの組み合せにより実現されることが可能である。例えば、そのような部材は、永続性記憶装置にインストールして記憶されるソフトウェアとして実現されることが可能であり、前記ソフトウェアがメモリにローディングされてプロセッサ（図示せず）により実行されることで、本明細書に記載のプロセスや操作を実施することができる。その代わりに、そのような部材は、専用ハードウェア（例えば、集積回路（例えば、特定用途向け集積回路（ＡＳＩＣ）、デジタルシグナルプロセッサ（ＤＳＰ）またはフィールドプログラマブルゲートアレイ（ＦＰＧＡ））にプログラミングされ、又は組み込まれる、実行可能なコードとして実現されてもよく、前記実行可能なコードが、アプリケーションからの相応的なドライバおよび／またはオペレーティングシステムを介してアクセス可能である。また、そのような部材は、プロセッサまたはプロセッサコアにおける特定ハードウェアロジックとして実現されることが可能であり、ソフトウェア部材が１つまたは複数の特定命令によりアクセス可能な命令セットの一部とされる。

ポイントクラウド特徴抽出
図４は、本発明の実施形態にかかる学習に基づくＬＩＤＡＲ測位システムを示す図である。図４に示すように、測位モジュール３０１は、ポイントクラウド特徴学習ネットワーク（例えば、ＰｏｉｎｔＮｅｔ）４０９を含むことができる。このポイントクラウド特徴学習ネットワーク４０９は、ＡＤＶの事前作成された３Ｄポイントクラウド地図４０６と、オンラインＬＩＤＡＲポイントクラウド４０４と、予測ポーズ４０７とを入力として採用し、複数の選択されたＬＩＤＡＲポイント（キーポイントとも呼ぶ）に基づいて、複数の特徴記述子をオンラインポイントクラウド４０４から抽出することができる。対応するキーポイントを見つけ、ポイントクラウド特徴学習ネットワーク４０９により同様に対応するＬＩＤＡＲポイントの特徴を抽出することができる。

一実施形態では、オンラインポイントクラウド４０４及び事前作成された３Ｄポイントクラウド地図４０６から抽出された特徴記述子に基づいてコストボリューム４１０を作成することができる。コストボリュームの各セル（すなわち、サブボリューム）は、第１組のキーポイントの１つと第２組のキーポイントにおける所定のオフセットを有する、対応するキーポイントとのマッチングコストを表すことができる。本明細書で使用されるように、一実施形態では、マッチングコストは、オンラインポイントクラウド４０４と予め確立された３Ｄポイントクラウド地図４０６からの対をなすキーポイント（すなわち、予め選択されたＬＩＤＡＲポイント）同士の類似性を測定するために、所定のアルゴリズムに基づいて算出されてもよい。

さらに示されるように、一実施形態では、測位モジュール３０１は複数のＣＮＮ４１１を含むことができ、複数のＣＮＮ４１１はコストボリューム４１０を正則化するようにコストボリューム４１０に適用されることにより、コストボリューム４１０におけるより多くの背景を考慮してマッチングコストをリファインすることができる。また、複数のＲＮＮ４１３が、正則化されたコストボリュームに適用されて、複数の連続するＬＩＤＡＲフレーム上の測位結果の軌跡を平滑化することができる。

一実施形態では、予測ポーズ４０７は一般的に、慣性測定ユニット（ＩＭＵ）またはビークルダイナミクスモデル（運動モデル）によって生成されることができる。予測ポーズ４０７は、シーケンスＬＩＤＡＲフレーム間の増分運動を測定することができる。したがって、学習に基づくＬＩＤＡＲ測位システム４００のタスクは、オンラインポイントクラウド４０４と３Ｄポイントクラウド地図４０６とのマッチングコストを最小化することにより、最終ポーズと予測ポーズとの最適オフセットを探すことである。

一実施形態では、より良好な効率およびロバスト性を有するために、システムは、ＡＤＶの２Ｄ水平オフセットとヘディングオフセット（Δｘ、Δｙ、Δψ）のみを推定することができる。

一実施形態では、システム４００は、ＬＩＤＡＲスキャンを使用してＡＤＶの位置およびオリエンテーションを正確に推定可能なディープニューラルネットワークアーキテクチャを表す。ディープニューラルネットワークにおいて、上述したように、１組のキーポイントが、３Ｄポイントの隣接ポイントの特徴値によって規定される線形性を用いて評価される。ミニチュアＰｏｉｎｔＮｅｔのグループは、特徴記述子を抽出し、これらのポイントのいくつかの統計的性質をエンコードすることができる。ミニチュアＰｏｉｎｔＮｅｔのグループは、異なるシーンでのマッチングロバスト性を最適化するように訓練されることができる。このシステムは、３Ｄ畳み込みによって正則化されたＸ×Ｙ×ψ（Ｘ、Ｙおよびヨー）次元において、十分に微分可能なコストボリュームで測位精度を改善することができるので、手作業で作成されたパイプラインに匹敵する結果をもたらす。これらの次元に対するマッチング確率を算出して、最適推定値を得る。したがって、システム４００を使用して、ディープリカレントニューラルネットワーク（ＲＮＮ）により、通常にフィルタリング方法によってモデリングされる時間的運動ダイナミクスをカプセル化することができる。

したがって、学習に基づくＬＩＤＡＲフレームワーク４００において、特徴マッチングロバスト性（特に長期にわたる屋外期間）にとって最適になるように、ミニチュアＰｏｉｎｔＮｅｔに基づく特徴記述子抽出に対してトレーニングを行うことにより、学習に基づくＬＩＤＡＲ測位を実現することができる。どのようにＸ×Ｙ×ヨー次元でコストボリューム４１０をフィルタリングし正則化するかを学習するために、微分可能な幾何変換および特徴記述子の双線形補間のような設計を使用することで３Ｄ畳み込みの使用を達成することにより、測位精度を改善することができる。

図５は、実施形態にかかるポイントクラウド特徴を抽出するためのシステムを示す。図５に示すように、ＡＤＶ上のＬＩＤＡＲ装置によって生成されるオンラインポイントクラウド４０４から１組のキーポイント５０２を選択して、ＡＤＶの予測ポーズに使用することができる。各キーポイントはＬＩＤＡＲポイントであり、密度、幾何学的特徴および分布を含む予め定められた１セットの要素に基づいて選択されることができる。選択されたキーポイントのそれぞれに対して、所定数の隣接ＬＩＤＡＲポイントを選択することができる。選択された隣接ポイントのそれぞれは、座標および反射強度を含む複数の属性に関連付けられることができる。選択されたキーポイントに対する各隣接ＬＩＤＡＲポイントの属性をテンソル５０１、５０３または５０５に入れることができるとともに、ミニチュア特徴学習ネットワーク５１３、５１５および５１７の１つに提供することができ、ミニチュア特徴学習ネットワーク５１３、５１５および５１７は、選択されたキーポイントに対して特徴記述子５１９、５２１および５２３を抽出することができる。

一実施形態では、同じ数の対応するキーポイント５０４が、事前作成された３Ｄポイントクラウド地図４０６上で見つけられることができる。それぞれの対応するキーポイントに対して、同様に同じ所定数の隣接ＬＩＤＡＲポイントを特定することができる。各隣接ＬＩＤＡＲポイントの属性は、テンソル５０７、５０９及び５１１に含まれることができ、対応するキーポイントに対して特徴記述子５２５、５２７及び５２９を抽出可能な特徴記述子ミニチュア特徴学習ネットワーク５１３、５１５及び５１７の１つに提供されることができる。

図６は、実施形態にかかるポイントクラウド特徴を抽出するためのシステムの例示的な実施例を示す。図６に示す例示的な実施例は、オンラインポイントクラウド６０５（すなわちＬＩＤＡＲポイントクラウド）と、事前作成された３Ｄポイントクラウド地図６０７とを含む。このオンラインＬＩＤＡＲポイントクラウド６０５は、車両に搭載されたＬＩＤＡＲ装置からの、動き補償を考慮した複数のＬＩＤＡＲスキャンから累積された単一または複数の連続フレームであってもよい。オンラインＬＩＤＡＲポイントクラウド６０５は、１セットの３Ｄポイント｛Ｐ_ｉ｜ｉ＝１、…、ｎ｝として表され、各々のポイントＰｉは、ローカル車両またはＬＩＤＡＲ座標系における各ポイントの座標および反射強度を含む（ｘ，ｙ，ｚ，ｒ）というベクトルである。

この事前作成された３Ｄポイントクラウド地図６０７は、車両を調査またはマッピングすることにより収集される、グローバル座標を有するＬＩＤＡＲポイントの集合である。より良好な記憶効率を得るために、ボクセルグリッドフィルタを用いて３Ｄポイントクラウド地図６０７をダウンサンプリングする。さらに、ポイントクラウド地図において、自動車、自転車、歩行者などの動的オブジェクトを除去するために、ＰｏｉｎｔＮｅｔ＋＋を使用してセマンティックセグメンテーションを実行する。

第１ステップとして、このシステムは、１セットの局所パッチ（キーポイントとも呼ばれる）から局所特徴記述子を抽出することができる。キーポイントの選択は、様々な態様からいくつかのローカル幾何学的特徴およびグローバル幾何学的特徴を考慮に入れている。キーポイントを選択した後に、ミニチュアバージョンＰｏｉｎｔＮｅｔ６１３を使用して特徴記述子を抽出する。

密度、幾何学的特徴および分布を含むいくつかの要因を考慮すると、固定数のキーポイントがオンラインポイントクラウド６０５から抽出される。まず、オンラインポイントクラウド６０５内のすべてのＬＩＤＡＲポイントをトラバースして、その隣接する領域に所定ポイント密度を有する候補を特定する。次に、３Ｄ構造テンソルを使用して、各候補キーポイントの線形性を評価する。強い線形構造を有する特徴は、通常の道路シーンにおける独自性および豊富さを有するため、測位タスクに適すると考えられる。そして、候補キーポイントは、線形性の顕著性が大きい順にソートされて、最小数のキーポイントを選択する。新たに選択されるキーポイントは、既存のキーポイントと十分な距離を維持する必要がある。

適格なキーポイントが選択されると、それに対して意味のある特徴記述子を抽出することができる。従来の特徴（例えば単純な幾何学的特徴や統計的特徴）は、ディープネットワークにより学習された特徴を用いてポイントクラウド間の類似性を記述するために使用されるが、ＰｏｉｎｔＮｅｔは、ネットワークアーキテクチャにおいて不規則点を消費する問題を解決するように特徴記述子を抽出するために使用される。

より具体的には、一例では、各キーポイントに対して、ｚ軸に沿って垂直シリンダーを適用して、６４個の隣接ポイントを収集することができる。水平測位について、球形サーチ領域に比べて、垂直シリンダー内の隣接ポイントの方は、より意味のある特徴を構築することができる。各隣接ポイントについて、キーポイントとの相対座標及びその反射強度（ｘ、ｙ、ｚ、ｒ）は、記述子抽出に使用される。したがって、ミニチュアＰｏｉｎｔＮｅｔネットワークは、入力が６４×４のテンソル６０９または６１１であり、出力がオンラインポイントクラウド６０５または事前作成された３Ｄポイントクラウド地図６０７からのキーポイントパッチの局所特徴を表す３２次元ベクトル６１４である。

特徴抽出のためのミニチュアバージョンＰｏｉｎｔＮｅｔ６１３は、３つの完全接続層が積層された多層パーセプトロン（ＭＬＰ）と、特徴記述子を集計して取得するための最大プーリング層とを含むことができる。

オンラインポイントクラウド６０５とオフライン３Ｄポイントクラウド地図６０７との両方からの抽出特徴に対して、パラメータ共有ミニチュアＰｏｉｎｔＮｅｔ構造６１３を使用することができる。特定の地図ポイントについては、地図ポイントの周りに最小数の隣接ポイントが見られないと、この地図ポイントが空の地図ポイント／キーポイントとみなされる。ＦＣＮは、空の地図ポイントの特徴記述子表現を学習するために使用されることができ、ネットワークへの入力は、単位ベクトルとして設定されることができる。

以下、実施形態のパラメータおよび閾値を説明する。

キーポイントの選択中に、ＬＩＤＡＲポイントクラウド６０５のフレーム内で１２８個のキーポイントを選択することができる。ここで使用されるように、フレームはＬＩＤＡＲユニットの回転またはスイングである。そして、ｚ軸に沿って０．５ｍの半径を有するシリンダー内で、各キーポイントの６４個の隣接ポイントが、特徴記述子抽出のために選択される。許容される隣接ポイントの最小数は１６に設定される。１６～６４個の隣接ポイントが存在すると、キーポイントの６４×４入力ベクトル６０９を有効な隣接ポイントによって簡単に繰り返し埋める。そうでないと、地図ポイントは空と見なされる。コストボリュームの解空間は１１×１１×１１に設定され、ｘ、ｙおよびψ次元における次数はそれぞれ０．２５ｍ、０．２５ｍおよび０．５度である。したがって、予測ポーズの最大許容偏移は、約（０．２５×（１１－１）／２＝１．２５ｍ、１．２５ｍおよび２．５度）である。この実施例では、ミニチュアＰｏｉｎｔＮｅｔ構造は、６４×３２×３２ＭＬＰであり、３ＤＣＮＮは、Ｃｏｎｖ３ｄ（１６，１，１）－Ｃｏｎｖ３ｄ（４，３，１）－Ｃｏｎｖ３ｄ（１，３，１）であり、ＲＮＮは、１１つの非表示状態を有する２層のＬＳＴＭである。

図７は実施形態にかかるポイントクラウド特徴を抽出する例示的なプロセスを示すフローチャートである。プロセス７００は、ソフトウェア、ハードウェアまたはそれらの組み合せを含む処理ロジックにより実行されることが可能である。プロセス７００は、ハードウェア（例えば回路、専用ロジック、プログラマブルロジック、プロセッサ、処理デバイス、中央処理ユニット（ＣＰＵ）、システムオンチップ（ＳｏＣ）など）、ソフトウェア（例えば、処理デバイス上でランニング／実行される命令）、ファームウェア（例えば、マイクロコード）、またはそれらの組み合わせを含む処理ロジックによって実行されることができる。いくつかの実施形態では、プロセス７００は、図３Ａおよび３Ｂに示されるようなモジュールの１つまたは複数によって実行されることができる。

図７を参照すると、操作７０１において、第１組のキーポイントは、ＡＤＶの予測ポーズのためにＡＤＶ上のＬＩＤＡＲ装置によって生成されるオンラインポイントクラウドからのものである。第１組のキーポイントにおける各ポイントはＬＩＤＡＲポイントである。第１組のキーポイントを選択する際に、ＡＤＶの予測ポーズを囲む所定の領域内のすべてのＬＩＤＡＲポイントをトラバースして、その隣接する領域に所定密度のＬＩＤＡＲポイントを有する複数の候補ＬＩＤＡＲポイントを特定することができる。３Ｄ構造テンソルを使用して候補ＬＩＤＡＲポイントのそれぞれの線形性を評価することができる。各候補ＬＩＤＡＲポイントの線形性は、かかる評価に基づいて値が割り当てられることができる。候補ＬＩＤＡＲポイントの割り当てられた値に基づいて、候補ＬＩＤＡＲポイントをソートすることができる。ソートされた候補ＬＩＤＡＲポイントに基づいて、固定数の候補ＬＩＤＡＲポイントを選択することができる。固定数の候補ＬＩＤＡＲポイントを選択する際に、新たに選択される各ＬＩＤＡＲポイントは、選択された１つ又は複数の既存のＬＩＤＡＲポイントと所定の距離を維持する必要がある。

操作７０３において、ＡＤＶ上で実行している特徴学習ニューラルネットワークを使用して、第１組のキーポイント用の第１組の特徴記述子を抽出することができる。キーポイントのｚ軸に沿ったシリンダーは、選択されたキーポイント毎に反射強度とそのキーポイントに対する相対座標とを有する所定数の隣接ＬＩＤＡＲポイントを収集するために適用されることができる。選択された各キーポイントについての関連する隣接ＬＩＤＡＲポイントの属性に基づいて、ニューラルネットワークにより各キーポイントの特徴を抽出することができる。

操作７０５において、第１組のキーポイントにおけるキーポイントにそれぞれ対応する第２組のキーポイントを事前作成されたポイントクラウド地図上で特定することができる。２×２回転行列と２Ｄ並進ベクトルとで表される変換を用いて、３Ｄ地図における対応する座標を算出することができる。

操作７０７において、オンラインポイントクラウドから第１組の特徴記述子を抽出する方法と同様に、事前作成されたポイントクラウド地図から第２組の特徴記述子を抽出することができる。

ＣＮＮを用いたソリューションの推定
図８は、実施形態にかかる光検出及び測距（ＬＩＤＡＲ）測位においてニューラルネットワークを使用したソリューション推断システムを示す。

図８に示すように、コストボリューム４０９は、オンラインポイントクラウドから抽出された特徴記述子５１９、５２１および５２３と、事前作成されたポイントクラウド地図から抽出された特徴記述子５２５、５２７および５２９とにより構築された、複数のサブボリューム（セルとも呼ばれる）８１３、８１５および８１７を含むことができる。

サブボリュームを正則化するために、サブボリュームのそれぞれは、複数のＣＮＮ４１１の１つ（例えば、３ＤＣＮＮＡ８２３、３ＤＣＮＮＢ８２５および３ＤＣＮＮＮ８２７）に供給されることができる。３ＤＣＮＮの出力は、正則化されたサブボリューム８１４の１つ（例えば正則化されたサブボリュームＡ８１６、正則化されたサブボリュームＢ８１８、または正則化されたサブボリュームＮ８２０）であってもよい。正則化されたサブボリュームのそれぞれにおいて、マッチングコストがリファインされる。解空間（ｘ，ｙ，ψ）の各解（Δｘｉ，Δｙｊ，Δψｋ）に対して、オンラインポイントクラウドと既存の地図とのＮ個の記述子の差分が解決される。ＣＮＮを用いることにより、差分が低減されるため、差分が最小となる解が算出されやすくなる。

図８に示されるように、正則化されたコストボリューム８１４は、オフセット空間内のキーポイントの一致性を表す確率オフセット８３１にさらに圧縮され、正則化されたコストボリューム８１４は、オンラインポイントクラウドと所定のオフセットの３Ｄポイントクラウド地図との全体的マッチングコストを表すｎ_ｘ×ｎ_ｙ×ｎ_ψボリュームである。

図９は、実施形態にかかるＬＩＤＡＲ測位においてニューラルネットワークを使用してソリューションを推断するシステムの例示的な実施例を示す。

図９に示すように、本明細書で説明される例示的なシステムは、測位オフセット（Δｘ，Δｙ，Δψ）を正確に推定するために使用することができるネットワークを表す。これは、空間（ｘ、ｙ、ψ）内にコストボリューム９１６を構築し、コストボリューム９１６を３Ｄ畳み込みニューラルネットワーク（３ＤＣＮＮ）により正則化することで達成される。まず、システムは、解空間をｘ、ｙ、ψ次元で離散空間に分割し、ｎ_ｘ、ｎ_ｙ、ｎ_ψを各次元における大きさとして表す。その後、システムは、｛ｆ_１、…、ｆ_Ｎ｝を、オンラインＬＩＤＡＲポイントクラウドのキーポイント記述子として表現する。従って、コストボリュームはＮ×ｎ_ｘ×ｎ_ｙ×ｎ_ψとして算出されることができる。各ユニットは、対応するキーポイントと所定のオフセットを有する３Ｄ地図ポイントとのマッチングコストを表すことができる。

予測ポーズが与えられた場合には、オンラインポイントクラウドの局所キーポイントがそれらのグローバル座標に変換される。予測ポーズのｘ、ｙおよびヨー次元において｛（Δｘ_ｉ，Δｙ_ｊ，Δψ_ｋ）｜１≦ｉ≦ｎ_ｘ，１≦ｎ_ｘ≦ｊｎ_ｙ，１≦ｋ≦ｎ_ψ｝として表される隣接領域は、複数の離散空間に分割されることができる。２×２回転行列と２Ｄ並進ベクトルとで表される変換を用いて、３Ｄポイントクラウド地図における対応する座標を算出することができる。

算出された３Ｄポイントクラウド地図における対応する座標の隣接ポイントは同様に、ミニチュアＰｏｉｎｔＮｅｔ構造によりその特徴記述子を抽出するために使用される。コストボリューム９１６の各セルは、その特徴記述子を有するオンラインポイントクラウドからの元のキーポイント、変換および事前作成されたポイントクラウド地図からの対応する特徴記述子に関連付けられることができる。また、バイリニア補間フィルタも、ｘおよびｙ次元においてその４つの隣接領域を有する地図からの対応する特徴記述子をリファインするために使用される。キーポイント特徴及び正則化ネットワークをブリッジするコアステップとして、変換及びバイリニア補間が微分可能であり、これにより、トレーニング段階中に逆伝播によるミニチュアＰｏｉｎｔＮｅｔ構造内での特徴学習を可能にすることができる。オンラインポイントクラウドおよび地図からの記述子ペアにより、Ｎ×ｎ_ｘ×ｎ_ｙ×ｎ_ψコストボリュームは、記述子ペア間の正則化ネットワークの入力であるメトリック距離を算出することによって、オフセット解空間内に形成されることができる。メトリック距離３２は多次元ベクトルであり、各要素が記述子ペアのうち対応する１つからの距離Ｌ２を二乗することによって算出される。

以上の入力が与えられた場合に、このボリュームの背景を考慮してマッチングコストを改善することが可能な正則化関数を学習することができる。オフセット空間内のマッチングコストは、各キーポイントに対して独立に算出されるので、それらがディープ特徴表現を使用しても望ましくない。

本明細書で提供される３Ｄ畳み込み９１５は、測位精度を効果的に改善するために、ボリュームの正則化に使用されることができる。３ＤＣＮＮ９１５は３層を含む。最初の２つの３Ｄ畳み込み層は、バッチ正規化およびＲｅＬＵを使用する。最後の１つの畳み込み層は、その出力を直接送信し、正規化および活性化動作を省略する。同じパラメータを共有する３ＤＣＮＮ９１５は、各ｎ_ｘ×ｎ_ｙ×ｎ_ψサブボリュームで実行され、３ＤＣＮＮ９１５は、収束速度を著しく増加させ、過度のフィッティングを効果的に回避することができる。

図９に示すように、正則化された１つまたは複数のコストボリューム９１８が３ＤＣＮＮ９１５によって生成されることができる。正則化されたコストボリュームまたはサブボリュームは、キーポイント毎のすべてのオフセット構成｛Δｘ_ｉ，Δｙ_ｊ，Δψ_ｋ｝に個別に対するマッチングコストを含む。

一実施形態では、確率オフセット（すなわち、ｎ_ｘ×ｎ_ｙ×ｎ_ψボリューム）は、オフセット空間内のすべてのキーポイントの整合性を表すために算出されることができる。確率オフセットは、所定のオフセットの場合のオンラインポイントクラウドと３Ｄ地図との全体的マッチングコストを表すことができる。

一実施形態では、キーポイントが互いに独立している場合には、

でオフセットΔＴ＝（Δｘ_ｉ，Δｙ_ｊ，Δψ_ｋ）のマッチング確率を算出することができ、ここでＰ_ｉ（ΔＴ）はオフセットΔＴにおけるｉ番目のキーポイントのマッチング確率を示す。

一実施形態では、上式は、対数尤度関数に変換することができる。

上記式において、Ｃ（ΔＴ）はオフセットΔＴにおけるオンラインポイントクラウドと３Ｄポイントクラウド地図との全体的マッチングコストを示す。図９に示す例示的な実施例では、上述のコストｌｏｇ（Ｐ_ｉ（ΔＴ））は入力として使用され、平均削減（ｒｅｄｕｃｅａｖｅｒａｇｅ）演算９１９を適用することによって、キーポイント次元において全体的マッチングコストＣ（ΔＴ）に対応するｎ_ｘ×ｎ_ｙ×ｎ_ψコストボリュームに圧縮されることができる。

一実施形態では、圧縮されたコストボリュームの各セルの値は、対応するオフセットの全体的マッチングコストである。ｘ、ｙおよびヨー次元に沿ってソフトマックス演算９２２を使用ことにより、マッチングコストＣ（ΔＴ）を確率Ｃ（ΔＴ）に変換することができる。確率オフセットＰ（ΔＴ）は、和削減（ｒｅｄｕｃｅｓｕｍ）演算９２１を適用することによって、ｘ、ｙおよびヨー次元においてさらに確率ベクトル：Ｐ_ｉ（Δｘ_ｉ）＝Σ_ｙ，ψＰ（ΔＴ）、Ｐ_ｊ（Δｙ_ｊ）＝Σ_ｘ，ψＰ（ΔＴ）およびＰ（Δψ_ｋ）＝Σ_ｘ，ｙＰ（ΔＴ）に圧縮されることができる。

図１０は、実施形態にかかるＬＩＤＡＲ測位においてニューラルネットワークを使用してソリューションを推断する例示的なプロセスを示すフローチャートである。プロセス１０００は、ソフトウェア、ハードウェアまたはそれらの組み合せを含む処理ロジックにより実行されることが可能である。プロセス１０００は、ハードウェア（例えば回路、専用ロジック、プログラマブルロジック、プロセッサ、処理デバイス、中央処理ユニット（ＣＰＵ）、システムオンチップ（ＳｏＣ）など）、ソフトウェア（例えば、処理デバイス上でランニング／実行される命令）、ファームウェア（例えば、マイクロコード）、またはそれらの組み合わせを含む処理ロジックによって実行されることができる。いくつかの実施形態では、プロセス１０００は、図３Ａおよび３Ｂに示されるようなモジュールの１つまたは複数によって実行されることができる。

図１０を参照すると、操作１００１において、解空間内に自動運転車両の予測ポーズのためのコストボリュームを作成する。コストボリュームは、オンラインポイントクラウドからのキーポイントと事前作成されたポイントクラウド地図上の対応するキーポイントとのマッチングコストを表す複数のサブボリュームを備える。

操作１００３において、複数の畳み込みニューラルネットワーク（ＣＮＮ）によりコストボリュームを正則化して、マッチングコストをリファインする。また、コストボリュームを正則化することにより、コストボリュームのより多くの背景を考慮に入れてマッチングコストをリファインすることができる。さらに、正則化されたコストボリュームに複数のＲＮＮを適用して、複数の連続するＬＩＤＡＲフレーム上の測位結果の軌跡を平滑化することができる。操作１００５において、ＡＤＶの位置を特定するために使用されるグラウンドトゥルースからの予測ポーズの最適オフセットを推定することができる。

測位結果における時間平滑化
図１１は、実施形態にかかるＡＤＶの測位結果において時間平滑化を行うシステムを示す。

図１１に示すように、確率ベクトル８３１は、時間平滑化のために複数のＲＮＮ１１０９、１１１１および１１１３に入力として提供されることができる。各ＲＮＮは、複数の長・短期記憶（ＬＳＴＭ）ユニットを含む。確率ベクトル１１０３、１１０５および１１０８のそれぞれは、対応する確率ベクトル１１２１、１１２３または１１２５を生成することが可能な入力としてＲＮＮの１つに提供されることができる。対応する確率ベクトル１１２１、１１２３および１１２５の加重和１１２７を算出し、元の確率ベクトル１１０３、１１０５および１１０７と組み合わせて使用して、推定されるオフセット１１１７を得ることができる。推定されたオフセット１１１７とグラウンドトゥルースオフセットとを使用して、ＡＤＶの最適なポーズを決定することができる。

一実施形態では、本明細書で説明されるシステムは、連続するＬＩＤＡＲフレームからの学習された履歴情報に基づいて、連続するＬＩＤＡＲフレーム上での測位結果の軌跡を平滑化することができる。ＡＤＶは、連続するＬＩＤＡＲフレーム上で複数の予測ポーズを有することができる。

図１２は、実施形態にかかるＡＤＶの測位結果において時間平滑化を行うためのシステムの例示的な実施例を示す。

上述したように、オンラインポイントクラウドと事前作成されたポイントクラウド地図とのマッチングは空間的である。したがって、連続するＬＩＤＡＲフレームの確率オフセットは、互いに独立している。しかしながら、測位タスクは連続的なプロセスであり、従って、連続フレームのポーズを考慮に入れるべきである。従来の方法では、ヒストグラムフィルタ内の履歴分布を伝達して、現在のマッチング分布を推定し、これにより出力の時間平滑化が保証される。

この例示的な実施例は、リカレントニューラルネットワーク（ＲＮＮ）を使用して、同様の時間平滑化を実現する。より具体的には、ＬＳＴＭユニットが使用される。上述した確率オフセットからのかかる次元（ｘ、ｙ、ψ）に対する確率ベクトル１２０９のそれぞれは、パラメータがそれぞれ独立したＲＮＮユニットの入力とみなすことができる。ＲＮＮによって履歴情報を学習することで、測位結果の軌跡がより滑らか且つ正確になる。

一実施形態では、この例示的な実施例は、損失として特徴空間距離を使用することなく、直接に推定オフセット

とグラウンドトゥルースオフセット

とのＬ２距離の二乗に損失を定義する。次に、推定オフセット１２１３は、以下のように算出することができる。

したがって、損失関数は以下のように定義することができる。

ここで、αは平衡係数である。

図１３は、本実施形態にかかるＡＤＶの測位結果において時間平滑化を行う例示的なプロセスを示すフローチャートである。

プロセス１３００は、ソフトウェア、ハードウェアまたはそれらの組み合せを含む処理ロジックにより実行されることが可能である。プロセス１３００は、ハードウェア（例えば回路、専用ロジック、プログラマブルロジック、プロセッサ、処理デバイス、中央処理ユニット（ＣＰＵ）、システムオンチップ（ＳｏＣ）など）、ソフトウェア（例えば、処理デバイス上でランニング／実行される命令）、ファームウェア（例えば、マイクロコード）、またはそれらの組み合わせを含む処理ロジックによって実行されることができる。いくつかの実施形態では、プロセス１３００は、図３Ａおよび３Ｂに示されるようなモジュールの１つまたは複数によって実行されることができる。

図１３を参照すると、操作１３０１において、オンラインポイントクラウド内の複数の連続する光検出および測距（ＬＩＤＡＲ）フレームのそれぞれに対して確率オフセットを作成する。確率オフセットは、オンラインポイントクラウドからの第１組のキーポイントと、事前作成されたポイントクラウド地図からの第２組のキーポイントとの全体的マッチングコストを表す。操作１３０３において、Ｘ次元、Ｙ次元、およびヨー次元において確率オフセットを複数の確率ベクトルに圧縮する。操作１３０５において、確率オフセットの各確率ベクトルを処理のためにリカレントニューラルネットワーク（ＲＮＮ）に提供する。操作１３０７において、ＲＮＮは、複数の連続するＬＩＤＡＲフレーム上で測位結果の軌跡を生成する。

図１４は、実施形態にかかる学習に基づくＬＩＤＡＲ測位システム１４００の全体的アーキテクチャを示す。図１４に示すように、システム１４００は、オンラインＬＩＤＡＲスキャン１４００および１４０５と、事前作成されたポイントクラウド地図１４０３および１４０７と、予測ポーズ１４０８とを入力として使用し、ＰｏｉｎｔＮｅｔ１４０９により特徴を学習し、解空間内にコストボリュームを作成し、ＣＮＮ１４１１およびＲＮＮ１４１３を使用して最適ポーズ１４１５を推定する。

図１５は、実施形態にかかる学習に基づくＬＩＤＡＲ測位システム１５００の全体的アーキテクチャをより詳細に示す。図１５に示すように、システム１５００は、キーポイント選択段階１５０１と、特徴記述子抽出段階１５０３と、コストボリューム作成段階と、３ＤＣＮＮ適用段階１５０５と、確率オフセット作成段階１５０７と、時間平滑化段階１５０９と、推定オフセット作成段階１５１１とを含む。さらに示すように、各段階において、対応する構造（例えば、１つまたは複数の部材および入力）が、該段階の動作および機能を実行するために提供されることができる。本開示では、これらの構造を上述した。

例示的な例として、システム１５００を訓練するために２ステップ戦略を使用することができる。第１ステップでは、記述子抽出段階１５０３におけるミニチュアＰｏｉｎｔＮｅｔ構造とコストボリューム作成段階１５０５用の３ＤＣＮＮのみを訓練する。これを達成するために、ネットワークアーキテクチャにおける時間平滑化段階１５０９用のＲＮＮを除去し、確率オフセットから推定された確率ベクトルに基づいて、損失を直接算出する。バッチサイズおよび学習率はそれぞれ１および０．１に設定される。抽出された特徴がよりロバスト性を有するために、ｘ－ｙ次元に［０～１．０］ｍの均一に分布するランダムノイズを追加するとともに、ヨー次元において［０～２．０］ｏのランダム誤差を入力予測ポーズに追加する。

第２ステップでは、ＲＮＮのパラメータは、ミニチュアＰｏｉｎｔＮｅｔ構造および３ＤＣＮＮに固定されたパラメータを使用して訓練される。バッチサイズおよび学習率はそれぞれ１および０．００１に設定される。ＲＮＮ訓練中に、長さが１０のシーケンスがサンプリングされる。ＬＩＤＡＲフレームの周波数が１０ｈｚであることを考慮すると、ＲＮＮの実際の受信可能なフィールドは約１．０秒である。これらの２つのステップでは、トレーニングと検証の比が４対１になるように、訓練データセットを訓練セットと検証セットにランダムに分割する。性能利得がない場合には、２つのステップに対して１００期間の訓練が行われると停止する。

図１６は、本発明の一実施態様とともに使用可能なデータ処理システムの例を示すブロック図である。例えば、システム１６００は、上述した前記プロセスまたは方法のいずれかを実行する任意のデータ処理システムを表すことができる。システム１６００は、様々の部材を備えることが可能である。それらの部材は、集積回路（ＩＣ）、集積回路の一部、別体の電子デバイスや回路基板（例えば、コンピュータシステムのマザーボードまたは挿入カード）に適用される他のモジュールとして実現され、又は、他の方式でコンピュータシステムのラックに組み込まれる部材として実現されることが可能である。

なお、システム１６００は、コンピュータシステムの多くの部材の上位図を示すものである。しかしながら、一部の実施態様では、付加部材を有してもよく、また、他の実施態様では、図示する部材と異なるレイアウトを有してもよいこと、を理解すべきである。システム１６００は、デスクトップ型コンピュータ、ラップトップ型コンピュータ、タブレット型コンピュータ、サーバ、携帯電話、メディアプレイヤ、携帯情報端末（ＰＤＡ）、スマートウォッチ、パーソナル通信機器、ゲーム装置、ルータやハブ機器、アクセスポイント（ＡＰ）やリピーター、セットトップボックス、またはそれらの組み合せを示すことが可能である。また、単一の機器またはシステムのみを示すが、「機器」または「システム」という用語は、１つ（または複数）の命令セットを個別または一緒に実行することにより、本明細書で検討するいずれかの１種または複数種の方法を実行する機器またはシステムの集合のいずれを含むことを、理解すべきである。

一実施態様では、システム１６００は、バスまたはインターコネクト１６１０を介して接続されるプロセッサ１６０１、メモリ１６０３及び装置１６０５～１６０８を含む。プロセッサ１６０１は、単一のプロセッサコア、または複数のプロセッサコアの１つのプロセッサや複数のプロセッサを含むことを表すことが可能である。プロセッサ１６０１は１つまたは複数の汎用プロセッサ、例えば、マイクロプロセッサ、中央処理ユニット（ＣＰＵ）などを表すことが可能である。より具体的には、プロセッサ１６０１は、複合命令セットコンピュータ（ＣＩＳＣ）方式のマイクロプロセッサ、縮小命令セットコンピュータ（ＲＩＳＣ）方式のマイクロプロセッサ、ＶＬＩＷ（ＶｅｒｙＬｏｎｇＩｎｓｔｒｕｃｔｉｏｎＷｏｒｄ）型マイクロプロセッサや他の命令セットを実施するプロセッサ、または命令セットの組み合せを実施するプロセッサであってもよい。プロセッサ１６０１は、１つまたは複数の専用プロセッサ、例えば、特定用途向け集積回路（ＡＳＩＣ）、セルラやベースバンドプロセッサ、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、デジタルシグナルプロセッサ（ＤＳＰ）、ネットワークプロセッサ、グラフィックプロセッサ、通信プロセッサ、暗号化プロセッサ、コプロセッサ、組込み用途向けプロセッサ、または命令を処理可能な他のロジックのいずれであってもよい。

プロセッサ１６０１（低パワーマルチコアプロセッサジャケットインタフェース、例えば超低電圧プロセッサであってもよい）は、前記システムの種々の部材と通信するためのメイン処理ユニット及び中央ハブとして使用されることが可能である。そのようなプロセッサは、オンチップシステム（ＳｏＣ）として実現されることが可能である。プロセッサ１６０１は、本明細書で検討する操作及びステップを実行するための命令を実施するように配置される。システム１６００は、選択可能なグラフィックサブシステム１６０４と通信可能なグラフィックインタフェースを更に含み、グラフィックサブシステム１６０４が、表示制御部、グラフィックプロセッサおよび／または表示装置を備えることが可能である。

プロセッサ１６０１は、メモリ１６０３と通信可能であり、一実施態様では、メモリ１６０３が所定量のシステム用の記憶を提供するように、複数のメモリ装置により実現されることが可能である。メモリ１６０３は、１つまたは複数の揮発性記憶（またはメモリ）装置、例えば、ランダムアクセスメモリ（ＲＡＭ）、ダイナミックＲＡＭ（ＤＲＡＭ）、シンクロナスＤＲＡＭ（ＳＤＲＡＭ）、スタティックＲＡＭ（ＳＲＡＭ）または他のタイプの記憶装置を含むことが可能である。メモリ１６０３は、プロセッサ１６０１または他の装置により実行される命令列を含む情報を記憶可能である。例えば、種々のオペレーティングシステム、デバイスドライバ、ファームウェア（例えば、入出力基本システムまたはＢＩＯＳ）および／またはアプリケーションの実行コードおよび／またはデータは、メモリ１６０３にローディングされてプロセッサ１６０１により実行されることが可能である。オペレーティングシステムは、いずれのタイプのオペレーティングシステム、例えば、ロボットオペレーティングシステム（ＲＯＳ）、Ｍｉｃｒｏｓｏｆｔ（登録商標）社のＷｉｎｄｏｗｓ（登録商標）オペレーティングシステム、アップル社のＭＡＣＯＳ（登録商標）／ＩＯＳ（登録商標）、Ｇｏｏｇｌｅ（登録商標）社のＡｎｄｒｏｉｄ（登録商標）、ＬＩＮＵＸ、ＵＮＩＸ（登録商標）、または他のリアタイムや組み込みオペレーティングシステムであってもよい。

システム１６００は、ＩＯ装置、例えばネットワークインタフェース装置１６０５、選択可能な入力装置１６０６及び他の選択可能なＩＯ装置１６０７を含む装置１６０５～１６０８をさらに備えることが可能である。ネットワークインタフェース装置１６０５は、無線送受信器および／またはネットワークインタフェースカード（ＮＩＣ）を含むことが可能である。前記無線送受信器は、ＷｉＦｉ送受信器、赤外線送受信器、ブルートゥース（登録商標）送受信器、ＷｉＭａｘ送受信器、無線携帯電話送受信器、衛星送受信器（例えば、全地球測位システム（ＧＰＳ）送受信器）や他の無線周波数（ＲＦ）送受信器、またはそれらの組み合せであってもよい。ＮＩＣは、イーサネットカードであってもよい。

入力装置１６０６は、マウス、タッチパネル、タッチスクリーン（表示装置１６０４に集積されることが可能である）、ポインティングデバイス（例えば、スタイラスペン）および／またはキーボード（例えば、物理的なキーボードまたはタッチスクリーンの一部として表示される仮想的なキーボード）を含むことが可能である。例えば、入力装置１６０６は、タッチスクリーンに接続されるタッチスクリーンコントローラを含むことが可能である。タッチスクリーン及びタッチスクリーンコントローラは、例えば複数種のタッチセンシティブ技術（容量、電気抵抗、赤外線及び弾性表面波技術を含むが、これに限定されない）のいずれか１種、及び他の近接センサアレイまたはタッチスクリーンに接触する１つまたは複数のポイントを特定するための他の素子により、その接触、及び移動や間欠を検出する。

ＩＯ装置１６０７は、オーディオ装置を含むことが可能である。オーディオ装置は、音声を支持する機能、例えば音声認識、音声再生、ディジタル記録および／または電話機能を促すために、スピーカおよび／またはマイクフォンを含むことが可能である。他のＩＯ装置１６０７として、ユニバーサルシリアルバス（ＵＳＢ）ポート、パラレルポート、シリアルポート、プリンタ、ネットワークインタフェース、バスブリッジ（例えば、ＰＣＩ－ＰＣＩブリッジ）、センサ（例えば、加速度計などのモーションセンサ、ジャイロ、磁力計、光センサ、コンパス、接近センサなど）またはそれらの組み合せを含むことが可能である。装置１６０７は、カメラ機能（例えば、写真及び動画セグメントの記録）を促すための光学センサ、例えば電荷結合素子（ＣＣＤ）または相補型金属酸化物半導体（ＣＭＯＳ）光学センサを備える撮像処理サブシステム（例えば、カメラ）をさらに含むことが可能である。システム１６００の具体的な構成または設計に応じて、センサ・ハブ（図示せず）を介して、いくつかのセンサをインターコネクト１６１０に接続することができる一方、キーボードや熱センサなどの他のデバイスを、組み込みコントローラ（図示せず）によって制御することができる。

例えばデータ、アプリケーション、１つまたは複数のオペレーティングシステムなどの情報の永続的な記憶を提供するために、大容量記憶装置（図示せず）がプロセッサ１６０１に接続されてもよい。種々の実施態様では、薄型化且つ軽量化のシステム設計を実現するとともにシステムの応答性を改良するために、そのような大容量記憶装置は、固体装置（ＳＳＤ）により実現されることが可能である。しかしながら、他の実施態様では、大容量記憶装置は、主にハードディスクドライブ（ＨＤＤ）により実現されてもよく、そのうち少量のＳＳＤ記憶装置は、ＳＳＤ用キャッシュとされることにより、停電期間でコンテキストの状態及び他の情報の非一時的記憶を実現して、システム活動が再起動する際に急速通電を実現することができる。また、フラッシュメモリは、例えばシリアルペリフェラルインタフェース（ＳＰＩ）を介してプロセッサ１６０１に接続されることが可能である。そのようなフラッシュメモリは、前記システムのＢＩＯＳ及び他のファームウェアを含むシステムソフトウェアの非一時的記憶を提供することが可能である。

記憶装置１６０８は、本明細書に記載のいずれか１種または複数種の方法や機能を実現する１つまたは複数の命令セットやソフトウェア（例えば、モジュール、ユニットおよび／またはロジック１６２８）が記憶されているコンピュータアクセス可能な記憶媒体１６０９（機械可読記憶媒体またはコンピュータ可読な媒体ともいう）を含むことが可能である。処理モジュール／ユニット／ロジック１６２８は、上記部材のいずれか１つ、例えば計画モジュール３０５、制御モジュール３０６を表すことが可能である。また、処理モジュール／ユニット／ロジック１６２８は、データ処理システム１６００、メモリ１６０３及びプロセッサ１６０１により実行されている期間で、全部または少なくとも一部が機械アクセス可能な記憶媒体を構成するメモリ１６０３および／またはプロセッサ１６０１に貯留されることが可能である。更に、処理モジュール／ユニット／ロジック１６２８は、ネットワークによりネットワークインタフェース装置１６０５を介して伝送または受信を行うことが可能である。

コンピュータ可読記憶媒体１６０９は、上述した一部のソフトウェア機能を永続的に記憶することが可能である。コンピュータ可読記憶媒体１６０９は、例示的な実施態様では単一の媒体として示されるが、「コンピュータ可読記憶媒体」という用語は、前記１つまたは複数の命令セットを記憶する単一の媒体または複数の媒体（例えば、集中または分散データベースおよび／または関連するキャッシュメモリ及びサーバ）を含む、と考えられる。「コンピュータ可読記憶媒体」という用語は、機械により実行される命令セットであって、前記機械に本発明のいずれの１種または複数種の方法を実行させる命令セットを記憶またはコーディング可能ないずれの媒体を含む、と考えられる。よって、「コンピュータ可読記憶媒体」という用語は、固体メモリ、光学媒体及び磁気媒体、または他の非一時的機械可読媒体のいずれを含むが、これに限定されない、と考えられる。

本明細書に記載の処理モジュール／ユニット／ロジック１６２８、部材及び他の特徴は、個別ハードウェア部材とされ、またはハードウェア部材（例えば、ＡＳＩＣＳ、ＦＰＧＡ、ＤＳＰまたは同様な装置）の機能に集積されるように、実現可能である。また、処理モジュール／ユニット／ロジック１６２８は、ハードウェア装置におけるファームウェアまたは機能回路として実現されることが可能である。また、処理モジュール／ユニット／ロジック１６２８は、ハードウェア装置とソフトウェア部材とのいずれの組み合せにより実現されることが可能である。

なお、システム１６００は、データ処理システムの種々の部材を備えるように示されるが、部材を相互に接続する特定の構成または態様を示すためではない。よって、そのような詳細は、本発明の実施態様と密接な関係がない。さらに、より少ない部材またはより多い部材を有するネットワークコンピュータ、ハンディコンピュータ、携帯電話、サーバおよび／または他のデータ処理システムも、本発明の実施態様とともに使用可能であることを、認識すべきである。

詳細に記載した前記内容の一部は、既にコンピュータメモリで行われるデータビットの演算のアルゴリズム及び符号表示に応じて表現された。それらのアルゴリズムの記載及び表示は、データ処理分野での技術者が使用する方式であり、技術者らの実質的な動作を効率よく本分野での他の技術者に伝達するためである。本明細書では、アルゴリズムは、通常に所望の結果を達成する自律操作シーケンスとして考えられる。それらの操作とは、物理量を物理的に操作する必要がある操作である。

ところで、それらの用語及びそれらの類似する用語のすべては、適当な物理量に関連するものであり、且つ単にそれらの物理量を簡便に表記することに適用されることはいうまでもない。以上の検討において他の態様で明確に限定しない限り、明細書全体では、用語（例えば、添付した特許請求の範囲に記載の用語）により検討されることは、コンピュータシステムのレジスタ及びメモリでの物理（電子）量として表示されるデータを操作して、前記データをコンピュータシステムメモリやレジスタ、または他の情報記憶装置、伝送装置や表示装置での同様に物理量として表示される他のデータを変換するコンピュータシステムや類似する電子計算装置の動作及び処理である。

本発明の実施態様は、本明細書における操作を実行するためのデバイスにさらに関する。そのようなコンピュータプログラムは、非一時的コンピュータ可読媒体に記憶されている。機械可読媒体は、機械（例えば、コンピュータ）可読態様で情報を記憶するための機構全体を含む。例えば、機械可読（例えば、コンピュータ可読）媒体は、機械（例えば、コンピュータ）可読記憶媒体（例えば、読み出し専用メモリ（ＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、磁気ディスク記憶媒体、光記憶媒体、フラッシュメモリ装置）を含む。

前記図面に記載のプロセスや方法は、ハードウェア（例えば、回路、専用ロジックなど）、ソフトウェア（例えば、非一時的コンピュータ可読媒体で実現される）またはそれらの組み合せを含む処理ロジックにより実行されることが可能である。前記プロセスや方法は、上記の内容において一部の順序操作に基づいて記載されるが、前記操作の一部が異なる順序で実行されてもよいことを、理解すべきである。また、一部の操作は、順序に実行されることではなく、並列に実行されてもよい。

本発明の実施態様は、いずれの特定のプログラミング言語を参照して記載されることではない。複数種のプログラミング言語を使用して本明細書に記載の本発明の実施態様の教示を実施可能であることを、理解すべきである。

以上の明細書では、本発明の具体的な実施態様を参照して本発明の実施態様を記載した。添付した特許請求の範囲に記載の本発明の更なる広い要旨及び範囲を逸脱しない限り、本開示を様々な形態で変形可能であることが、明らかである。したがって、明細書および図面は、制限的な意味ではなく、例示的な意味で理解されるべきである。

Claims

ＬＩＤＡＲ測位においてニューラルネットワークを用いてソリューション推断を行うコンピュータ実施の方法であって、
ＡＤＶの予測ポーズに用いられる、オンラインポイントクラウドからのキーポイントと事前作成されたポイントクラウド地図上の対応するキーポイントとのマッチングコストを表す複数のサブボリュームを備えるコストボリュームを解空間内において作成することと、
前記マッチングコストをリファインするように複数の畳み込みニューラルネットワークを用いて、前記コストボリュームの前記複数のサブボリュームをそれぞれ正則化して、正則化されたコストボリュームを得ることと、
正則化されたコストボリュームから前記予測ポーズの、前記ＡＤＶの位置を特定するために用いられる最適なオフセットを推定することと、
を含むことを特徴とするコンピュータ実施の方法。
前記複数の畳み込みニューラルネットワークのそれぞれは、同一セットのパラメータを共有し、複数の畳み込み層を含み、前記複数の畳み込み層の少なくとも一層は、バッチ正規化及び正規化線形ユニットを用いる３Ｄ畳み込み層であることを特徴とする請求項１に記載の方法。
前記予測ポーズの解空間は、前記オンラインポイントクラウドから選択される１組のキーポイントにより定義される空間を含み、前記１組のキーポイントのそれぞれは、所定数の隣接ポイントと関連付けられるとともに、前記１組のキーポイントの残りのキーポイントと最小距離を有することを特徴とする請求項１に記載の方法。
前記オンラインポイントクラウド及び前記事前作成されたポイントクラウド地図から抽出された特徴記述子に基づいて前記コストボリュームを作成し、前記オンラインポイントクラウドから抽出されたそれぞれの特徴は、キーポイント及び所定の数の隣接するＬＩＤＡＲポイントに対応することを特徴とする請求項３に記載の方法。
前記コストボリュームを作成することは、各対の対応する特徴記述子同士のメトリック距離を算出することを更に含み、当該メトリック距離は、多次元ベクトルであり、各要素は、記述子ペアのうち対応する一つからの距離を二乗することによって算出されることを特徴とする請求項３に記載の方法。
前記コストボリュームを作成することは、
前記解空間を前記１組のキーポイントの１つにそれぞれ対応する複数の離散空間に分割することと、
対応するキーポイント及びそれに関連する隣接するＬＩＤＡＲポイントに占められた空間に基づき、それぞれの離散空間に対してローリング角（Ｘ）次元、コース角（Ｙ）次元及びヨー角次元の大きさを決定することと、
前記予測ポーズのための複数の特徴記述子及びそれぞれの離散空間に対するそれぞれの次元の大きさに基づいて前記コストボリュームを作成することと、
を更に含むことを特徴とする請求項３に記載の方法。
前記コストボリュームのそれぞれのサブボリュームは、前記オンラインポイントクラウドからのその関連する特徴記述子を有するキーポイント、変換及び前記事前作成されたポイントクラウド地図からの対応する特徴記述子と関連付けられることを特徴とする請求項１に記載の方法。
ＬＩＤＡＲ測位においてニューラルネットワークを用いてソリューション推断を行うポイントクラウド特徴を抽出するシステムであって、
プロセッサと、プロセッサに接続され、命令を記憶するメモリと、を含み、
前記命令は、前記プロセッサによって実行されると、
ＡＤＶの予測ポーズに用いられる、オンラインポイントクラウドからのキーポイントと事前作成されたポイントクラウド地図上の対応するキーポイントとのマッチングコストを表す複数のサブボリュームを備えるコストボリュームを解空間内において作成することと、
前記マッチングコストをリファインするように複数の畳み込みニューラルネットワークを用いて前記コストボリュームの前記複数のサブボリュームをそれぞれ正則化して、正則化されたコストボリュームを得ることと、
正則化されたコストボリュームから前記予測ポーズの、前記ＡＤＶの位置を特定するために用いられる最適なオフセットを推定することと、
を含む操作をプロセッサに実行させることを特徴とするシステム。
前記複数の畳み込みニューラルネットワークのそれぞれは、同一セットのパラメータを共有し、複数の畳み込み層を含み、前記複数の畳み込み層の少なくとも一層は、バッチ正規化及び正規化線形ユニットを用いる３Ｄ畳み込み層であることを特徴とする請求項８に記載のシステム。
前記予測ポーズの解空間は、前記オンラインポイントクラウドから選択される１組のキーポイントにより定義される空間を含み、前記１組のキーポイントのそれぞれは、所定数の隣接ポイントと関連付けられるとともに、前記１組のキーポイントの残りのキーポイントと最小距離を有することを特徴とする請求項８に記載のシステム。
前記オンラインポイントクラウド及び前記事前作成されたポイントクラウド地図から抽出された特徴記述子に基づいて前記コストボリュームを作成し、前記オンラインポイントクラウドから抽出されたそれぞれの特徴は、キーポイント及び所定の数の隣接するＬＩＤＡＲポイントに対応することを特徴とする請求項１０に記載のシステム。
前記コストボリュームを作成することは、各対の対応する特徴記述子同士のメトリック距離を算出することを更に含み、当該メトリック距離は、多次元ベクトルであり、各要素は、記述子ペアのうち対応する一つからの距離を二乗することによって算出されることを特徴とする請求項１０に記載のシステム。
前記コストボリュームを作成することは、
前記解空間を前記１組のキーポイントの１つにそれぞれ対応する複数の離散空間に分割することと、
対応するキーポイント及びそれに関連する隣接するＬＩＤＡＲポイントに占められた空間に基づき、それぞれの離散空間に対してローリング角（Ｘ）次元、コース角（Ｙ）次元及びヨー角次元の大きさを決定することと、
前記予測ポーズのための複数の特徴記述子及びそれぞれの離散空間に対するそれぞれの次元の大きさに基づいて前記コストボリュームを作成することと、
を更に含むことを特徴とする請求項８に記載のシステム。
前記コストボリュームのそれぞれのサブボリュームは、前記オンラインポイントクラウドからのその関連する特徴記述子を有するキーポイント、変換及び前記事前作成されたポイントクラウド地図からの対応する特徴記述子と関連付けられることを特徴とする請求項８に記載のシステム。
指令を記憶している非一時性機器可読メディアであって、
前記指令は、プロセッサによって実行されると、前記プロセッサに、ＬＩＤＡＲ測位においてニューラルネットワークを用いてソリューション推断を行うためのポイントクラウド特徴を抽出する操作を実行させ、前記操作は、
ＡＤＶの予測ポーズに用いられる、オンラインポイントクラウドからのキーポイントと事前作成されたポイントクラウド地図上の対応するキーポイントとのマッチングコストを表す複数のサブボリュームを備えるコストボリュームを解空間内において作成することと、
前記マッチングコストをリファインするように複数の畳み込みニューラルネットワークを用いて前記コストボリュームの前記複数のサブボリュームをそれぞれ正則化して、正則化されたコストボリュームを得ることと、
正則化されたコストボリュームから前記予測ポーズの、前記ＡＤＶの位置を特定するために用いられる最適なオフセットを推定することと、
を含むことを特徴とする機器可読メディア。
前記複数の畳み込みニューラルネットワークのそれぞれは、同一セットのパラメータを共有し、複数の畳み込み層を含み、前記複数の畳み込み層の中の少なくとも一層は、バッチ正規化及び正規化線形ユニットを用いる３Ｄ畳み込み層であることを特徴とする請求項１５に記載の機器可読メディア。
前記予測ポーズの解空間は、前記オンラインポイントクラウドから選択される１組のキーポイントにより定義される空間を含み、前記１組のキーポイントのそれぞれは、所定数の隣接ポイントと関連付けられるとともに、前記１組のキーポイントの残りのキーポイントと最小距離を有することを特徴とする請求項１５に記載の機器可読メディア。
前記オンラインポイントクラウド及び前記事前作成されたポイントクラウド地図から抽出された特徴記述子に基づいて前記コストボリュームを作成し、前記オンラインポイントクラウドから抽出されたそれぞれの特徴は、キーポイント及び所定の数の隣接するＬＩＤＡＲポイントに対応することを特徴とする請求項１７に記載の機器可読メディア。
前記コストボリュームを作成することは、各対の対応する特徴記述子同士のメトリック距離を算出することを更に含み、当該メトリック距離は、多次元ベクトルであり、各要素は、記述子ペアのうち対応する一つからの距離を二乗することによって算出されることを特徴とする請求項１７に記載の機器可読メディア。
前記コストボリュームを作成することは、
前記解空間を前記１組のキーポイントの１つにそれぞれ対応する複数の離散空間に分割することと、
対応するキーポイント及びそれに関連する隣接するＬＩＤＡＲポイントに占められた空間に基づき、それぞれの離散空間に対してローリング角（Ｘ）次元、コース角（Ｙ）次元及びヨー角次元の大きさを決定することと、
前記予測ポーズのための複数の特徴記述子及びそれぞれの離散空間に対するそれぞれの次元の大きさに基づいて前記コストボリュームを作成することと、
を更に含むことを特徴とする請求項１５に記載の機器可読メディア。
前記コストボリュームのそれぞれのサブボリュームは、前記オンラインポイントクラウドからのその関連する特徴記述子を有するキーポイント、変換及び前記事前作成されたポイントクラウド地図からの対応する特徴記述子と関連付けられることを特徴とする請求項１５に記載の機器可読メディア。
コンピュータプログラムであって、
前記コンピュータプログラムは、プロセッサにより実行されると、請求項１～７のいずれか１項に記載の方法を実行させるコンピュータプログラム。