JP2022515591A

JP2022515591A - ターゲットオブジェクトの３ｄ検出方法、装置、媒体及び機器

Info

Publication number: JP2022515591A
Application number: JP2021526222A
Authority: JP
Inventors: シー，シャオシュアイ; リー，ホンシェン; ワン，シャオガン
Original assignee: ベイジンセンスタイムテクノロジーデベロップメントシーオー．，エルティーディー
Priority date: 2018-11-29
Filing date: 2019-11-13
Publication date: 2022-02-21
Also published as: KR20210078529A; WO2020108311A1; CN109635685B; CN109635685A

Abstract

本開示の実施形態は、ターゲットオブジェクトの３Ｄ検出方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラムを開示し、ターゲットオブジェクトの３Ｄ検出方法は、取得されたシーンの点群データの特徴情報を抽出することと、前記点群データの特徴情報に基づいて、前記点群データに対してセマンティックセグメンテーションを行って、前記点群データにおける複数の点の第１セマンティック情報を取得することと、前記第１セマンティック情報に基づいて、前記複数の点のうち、ターゲットオブジェクトに対応する少なくとも１つの前景点を予測することと、前記第１セマンティック情報に基づいて、前記少なくとも１つの前景点のそれぞれに対応する３Ｄ初期枠を生成することと、前記３Ｄ初期枠に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定することと、を含む。【選択図】図１

Description

本開示は、２０１８年１１月２９日に中国特許庁に提出された、出願番号２０１８１１４４６５８８．８、発明の名称「ターゲットオブジェクトの３Ｄ検出方法、装置、媒体及び機器」の中国特許出願の優先権を主張するものであり、その全ての内容は、参照により本開示に組み込まれるものとする。

本開示は、コンピュータビジョン技術に関し、特に、ターゲットオブジェクトの３Ｄ検出方法及び装置、車両のインテリジェント制御方法及び装置、障害物回避ナビゲーション方法及び装置、電子機器、コンピュータ可読記憶媒体、並びにコンピュータプログラムに関する。

３Ｄ検出は、インテリジェント運転及び障害物回避ナビゲーションなどの様々な技術に適用することができる。インテリジェント運転技術では、３Ｄ検出により、インテリジェント運転車両の周囲の車両及び歩行者などのターゲットオブジェクトの具体的な位置、形状、大きさ及び移動方向などの情報を取得することができるため、インテリジェント運転車両がインテリジェント運転の意思決定を行うことを支援することができる。

本開示の実施形態は、ターゲットオブジェクトの３Ｄ検出、車両のインテリジェント制御運転及び障害物回避ナビゲーションの技術的解決手段を提供する。

本開示の実施形態の一態様に係るターゲットオブジェクトの３Ｄ検出方法は、取得されたシーンの点群データの特徴情報を抽出することと、前記点群データの特徴情報に基づいて、前記点群データに対してセマンティックセグメンテーションを行って、前記点群データにおける複数の点の第１セマンティック情報を取得することと、前記第１セマンティック情報に基づいて、前記複数の点のうち、ターゲットオブジェクトに対応する少なくとも１つの前景点を予測することと、前記第１セマンティック情報に基づいて、前記少なくとも１つの前景点のそれぞれに対応する３Ｄ初期枠を生成することと、前記３Ｄ初期枠に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定することと、を含む。

本開示の実施形態の別の態様に係る車両のインテリジェント制御方法は、上記ターゲットオブジェクトの３Ｄ検出方法を用いてターゲットオブジェクトの３Ｄ検出枠を取得することと、前記３Ｄ検出枠に基づいて、車両を制御する命令又は早期警報提示情報を生成することと、を含む。

本開示の実施形態の別の態様に係る障害物回避ナビゲーション方法は、上記ターゲットオブジェクトの３Ｄ検出方法を用いてターゲットオブジェクトの３Ｄ検出枠を取得することと、前記３Ｄ検出枠に基づいて、ロボットに対して障害物回避ナビゲーション制御を行う命令又は早期警報提示情報を生成することと、を含む。

本開示の実施形態の別の態様に係るターゲットオブジェクトの３Ｄ検出装置は、取得されたシーンの点群データの特徴情報を抽出する特徴抽出モジュールと、前記点群データの特徴情報に基づいて、前記点群データに対してセマンティックセグメンテーションを行って、前記点群データにおける複数の点の第１セマンティック情報を取得する第１セマンティックセグメンテーションモジュールと、前記第１セマンティック情報に基づいて、前記複数の点のうち、ターゲットオブジェクトに対応する少なくとも１つの前景点を予測する前景点予測モジュールと、前記第１セマンティック情報に基づいて、前記少なくとも１つの前景点のそれぞれに対応する３Ｄ初期枠を生成する初期枠生成モジュールと、前記３Ｄ初期枠に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定する検出枠決定モジュールとを含む。

本開示の実施形態の別の態様に係る車両のインテリジェント制御装置は、ターゲットオブジェクトの３Ｄ検出枠を取得する上記ターゲットオブジェクトの３Ｄ検出装置と、前記３Ｄ検出枠に基づいて、車両を制御する命令又は早期警報提示情報を生成する第１制御モジュールと、を含む。

本開示の実施形態の別の態様に係る障害物回避ナビゲーション装置は、ターゲットオブジェクトの３Ｄ検出枠を取得する上記ターゲットオブジェクトの３Ｄ検出装置と、前記３Ｄ検出枠に基づいて、ロボットに対して障害物回避ナビゲーション制御を行う命令又は早期警報提示情報を生成する第２制御モジュールと、を含む。

本開示の実施形態の別の態様に係る電子機器は、コンピュータプログラムを記憶するメモリと、前記メモリに記憶されたコンピュータプログラムを実行し、かつ前記コンピュータプログラムを実行すると、本開示のいずれかの方法の実施形態を実現するプロセッサと、を含む。

本開示の実施形態の別の態様に係るコンピュータ可読記憶媒体には、プロセッサにより実行されると、本開示のいずれかの方法の実施形態を実現するコンピュータプログラムが記憶されている。

本開示の実施形態の別の態様に係るコンピュータプログラムは、機器のプロセッサで実行されると、本開示のいずれかの方法の実施形態を実現するコンピュータ命令を含む。

本開示に係るターゲットオブジェクトの３Ｄ検出方法及び装置、車両のインテリジェント制御方法及び装置、障害物回避ナビゲーション方法及び装置、電子機器、コンピュータ可読記憶媒体、並びにコンピュータプログラムによれば、本開示における、点群データに対する特徴抽出、及び抽出された特徴情報に基づく点群データに対するセマンティックセグメンテーションは、下位層データの分析に相当し、本開示における、セマンティックセグメンテーション結果に基づくターゲットオブジェクトの３Ｄ検出枠の生成及び決定は、上位層データの分析に相当するため、本開示は、ターゲットオブジェクトの３Ｄ検出プロセスにおいて、下から上への３Ｄ検出枠の生成方式を形成することにより、点群データに対して投影処理を行ってから投影処理後に取得された画像を利用して３Ｄ検出枠の検出を行うことに起因する、点群データの元情報の損失現象を回避することができるだけでなく、撮像装置で撮像された２Ｄ画像を利用して３Ｄ検出枠の検出を行う時に２Ｄ画像におけるターゲットオブジェクト（例えば、車両又は障害物など）が遮蔽されるため、３Ｄ検出枠の検出に影響を与える現象を回避することもできる。上記説明から分かるように、本開示に係る技術的解決手段は、３Ｄ検出枠の検出性能を向上させることに役立つ。

以下、図面及び実施形態により本開示の技術的解決手段をさらに詳細に説明する。

明細書の一部となる図面は、本開示の実施形態を説明し、かつ説明と共に本開示の原理を解釈するためのものである。

図面を参照しながら、以下の詳細な説明に基づいて、本開示をより明確に理解することができる。
本開示のターゲットオブジェクトの３Ｄ検出方法の一実施形態のフローチャートである。本開示のターゲットオブジェクトの３Ｄ検出方法の別の実施形態のフローチャートである。本開示の第１段階ニューラルネットワークの概略構成図である。本開示の第１段階ニューラルネットワークの別の概略構成図である。本開示の第２段階ニューラルネットワークの概略構成図である。本開示の車両のインテリジェント制御方法の一実施形態のフローチャートである。本開示の障害物回避ナビゲーション方法の一実施形態のフローチャートである。本開示のターゲットオブジェクトの３Ｄ装置の一実施形態の概略構成図である。本開示の車両のインテリジェント制御装置の一実施形態の概略構成図である。本開示の障害物回避ナビゲーション装置の一実施形態の概略構成図である。本開示の実施形態を実現する例示的な機器のブロック図である。

以下、図面を参照しながら、本開示の様々な例示的な実施例を詳細に説明する。特に具体的に説明しない限り、これらの実施例において記載された部品及びステップの相対的配置、数式及び数値は、本開示の範囲を限定するものではないことに留意されたい。

同時に、説明の便宜上、図面に示された各部分の寸法は実際の比例関係に従って描いたものではないことを理解されたい。以下、少なくとも１つの例示的な実施例についての説明は、本質的に例示的なものに過ぎず、決して本開示及びその適用又は使用を限定するものではない。当業者に公知の技術、方法及び機器について詳細に検討していない場合があるが、適切な場合で、前記技術、方法及び機器は、明細書の一部と見なすべきである。

類似の符号及び文字が以下の図面において類似のものを表すため、あるものが１つの図面において定義されれば、後の図面においてそれをさらに検討する必要がないことに留意されたい。本開示の実施例は、端末機器、コンピュータシステム及びサーバなどの電子機器に適用されてよく、多数の他の汎用又は専用のコンピューティングシステム環境又は構成と共に動作可能である。端末機器、コンピュータシステム及びサーバなどの電子機器と共に使用するのに適する周知の端末機器、コンピューティングシステム、環境及び／又は構成の例は、パーソナルコンピュータシステム、サーバコンピュータシステム、シンクライアント、ファットクライアント、手持ち又はラップトップ機器、マイクロプロセッサに基づくシステム、セットトップボックス、プログラマブル消費電子製品、ネットワークパソコン、小型コンピュータシステム、大型コンピュータシステム、及び上記任意のシステムを含む分散型クラウドコンピューティング技術環境などを含むが、これらに限定されない。

端末機器、コンピュータシステム及びサーバなどの電子機器について、コンピュータシステムにより実行されるコンピュータシステム実行可能命令（例えば、プログラムモジュール）の一般的なコンテキストで説明してよい。一般的に、プログラムモジュールは、特定のタスクを実行するか又は特定の抽象データ型を実現するルーチン、プログラム、ターゲットプログラム、コンポーネント、ロジック及びデータ構造などを含んでよい。コンピュータシステム／サーバは、分散型クラウドコンピューティング環境において実施されてよく、分散型クラウドコンピューティング環境において、タスクは、通信ネットワークを介して接続された遠隔処理機器によって実行される。分散型クラウドコンピューティング環境において、プログラムモジュールは、記憶機器を含むローカル又は遠隔コンピューティングシステムの記憶媒体に位置してよい。

例示的な実施例
図１は、本開示のターゲットオブジェクトの３Ｄ検出方法の一実施例のフローチャートである。

Ｓ１００において、取得されたシーンの点群データの特徴情報を抽出する。

好ましい例において、本開示におけるシーンとは、ビジョンに基づく表示画面を指してよい。例えば、撮像装置で撮像された画像とレーザレーダ走査により取得された点群データ（ＰｏｉｎｔＣｌｏｕｄＤａｔａ）とにより表示されたビジョン画面がいずれもシーンであると考えてよい。

好ましい例において、本開示における点群データとは、一般的に、点の形式で記録された走査情報を指す。例えば、レーザレーダ走査により取得された点群データである。点群データにおける各点は、複数種の情報で記述されてよく、点群データにおける各点は一般的に複数種の情報を含むと考えられてよく、例えば、該点の三次元座標、色情報（例えば、ＲＧＢ情報など）及び反射強度（Ｉｎｔｅｎｓｉｔｙ）情報などのうちの１種以上を含んでよいが、これらに限定されない。つまり、点群データにおける１つの点は、三次元座標、色情報、反射強度情報などの１種以上の情報で記述されてよい。

好ましい例において、本開示は、ニューラルネットワークの少なくとも１つの畳み込み層を利用して点群データを処理することにより、点群データの特徴情報（ｆｅａｔｕｒｅｍａｐ）を形成し、例えば、点群データにおける各点に対して１つの特徴情報をそれぞれ形成してよい。今回形成された点群データの特徴情報は、点群データの全空間範囲内の全ての点を考慮する場合に、各点に対してそれぞれ形成された特徴情報であるため、今回形成された特徴情報は、グローバル特徴情報と呼ばれてよい。

Ｓ１１０において、点群データの特徴情報に基づいて、点群データに対してセマンティックセグメンテーションを行って、点群データにおける複数の点の第１セマンティック情報を取得する。

好ましい例において、本開示は、ニューラルネットワークを利用して点群データに対してセマンティックセグメンテーションを行ってよく、ニューラルネットワークは、点群データにおける一部の点、さらに点群データにおける各点に対して、第１セマンティック情報をそれぞれ形成してよい。例えば、点群データをニューラルネットワークに提供し、かつニューラルネットワークにより点群データの特徴情報を抽出した後、ニューラルネットワークは、点群データの特徴情報を処理し続けて、点群データにおける複数の点の第１セマンティック情報を取得する。

好ましい例において、本開示における点の第１セマンティック情報とは、一般的に、点群データ全体を考慮する場合に、該点に対して生成されたセマンティック特徴（ＳｅｍａｎｔｉｃＦｅａｔｕｒｅ）を指すため、第１セマンティック情報は、第１セマンティック特徴又はグローバルセマンティック特徴と呼ばれてよい。本開示における点のグローバルセマンティック特徴は、一般的に、複数（例えば、２５６個）の要素を含む一次元ベクトル配列の形式で表現されてよい。本開示におけるグローバルセマンティック特徴は、グローバルセマンティック特徴ベクトルと呼ばれてよい。

好ましい例において、本開示における前景点及び背景点は、ターゲットオブジェクトに対するものであり、好ましくは、１つのターゲットオブジェクトに属する点は、該ターゲットオブジェクトの前景点であり、該ターゲットオブジェクトに属しない点は、該ターゲットオブジェクトの背景点である。シーンに複数のターゲットオブジェクトが含まれる場合に、そのうちの１つのターゲットオブジェクトについて、該ターゲットオブジェクトに属する点は、該ターゲットオブジェクトの前景点であるが、該点は、他のターゲットオブジェクトに属しないため、該点は、他のターゲットオブジェクトの背景点である。

好ましい例において、点群データにおける点がターゲットオブジェクトの前景点及び該ターゲットオブジェクトの背景点を含む場合に、本開示で取得される複数の点の第１セマンティック情報は、一般的に、該ターゲットオブジェクトの前景点のグローバルセマンティック特徴及び該ターゲットオブジェクトの背景点のグローバルセマンティック特徴を含む。本開示におけるシーンは、１つ以上のターゲットオブジェクトを含んでよい。本開示におけるターゲットオブジェクトは、車両、非自動車両、歩行者及び／又は障害物などを含むが、これらに限定されない。

Ｓ１２０において、第１セマンティック情報に基づいて、複数の点のうち、ターゲットオブジェクトに対応する少なくとも１つの前景点を予測する。

好ましい例において、本開示は、ニューラルネットワークを利用して複数の点のうち、ターゲットオブジェクトに対応する少なくとも１つの前景点を予測してよく、ニューラルネットワークは、点群データにおける一部の点、さらに点群データにおける各点に対して、それぞれ予測を行って、該点が前景点である信頼度を生成してよい。点の信頼度は、該点が前景点である確率を示すことができる。例えば、点群データをニューラルネットワークに提供し、ニューラルネットワークにより点群データの特徴情報を抽出し、かつニューラルネットワークによりセマンティックセグメンテーション処理を行った後、該ニューラルネットワークがグローバルセマンティック特徴を処理し続けて、点群データにおける複数の点がターゲットオブジェクトの前景点である信頼度を予測し、ニューラルネットワークは、各点に対して信頼度をそれぞれ生成してよい。本開示は、ニューラルネットワークにより生成された各信頼度をそれぞれ判定することにより、信頼度が所定値を超える点をターゲットオブジェクトの前景点としてよい。

なお、本開示における信頼度を判定する動作は、Ｓ１２０において実行されてもよく、Ｓ１３０において実行されてもよい。また、信頼度を判定する動作がＳ１２０において実行され、かつ判定結果が、信頼度が所定値を超える点が存在せず、すなわち前景点が存在しなければ、該シーンにターゲットオブジェクトが存在しないと考えてよい。

Ｓ１３０において、第１セマンティック情報に基づいて少なくとも１つの前景点のそれぞれに対応する３Ｄ初期枠を生成する。

好ましい例において、Ｓ１２０には信頼度を判定する動作が含まれない場合に、本開示は、Ｓ１１０において取得された各点のグローバルセマンティック特徴に基づいて、各点に対して３Ｄ初期枠をそれぞれ生成してよい。本開示は、Ｓ１２０において取得された全ての信頼度を判定することにより、ターゲットオブジェクトの前景点を選別し、かつ選別された前景点を利用してＳ１３０において生成された３Ｄ初期枠から選別することにより、各前景点のそれぞれに対応する３Ｄ初期枠を取得してよい。すなわち、Ｓ１３０において生成された各３Ｄ初期枠は、一般的に、前景点に対応する３Ｄ初期枠と背景点に対応する３Ｄ初期枠とを含むため、Ｓ１３０において、生成された全ての３Ｄ初期枠から、各前景点に対応する３Ｄ初期枠を選別する必要がある。

好ましい例において、Ｓ１２０には信頼度を判定する動作が含まれる場合に、本開示は、上記予測された各前景点のグローバルセマンティック特徴に基づいて３Ｄ初期枠をそれぞれ生成することにより、取得された各３Ｄ初期枠は、いずれも前景点に対応する３Ｄ初期枠である。すなわち、Ｓ１３０において生成された各３Ｄ初期枠は、いずれも前景点に対応する３Ｄ初期枠であり、つまり、Ｓ１３０において前景点のみに対して３Ｄ初期枠を生成してよい。

好ましい例において、本開示における３Ｄ初期枠は、３Ｄ初期枠の中心点位置情報、３Ｄ初期枠の長さ・幅・高さ情報及び３Ｄ初期枠の方向情報で記述されてよく、つまり、本開示における３Ｄ初期枠は、３Ｄ初期枠の中心点位置情報、３Ｄ初期枠の長さ・幅・高さ情報及び３Ｄ初期枠の方向情報などを含んでよい。３Ｄ初期枠は、３Ｄ初期枠情報と呼ばれてよい。

好ましい例において、本開示は、ニューラルネットワークを利用して３Ｄ初期枠を生成してよい。例えば、点群データをニューラルネットワークに提供し、ニューラルネットワークにより点群データの特徴情報を抽出し、かつニューラルネットワークによりセマンティックセグメンテーション処理を行った後、該ニューラルネットワークがグローバルセマンティック特徴を処理し続けて、複数の点のうちの各点に対して３Ｄ初期枠をそれぞれ生成する。また例えば、点群データをニューラルネットワークに提供し、ニューラルネットワークにより点群データの特徴情報を抽出し、ニューラルネットワークによりセマンティックセグメンテーション処理を行い、かつ該ニューラルネットワークによりグローバルセマンティック特徴に対して予測処理を行うことにより、点群データにおける複数の点がターゲットオブジェクトの前景点である信頼度を取得した後、ニューラルネットワークが、信頼度が所定値を超える点のグローバルセマンティック特徴を処理し続けて、各前景点に対して３Ｄ初期枠をそれぞれ生成してよい。

点群データが一定の受容野を有するが、セマンティックセグメンテーションが点群データにおける全ての点の特徴情報に基づいて行われるため、セマンティックセグメンテーションにより形成されたセマンティック特徴は、点自体のセマンティック特徴を含むだけでなく、周囲点のセマンティック特徴も含むことにより、本開示における複数の前景点は、セマンティックにシーンにおける同一のターゲットオブジェクトを指してよい。また同一のターゲットオブジェクトを指す異なる前景点のそれぞれに対応する３Ｄ初期枠の間に一定の差異があるが、差異が一般的に大きくない。

また、Ｓ１３０において第１セマンティック情報に基づいて生成された３Ｄ初期枠には前景点に対応する３Ｄ初期枠が存在しなければ、該シーンにターゲットオブジェクトが存在しないと考えてよい。

Ｓ１４０において、３Ｄ初期枠に基づいてシーンにおけるターゲットオブジェクトの３Ｄ検出枠を決定する。

本開示は、最終的にターゲットオブジェクト毎に１つの３Ｄ検出枠を決定する。

好ましい例において、本開示は、上記取得された全ての前景点のそれぞれに対応する３Ｄ初期枠に対して冗長処理を行うことにより、ターゲットオブジェクトの３Ｄ検出枠、すなわち、点群データに対してターゲットオブジェクトの検出を行って最終的に取得された３Ｄ検出枠を取得してよい。好ましくは、本開示は、３Ｄ初期枠の間の重なり度を用いて冗長な３Ｄ初期枠を除去することにより、ターゲットオブジェクトの３Ｄ検出枠を取得してよい。例えば、本開示は、複数の前景点に対応する３Ｄ初期枠の間の重なり度を決定し、重なり度が設定閾値より大きい３Ｄ初期枠を選別して、重なり度が設定閾値より大きい３Ｄ初期枠を取得し、次に選別された３Ｄ初期枠からターゲットオブジェクトの３Ｄ検出枠を決定してよい。好ましくは、本開示は、ＮＭＳ（Ｎｏｎ－ＭａｘｉｍｕｍＳｕｐｐｒｅｓｓｉｏｎ、非最大抑制）アルゴリズムを用いて全ての前景点のそれぞれに対応する３Ｄ初期枠に対して冗長処理を行うことにより、互いにカバーする冗長な３Ｄ検出枠を除去して、最終的な３Ｄ検出枠を取得してよい。シーンに複数のターゲットオブジェクト（例えば、１人以上の歩行者、１つ以上の非自動車両、１つ以上の車両など）が含まれる場合に、本開示は、シーンにおける各ターゲットオブジェクトに対して１つの最終的な３Ｄ検出枠を取得してよい。

好ましい例において、本開示は、現在取得された前景点のそれぞれに対応する３Ｄ初期枠に対して補正（最適化とも呼ばれる）処理を行い、そして、補正後の全ての３Ｄ初期枠に対して冗長処理を行うことにより、ターゲットオブジェクトの３Ｄ検出枠、すなわち、点群データに対してターゲットオブジェクトの検出を行って最終的に取得された３Ｄ検出枠を取得してよい。

好ましい例において、本開示における各前景点のそれぞれに対応する３Ｄ初期枠をそれぞれ補正するプロセスは、下記ステップＡ１、ステップＢ１及びステップＣ１を含んでよい。

ステップＡ１において、点群データにおける、３Ｄ初期枠を少なくとも含む部分領域内の点の特徴情報を取得する。

好ましくは、本開示は、３Ｄ初期枠を含む３Ｄ拡張枠を設定し、かつ点群データにおける３Ｄ拡張枠内の各点の特徴情報を取得してよい。本開示における３Ｄ拡張枠は、点群データにおける部分領域の実現形態である。本開示における各前景点に対応する３Ｄ初期枠は、それぞれ１つの３Ｄ拡張枠に対応し、３Ｄ拡張枠が占める空間範囲は、一般的に、３Ｄ初期枠が占める空間範囲を完全にカバーするかつそれよりも僅かに大きい。一般的な場合に、３Ｄ初期枠のいずれか一面は、それに対応する３Ｄ拡張枠のいずれか一面と同一の平面内になく、３Ｄ初期枠の中心点は、３Ｄ拡張枠の中心点と互いに重なり、かつ３Ｄ初期枠のいずれか一面は、それに対応する３Ｄ拡張枠の対応する面に平行である。このような３Ｄ拡張枠と３Ｄ初期枠との位置関係が規範的であるため、３Ｄ拡張枠を形成する難度を低減することに役立つことにより、本開示の実現難度を低減することに役立つ。当然のことながら、本開示は、２つの中心点が重ならないが、３Ｄ初期枠のいずれか一面がいずれもそれに対応する３Ｄ拡張枠の対応する面に平行である場合を排除しない。

好ましくは、本開示は、予め設定されたＸ軸方向の増分（例えば、２０センチメートル）、Ｙ軸方向の増分（例えば、２０センチメートル）及びＺ軸方向の増分（例えば、２０センチメートル）のうちの少なくとも１つに基づいて、前景点に対応する３Ｄ初期枠に対して３Ｄ空間拡張を行うことにより、２つの中心点が互いに重なり、かつ対応する面が互いに平行である、３Ｄ初期枠を含む３Ｄ拡張枠を形成してよい。

好ましくは、本開示における増分は、実際の必要に応じて設定されてよく、例えば、対応する方向の増分は、３Ｄ初期枠の対応する辺長のＮ（例えば、Ｎが４などより大きい）分の１などを超えず、好ましくは、Ｘ軸方向の増分は、３Ｄ初期枠の長さの１０分の１を超えず、Ｙ軸方向の増分は、３Ｄ初期枠の幅の１０分の１を超えず、Ｚ軸方向の増分は、３Ｄ初期枠の高さの１０分の１を超えない。また、Ｘ軸方向の増分、Ｙ軸方向の増分及びＺ軸方向の増分は、同じであってもよく、異なってもよい。

好ましくは、ｉ番目の３Ｄ初期枠

は、

として示されてよいと仮定し、ここで、

及び

は、それぞれｉ番目の３Ｄ初期枠の中心点の座標を示し、

及び

は、それぞれｉ番目の３Ｄ初期枠の高さ、幅、長さを示し、

は、ｉ番目の３Ｄ初期枠の方向を示し、例えば、鳥瞰図において、ｉ番目の３Ｄ初期枠の長さとＸ座標軸との夾角が

であれば、ｉ番目の３Ｄ初期枠に対応する３Ｄ拡張枠

は、

として示されてよく、
ここで、

は、増分を示す。

好ましくは、本開示は、ニューラルネットワークを利用して点群データにおける部分領域内の点の特徴情報を取得してよく、例えば、点群データにおける部分領域内の全ての点を入力とし、ニューラルネットワークに提供し、ニューラルネットワークの少なくとも１つの畳み込み層により部分領域内の点群データを処理することにより、部分領域内の各点に対して特徴情報をそれぞれ形成してよい。今回形成された特徴情報は、局所特徴情報と呼ばれてよい。今回形成された点群データの特徴情報は、点群データの部分領域内の全ての点を考慮する場合に、部分領域内の各点に対してそれぞれ形成された特徴情報であるため、今回形成された特徴情報は、局所特徴情報と呼ばれてよい。

ステップＢ１において、部分領域内の点の特徴情報に基づいて、部分領域内の点に対してセマンティックセグメンテーションを行って、部分領域内の点の第２セマンティック情報を取得する。

好ましくは、本開示における点の第２セマンティック情報とは、３Ｄ拡張枠で形成された空間範囲内の全ての点を考慮する場合に、該点に対して形成されたセマンティック特徴ベクトルを指す。本開示における第２セマンティック情報は、第２セマンティック特徴又は局所空間セマンティック特徴と呼ばれてよい。局所空間セマンティック特徴は、同様に、複数（例えば、２５６個）の要素を含む一次元ベクトル配列の形式で表現されてよい。

本開示は、ニューラルネットワークを利用して３Ｄ拡張枠内の全ての点の局所空間セマンティック特徴を取得してよく、ニューラルネットワークを利用して点の局所空間セマンティック特徴を取得する方式は、下記ステップａ及びステップｂを含んでよい。

ａ、まず、３Ｄ拡張枠の所定のターゲット位置に基づいて、３Ｄ拡張枠内に位置する点群データの座標情報に対して座標変換を行って、３Ｄ拡張枠内に位置する各点の座標を変位させることにより、３Ｄ拡張枠を変位させて回転させ（３Ｄ拡張枠の方向を調整し）、さらに該３Ｄ拡張枠の所定のターゲット位置に変換する。好ましくは、３Ｄ拡張枠の所定のターゲット位置は、３Ｄ拡張枠の中心点（すなわち、３Ｄ初期枠の中心点）が座標原点に位置し、かつ３Ｄ拡張枠の長さがＸ軸に平行である位置などを含んでよい。好ましくは、上記座標原点及びＸ軸は、点群データの座標系の座標原点及びＸ軸であってよく、当然のことながら、他の座標系の座標原点及びＸ軸であってもよい。

前の例を続けて、ｉ番目の３Ｄ初期枠

は、

として示されてよいと仮定し、ここで、

及び

は、それぞれｉ番目の３Ｄ初期枠の中心点の座標を示し、

及び

であれば、ｉ番目の３Ｄ初期枠を含む３Ｄ拡張枠に対して座標変換を行った後、本開示は、新たな３Ｄ初期枠

を取得し、該新たな３Ｄ初期枠

は、

として示されてよい。

つまり、該新たな３Ｄ初期枠

の中心点が座標原点に位置し、かつ鳥瞰図において、該新たな３Ｄ初期枠

の長さとＸ座標軸との間の夾角が０である。

本開示の上記座標変換方式は、正規化座標変換と呼ばれてよい。本開示は、１つの点に対して座標変換を行う場合に、一般的に該点の座標情報のみを変更し、該点の他の情報を変更しない。本開示は、正規化座標変換の動作を実行することにより、異なる３Ｄ初期枠内の各点の座標を１つの大まかな範囲内に集中させることにより、ニューラルネットワークのトレーニングに役立ち、すなわち、ニューラルネットワークによる局所空間セマンティック特徴の形成の正確性を向上させることに役立ち、さらに３Ｄ初期枠を補正する正確性を向上させることに役立つ。理解できるように、上記データの座標変換方式は、好ましい例に過ぎず、当業者は、また座標を一定の範囲に変換する他の変換方式を用いてよい。

ｂ、座標変換後の点群データ（すなわち、座標変換後の３Ｄ拡張枠内に位置する点群データ）をニューラルネットワークに提供し、ニューラルネットワークにより、受信された点に対してセマンティックセグメンテーション処理を行って、３Ｄ拡張枠内に位置する各点に対して局所空間セマンティック特徴をそれぞれ生成する。

好ましくは、本開示は、上記ステップにおいて生成された、前景点である信頼度に基づいて、前景点のマスクを形成してよい（例えば、信頼度が所定値（例えば、０．５など）を超える点を１に設定し、信頼度が所定値を超えない点を０に設定することにより、前景点のマスクを形成する）。本開示は、前景点のマスク及び座標変換後の点群データを一緒にニューラルネットワークに提供して、ニューラルネットワークがセマンティック処理を行う時に前景点のマスクを参照するようにすることにより、局所空間セマンティック特徴の記述の正確性を向上させることに役立つ。

ステップＣ１において、部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、補正後の３Ｄ初期枠を形成する。

好ましくは、本開示で３Ｄ拡張枠内の複数の点のグローバルセマンティック特徴を取得する方式は、以下のとおりであってよい。まず、点群データにおける各点の座標情報に基づいて、各点が３Ｄ拡張枠の空間範囲に属するか否か（すなわち、３Ｄ拡張枠のいずれかの表面に位置する場合を含んでよい、３Ｄ拡張枠内に位置するか否か）を判定し、１つの点について、該点の所在する位置が３Ｄ拡張枠の空間範囲に属すれば、該点を３Ｄ拡張枠に属する点としてよく、該点の所在する位置が３Ｄ拡張枠の空間範囲に属しなければ、該点を３Ｄ拡張枠に属する点としない。次に、点群データにおける複数の点（例えば、全ての点）のグローバルセマンティック特徴に基づいて、３Ｄ拡張枠に属する全ての点のグローバルセマンティック特徴を決定する。好ましくは、本開示は、１つの点が３Ｄ拡張枠に属すると判定した場合に、前述の取得された各点のグローバルセマンティック特徴から該点のグローバルセマンティック特徴を検索することができ、このように類推すれば、本開示は、３Ｄ拡張枠に属する全ての点のグローバルセマンティック特徴を取得することができる。

好ましくは、本開示は、ニューラルネットワークにより各点のグローバルセマンティック特徴及び局所セマンティック特徴を処理し、かつニューラルネットワークの処理結果に基づいて補正後の３Ｄ初期枠を取得してよい。例えば、ニューラルネットワークは、３Ｄ拡張枠内の点のグローバルセマンティック特徴及び局所空間セマンティック特徴に対して、符号化処理を行って、該３Ｄ拡張枠内の３Ｄ初期枠を記述する特徴を取得し、ニューラルネットワークを介して３Ｄ初期枠を記述する特徴に基づいて、３Ｄ初期枠がターゲットオブジェクトである信頼度を予測し、ニューラルネットワークを介して３Ｄ初期枠を記述する特徴に基づいて３Ｄ初期枠を調整することにより、補正後の３Ｄ初期枠を取得する。３Ｄ初期枠を補正することにより、３Ｄ初期枠の正確性に役立つため、３Ｄ検出枠の正確性を向上させることに役立つ。

好ましくは、本開示は、３Ｄ拡張枠内の各点のグローバルセマンティック特徴と局所空間セマンティック特徴をスティッチングしてよく、例えば、３Ｄ拡張枠内のいずれか１つの点に対して、該点のグローバルセマンティック特徴と局所空間セマンティック特徴をスティッチングして、スティッチング後のセマンティック特徴を形成し、各点のスティッチング後のセマンティック特徴をいずれも入力として、ニューラルネットワークに提供することにより、ニューラルネットワークは、スティッチング後のセマンティック特徴に対して符号化処理を行い、ニューラルネットワークは、符号化処理後の、該３Ｄ拡張枠内の３Ｄ初期枠を記述する特徴（以下、符号化処理後の特徴と略称する）を生成することができる。

好ましくは、ニューラルネットワークは、符号化処理後の特徴を形成した後、入力された各符号化処理後の特徴に対して、該３Ｄ初期枠がターゲットオブジェクトである信頼度をそれぞれ予測し、かつ各３Ｄ初期枠に対して信頼度をそれぞれ形成してよい。該信頼度は、補正後の３Ｄ初期枠がターゲットオブジェクトである確率を示してよい。同時に、ニューラルネットワークは、入力された各符号化処理後の特徴に対して、新たな３Ｄ初期枠（すなわち、補正後の３Ｄ初期枠）をそれぞれ形成してよい。例えば、ニューラルネットワークは、入力された各符号化処理後の特徴に基づいて、新たな３Ｄ初期枠の中心点位置情報、新たな３Ｄ初期枠の長さ・幅・高さ情報及び新たな３Ｄ初期枠の方向情報などをそれぞれ形成する。

本開示における、補正後の全ての３Ｄ初期枠に対して冗長処理を行うことにより、ターゲットオブジェクトの３Ｄ検出枠を取得するプロセスについては、上記対応する説明を参照することができるため、ここで詳細に説明しない。

図２に示すように、本開示のターゲットオブジェクトの３Ｄ検出方法の一実施形態は、ステップＳ２００及びＳ２１０を含む。以下、図２における各ステップをそれぞれ詳細に説明する。

Ｓ２００において、点群データをニューラルネットワークに提供し、該ニューラルネットワークを介して点群データにおける点に対して特徴抽出処理を行い、抽出された特徴情報に基づいて点群データに対してセマンティックセグメンテーション処理を行って、複数の点のセマンティック特徴を取得し、セマンティック特徴に基づいて、複数の点のうちの前景点を予測し、かつ複数の点のうちの少なくとも一部の点のそれぞれに対応する３Ｄ初期枠を生成する。

好ましい例において、本開示におけるニューラルネットワークは、主に、入力された点群データにおける複数の点（例えば、点群データにおける全ての点又は多数の点）に対して３Ｄ初期枠をそれぞれ生成することにより、点群データにおける複数の点のうちの各点が１つの３Ｄ初期枠に対応する。点群データにおける複数の点（例えば、各点）は、一般的に前景点及び背景点を含むため、本開示のニューラルネットワークにより生成された３Ｄ初期情報枠は、一般的に、前景点に対応する３Ｄ初期枠と背景点に対応する３Ｄ初期枠を含む。

本開示のニューラルネットワークへの入力が点群データあり、ニューラルネットワークが点群データに対して特徴抽出を行い、かつ抽出された特徴情報に基づいて点群データに対してセマンティックセグメンテーションを行うことは、下位層データの分析に相当し、また本開示のニューラルネットワークがセマンティックセグメンテーション結果に基づいて３Ｄ初期枠を生成することは、上位層データの分析に相当するため、本開示は、ターゲットオブジェクトの３Ｄ検出プロセスにおいて、下から上への３Ｄ検出枠の生成方式を形成する。本開示のニューラルネットワークは、下から上への生成方式を用いて３Ｄ初期枠を生成することにより、点群データに対して投影処理を行ってから、投影処理後に取得された画像を利用して３Ｄ検出枠の検出を行うことに起因する、３Ｄ検出枠の検出性能の向上に不利である点群データの元情報の損失現象を回避することができるだけでなく、本開示は、撮像装置で撮像された２Ｄ画像を利用して３Ｄ検出枠の検出を行う時に２Ｄ画像におけるターゲットオブジェクト（例えば、車両又は障害物など）が遮蔽されるため、３Ｄ検出枠の検出に影響を与える、同様に３Ｄ検出枠の検出性能の向上に不利である現象を回避することもできる。このことから分かるように、本開示のニューラルネットワークは、下から上への生成方式を用いて３Ｄ初期枠を生成することにより、３Ｄ検出枠の検出性能を向上させることに役立つ。

好ましい例において、本開示におけるニューラルネットワークは、複数の部分に分割されてよく、各部分は、それぞれ１つの小さなニューラルネットワーク（ニューラルネットワークユニット又はニューラルネットワークモジュールなどと呼ばれてもよい）で実現されてよく、すなわち、本開示のニューラルネットワークは、複数の小さなニューラルネットワークで構成される。本開示のニューラルネットワークの一部の構造は、ＲＣＮＮ（ＲｅｇｉｏｎｓｗｉｔｈＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ、領域畳み込みニューラルネットワーク）の構造を用いてよいため、本開示のニューラルネットワークは、ＰｏｉｎｔＲＣＮＮ（ＰｏｉｎｔＲｅｇｉｏｎｓｗｉｔｈＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ、点に基づく領域畳み込みニューラルネットワーク）と呼ばれてよい。

好ましい例において、本開示のニューラルネットワークにより生成された３Ｄ初期枠は、３Ｄ初期枠の中心点位置情報（例えば、中心点の座標）、３Ｄ初期枠の長さ・幅・高さ情報及び３Ｄ初期枠の方向情報（例えば、３Ｄ初期枠の長さとＸ座標軸との夾角）などを含んでよい。当然のことながら、本開示で形成された３Ｄ初期枠は、３Ｄ初期枠の底面又は上面の中心点位置情報、３Ｄ初期枠の長さ・幅・高さ情報及び３Ｄ初期枠の方向情報などを含んでもよい。本開示は、３Ｄ初期枠の具体的な表現形式を限定しない。

好ましい例において、本開示のニューラルネットワークは、第１ニューラルネットワーク、第２ニューラルネットワーク及び第３ニューラルネットワークを含んでよい。点群データは、第１ニューラルネットワークに提供され、第１ニューラルネットワークは、受信された点群データにおける複数の点（例えば、全ての点）に対して特徴抽出処理を行うことにより、点群データにおける各点に対してグローバル特徴情報をそれぞれ形成し、かつ複数の点（例えば、全ての点）のグローバル特徴情報に基づいてセマンティックセグメンテーション処理を行うことにより、各点に対してグローバルセマンティック特徴をそれぞれ形成し、第１ニューラルネットワークは、各点のグローバルセマンティック特徴を出力する。好ましくは、点のグローバルセマンティック特徴は、一般的に、複数（例えば、２５６個）の要素を含む一次元ベクトル配列の形式で表現されてよい。本開示におけるグローバルセマンティック特徴は、グローバルセマンティック特徴ベクトルと呼ばれてもよい。点群データにおける点が前景点及び背景点を含む場合に、第１ニューラルネットワークにより出力された情報は、一般的に、前景点のグローバルセマンティック特徴及び背景点のグローバルセマンティック特徴を含む。

好ましくは、本開示における第１ニューラルネットワークは、ＰｏｉｎｔＣｌｏｕｄＥｎｃｏｄｅｒ（点群データエンコーダ）及びＰｏｉｎｔＣｌｏｕｄＤｅｃｏｄｅｒ（点群データデコーダ）で実現されてよく、好ましくは、第１ニューラルネットワークは、ＰｏｉｎｔＮｅｔ＋＋又はＰｏｉｎｔｓｉｆｔネットワークモデルなどのネットワーク構造を用いてよい。本開示における第２ニューラルネットワークは、ＭＬＰ（Ｍｕｌｔｉ－ＬａｙｅｒＰｅｒｃｅｐｔｒｏｎ、多層パーセプトロン）で実現されてよく、かつ第２ニューラルネットワークを実現するＭＬＰの出力次元は、１であってよい。本開示における第３ニューラルネットワークは、ＭＬＰで実現されてもよく、かつ第３ニューラルネットワークを実現するＭＬＰの出力次元は、多次元であり、次元の数は、３Ｄ検出枠情報に含まれる情報に関連する。

点のグローバルセマンティック特徴を取得した場合に、本開示は、該グローバルセマンティック特徴を利用して前景点の予測及び３Ｄ初期枠の生成を実現する必要がある。本開示は、下記２種の方式で前景点の予測及び３Ｄ初期枠の生成を実現してよい。

方式１、第１ニューラルネットワークにより出力された各点のグローバルセマンティック特徴を同時に第２ニューラルネットワーク及び第３ニューラルネットワークに提供する（図３に示すとおりである）。第２ニューラルネットワークは、入力された各点のグローバルセマンティック特徴に対して、該点が前景点である信頼度をそれぞれ予測し、かつ各点に対して、信頼度をそれぞれ出力する。第２ニューラルネットワークにより予測された信頼度は、点が前景点である確率を示してよい。第３ニューラルネットワークは、入力された各点のグローバルセマンティック特徴に対して、１つの３Ｄ初期枠をそれぞれ生成し、かつ出力する。例えば、第３ニューラルネットワークは、各点のグローバルセマンティック特徴に基づいて、各点に対して３Ｄ初期枠の中心点位置情報、３Ｄ初期枠の長さ・幅・高さ情報及び３Ｄ初期枠の方向情報などをそれぞれ出力する。

第１ニューラルネットワークにより出力された情報は、一般的に、前景点のグローバルセマンティック特徴及び背景点のグローバルセマンティック特徴を含むため、第３ニューラルネットワークにより出力された３Ｄ初期枠は、一般的に、前景点に対応する３Ｄ初期枠と背景点に対応する３Ｄ初期枠を含むが、第３ニューラルネットワーク自体は、出力した各３Ｄ初期枠がそれぞれ前景点に対応する３Ｄ初期枠であるか背景点に対応する３Ｄ初期枠であるかを区別することができない。

方式２、第１ニューラルネットワークにより出力された各点のグローバルセマンティック特徴をまず第２ニューラルネットワークに提供し、第２ニューラルネットワークは、入力された各点のグローバルセマンティック特徴に対して、点が前景点である信頼度をそれぞれ予測し、本開示は、第２ニューラルネットワークにより出力された点が前景点である信頼度が所定値を超えると判定した場合に、該点のグローバルセマンティック特徴を第３ニューラルネットワークに提供してよい（図４に示すとおりである）。第３ニューラルネットワークは、受信した、前景点であると判定された各グローバルセマンティック特徴に対して、１つの３Ｄ初期枠をそれぞれ生成し、かつ各前景点のそれぞれに対応する３Ｄ初期枠を出力する。本開示は、第２ニューラルネットワークにより出力された点が前景点である信頼度が所定値を超えないと判定した場合に、該点のグローバルセマンティック特徴を第３ニューラルネットワークに提供しないため、第３ニューラルネットワークにより出力された全ての３Ｄ初期枠は、いずれも前景点に対応する３Ｄ初期枠である。

Ｓ２１０において、複数の点のうちの前景点に対応する３Ｄ検出枠情報に基づいて、最終的な３Ｄ検出枠を決定する。

好ましい例において、Ｓ２００において方式１を用いる場合に、本開示は、第２ニューラルネットワークにより出力された各信頼度に基づいて、第３ニューラルネットワークにより出力された各点に対応する３Ｄ初期枠がそれぞれ前景点に対応する３Ｄ初期枠であるか背景点に対応する３Ｄ初期枠であるかを判定してよい。例えば、本開示は、第２ニューラルネットワークにより出力された１番目の点が前景点である信頼度が所定値を超えると判定した場合に、該点を前景点と判定することにより、本開示は、第３ニューラルネットワークにより出力された１番目の点に対応する３Ｄ初期枠を、前景点に対応する３Ｄ初期枠と判定してよく、このように類推すれば、本開示は、第２ニューラルネットワークにより出力された信頼度に基づいて、第３ニューラルネットワークにより出力された全ての３Ｄ初期枠から全ての前景点に対応する３Ｄ初期枠を選別してよい。その後、本開示は、選別された全ての前景点に対応する３Ｄ初期枠に対して冗長処理を行うことにより、最終的な３Ｄ検出枠、すなわち点群データに対して検出された３Ｄ検出枠を取得してよい。例えば、本開示は、ＮＭＳ（Ｎｏｎ－ＭａｘｉｍｕｍＳｕｐｐｒｅｓｓｉｏｎ、非最大抑制）アルゴリズムを用いて、現在選別された全ての前景点のそれぞれに対応する３Ｄ検出枠情報に対して冗長処理を行うことにより、互いにカバーする冗長な３Ｄ検出枠を除去して、最終的な３Ｄ検出枠を取得してよい。

好ましい例において、Ｓ２００において方式２を用いる場合に、本開示は、第３ニューラルネットワークにより出力された３Ｄ初期枠に基づいて、前景点に対応する３Ｄ初期枠を直接取得してよいため、本開示は、第３ニューラルネットワークにより出力された全ての３Ｄ初期枠に対して冗長処理を直接行うことにより、最終的な３Ｄ検出枠、すなわち点群データに対して検出された３Ｄ検出枠を取得してよい（上記実施形態における関連説明を参照することができる）。例えば、本開示は、ＮＭＳアルゴリズムを用いて、第３ニューラルネットワークにより出力された全ての３Ｄ初期枠に対して冗長処理を行うことにより、互いにカバーする冗長な３Ｄ初期枠を除去して、最終的な３Ｄ検出枠を取得してよい。

好ましい例において、Ｓ２００において方式１を用いるか方式２を用いるかに関わらず、本開示は、前景点に対応する３Ｄ初期枠を取得した後、各前景点のそれぞれに対応する３Ｄ初期枠をそれぞれ補正し、かつ補正後の、各前景点のそれぞれに対応する３Ｄ初期枠に対して冗長処理を行うことにより、最終的な３Ｄ検出枠を取得してよい。つまり、本開示のニューラルネットワークにより３Ｄ検出枠を生成するプロセスは、２つの段階に分けられてよく、ニューラルネットワークが第１段階ニューラルネットワークにおいて生成した３Ｄ初期枠を第２段階ニューラルネットワークに提供し、第２段階ニューラルネットワークは、第１段階ニューラルネットワークにおいて生成された３Ｄ初期枠に対して補正（例えば、位置最適化など）を行い、その後、本開示は、さらに第２段階ニューラルネットワークにより補正された後の３Ｄ初期枠に基づいて最終的な３Ｄ検出枠を決定する。最終的な３Ｄ検出枠は、本開示において点群データに基づいて検出された３Ｄ検出枠である。しかしながら、本開示のニューラルネットワークにより３Ｄ初期枠を生成するプロセスは、第２段階ニューラルネットワークを含むことなく、第１段階ニューラルネットワークのみを含んでよい。ニューラルネットワークにより３Ｄ初期枠を生成するプロセスが第１段階ニューラルネットワークのみを含む場合に、本開示における、第１段階ニューラルネットワークにより生成された３Ｄ初期枠に基づいて最終的な３Ｄ検出枠を決定することも、完全に実現可能である。補正後の３Ｄ初期枠はより正確である場合が多いため、補正後の３Ｄ初期枠に基づいて最終的な３Ｄ検出枠を決定することは、３Ｄ検出枠の検出正確性を向上させることに役立つ。本開示における第１段階ニューラルネットワーク及び第２段階ニューラルネットワークは、いずれも独立して存在することができるニューラルネットワークにより実現されてもよく、１つの完全なニューラルネットワークにおける一部のネットワーク構造ユニットで構成されてもよく、また、説明を容易にするために、関連するニューラルネットワークを、第１ニューラルネットワーク、第２ニューラルネットワーク、第３ニューラルネットワーク、第４ニューラルネットワーク、第５ニューラルネットワーク、第６ニューラルネットワーク又は第７ニューラルネットワークと呼んでもよいが、第１～第７ニューラルネットワークのそれぞれは、いずれも独立したニューラルネットワークであってもよく、大きなニューラルネットワークにおける幾つかのネットワーク構造ユニットで構成されてもよく、本開示はこれを限定しないことを理解されない。

好ましい例において、本開示においてニューラルネットワークを利用して各前景点のそれぞれに対応する３Ｄ初期枠をそれぞれ補正するプロセスは、下記ステップＡ２、ステップＢ２及びステップＣ２を含んでよい。

ステップＡ２において、３Ｄ初期枠を含む３Ｄ拡張枠を設定し、かつ３Ｄ拡張枠内の点のグローバルセマンティック特徴を取得する。

好ましくは、本開示における各３Ｄ初期枠は、１つの３Ｄ拡張枠に対応し、３Ｄ拡張枠が占める空間範囲は、一般的に、３Ｄ初期枠が占める空間範囲を完全にカバーする。一般的な場合に、３Ｄ初期枠のいずれか一面は、それに対応する３Ｄ拡張枠のいずれか一面と同一平面内になく、３Ｄ初期枠の中心点は、３Ｄ拡張枠の中心点と互いに重なり、かつ３Ｄ初期枠のいずれか一面は、それに対応する３Ｄ拡張枠の対応する面に平行である。当然のことながら、本開示は、２つの中心点が重ならないが、３Ｄ初期枠のいずれか一面がそれに対応する３Ｄ拡張枠の対応する面に平行である場合を排除しない。

好ましくは、本開示は、予め設定されたＸ軸方向の増分（例えば、２０センチメートル）、Ｙ軸方向の増分（例えば、２０センチメートル）及びＺ軸方向の増分（例えば、２０センチメートル）のうちの少なくとも１つに基づいて、前景点の３Ｄ初期枠に対して３Ｄ空間拡張を行うことにより、２つの中心点が互いに重なり、かつ面が互いに平行である、３Ｄ初期枠を含む３Ｄ拡張枠を形成してよい。

好ましくは、ｉ番目の３Ｄ初期枠

は、

として示されてよいと仮定し、ここで、

及び

は、それぞれｉ番目の３Ｄ初期枠の中心点の座標を示し、

及び

であれば、ｉ番目の３Ｄ初期枠に対応する３Ｄ拡張枠

は、

として示されてよく、
ここで、

は、増分を示す。

好ましくは、本開示における局所空間とは、一般的に、３Ｄ拡張枠で形成された空間範囲を指す。点の局所空間セマンティック特徴とは、一般的に、３Ｄ拡張枠で形成された空間範囲内の全ての点を考慮する場合に、該点に対して形成されたセマンティック特徴ベクトルを指す。局所空間セマンティック特徴は、同様に、複数（例えば、２５６個）の要素を含む一次元ベクトル配列の形式で表現されてよい。

ステップＢ２において、３Ｄ拡張枠内に位置する点群データをニューラルネットワークにおける第４ニューラルネットワークに提供し、第４ニューラルネットワークを介して３Ｄ拡張枠内の点の局所空間セマンティック特徴を生成する。

好ましくは、本開示で３Ｄ拡張枠内の全ての点の局所空間セマンティック特徴を取得する方式は、下記ステップａ及びステップｂを含んでよい。

前の例を続けて、ｉ番目の３Ｄ初期枠

は、

として示されてよいと仮定し、ここで、

及び

は、それぞれｉ番目の３Ｄ初期枠の中心点の座標を示し

及び

を取得し、該新たな３Ｄ初期枠

は、

として示されてよい。

つまり、該新たな３Ｄ初期枠

の長さとＸ座標軸との間の夾角が０である。

ｂ、座標変換後の点群データ（すなわち、座標変換後の３Ｄ拡張枠内に位置する点群データ）を、ニューラルネットワークにおける第４ニューラルネットワークに提供し、第４ニューラルネットワークにより、受信された点に対して特徴抽出処理を行い、かつ抽出された局所特徴情報に基づいてセマンティックセグメンテーション処理を行うことにより、３Ｄ拡張枠内に位置する各点に対して局所空間セマンティック特徴をそれぞれ生成する。

好ましくは、本開示は、さらに第２ニューラルネットワークにより出力された信頼度に基づいて、前景点のマスクを形成してよい（例えば、信頼度が所定値（例えば、０．５など）を超える点を１に設定し、信頼度が所定値を超えない点を０に設定する）。本開示は、前景点のマスク及び座標変換後の点群データを一緒に第４ニューラルネットワークに提供して、第４ニューラルネットワークが特徴抽出及びセマンティック処理を行う時に前景点のマスクを参照するようにすることにより、局所空間セマンティック特徴の記述の正確性を向上させることに役立つ。

好ましくは、本開示における第４ニューラルネットワークは、ＭＬＰで実現されてよく、かつ第４ニューラルネットワークを実現するＭＬＰの出力次元は、一般的に多次元であり、次元の数は、局所空間セマンティック特徴に含まれる情報に関連する。

ステップＣ２において、ニューラルネットワークにおける第５ニューラルネットワークを介して、３Ｄ拡張枠内の点のグローバルセマンティック特徴及び局所空間セマンティック特徴に対して符号化処理を行って、該３Ｄ拡張枠内の３Ｄ初期枠を記述する特徴を取得し、ニューラルネットワークにおける第６ニューラルネットワークを介して、３Ｄ初期枠を記述する特徴に基づいて、３Ｄ初期枠がターゲットオブジェクトである信頼度を予測し、ニューラルネットワークにおける第７ニューラルネットワークを介して、３Ｄ初期枠を記述する特徴に基づいて３Ｄ初期枠を補正することにより、３Ｄ初期枠の正確性を向上させることに役立ち、さらに３Ｄ検出枠の正確性を向上させることに役立つ。

好ましくは、本開示における第５ニューラルネットワークは、ＰｏｉｎｔＣｌｏｕｄＥｎｃｏｄｅｒ（点群データエンコーダ）で実現されてよく、好ましくは、第５ニューラルネットワークは、ＰｏｉｎｔＮｅｔ＋＋又はＰｏｉｎｔｓｉｆｔネットワークモデルなどの一部のネットワーク構造を用いてよい。本開示における第６ニューラルネットワークは、ＭＬＰで実現されてよく、かつ第６ニューラルネットワークを実現するＭＬＰの出力次元は、１であってよく、次元の数は、ターゲットオブジェクトの種類数に関連してよい。本開示における第７ニューラルネットワークは、ＭＬＰで実現されてもよく、かつ第７ニューラルネットワークを実現するＭＬＰの出力次元は、多次元であり、次元の数は、３Ｄ検出枠情報に含まれる情報に関連する。本開示における第１ニューラルネットワーク～第７ニューラルネットワークは、いずれも独立して存在することができるニューラルネットワークにより実現されてもよく、１つのニューラルネットワークにおける、独立して存在することができない一部により実現されてもよい。

好ましくは、本開示は、３Ｄ拡張枠内の各点のグローバルセマンティック特徴と局所空間セマンティック特徴をスティッチングしてよく、例えば、３Ｄ拡張枠内のいずれか１つの点に対して、該点のグローバルセマンティック特徴と局所空間セマンティック特徴をスティッチングして、スティッチング後のセマンティック特徴を形成し、各点のスティッチング後のセマンティック特徴を入力として、第５ニューラルネットワークに提供することにより、第５ニューラルネットワークは、スティッチング後のセマンティック特徴に対して符号化処理を行い、第５ニューラルネットワークは、符号化処理後の、該３Ｄ拡張枠内の３Ｄ初期枠を記述する特徴（以下、符号化処理後の特徴と略称する）を出力することができる。

好ましくは、第５ニューラルネットワークにより出力された符号化処理後の特徴を同時に第６ニューラルネットワーク及び第７ニューラルネットワークに提供する（図５に示すとおりである）。第６ニューラルネットワークは、入力された各符号化処理後の特徴に対して、該３Ｄ初期枠がターゲットオブジェクトである信頼度をそれぞれ予測し、かつ各３Ｄ初期枠に対して信頼度をそれぞれ出力する。第６ニューラルネットワークにより予測された信頼度は、補正後の３Ｄ初期枠がターゲットオブジェクトである確率を示してよい。ここでのターゲットオブジェクトは、車両又は歩行者などであってよい。第７ニューラルネットワークは、入力された各符号化処理後の特徴に対して新たな３Ｄ初期枠（すなわち、補正後の３Ｄ初期枠）をそれぞれ形成し、かつ出力する。例えば、第７ニューラルネットワークは、入力された各符号化処理後の特徴に基づいて、新たな３Ｄ初期枠の中心点位置情報、新たな３Ｄ初期枠の長さ・幅・高さ情報及び新たな３Ｄ初期枠の方向情報などをそれぞれ出力する。

なお、本開示では、本開示のニューラルネットワークの実現方式が複数種あり、一実現方式は、図３に示すとおりであり、別の実現方式は、図４に示すとおりであり、他の実現方式は、図３と図５の組み合わせのとおりであり、更なる実現方式は、図４と図５の組み合わせのとおりである。ここでは各実現方式について１つずつ詳細に説明しない。

好ましい例において、本開示のニューラルネットワークは、３Ｄアノテーション枠付きの複数の点群データサンプルを利用してトレーニングして得られる。例えば、本開示は、トレーニング対象のニューラルネットワークにより生成された信頼度に対応する損失を取得し、かつトレーニング対象のニューラルネットワークにより点群データサンプルに対して生成された３Ｄ初期枠が点群データサンプルの３Ｄアノテーション枠に対して形成した損失を取得することにより、これら２つの損失を利用してトレーニング対象のニューラルネットワークのネットワークパラメータを調整して、ニューラルネットワークのトレーニングを実現してよい。本開示におけるネットワークパラメータは、畳み込みカーネルパラメータ及び重み値などを含むがこれらに限定されない。

本開示のニューラルネットワークにより３Ｄ検出枠を形成するプロセスが１つの段階（すなわち、第１段階ニューラルネットワークにより３Ｄ検出枠を形成するプロセス）のみを含む場合に、本開示は、第１段階ニューラルネットワークにより生成された信頼度に対応する損失と３Ｄ初期枠に対応する損失とを取得し、かつ第１段階ニューラルネットワークの２つの損失を利用して第１段階ニューラルネットワーク（例えば、第１ニューラルネットワーク、第２ニューラルネットワーク及び第３ニューラルネットワーク）のネットワークパラメータを調整し、かつ第１段階ニューラルネットワークのトレーニングが成功して完了した後、ニューラルネットワーク全体のトレーニングが成功して完了する。

本開示のニューラルネットワークにより３Ｄ検出枠を形成するプロセスが２つの段階に分けられる場合に、本開示は、第１段階ニューラルネットワークと第２段階ニューラルネットワークに対してそれぞれトレーニングしてよい。例えば、まず、第１段階ニューラルネットワークにより生成された信頼度に対応する損失と３Ｄ初期枠に対応する損失とを取得し、かつこれら２つの損失を利用して第１段階ニューラルネットワークのネットワークパラメータを調整する。第１段階ニューラルネットワークのトレーニングが成功して完了した後、第１段階ニューラルネットワークにより出力された、前景点に対応する３Ｄ初期枠を入力として、第２段階ニューラルネットワークに提供し、第２段階ニューラルネットワークにより生成された信頼度に対応する損失と補正後の３Ｄ初期枠に対応する損失とを取得し、かつ第２段階ニューラルネットワークのこれら２つの損失を利用して第２段階ニューラルネットワーク（例えば、第４ニューラルネットワーク、第５ニューラルネットワーク、第６ニューラルネットワーク及び第７ニューラルネットワーク）のネットワークパラメータを調整し、第２段階ニューラルネットワークのトレーニングが成功して完了した後、ニューラルネットワーク全体のトレーニングが成功して完了する。

本開示における第１段階ニューラルネットワークにより生成された信頼度に対応する損失は、下記式（１）で示されてよい。

式（１）

上記式（１）において、点

が前景点である場合に、

は、前景点

の信頼度であり、点

が前景点ではない場合に、

は、１と前景点

の信頼度との差であり、

及び

は、いずれも定数であり、好ましい例において、

＝０．２５であり、

＝２である。

本開示における第１段階ニューラルネットワークにより生成された３Ｄ初期枠に対応する損失は、下記式（２）で示されてよい。

式（２）

上記式（２）において、

は、３Ｄ検出枠の回帰損失関数を示し、

は、前景点の数を示し、

は、前景点

に対して生成された３Ｄ初期枠のビン（ｂｉｎ）損失関数を示し、かつ

は、下記式（３）の形式で示されてよく、

は、前景点

に対して生成された３Ｄ初期枠のマージン損失関数を示し、かつ

は、下記式（４）の形式で示されてよい。

式（３）

上記式（３）において、

は、前景点

に対して生成された３Ｄ初期枠のビン損失関数を示し、

及び

は、それぞれ中心点の

座標、中心点の

座標及びターゲットオブジェクトの方向を示し、かつターゲットオブジェクトは、ニューラルネットワークにより生成された３Ｄ初期枠であってもよく、点群データサンプル中の３Ｄアノテーション枠であってもよく、

は、クロスエントロピー分類損失関数（Ｃｒｏｓｓ－ｅｎｔｒｏｐｙｃｌａｓｓｉｆｉｃａｔｉｏｎｌｏｓｓ）を示し、

は、前景点

に対して生成された３Ｄ初期枠の中心点のパラメータ

の所在するビンの番号を示し、

は、点群データサンプル中の３Ｄアノテーション枠のパラメータ

の所在するビンの番号を示し、

及び

は、パラメータ

が

である場合に、下記式（５）の形式で示されてよく、

及び

は、パラメータ

が

である場合に、下記式（６）の形式で示されてよく、

は、平滑Ｌ１損失関数（ＳｍｏｏｔｈＬ１Ｌｏｓｓ）を示し、

は、前景点

に対して生成された３Ｄ初期枠のパラメータ

の対応するビンでのオフセット量を示し、

及び

は、パラメータ

が

又は

である場合に、下記式（７）の形式で示されてよい。

点について、本開示におけるビンとは、点周囲の空間範囲を分割して得られるものを指してよく、分割された値域範囲は、ビンと呼ばれ、各ビンは、いずれも対応する番号を有してよく、一般的な場合に、ビンの値域範囲が一定であり、好ましい例において、ビンの値域範囲は、長さ範囲であり、この場合に、ビンは、一定の長さを有し、別の好ましい例において、ビンの値域範囲は、角度範囲であり、この場合に、ビンは、一定の角度区間を有する。好ましくは、ｘ方向又はｚ方向について、ビンの長さは、０．５ｍであってよく、この場合に、異なるビンの値域範囲は、０－０．５ｍ及び０．５ｍ－１ｍなどであってよい。好ましくは、本開示は、

を複数の角度区間に均等に分割してよく、１つの角度区間は、１つの値域範囲に対応し、この場合に、ビンの大きさ（すなわち、角度区間）は、４５度又は３０度などであってよい。

式（４）

上記式（４）において、

は、前景点

に対して生成された３Ｄ初期枠のマージン損失関数を示し、

及び

は、前景点

に対して生成された３Ｄ初期枠の中心点の

座標、前景点

に対して生成された３Ｄ初期枠の高さ、幅及び長さをそれぞれ示し、

は、平滑Ｌ１損失関数を示し、パラメータ

が

である場合に、

は、前景点

の

座標の、前景点

に対して生成された３Ｄ初期枠の中心点の

座標に対するオフセット量を示し、式（８）に示すとおりであり、パラメータ

が

又は

である場合に、

は、前景点

に対して生成された３Ｄ初期枠の高さ、幅及び長さの、対応する所定のパラメータに対するオフセット量を示し、パラメータ

が

である場合に、

は、前景点

の

座標の、３Ｄアノテーション枠の中心点の

が

又は

である場合に、

は、３Ｄアノテーション枠の高さ、幅及び長さの、対応する所定のパラメータに対するオフセット量を示し、本開示における所定のパラメータは、トレーニングデータにおける各点群データサンプル中の３Ｄアノテーション枠の長さ、幅及び高さに対して統計計算をそれぞれ行って得られた長さ平均値、幅平均値及び高さ平均値であってよい。

式（５）

式（６）

上記式（５）及び式（６）において、

は、点群データサンプル中の３Ｄアノテーション枠の中心点のＸ座標軸方向におけるビンの番号を示し、

は、点群データサンプル中の３Ｄアノテーション枠の中心点のＺ座標軸方向におけるビンの番号を示し、

は、前景点

の

座標及び

座標を示し、

は、前景点

に対して生成された３Ｄ初期枠の中心点の

座標及び

座標を示し、

は、ビンの長さを示し、

は、

軸又は

軸上の、前景点

を検索する検索距離を示す。

式（７）

上記式（７）において、

は、

軸又は

軸上の、前景点

を検索する検索距離を示し、つまり、パラメータ

が

である場合に、

は、前景点

に対して生成された３Ｄ初期枠の中心点の、

軸方向における前景点

の

座標との距離を示し、パラメータ

が

である場合に、

は、前景点

に対して生成された３Ｄ初期枠の中心点の、

軸方向における前景点

の

座標との距離を示し、

は、ビンの長さを示し、ビンの長さは、定数値であり、例えば、

＝０．５ｍであり、

は、上記式（５）及び式（６）に示すとおりであり、

は、定数値であり、かつ

は、ビンの長さに関連してよく、例えば、

は、ビンの長さ又はビンの長さの半分に等しい。

式（８）

上記式（８）において、

は、前景点の

座標の対応するビンでのオフセット量を示し、

は、前景点

に対して生成された３Ｄ初期枠の中心点の

座標を示し、

は、前景点の

座標を示す。

好ましい例において、第１～第３ニューラルネットワークに対するトレーニングが所定の反復条件を満たすと、今回のトレーニングプロセスが終了する。本開示における所定の反復条件は、第３ニューラルネットワークにより出力された３Ｄ初期枠と点群データサンプルの３Ｄアノテーション枠との間の差異が所定の差異要求を満たし、かつ第２ニューラルネットワークにより出力された信頼度が所定の要求を満たすことを含んでよい。両者がいずれも要求を満たす場合に、第１～第３ニューラルネットワークに対する今回のトレーニングは、成功して完了する。本開示における所定の反復条件は、第１～第３ニューラルネットワークをトレーニングするために使用される点群データサンプルの数が所定の数量要求を満たすなどを含んでもよい。使用される点群データサンプルの数が所定の数量要求を満たすが、両者が同時に要求を満たさない場合に、第１～第３ニューラルネットワークに対する今回のトレーニングが成功しない。

好ましくは、本開示のニューラルネットワークにより３Ｄ検出枠を形成するプロセスが１つの段階を含む場合に、成功してトレーニングされた第１～第３ニューラルネットワークは、ターゲットオブジェクトの３Ｄ検出に用いられてよい。

好ましくは、本開示のニューラルネットワークにより３Ｄ検出枠を形成するプロセスが２つの段階を含む場合に、成功してトレーニングされた第１～第３ニューラルネットワークは、点群データサンプルに対して、前景点に対応する３Ｄ初期枠を生成してもよく、すなわち、本開示は、点群データサンプルを再び、成功してトレーニングされた第１ニューラルネットワークに提供し、かつ第２ニューラルネットワーク及び第３ニューラルネットワークにより出力された情報をそれぞれ記憶することにより、第２段階ニューラルネットワークに入力（すなわち、前景点に対応する３Ｄ初期枠）を提供し、その後、第２段階において生成された信頼度に対応する損失と補正後の３Ｄ初期枠に対応する損失とを取得し、取得された損失を利用して第４ニューラルネットワーク～第７ニューラルネットワークのネットワークパラメータを調整し、かつ第４～第７ニューラルネットワークのトレーニングが成功して完了した後にニューラルネットワーク全体のトレーニングが成功して完了する。

本開示における第２段階ニューラルネットワークにおける第４～第７ニューラルネットワークのネットワークパラメータの調整に使用される、信頼度に対応する損失と補正後の３Ｄ初期枠に対応する損失とを含む損失関数は、下記式（９）で示されてよい。

式（９）

上記式（９）において、

は、３Ｄ初期枠集合を示し、

は、３Ｄ初期枠集合における３Ｄ初期枠の数を示し、

は、予測された信頼度を監督するクロスエントロピー損失関数を示し、すなわち、

は、クロスエントロピー分類損失関数であり、

は、第６ニューラルネットワークにより予測された、補正後のｉ番目の３Ｄ初期枠がターゲットオブジェクトである信頼度を示し、

は、ｉ番目の３Ｄ初期枠がターゲットオブジェクトであるか否かを示すラベルであり、該ラベルは、計算により取得されてよく、例えば、ｉ番目の３Ｄ初期枠と対応する３Ｄアノテーション枠との重なり度が設定閾値を超える場合に、該ラベルの値が１であり、そうでなければ、該ラベルの値が０であり、

は、

の部分集合であり、かつ

における３Ｄ初期枠と対応する３Ｄアノテーション枠との重なり度が設定閾値を超え、

は、該部分集合における３Ｄ初期枠の数を示し、

は上記

と類似し、

は上記

と類似し、単に

（式におけるｉ番目の３Ｄ初期枠

を置き換える）及び

（式におけるｉ番目の３Ｄアノテーション枠情報を置き換える）を利用したものであり、

と

は、下記式（１０）の形式で示されてよい。

式（１０）

上記式（１０）において、

は、ｉ番目の３Ｄアノテーション枠情報であり、

は、座標変換後のｉ番目の３Ｄアノテーション枠情報を示し、

は、補正後のｉ番目の３Ｄ初期枠であり、

は、座標変換後のｉ番目の３Ｄ初期枠を示す。

式（９）を計算する時に、上記式（３）を利用する必要があり、かつ式（３）における

と

は、下記式（１１）の形式に置き換えられてよい。

式（１１）

上記式（１１）において、

は、ビンの大きさ、すなわち、ビンの角度区間を示す。

と

は、下記式（１２）の形式に置き換えられてよい。

式（１２）
ここで、

は、ビンの大きさ、すなわち、ビンの角度区間を示す。

好ましい例において、第４～第７ニューラルネットワークに対するトレーニングが所定の反復条件を満たすと、今回のトレーニングプロセスが終了する。本開示における所定の反復条件は、第７ニューラルネットワークにより出力された３Ｄ初期枠と点群データサンプルの３Ｄアノテーション枠との間の差異が所定の差異要求を満たし、かつ第６ニューラルネットワークにより出力された信頼度が所定の要求を満たすことを含んでよい。両者がいずれも要求を満たす場合に、第４～第７ニューラルネットワークに対する今回のトレーニングは、成功して完了する。本開示における所定の反復条件は、第４～第７ニューラルネットワークをトレーニングするために使用される点群データサンプルの数が所定の数量要求を満たすなどを含んでもよい。使用される点群データサンプルの数が所定の数量要求を満たすが、両者が同時に要求を満たさない場合に、第４～第７ニューラルネットワークに対する今回のトレーニングが成功しない。

図６は、本開示の車両のインテリジェント制御方法の一実施例のフローチャートである。

図６に示すように、該実施例の方法は、ステップＳ６００、Ｓ６１０、Ｓ６２０、Ｓ６３０、Ｓ６４０及びＳ６５０を含む。以下、図６における各ステップをそれぞれ詳細に説明する。

Ｓ６００において、取得されたシーンの点群データの特徴情報を抽出する。

Ｓ６１０において、点群データの特徴情報に基づいて、点群データに対してセマンティックセグメンテーションを行って、点群データにおける複数の点の第１セマンティック情報を取得する。

Ｓ６２０において、第１セマンティック情報に基づいて、複数の点のうち、ターゲットオブジェクトに対応する少なくとも１つの前景点を予測する。

Ｓ６３０において、第１セマンティック情報に基づいて、少なくとも１つの前景点のそれぞれに対応する３Ｄ初期枠を生成する。

Ｓ６４０において、３Ｄ初期枠に基づいて、シーンにおけるターゲットオブジェクトの３Ｄ検出枠を決定する。

上記Ｓ６００～Ｓ６４０の具体的な実現プロセスについては、上記実施形態における関連説明を参照することができるため、ここでは説明を省略する。また、上記Ｓ６００～Ｓ６４０の実現方式は、点群データをニューラルネットワークに提供し、該ニューラルネットワークを介して点群データにおける点に対して特徴情報抽出処理を行い、抽出された特徴情報に基づいてセマンティックセグメンテーション処理を行って、複数の点のセマンティック特徴を取得し、セマンティック特徴に基づいて、複数の点のうちの前景点を予測し、かつ複数の点のうちの少なくとも一部の点のそれぞれに対応する３Ｄ初期枠を生成することであってよい。

Ｓ６５０において、上記３Ｄ検出枠に基づいて、車両を制御する命令又は早期警報提示情報を生成する。

好ましくは、本開示は、まず、３Ｄ検出枠に基づいて、ターゲットオブジェクトのシーンにおける空間位置、大きさ、車両との距離、車両との相対方位情報のうちの少なくとも１つを含むターゲットオブジェクトの情報を決定してよい。次に、決定された少なくとも１つの情報に基づいて、車両を制御する命令又は早期警報提示情報を生成する。本開示において生成される命令は、例えば、時速を上げる命令、時速を下げる命令、又は急ブレーキをかける命令などである。生成される早期警報提示情報は、例えば、ある方位の車両又は歩行者などのターゲットオブジェクトに注意する提示情報などである。本開示は、３Ｄ検出枠に基づいて命令又は早期警報提示情報を生成する具体的な実現方式を限定しない。

図７は、本開示の障害物回避ナビゲーション方法の一実施例のフローチャートである。

図７に示すように、該実施例の方法は、ステップＳ７００、Ｓ７１０、Ｓ７２０、Ｓ７３０、Ｓ７４０及びＳ７５０を含む。以下、図７における各ステップをそれぞれ詳細に説明する。

Ｓ７００において、取得されたシーンの点群データの特徴情報を抽出する。

Ｓ７１０において、点群データの特徴情報に基づいて、点群データに対してセマンティックセグメンテーションを行って、点群データにおける複数の点の第１セマンティック情報を取得する。

Ｓ７２０において、第１セマンティック情報に基づいて、複数の点のうち、ターゲットオブジェクトに対応する少なくとも１つの前景点を予測する。

Ｓ７３０において、第１セマンティック情報に基づいて、少なくとも１つの前景点のそれぞれに対応する３Ｄ初期枠を生成する。

Ｓ７４０において、３Ｄ初期枠に基づいて、シーンにおけるターゲットオブジェクトの３Ｄ検出枠を決定する。

上記Ｓ７００～Ｓ７４０の具体的な実現プロセスについては、上記実施形態における関連説明を参照することができるため、ここでは説明を省略する。また、上記Ｓ７００～Ｓ７４０の実現方式は、点群データをニューラルネットワークに提供し、該ニューラルネットワークを介して点群データにおける点に対して特徴情報抽出処理を行い、抽出された特徴情報に基づいてセマンティックセグメンテーション処理を行って、複数の点のセマンティック特徴を取得し、セマンティック特徴に基づいて、複数の点のうちの前景点を予測し、かつ複数の点のうちの少なくとも一部の点のそれぞれに対応する３Ｄ初期枠を生成することであってよい。

Ｓ７５０において、上記３Ｄ検出枠に基づいて、レーザレーダが位置するロボットに対して障害物回避ナビゲーション制御を行う命令又は早期警報提示情報を生成する。

好ましくは、本開示は、まず、３Ｄ検出枠に基づいて、ターゲットオブジェクトのシーンにおける空間位置、大きさ、ロボットとの距離、ロボットとの相対方位情報のうちの少なくとも１つを含むターゲットオブジェクトの情報を決定してよい。次に、決定された少なくとも１つの情報に基づいて、ロボットに対して障害物回避ナビゲーション制御を行う命令又は早期警報提示情報を生成する。本開示において生成される命令は、例えば、行動速度を下げる命令、行動を一時停止させる命令、又は旋回させる命令などである。生成される早期警報提示情報は、例えば、ある方位の障害物（すなわち、ターゲットオブジェクト）に注意する提示情報などである。本開示は、３Ｄ検出枠に基づいて命令又は早期警報提示情報を生成する具体的な実現方式を限定しない。

図８は、本開示のターゲットオブジェクトの３Ｄ検出装置の一実施例の概略構成図である。図８に示す装置は、特徴抽出モジュール８００、第１セマンティックセグメンテーションモジュール８１０、前景点予測モジュール８２０、初期枠生成モジュール８３０及び検出枠決定モジュール８４０を含む。

特徴抽出モジュール８００は、主に、取得されたシーンの点群データの特徴情報を抽出する。第１セマンティックセグメンテーションモジュール８１０は、主に、点群データの特徴情報に基づいて、点群データに対してセマンティックセグメンテーション処理を行って、点群データにおける複数の点の第１セマンティック情報を取得する。前景点予測モジュール８２０は、主に、第１セマンティック情報に基づいて複数の点のうち、ターゲットオブジェクトに対応する少なくとも１つの前景点を予測する。初期枠生成モジュール８３０は、主に、第１セマンティック情報に基づいて、少なくとも１つの前景点のそれぞれに対応する３Ｄ初期枠を生成する。検出枠決定モジュール８４０は、主に、３Ｄ初期枠に基づいてシーンにおけるターゲットオブジェクトの３Ｄ検出枠を決定する。

好ましい例において、検出枠決定モジュール８４０は、第１サブモジュール、第２サブモジュール及び第３サブモジュールを含んでよい。第１サブモジュールは、主に、点群データにおける、上記３Ｄ初期枠を少なくとも含む部分領域内の点の特徴情報を取得する。第２サブモジュールは、主に、部分領域内の点の特徴情報に基づいて、部分領域内の点に対してセマンティックセグメンテーションを行って、部分領域内の点の第２セマンティック情報を取得する。第３サブモジュールは、主に、部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、シーンにおけるターゲットオブジェクトの３Ｄ検出枠を決定する。

好ましい例において、本開示における第３サブモジュールは、第４サブモジュール及び第５サブモジュールを含んでよい。第４サブモジュールは、主に、部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、３Ｄ初期枠を補正して、補正後の３Ｄ初期枠を得る。第５サブモジュールは、主に、補正後の３Ｄ初期枠に基づいて、シーンにおけるターゲットオブジェクトの３Ｄ検出枠を決定する。

好ましい例において、本開示における第３サブモジュールは、さらに、部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、３Ｄ初期枠がターゲットオブジェクトに対応する信頼度を決定し、３Ｄ初期枠及びその信頼度に基づいてシーンにおけるターゲットオブジェクトの３Ｄ検出枠を決定してよい。

好ましい例において、本開示における第３サブモジュールは、第４サブモジュール、第６サブモジュール及び第７サブモジュールを含んでよい。第４サブモジュールは、主に、部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、３Ｄ初期枠を補正して、補正後の３Ｄ初期枠を得る。第６サブモジュールは、主に、部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、補正後の３Ｄ初期枠がターゲットオブジェクトに対応する信頼度を決定する。第７サブモジュールは、主に、補正後の３Ｄ初期枠及びその信頼度に基づいて、シーンにおけるターゲットオブジェクトの３Ｄ検出枠を決定する。

好ましい例において、本開示における部分領域は、所定のポリシーに基づいて３Ｄ初期枠に対してエッジ拡張を行って得られた３Ｄ拡張枠を含む。例えば、３Ｄ拡張枠は、予め設定されたＸ軸方向の増分、Ｙ軸方向の増分及び／又はＺ軸方向の増分に基づいて、上記３Ｄ初期枠に対して３Ｄ空間拡張を行って形成された、３Ｄ初期枠を含む３Ｄ拡張枠であってよい。

好ましい例において、本開示における第２サブモジュールは、第８サブモジュール及び第９サブモジュールを含んでよい。第８サブモジュールは、主に、３Ｄ拡張枠の所定のターゲット位置に基づいて、点群データにおける、３Ｄ拡張枠内に位置する点の座標情報に対して座標変換を行って、座標変換後の点の特徴情報を取得する。第９サブモジュールは、主に、座標変換後の点の特徴情報に基づいて、３Ｄ拡張枠に基づくセマンティックセグメンテーションを行って、３Ｄ拡張枠内の点の第２セマンティック特徴を取得する。

好ましくは、第９サブモジュールは、前景点のマスク及び座標変換後の点の特徴情報に基づいて、３Ｄ拡張枠に基づくセマンティックセグメンテーションを行って、点の第２セマンティック特徴を取得してよい。

好ましい例において、前景点が複数ある場合に、本開示における検出枠決定モジュール８４０は、まず、複数の前景点に対応する３Ｄ初期枠の間の重なり度を決定し、次に、検出枠決定モジュール８４０は、重なり度が設定閾値より大きい３Ｄ初期枠を選別し、その後、検出枠決定モジュール８４０は、選別された３Ｄ初期枠に基づいて、シーンにおけるターゲットオブジェクトの３Ｄ検出枠を決定してよい。

好ましい例において、本開示における特徴抽出モジュール８００、第１セマンティックセグメンテーションモジュール８１０、前景点予測モジュール８２０及び初期枠生成モジュール８３０は、第１段階ニューラルネットワークにより実現されてよい。この場合に、本開示の装置は、さらに第１トレーニングモジュールを含んでよい。第１トレーニングモジュールは、３Ｄアノテーション枠付きの点群データサンプルを利用してトレーニング対象の第１段階ニューラルネットワークをトレーニングする。

好ましい例において、第１トレーニングモジュールが第１段階ニューラルネットワークをトレーニングするプロセスは、以下を含む。

まず、第１トレーニングモジュールは、点群データサンプルを第１段階ニューラルネットワークに提供し、第１段階ニューラルネットワークに基づいて点群データサンプルの特徴情報を抽出し、第１段階ニューラルネットワークは、抽出された特徴情報に基づいて、点群データサンプルに対してセマンティックセグメンテーション処理を行い、第１段階ニューラルネットワークは、セマンティックセグメンテーション処理により取得された複数の点の第１セマンティック特徴に基づいて、複数の点のうち、ターゲットオブジェクトに対応する少なくとも１つの前景点を予測し、かつ第１セマンティック情報に基づいて少なくとも１つの前景点のそれぞれに対応する３Ｄ初期枠を生成する。

次に、第１トレーニングモジュールは、前景点に対応する損失と、３Ｄ初期枠がその対応する３Ｄアノテーション枠に対して生成した損失とを取得し、かつ上記損失に基づいて第１段階ニューラルネットワークのネットワークパラメータを調整する。

好ましくは、第１トレーニングモジュールは、第１段階ニューラルネットワークにより予測された前景点の信頼度に基づいて、前景点の予測結果に対応する第１損失を決定してよい。第１トレーニングモジュールは、前景点に対して生成された３Ｄ初期枠内のパラメータの所在するビンの番号と、点群データサンプル中の３Ｄアノテーション枠情報におけるパラメータの所在するビンの番号とに基づいて、第２損失を生成する。第１トレーニングモジュールは、前景点に対して生成された３Ｄ初期枠内のパラメータの対応するビンでのオフセット量と、点群データサンプル中の３Ｄアノテーション枠情報におけるパラメータの対応するビンでのオフセット量とに基づいて、第３損失を生成する。第１トレーニングモジュールは、前景点に対して生成された３Ｄ初期枠内のパラメータの所定のパラメータに対するオフセット量に基づいて第４損失を生成する。第１トレーニングモジュールは、前景点の座標パラメータの、該前景点に対して生成された３Ｄ初期枠内の座標パラメータに対するオフセット量に基づいて第５損失を生成する。第１トレーニングモジュールは、取得した第１損失、第２損失、第３損失、第４損失及び第５損失に基づいて、第１段階ニューラルネットワークのネットワークパラメータを調整する。

好ましい例において、本開示における第１サブモジュール、第２サブモジュール及び第３サブモジュールは、第２段階ニューラルネットワークにより実現される。この場合に、本開示の装置は、第２トレーニングモジュールをさらに含み、第２トレーニングモジュールは、３Ｄアノテーション枠付きの点群データサンプルを利用してトレーニング対象の第２段階ニューラルネットワークをトレーニングする。

好ましい例において、第２トレーニングモジュールが第２段階ニューラルネットワークをトレーニングするプロセスは、以下を含む。

まず、第２トレーニングモジュールは、第１段階ニューラルネットワークを利用して取得した３Ｄ初期枠を第２段階ニューラルネットワークに提供し、第２段階ニューラルネットワークに基づいて点群データサンプル中の部分領域内の点の特徴情報を取得し、部分領域内の点の特徴情報に基づいて、部分領域内の点に対してセマンティックセグメンテーションを行って、部分領域内の点の第２セマンティック特徴を取得して、第２段階ニューラルネットワークは、部分領域内の点の第１セマンティック特徴及び第２セマンティック特徴に基づいて、３Ｄ初期枠がターゲットオブジェクトである信頼度を決定し、かつ部分領域内の点の第１セマンティック特徴及び第２セマンティック特徴に基づいて、位置補正後の３Ｄ初期枠を生成する。

次に、第２トレーニングモジュールは、３Ｄ初期枠がターゲットオブジェクトである信頼度に対応する損失と、位置補正後の３Ｄ初期枠がその対応する３Ｄアノテーション枠に対して生成した損失とを取得し、かつ取得された損失に基づいて第２段階ニューラルネットワークのネットワークパラメータを調整する。

好ましくは、第２トレーニングモジュールは、第２段階ニューラルネットワークにより予測された、３Ｄ初期枠がターゲットオブジェクトである信頼度に基づいて、予測結果に対応する第６損失を決定してよい。第２トレーニングモジュールは、第２段階ニューラルネットワークにより生成された、対応する３Ｄアノテーション枠との重なり度が設定閾値を超える、位置補正後の３Ｄ初期枠内のパラメータの所在するビンの番号と、点群データサンプル中の３Ｄアノテーション枠情報におけるパラメータの所在するビンの番号とに基づいて、第７損失を生成し、第２トレーニングモジュールは、第２段階ニューラルネットワークにより生成された、対応する３Ｄアノテーション枠との重なり度が設定閾値を超える、位置補正後の３Ｄ初期枠内のパラメータの対応するビンでのオフセット量と、点群データサンプル中の３Ｄアノテーション枠情報におけるパラメータの対応するビンでのオフセット量とに基づいて、第８損失を生成し、第２トレーニングモジュールは、第２段階ニューラルネットワークにより生成された、対応する３Ｄアノテーション枠との重なり度が設定閾値を超える、位置補正後の３Ｄ初期枠内のパラメータの所定のパラメータに対するオフセット量に基づいて、第９損失を生成し、第２トレーニングモジュールは、第２段階ニューラルネットワークにより生成された、対応する３Ｄアノテーション枠との重なり度が設定閾値を超える、位置補正後の３Ｄ初期枠内の座標パラメータの、３Ｄアノテーション枠の中心点の座標パラメータに対するオフセット量に基づいて、第１０損失を生成し、第２トレーニングモジュールは、第６損失、第７損失、第８損失、第９損失及び第１０損失に基づいて第２段階ニューラルネットワークのネットワークパラメータを調整する。

図９は、本開示の車両のインテリジェント制御装置の一実施例の概略構成図である。図９に示すように、該実施例の装置は、ターゲットオブジェクトの３Ｄ検出装置９００及び第１制御モジュール９１０を含む。ターゲットオブジェクトの３Ｄ検出装置９００は、点群データに基づいてターゲットオブジェクトの３Ｄ検出枠を取得する。ターゲットオブジェクトの３Ｄ検出装置９００の具体的な構造と実行する具体的な動作は、上記装置及び方法の実施形態における説明のとおりであるため、ここで詳細に説明しない。第１制御モジュール９１０は、主に、３Ｄ検出枠に基づいて、車両を制御する命令又は早期警報提示情報を生成する。具体的には、上記方法の実施形態における関連説明を参照することができるため、ここで詳細に説明しない。

図１０は、本開示の障害物回避ナビゲーション装置であり、図１０に示すように、該実施例の装置は、ターゲットオブジェクトの３Ｄ検出装置１０００及び第２制御モジュール１０１０を含む。ターゲットオブジェクトの３Ｄ検出装置１０００は、点群データに基づいてターゲットオブジェクトの３Ｄ検出枠を取得する。ターゲットオブジェクトの３Ｄ検出装置１０００の具体的な構造と実行する具体的な動作は、上記装置及び方法の実施形態における関連説明のとおりであるため、ここで詳細に説明しない。第２制御モジュール１０１０は、主に、３Ｄ検出枠に基づいて、ロボットに対して障害物回避ナビゲーション制御を行う命令又は早期警報提示情報を生成する。具体的には、上記方法の実施形態における関連説明を参照することができるため、ここで詳細に説明しない。

例示的な機器
図１１は、本開示の実現に適する例示的な機器１１００を示し、機器１１００は、自動車に配置された制御システム／電子システム、移動端末（例えば、スマートフォンなど）、パーソナルコンピュータ（ＰＣ、例えば、デスクトップコンピュータ又はノートブックコンピュータなど）、タブレットコンピュータ及びサーバなどであってよい。図１１において、機器１１００は、１つ以上のプロセッサ、通信部などを含み、上記１つ以上のプロセッサは、１つ以上の中央処理装置（ＣＰＵ）１１０１、及び／又は、ニューラルネットワークを利用してビジョントラッキングを行う１つ以上の画像プロセッサ（ＧＰＵ）１１１３などであってよく、プロセッサは、読み出し専用メモリ（ＲＯＭ）１１０２に記憶された実行可能命令、又は記憶部分１１０８からランダムアクセスメモリ（ＲＡＭ）１１０３にロードされた実行可能命令に基づいて、様々な適切な動作及び処理を実行してよい。通信部１１１２は、ネットワークカードを含むが、これに限定されず、上記ネットワークカードは、ＩＢ（Ｉｎｆｉｎｉｂａｎｄ）ネットワークカードを含むが、これに限定されない。プロセッサは、読み出し専用メモリ１１０２及び／又はランダムアクセスメモリ１１０３と通信して実行可能命令を実行し、バス１１０４を介して通信部１１１２に接続され、かつ通信部１１１２を介して他のターゲット機器と通信することにより、本開示における対応するステップを完了する。上記各命令により実行される動作については、上記方法の実施例における関連説明を参照することができるため、ここで詳細に説明しない。ＲＡＭ１１０３には、装置の動作に必要な様々なプログラム及びデータがさらに記憶されてよい。ＣＰＵ１１０１、ＲＯＭ１１０２、及びＲＡＭ１１０３は、バス１１０４を介して互いに接続される。

ＲＡＭ１１０３がある場合に、ＲＯＭ１１０２は、オプションモジュールである。ＲＡＭ１１０３は、実行可能命令を記憶するか、又は実行時にＲＯＭ１１０２に実行可能命令を書き込み、実行可能な命令は、上記ターゲットオブジェクトの３Ｄ検出方法に含まれるステップを中央処理装置１１０１に実行させる。入力／出力（Ｉ／Ｏ）インタフェース１１０５もバス１１０４に接続される。通信部１１１２は、集積して設置されてもよく、複数のサブモジュール（例えば、複数のＩＢネットワークカード）を有し、かつそれぞれバスに接続されるように設置されてもよい。キーボード、マウスなどを含む入力部分１１０６と、ブラウン管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）など及びスピーカなどを含む出力部分１１０７と、ハードディスクなどを含む記憶部分１１０８と、ＬＡＮカード、モデムなどのネットワークインタフェースカードを含む通信部分１１０９とは、Ｉ／Ｏインタフェース１１０５に接続される。通信部分１１０９は、インターネットなどのネットワークを介して通信処理を実行する。ドライブ１１１０も必要に応じてＩ／Ｏインタフェース１１０５に接続される。磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどのリムーバブル媒体１１１１は、そこから読み出されたコンピュータプログラムが必要に応じて記憶部分１１０８にインストールされるように、必要に応じてドライブ１１１０にインストールされる。

なお、図１１に示すアーキテクチャは、好ましい実現方式に過ぎず、具体的な実践過程において、実際の必要に応じて上記図１１における部品の数及び種類を選択、削除、追加、又は置換してよく、異なる機能部品の設置について、分離設置又は集積設置などの実現方式を採用してもよく、例えば、ＧＰＵ１１１３とＣＰＵ１１０１が分離して設置されてよく、また、例えば、ＧＰＵ１１１３がＣＰＵ１１０１に集積されてよく、通信部１１１２は、分離して設置されてもよく、ＣＰＵ１１０１又はＧＰＵ１１１３に集積して設置されてもよい。これらの代替的な実施形態は、いずれも本開示の保護範囲に属する。特に、本開示の実施形態によれば、以下にフローチャートを参照して説明されるプロセスは、コンピュータソフトウェアプログラムとして実現されてよく、例えば、本開示の実施形態は、機械可読媒体に有形に含まれるコンピュータプログラムを含むコンピュータプログラム製品を含み、コンピュータプログラムは、フローチャートに示されるステップを実行するプログラムコードを含み、プログラムコードは、本開示に係る方法におけるステップを対応して実行する対応命令を含んでよい。このような実施形態において、該コンピュータプログラムは、通信部分１１０９によりネットワークからダウンロードされインストールされ、及び／又はリムーバブル媒体１１１１からインストールされてよい。該コンピュータプログラムが中央処理装置（ＣＰＵ）１１０１により実行されると、本開示に記載の、上記対応するステップを実現する命令を実行する。

１つ以上の好ましい実施形態において、本開示の実施例は、実行されると、上記任意の実施例に記載のターゲットオブジェクトの３Ｄ検出方法をコンピュータに実行させるコンピュータ可読命令を記憶するコンピュータプログラム製品をさらに提供する。

該コンピュータプログラム製品は、具体的には、ハードウェア、ソフトウェア又はそれらの組み合わせにより実現されてよい。好ましい例において、上記コンピュータプログラム製品は、具体的には、コンピュータ記憶媒体として具現化され、別の好ましい例において、上記コンピュータプログラム製品は、具体的には、例えばソフトウェア開発キット（ＳｏｆｔｗａｒｅＤｅｖｅｌｏｐｍｅｎｔＫｉｔ、ＳＤＫ）などのソフトウェア製品として具現化される。

１つ以上の好ましい実施形態において、本開示の実施例は、別のターゲットオブジェクトの３Ｄ検出方法及び対応する装置、電子機器、コンピュータ記憶媒体、コンピュータプログラム並びにコンピュータプログラム製品をさらに提供し、ターゲットオブジェクトの３Ｄ検出方法は、上記いずれか１つの可能な実施例におけるターゲットオブジェクトの３Ｄ検出方法を第２装置に実行させるターゲットオブジェクト３Ｄ検出指示を第１装置が第２装置に送信することと、第１の装置が第２の装置から送信されたターゲットオブジェクト３Ｄ検出結果を受信することと、を含む。

いくつかの実施例において、該ターゲットオブジェクト３Ｄ検出指示は、具体的には、呼び出し命令であってよく、第１装置は、呼び出し方式で、ターゲットオブジェクト３Ｄ検出動作を実行するように第２装置に指示することができ、それに応じて、呼び出し命令を受信したことに応答して、第２装置は、上記ターゲットオブジェクトの３Ｄ検出方法の任意の実施例におけるステップ及び／又はフローを実行することができる。

本開示の実施例における「第１」、「第２」などの用語は、区別するためのものに過ぎず、本開示の実施例を限定するものと理解すべきではないことを理解されたい。さらに、本開示では、「複数」は、２つ又は２つ以上を指してよく、「少なくとも１つ」は、１つ、２つ又は２つ以上を指してよいことを理解されたい。さらに、本開示で言及された任意の部品、データ又は構造は、明確に限定されるか又は明細書の前後で反対的に示唆された場合でなければ、一般的には１つ又は複数と理解してよいことを理解されたい。さらに、本開示における各実施例についての説明は各実施例の間の相違点を重点として強調し、その同一又は類似する点については互いに参照してよく、簡潔にするために、ここで一つずつ繰り返して説明しないことを理解されたい。

本開示の方法、装置、電子機器及びコンピュータ可読記憶媒体は、様々な形態で実現されてよい。例えば、ソフトウェア、ハードウェア、ファームウェア、又はソフトウェア、ハードウェア、ファームウェアの任意の組み合わせによって本開示の方法、装置、電子機器及びコンピュータ可読記憶媒体を実現することができる。方法のステップのための上記順序は、説明するためのものに過ぎず、本開示の方法のステップは、他の方式で特に説明しない限り、以上で具体的に説明された順序に限定されない。また、いくつかの実施形態において、さらに本開示は、記録媒体に記憶されたプログラムとして実施することができ、これらのプログラムは本開示に係る方法を実現するための機械可読命令を含む。したがって、本開示は、本開示に係る方法を実行するためのプログラムが記憶された記録媒体も含む。

本開示の説明は、例示及び説明のために提示されたものであり、網羅的なものであり、もしくは開示された形式に本開示を限定するというわけでない。多くの修正及び変形は、当業者にとって明らかである。実施形態は、本開示の原理及び実際の適用をよりよく説明し、かつ当業者が本開示の実施例を理解して特定用途に適した様々な修正を加えた様々な実施形態を設計可能にするように選択され説明されたものである。

Claims

取得されたシーンの点群データの特徴情報を抽出することと、
前記点群データの特徴情報に基づいて、前記点群データに対してセマンティックセグメンテーションを行って、前記点群データにおける複数の点の第１セマンティック情報を取得することと、
前記第１セマンティック情報に基づいて、前記複数の点のうち、ターゲットオブジェクトに対応する少なくとも１つの前景点を予測することと、
前記第１セマンティック情報に基づいて、前記少なくとも１つの前景点のそれぞれに対応する３Ｄ初期枠を生成することと、
前記３Ｄ初期枠に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定することとを含む、ことを特徴とするターゲットオブジェクトの３Ｄ検出方法。
前記３Ｄ初期枠に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定することは、
前記点群データにおける、前記３Ｄ初期枠を少なくとも含む部分領域内の点の特徴情報を取得することと、
前記部分領域内の点の特徴情報に基づいて、前記部分領域内の点に対してセマンティックセグメンテーションを行って、前記部分領域内の点の第２セマンティック情報を取得することと、
前記部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定することと、を含む、請求項１に記載の方法。
前記部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定することは、
前記部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、前記３Ｄ初期枠を補正して、補正後の３Ｄ初期枠を得ることと、
補正後の３Ｄ初期枠に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定することと、を含む、請求項２に記載の方法。
前記部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定することは、
前記部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、前記３Ｄ初期枠がターゲットオブジェクトに対応する信頼度を決定することと、
前記３Ｄ初期枠及びその信頼度に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定することと、を含む、請求項２に記載の方法。
前記部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定することは、
前記部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、前記３Ｄ初期枠を補正して、補正後の３Ｄ初期枠を得ることと、
前記部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、前記補正後の３Ｄ初期枠がターゲットオブジェクトに対応する信頼度を決定することと、
前記補正後の３Ｄ初期枠及びその信頼度に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定することと、を含む、請求項２に記載の方法。
前記部分領域は、
所定のポリシーに基づいて３Ｄ初期枠に対してエッジ拡張を行って得られた３Ｄ拡張枠を含む、ことを特徴とする請求項２～５のいずれか一項に記載の方法。
前記３Ｄ拡張枠は、
予め設定されたＸ軸方向の増分、Ｙ軸方向の増分及び／又はＺ軸方向の増分に基づいて、前記３Ｄ初期枠に対して３Ｄ空間拡張を行って形成された、前記３Ｄ初期枠を含む３Ｄ拡張枠を含む、ことを特徴とする請求項６に記載の方法。
前記部分領域内の点の特徴情報に基づいて前記部分領域内の点に対してセマンティックセグメンテーションを行って、前記部分領域内の点の第２セマンティック情報を取得することは、
前記３Ｄ拡張枠の所定のターゲット位置に基づいて、点群データにおける、前記３Ｄ拡張枠内に位置する点の座標情報に対して座標変換を行って、座標変換後の点の特徴情報を取得することと、
座標変換後の点の特徴情報に基づいて、前記３Ｄ拡張枠に基づくセマンティックセグメンテーションを行って、前記３Ｄ拡張枠内の点の第２セマンティック特徴を取得することとを含む、ことを特徴とする請求項６又は７に記載の方法。
前記座標変換後の点の特徴情報に基づいて、前記３Ｄ拡張枠に基づくセマンティックセグメンテーションを行うことは、
前記前景点のマスク及び座標変換後の点の特徴情報に基づいて、前記３Ｄ拡張枠に基づくセマンティックセグメンテーションを行うことを含む、ことを特徴とする請求項８に記載の方法。
前記前景点は複数あり、前記３Ｄ初期枠に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定することは、
複数の前記前景点に対応する３Ｄ初期枠の間の重なり度を決定することと、
重なり度が設定閾値より大きい３Ｄ初期枠を選別することと、
選別された３Ｄ初期枠に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定することと、を含む、請求項１に記載の方法。
前記取得されたシーンの点群データの特徴情報を抽出することと、前記点群データの特徴情報に基づいて、前記点群データに対してセマンティックセグメンテーションを行って、前記点群データにおける複数の点の第１セマンティック情報を取得することと、前記第１セマンティック情報に基づいて、前記複数の点のうち、ターゲットオブジェクトに対応する少なくとも１つの前景点を予測することと、前記第１セマンティック情報に基づいて、前記少なくとも１つの前景点のそれぞれに対応する３Ｄ初期枠を生成することとは、第１段階ニューラルネットワークにより実現され、
前記第１段階ニューラルネットワークは、３Ｄアノテーション枠付きの点群データサンプルを利用してトレーニングして得られる、ことを特徴とする請求項１～１０のいずれか一項に記載の方法。
前記第１段階ニューラルネットワークのトレーニングプロセスは、
点群データサンプルを前記第１段階ニューラルネットワークに提供し、前記第１段階ニューラルネットワークに基づいて前記点群データサンプルの特徴情報を抽出し、前記点群データサンプルの特徴情報に基づいて前記点群データサンプルに対してセマンティックセグメンテーションを行い、セマンティックセグメンテーションにより取得された複数の点の第１セマンティック特徴に基づいて前記複数の点のうち、ターゲットオブジェクトに対応する少なくとも１つの前景点を予測し、かつ前記第１セマンティック情報に基づいて前記少なくとも１つの前景点のそれぞれに対応する３Ｄ初期枠を生成することと、
前記前景点に対応する損失と、前記３Ｄ初期枠がその対応する３Ｄアノテーション枠に対して生成した損失とを取得し、かつ前記損失に基づいて前記第１段階ニューラルネットワークのネットワークパラメータを調整することとを含む、ことを特徴とする請求項１１に記載の方法。
前記前景点に対応する損失と、前記３Ｄ初期枠がその対応する３Ｄアノテーション枠に対して生成した損失とを取得し、かつ前記損失に基づいて前記第１段階ニューラルネットワークのネットワークパラメータを調整することは、
前記第１段階ニューラルネットワークにより予測された前記前景点の信頼度に基づいて、前記前景点の予測結果に対応する第１損失を決定することと、
前記前景点に対して生成された３Ｄ初期枠内のパラメータの所在するビンの番号と、前記点群データサンプル中の３Ｄアノテーション枠情報における、パラメータの所在するビンの番号とに基づいて、第２損失を生成することと、
前記前景点に対して生成された３Ｄ初期枠内のパラメータの対応するビンでのオフセット量と、前記点群データサンプル中の３Ｄアノテーション枠情報におけるパラメータの対応するビンでのオフセット量とに基づいて、第３損失を生成することと、
前記前景点に対して生成された３Ｄ初期枠内のパラメータの所定のパラメータに対するオフセット量に基づいて、第４損失を生成することと、
前記前景点の座標パラメータの、該前景点に対して生成された３Ｄ初期枠内の座標パラメータに対するオフセット量に基づいて、第５損失を生成することと、
前記第１損失、第２損失、第３損失、第４損失及び第５損失に基づいて、前記第１段階ニューラルネットワークのネットワークパラメータを調整することとを含む、ことを特徴とする請求項１２に記載の方法。
前記点群データにおける、部分領域内の点の特徴情報を取得することと、前記部分領域内の点の特徴情報に基づいて、前記部分領域内の点に対してセマンティックセグメンテーションを行って、前記部分領域内の点の第２セマンティック情報を取得することと、前記部分領域内の点の前記第１セマンティック情報及び前記第２セマンティック情報に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定することとは、第２段階ニューラルネットワークにより実現され、
前記第２段階ニューラルネットワークは、３Ｄアノテーション枠付きの点群データサンプルを利用してトレーニングして得られる、ことを特徴とする請求項２～９のいずれか一項に記載の方法。
前記第２段階ニューラルネットワークのトレーニングプロセスは、
前記３Ｄ初期枠を第２段階ニューラルネットワークに提供し、第２段階ニューラルネットワークに基づいて前記点群データサンプル中の部分領域内の点の特徴情報を取得し、前記点群データサンプル中の部分領域内の点の特徴情報に基づいて前記点群データサンプル中の部分領域内の点に対してセマンティックセグメンテーションを行って、前記点群データサンプル中の部分領域内の点の第２セマンティック特徴を取得して、前記点群データサンプル中の部分領域内の点の第１セマンティック特徴及び第２セマンティック特徴に基づいて、前記３Ｄ初期枠がターゲットオブジェクトである信頼度を決定し、かつ前記点群データサンプル中の部分領域内の点の第１セマンティック特徴及び第２セマンティック特徴に基づいて、位置補正後の３Ｄ初期枠を生成することと、
前記３Ｄ初期枠がターゲットオブジェクトである信頼度に対応する損失と、前記位置補正後の３Ｄ初期枠がその対応する３Ｄアノテーション枠に対して生成した損失とを取得し、かつ前記損失に基づいて前記第２段階ニューラルネットワークのネットワークパラメータを調整することとを含む、ことを特徴とする請求項１４に記載の方法。
前記３Ｄ初期枠がターゲットオブジェクトである信頼度に対応する損失と、前記位置補正後の３Ｄ初期枠がその対応する３Ｄアノテーション枠に対して生成した損失とを取得し、かつ前記損失に基づいて前記第２段階ニューラルネットワークのネットワークパラメータを調整することは、
第２段階ニューラルネットワークにより予測された、３Ｄ初期枠がターゲットオブジェクトである信頼度に基づいて、予測結果に対応する第６損失を決定することと、
第２段階ニューラルネットワークにより生成された、対応する３Ｄアノテーション枠との重なり度が設定閾値を超える位置補正後の３Ｄ初期枠内のパラメータの所在するビンの番号と、点群データサンプル中の３Ｄアノテーション枠情報における、パラメータの所在するビンの番号とに基づいて、第７損失を生成することと、
第２段階ニューラルネットワークにより生成された、対応する３Ｄアノテーション枠との重なり度が設定閾値を超える位置補正後の３Ｄ初期枠内のパラメータの対応するビンでのオフセット量と、点群データサンプル中の３Ｄアノテーション枠情報におけるパラメータの対応するビンでのオフセット量とに基づいて、第８損失を生成することと、
第２段階ニューラルネットワークにより生成された、対応する３Ｄアノテーション枠との重なり度が設定閾値を超える位置補正後の３Ｄ初期枠内のパラメータの所定のパラメータに対するオフセット量に基づいて、第９損失を生成することと、
第２段階ニューラルネットワークにより生成された、対応する３Ｄアノテーション枠との重なり度が設定閾値を超える位置補正後の３Ｄ初期枠内の座標パラメータの、３Ｄアノテーション枠の中心点の座標パラメータに対するオフセット量に基づいて、第１０損失を生成することと、
前記第６損失、第７損失、第８損失、第９損失及び第１０損失に基づいて、前記第２段階ニューラルネットワークのネットワークパラメータを調整することとを含む、ことを特徴とする請求項１５に記載の方法。
請求項１～１６のいずれか一項に記載のターゲットオブジェクトの３Ｄ検出方法を用いてターゲットオブジェクトの３Ｄ検出枠を取得することと、
前記３Ｄ検出枠に基づいて、車両を制御する命令又は早期警報提示情報を生成することとを含む、ことを特徴とする車両のインテリジェント制御方法。
前記３Ｄ検出枠に基づいて、車両を制御する命令又は早期警報提示情報を生成することは、
前記３Ｄ検出枠に基づいて、前記ターゲットオブジェクトのシーンにおける空間位置、大きさ、車両との距離、及び車両との相対方位情報のうちの少なくとも１つを含む前記ターゲットオブジェクトの情報を決定することと、
決定された前記少なくとも１つの情報に基づいて、前記車両を制御する命令又は早期警報提示情報を生成することとを含む、請求項１７に記載の方法。
請求項１～１６のいずれか一項に記載のターゲットオブジェクトの３Ｄ検出方法を用いてターゲットオブジェクトの３Ｄ検出枠を取得することと、
前記３Ｄ検出枠に基づいて、ロボットに対して障害物回避ナビゲーション制御を行う命令又は早期警報提示情報を生成することとを含む、ことを特徴とする障害物回避ナビゲーション方法。
前記３Ｄ検出枠に基づいて、ロボットに対して障害物回避ナビゲーション制御を行う命令又は早期警報提示情報を生成することは、
前記３Ｄ検出枠に基づいて、前記ターゲットオブジェクトのシーンにおける空間位置、大きさ、ロボットとの距離、ロボットとの相対方位情報のうちの少なくとも１つを含む前記ターゲットオブジェクトの情報を決定することと、
決定された前記少なくとも１つの情報に基づいて、前記ロボットに対して障害物回避ナビゲーション制御を行う命令又は早期警報提示情報を生成することと、を含む、請求項１９に記載の方法。
取得されたシーンの点群データの特徴情報を抽出する特徴抽出モジュールと、
前記点群データの特徴情報に基づいて、前記点群データに対してセマンティックセグメンテーションを行って、前記点群データにおける複数の点の第１セマンティック情報を取得する第１セマンティックセグメンテーションモジュールと、
前記第１セマンティック情報に基づいて、前記複数の点のうち、ターゲットオブジェクトに対応する少なくとも１つの前景点を予測する前景点予測モジュールと、
前記第１セマンティック情報に基づいて、前記少なくとも１つの前景点のそれぞれに対応する３Ｄ初期枠を生成する初期枠生成モジュールと、
前記３Ｄ初期枠に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定する検出枠決定モジュールとを含む、ことを特徴とするターゲットオブジェクトの３Ｄ検出装置。
前記検出枠決定モジュールは、
前記点群データにおける、前記３Ｄ初期枠を少なくとも含む部分領域内の点の特徴情報を取得する第１サブモジュールと、
前記部分領域内の点の特徴情報に基づいて、前記部分領域内の点に対してセマンティックセグメンテーションを行って、前記部分領域内の点の第２セマンティック情報を取得する第２サブモジュールと、
前記部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定する第３サブモジュールと、をさらに含む、請求項２１に記載の装置。
前記第３サブモジュールは、
前記部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、前記３Ｄ初期枠を補正して、補正後の３Ｄ初期枠を得る第４サブモジュールと、
補正後の３Ｄ初期枠に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定する第５サブモジュールと、を含む、請求項２２に記載の装置。
前記第３サブモジュールは、さらに、
前記部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、前記３Ｄ初期枠がターゲットオブジェクトに対応する信頼度を決定し、
前記３Ｄ初期枠及びその信頼度に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定する、請求項２２に記載の装置。
前記第３サブモジュールは、
前記部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、前記３Ｄ初期枠を補正して、補正後の３Ｄ初期枠を得る第４サブモジュールと、
前記部分領域内の点の第１セマンティック情報及び第２セマンティック情報に基づいて、前記補正後の３Ｄ初期枠がターゲットオブジェクトに対応する信頼度を決定する第６サブモジュールと、
前記補正後の３Ｄ初期枠及びその信頼度に基づいて、前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定する第７サブモジュールと、を含む、請求項２２に記載の装置。
前記部分領域は、
所定のポリシーに基づいて３Ｄ初期枠に対してエッジ拡張を行って得られた３Ｄ拡張枠を含む、ことを特徴とする請求項２２～２５のいずれか一項に記載の装置。
前記３Ｄ拡張枠は、
予め設定されたＸ軸方向の増分、Ｙ軸方向の増分及び／又はＺ軸方向の増分に基づいて、前記３Ｄ初期枠に対して３Ｄ空間拡張を行って形成された、前記３Ｄ初期枠を含む３Ｄ拡張枠を含む、ことを特徴とする請求項２６に記載の装置。
前記第２サブモジュールは、
前記３Ｄ拡張枠の所定のターゲット位置に基づいて、点群データにおける、前記３Ｄ拡張枠内に位置する点の座標情報に対して座標変換を行って、座標変換後の点の特徴情報を取得する第８サブモジュールと、
座標変換後の点の特徴情報に基づいて、前記３Ｄ拡張枠に基づくセマンティックセグメンテーションを行って、前記３Ｄ拡張枠内の点の第２セマンティック特徴を取得する第９サブモジュールとを含む、ことを特徴とする請求項２６又は２７に記載の装置。
前記第９サブモジュールは、さらに、
前記前景点のマスク及び座標変換後の点の特徴情報に基づいて、前記３Ｄ拡張枠に基づくセマンティックセグメンテーションを行う、ことを特徴とする請求項２８に記載の装置。
前記前景点は複数あり、前記検出枠決定モジュールは、さらに、
複数の前記前景点に対応する３Ｄ初期枠の間の重なり度を決定し、
重なり度が設定閾値より大きい３Ｄ初期枠を選別し、
選別された３Ｄ初期枠に基づいて前記シーンにおける前記ターゲットオブジェクトの３Ｄ検出枠を決定する、請求項２１に記載の装置。
前記特徴抽出モジュール、第１セマンティックセグメンテーションモジュール、前景点予測モジュール及び初期枠生成モジュールは、第１段階ニューラルネットワークにより実現され、かつ前記第１段階ニューラルネットワークは、第１トレーニングモジュールが３Ｄアノテーション枠付きの点群データサンプルを利用してトレーニングして得るものである、ことを特徴とする請求項２１～３０のいずれか一項に記載の装置。
前記第１トレーニングモジュールは、
点群データサンプルを前記第１段階ニューラルネットワークに提供し、前記第１段階ニューラルネットワークに基づいて前記点群データサンプルの特徴情報を抽出し、前記点群データサンプルの特徴情報に基づいて前記点群データサンプルに対してセマンティックセグメンテーションを行い、セマンティックセグメンテーションにより取得された複数の点の第１セマンティック特徴に基づいて前記複数の点のうち、ターゲットオブジェクトに対応する少なくとも１つの前景点を予測し、かつ前記第１セマンティック情報に基づいて前記少なくとも１つの前景点のそれぞれに対応する３Ｄ初期枠を生成し、
前記前景点に対応する損失と、前記３Ｄ初期枠がその対応する３Ｄアノテーション枠に対して生成した損失とを取得し、かつ前記損失に基づいて前記第１段階ニューラルネットワークのネットワークパラメータを調整する、ことを特徴とする請求項３１に記載の装置。
前記第１トレーニングモジュールは、さらに、
前記第１段階ニューラルネットワークにより予測された前記前景点の信頼度に基づいて、前記前景点の予測結果に対応する第１損失を決定し、
前記前景点に対して生成された３Ｄ初期枠内のパラメータの所在するビンの番号と、前記点群データサンプル中の３Ｄアノテーション枠情報における、パラメータの所在するビンの番号とに基づいて、第２損失を生成し、
前記前景点に対して生成された３Ｄ初期枠内のパラメータの対応するビンでのオフセット量と、前記点群データサンプル中の３Ｄアノテーション枠情報におけるパラメータの対応するビンでのオフセット量とに基づいて、第３損失を生成し、
前記前景点に対して生成された３Ｄ初期枠内のパラメータの所定のパラメータに対するオフセット量に基づいて、第４損失を生成し、
前記前景点の座標パラメータの、該前景点に対して生成された３Ｄ初期枠内の座標パラメータに対するオフセット量に基づいて、第５損失を生成し、
前記第１損失、第２損失、第３損失、第４損失及び第５損失に基づいて、前記第１段階ニューラルネットワークのネットワークパラメータを調整する、ことを特徴とする請求項３２に記載の装置。
前記第１サブモジュール、第２サブモジュール及び第３サブモジュールは、第２段階ニューラルネットワークにより実現され、かつ前記第２段階ニューラルネットワークは、第２トレーニングモジュールが３Ｄアノテーション枠付きの点群データサンプルを利用してトレーニングして得るものである、ことを特徴とする請求項２２～２９のいずれか一項に記載の装置。
前記第２トレーニングモジュールは、
前記３Ｄ初期枠を第２段階ニューラルネットワークに提供し、第２段階ニューラルネットワークに基づいて前記点群データサンプル中の部分領域内の点の特徴情報を取得し、前記点群データサンプル中の部分領域内の点の特徴情報に基づいて前記点群データサンプル中の部分領域内の点に対してセマンティックセグメンテーションを行って、点群データサンプル中の部分領域内の点の第２セマンティック特徴を取得して、前記点群データサンプル中の部分領域内の点の第１セマンティック特徴及び第２セマンティック特徴に基づいて、前記３Ｄ初期枠がターゲットオブジェクトである信頼度を決定し、かつ前記点群データサンプル中の部分領域内の点の第１セマンティック特徴及び前記第２セマンティック特徴に基づいて、位置補正後の３Ｄ初期枠を生成し、
前記３Ｄ初期枠がターゲットオブジェクトである信頼度に対応する損失と、前記位置補正後の３Ｄ初期枠がその対応する３Ｄアノテーション枠に対して生成した損失とを取得し、かつ前記損失に基づいて前記第２段階ニューラルネットワークのネットワークパラメータを調整する、ことを特徴とする請求項３４に記載の装置。
前記第２トレーニングモジュールは、さらに、
第２段階ニューラルネットワークにより予測された、３Ｄ初期枠がターゲットオブジェクトである信頼度に基づいて、予測結果に対応する第６損失を決定し、
第２段階ニューラルネットワークにより生成された、対応する３Ｄアノテーション枠との重なり度が設定閾値を超える位置補正後の３Ｄ初期枠内のパラメータの所在するビンの番号と、点群データサンプル中の３Ｄアノテーション枠情報における、パラメータの所在するビンの番号とに基づいて、第７損失を生成し、
第２段階ニューラルネットワークにより生成された、対応する３Ｄアノテーション枠との重なり度が設定閾値を超える位置補正後の３Ｄ初期枠内のパラメータの対応するビンでのオフセット量と、点群データサンプル中の３Ｄアノテーション枠情報におけるパラメータの対応するビンでのオフセット量とに基づいて、第８損失を生成し、
第２段階ニューラルネットワークにより生成された、対応する３Ｄアノテーション枠との重なり度が設定閾値を超える位置補正後の３Ｄ初期枠内のパラメータの所定のパラメータに対するオフセット量に基づいて、第９損失を生成し、
第２段階ニューラルネットワークにより生成された、対応する３Ｄアノテーション枠との重なり度が設定閾値を超える位置補正後の３Ｄ初期枠内の座標パラメータの、３Ｄアノテーション枠の中心点の座標パラメータに対するオフセット量に基づいて、第１０損失を生成し、
前記第６損失、第７損失、第８損失、第９損失及び第１０損失に基づいて、前記第２段階ニューラルネットワークのネットワークパラメータを調整する、ことを特徴とする請求項３５に記載の装置。
ターゲットオブジェクトの３Ｄ検出枠を取得する請求項２１～３６のいずれか一項に記載のターゲットオブジェクトの３Ｄ検出装置と、
前記３Ｄ検出枠に基づいて、車両を制御する命令又は早期警報提示情報を生成する第１制御モジュールとを含む、ことを特徴とする車両のインテリジェント制御装置。
前記第１制御モジュールは、さらに、
前記３Ｄ検出枠に基づいて、前記ターゲットオブジェクトのシーンにおける空間位置、大きさ、車両との距離、車両との相対方位情報のうちの少なくとも１つを含む前記ターゲットオブジェクトの情報を決定し、
決定された前記少なくとも１つの情報に基づいて、前記車両を制御する命令又は早期警報提示情報を生成する、請求項３７に記載の装置。
ターゲットオブジェクトの３Ｄ検出枠を取得する請求項２１～３６のいずれか一項に記載のターゲットオブジェクトの３Ｄ検出装置と、
前記３Ｄ検出枠に基づいて、ロボットに対して障害物回避ナビゲーション制御を行う命令又は早期警報提示情報を生成する第２制御モジュールとを含む、ことを特徴とする障害物回避ナビゲーション装置。
前記第２制御モジュールは、さらに、
前記３Ｄ検出枠に基づいて、前記ターゲットオブジェクトのシーンにおける空間位置、大きさ、ロボットとの距離、ロボットとの相対方位情報のうちの少なくとも１つを含む前記ターゲットオブジェクトの情報を決定し、
決定された前記少なくとも１つの情報に基づいて、前記ロボットに対して障害物回避ナビゲーション制御を行う命令又は早期警報提示情報を生成する、請求項３９に記載の装置。
コンピュータプログラムを記憶するメモリと、
前記メモリに記憶されたコンピュータプログラムを実行し、かつ前記コンピュータプログラムを実行すると、上記請求項１～２０のいずれか一項に記載の方法を実現するプロセッサと、を含む、電子機器。
プロセッサにより実行されると、上記請求項１～２０のいずれか一項に記載の方法を実現するコンピュータプログラムが記憶されているコンピュータ可読記憶媒体。
機器のプロセッサで実行されると、上記請求項１～２０のいずれか一項に記載の方法を実現するコンピュータ命令を含むコンピュータプログラム。