JP6895694B2

JP6895694B2 - Ａｖｍ及び強化学習を利用して自律走行の安全性を達成するためのアテンション−ドリブンアルゴリズムを利用したリソース割り当てのための方法及び装置｛ｍｅｔｈｏｄａｎｄｄｅｖｉｃｅｆｏｒａｔｔｅｎｔｉｏｎ−ｄｒｉｖｅｎｒｅｓｏｕｒｃｅａｌｌｏｃａｔｉｏｎｂｙｕｓｉｎｇａｖｍａｎｄｒｅｉｎｆｏｒｃｅｍｅｎｔｌｅａｒｎｉｎｇｔｏｔｈｅｒｅｂｙａｃｈｉｅｖｅｓａｆｅｔｙｏｆａｕｔｏｎｏｍｏｕｓｄｒｉｖｉｎｇ｝

Info

Publication number: JP6895694B2
Application number: JP2020008883A
Authority: JP
Inventors: 金桂賢; 金鎔重; 金鶴京; 南雲鉉; 夫碩▲くん▼; 成明哲; 申東洙; 呂東勳; 柳宇宙; 李明春; 李炯樹; 張泰雄; 鄭景中; 諸泓模; 趙浩辰
Original assignee: Stradvision Inc
Current assignee: Stradvision Inc
Priority date: 2019-01-31
Filing date: 2020-01-23
Publication date: 2021-06-30
Anticipated expiration: 2040-01-23
Also published as: EP3690719A1; CN111507167B; KR102396272B1; US10726279B1; CN111507167A; US20200250442A1; KR20200095376A; JP2020126633A

Description

本発明は自律走行車両と共に使用する方法及び装置に関し、より詳細には、強化学習を利用して、自律走行の安全性を取得するためのリソース割り当て方法及び、そのための装置に関する。

最近、自律走行技術が研究されて、自律走行車両が運転手の介入なしにかなりの正確度で走行することができるほどに発展した。しかしながら、このような自律走行技術は商用化され得ていない。自律走行技術が大衆的に使用され得ないのには様々な理由があるが、そのうちの一つは、自律走行のための演算は過度に多くのコンピューティングパワーを消耗するという点である。

自律走行のための演算を遂行する際に消耗するコンピューティングパワーを減らすために多大な努力がなされているが、その場合に生じる問題点は、消耗するコンピューティングパワーを減らせば自律走行の性能が劣るということである。自律走行の性能が劣ると、多くのエラーが生じ、運転者及び周囲の人々の生命を脅かすようになる。したがって、コンピューティングパワーを減らしながらも自律走行の性能をある程度保持し得るようにすることが必要であり、このような方法はあまり研究されていないのが事実である。

本発明は、上述した問題点を解決することを目的とする。

本発明は、強化学習アルゴリズム及びＡＶＭを利用して自律走行の安全性を取得するための、アテンション−ドリブンリソース割り当てのための方法を提供することを目的とする。

また、本発明は、物体検出過程と並行して、物体検出の信頼度を示すパラメータであるコンフィデンスコア（ＣｏｎｆｉｄｅｎｃｅＳｃｏｒｅ）を生成する方法を提供することを目的とする。

また、本発明は、コンフィデンスコアを使用して強化学習アルゴリズムを遂行することによって、より正確な物体検出を遂行して、信頼度の高くない領域に対する物体検出を再度遂行する方法を提供することを目的とする。

前記のような本発明の目的を達成し、後述する本発明の特徴的な効果を実現するための、本発明の特徴的な構成は以下の通りである。

本発明の一態様によると、物体検出プロセスと並行して生成された、物体検出の信頼度（Ｃｒｅｄｉｂｉｌｉｔｙ）を表すコンフィデンスコア（ＣｏｎｆｉｄｅｎｃｅＳｃｏｒｅ）を利用することによって、コンピューティングパワーを節約しながらもより優れた自律走行性能を達成するための方法において、（ａ）コンピューティング装置が、対象車両に設置された少なくとも一つのパノラマビューセンサ（ＰａｎｏｒａｍａＶｉｅｗＳｅｎｓｏｒ）を通じて前記対象車両の周辺に対する少なくとも一つの状況イメージ（ＣｉｒｃｕｍｓｔａｎｃｅＩｍａｇｅ）を取得する段階；（ｂ）前記コンピューティング装置が、ＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）をもって、前記状況イメージにＣＮＮ演算を少なくとも一回適用させて、前記状況イメージに関する初期物体情報及び初期コンフィデンス情報を生成させる段階；及び（ｃ）前記コンピューティング装置が、強化学習エージェントのサポートを受けて作動することによって、前記初期物体情報及び前記初期コンフィデンス情報を参照して、前記状況イメージに関する最終物体情報を生成する段階；を含むことを特徴とする方法が開示される。

一実施例において、前記（ｃ）段階は、（ｃ１）前記コンピューティング装置が、（ｉ）前記強化学習エージェントをもって、前記初期コンフィデンス情報を参照して、前記状況イメージ内の一つ以上の領域のうち、再検出プロセスを適用する予定の一つ以上の第１特定領域それぞれを選択させ、（ｉｉ）前記ＣＮＮをもって、前記第１特定領域に前記ＣＮＮ演算を適用して、前記状況イメージに関する第１調整物体情報及び第１調整コンフィデンス情報を生成させる前記再探索プロセスを遂行させる段階；（ｃ２）前記コンピューティング装置が、繰り返して（ｉ）前記強化学習エージェントをもって、以前に生成された第Ｋ−１調整コンフィデンス情報を参照して、前記状況イメージ内の前記領域のうち、前記再検出プロセスを適用する予定の一つ以上の第Ｋ特定領域それぞれを選択させ、（ｉｉ）前記ＣＮＮをもって、前記第Ｋ特定領域に前記ＣＮＮ演算を適用して、前記状況イメージに関する第Ｋ調整物体情報及び第Ｋ調整コンフィデンス情報を生成させる前記再検出プロセスを遂行する段階；及び（ｃ３）前記再検出プロセスがＮ回遂行されることによって第Ｎ調整物体情報及び第Ｎ調整コンフィデンス情報が生成されると、前記コンピューティング装置が、前記第１調整物体情報ないし前記第Ｎ調整物体情報のうち少なくとも一部及び前記初期物体情報を参照して、前記最終物体情報を生成する段階；を含み、前記Ｋは２以上Ｎ以下の整数（ｉｎｔｅｇｅｒ）であり、前記Ｎは、前記強化学習エージェントが、前記再検出プロセスが遂行されるべきであると判断した回数であることを特徴とする。

一実施例において、前記コンピューティング装置は、前記第Ｍ再検出確率が閾値以上である場合に、前記ＣＮＮをもって前記第Ｍ特定領域に前記ＣＮＮ演算を適用させ、前記強化学習エージェントは、第Ｍ−１調整コンフィデンス情報を参照して第Ｍ再検出確率及び一つ以上の第Ｍ特定領域を生成し、Ｍは１以上Ｎ以下の整数であり、前記強化学習エージェントは、Ｍが１である場合、前記初期コンフィデンス情報を参照して第１再検出確率及び前記第１特定領域を生成することを特徴とする。

一実施例において、前記強化学習エージェントは、それ自体に前記第Ｍ−１調整コンフィデンス情報が入力されると、（ｉ）それ自体のパラメータ及び前記第Ｍ−１調整コンフィデンス情報を利用して前記第Ｍ再検出確率及び前記第Ｍ特定領域を生成し、（ｉｉ）前記第Ｍ再検出確率が前記閾値以上である場合、前記ＣＮＮから第Ｍ調整コンフィデンス情報を取得し、（ｉｉｉ）前記第Ｍ調整コンフィデンス情報とこれに対応する第Ｍ調整物体情報とを生成するのに使用された第Ｍ演算費用、前記第Ｍ−１調整コンフィデンス情報、及び前記第Ｍ調整コンフィデンス情報を参照して第Ｍ原本リワードを計算し、（ｉｖ）前記第Ｍ原本リワードを参照して前記パラメータを学習することを特徴とする。

一実施例において、前記強化学習エージェントは、下記数式にしたがって生成されたグラディエントを利用して前記パラメータを学習し、

Ｏは前記第Ｍ再検出確率及び前記第Ｍ特定領域に関する情報を含む第Ｍ原本ベクトルであり、Ｏ’は前記第Ｍ原本ベクトルにノイズを適用して生成された第Ｍ調整ベクトルであり、Ｒ（Ｏ）及びＲ（Ｏ’）はそれぞれ前記第Ｍ原本リワード及び前記第Ｍ調整ベクトルに対応する第Ｍ調整リワードであり、εは前記グラディエントの発散を防止するための定数（ｃｏｎｓｔａｎｔ）であることを特徴とする。

一実施例において、前記再検出プロセスが繰り返し遂行されつつ一つ以上の第Ｌ特定領域（Ｌは１以上Ｎ以下の整数である）が選択されると、前記コンピューティング装置が、前記強化学習エージェントをもって、前記第Ｌ特定領域に対応する第Ｌ倍数情報を生成させ、前記第Ｌ倍数情報を参照して前記第Ｌ特定領域にアップサンプリング（Ｕｐｓａｍｐｌｉｎｇ）演算を適用して第Ｌ特定アップサンプリング済みイメージを生成し、前記ＣＮＮをもって、前記第Ｌ特定アップサンプリング済みイメージに前記ＣＮＮ演算を適用して第Ｌ調整物体情報及び第Ｌ調整コンフィデンス情報を生成させることを特徴とする。

一実施例において、前記（ｃ）段階で、前記コンピューティング装置が、複数個の状況イメージを部分イメージとして含む統合イメージを生成しつつ、それぞれの前記状況イメージに対する、それぞれの前記初期物体情報とそれぞれの前記初期コンフィデンス情報とを利用して、前記統合イメージに関する統合最終物体情報を生成し、前記統合最終物体情報は、（ｃ４）前記コンピューティング装置が、（ｉ）それぞれの前記初期コンフィデンス情報を参照して、前記統合イメージに関する第１統合コンフィデンス情報を生成し、（ｉｉ）前記強化学習エージェントをもって、前記第１統合コンフィデンス情報を参照して、前記統合イメージ内の一つ以上の領域のうち、前記再検出プロセスを適用する予定の一つ以上の第１特定領域それぞれを選択させ、（ｉｉｉ）前記ＣＮＮをもって、前記第１特定領域に前記ＣＮＮ演算を適用して、前記統合イメージに関するそれぞれの前記第１調整物体情報及びそれぞれの第１調整コンフィデンス情報を生成させる前記再検出プロセスを遂行する段階；（ｃ５）前記コンピューティング装置が、繰り返して（ｉ）それぞれの第Ｋ−１調整コンフィデンス情報を参照して、前記統合イメージに関する第Ｋ調整統合コンフィデンス情報を生成し、（ｉｉ）前記強化学習エージェントをもって、前記第Ｋ調整統合コンフィデンス情報を参照して、前記統合イメージ内の前記領域のうち、前記再検出プロセスを適用する予定の一つ以上の第Ｋ特定領域それぞれを選択させ、（ｉｉｉ）前記ＣＮＮをもって、前記第Ｋ特定領域に前記ＣＮＮ演算を適用して、前記統合イメージに対するそれぞれの第Ｋ調整物体情報及びそれぞれの第Ｋ調整コンフィデンス情報を生成させる前記再検出プロセスを遂行する段階；及び（ｃ６）前記再検出プロセスがＮ回遂行されることによって、それぞれの第Ｎ調整物体情報及びそれぞれの第Ｎ調整コンフィデンス情報が生成されると、前記コンピューティング装置が、前記第１調整物体情報ないし第Ｎ調整物体情報のうち少なくとも一部及び前記初期物体情報を参照して前記統合最終物体情報を生成する段階；を通じて生成され、前記Ｋは２以上Ｎ以下の整数であり、前記Ｎは、前記強化学習エージェントが、前記再検出プロセスが遂行されるべきであると判断した回数であることを特徴とする。

一実施例において、（ｉ）複数の前記パノラマビューセンサのうちカメラに対応する少なくとも一つの第１パノラマビューセンサを通じて少なくとも一つの第１状況イメージが取得されると、前記コンピューティング装置が、３チャンネルイメージに対して最適化された、インプットノード（ＩｎｐｕｔＮｏｄｅ）が３個以上である第１ＣＮＮをもって、前記第１状況イメージに対して第１ＣＮＮ演算を少なくとも一回適用させ、（ｉｉ）デプスセンサ（ＤｅｐｔｈＳｅｎｓｏｒ）に対応する少なくとも一つの第２パノラマビューセンサを通じて少なくとも一つの第２状況イメージが取得されると、前記コンピューティング装置が、デプスイメージ（ＤｅｐｔｈＩｍａｇｅ）に対して最適化された、インプットノードが１個以上である第２ＣＮＮをもって、前記第２状況イメージに対して第２ＣＮＮ演算を少なくとも一回適用させることを特徴とする。

一実施例において、前記（ａ）段階以前に、（ａ１）トレーニングイメージが取得されると、学習装置が、前記ＣＮＮに含まれている少なくとも一つのコンボリューションレイヤをもって、前記トレーニングイメージに対してコンボリューション演算を少なくとも一回適用して少なくとも一つのコンボリューション特徴マップを生成させる段階；（ａ２）前記学習装置が、前記コンボリューション特徴マップに対してアンカー（Ａｎｃｈｏｒ）演算を少なくとも一回適用することによって前記トレーニングイメージ上の予測ＲＯＩ（ＲｅｇｉｏｎＯｆＩｎｔｅｒｅｓｔ）を生成するプロセスを遂行しつつ、ＲＰＮ（ＲｅｇｉｏｎＰｒｏｐｏｓａｌＮｅｔｗｏｒｋ）に含まれている少なくとも一つのアンカーレイヤをもって、前記予測ＲＯＩが原本正解（Ｇｒｏｕｎｄ−Ｔｒｕｔｈ）ＲＯＩと同一であるそれぞれの少なくとも一つの確率を表すそれぞれの少なくとも一つのＲＰＮコンフィデンススコアを前記コンボリューション特徴マップのピクセルごとに生成することによって、前記ＲＰＮコンフィデンススコアを含むＲＰＮコンフィデンスマップを生成させる段階；（ａ３）前記ＣＮＮに含まれているＲＯＩプーリングレイヤを通じて、前記コンボリューション特徴マップ及び前記予測ＲＯＩを利用して生成された少なくとも一つのＲＯＩプーリング済み特徴マップが取得されると、前記学習装置は、前記ＲＯＩプーリング済み特徴マップを利用して予測物体検出結果を生成するプロセスを遂行しつつ、前記ＣＮＮに含まれているＦＣレイヤをもって、前記予測物体検出結果に含まれるそれぞれの少なくとも一つの予測ＣＮＮ分類結果と、それぞれの少なくとも一つの予測ＣＮＮリグレッション結果とが、原本正解物体検出結果に含まれているそれぞれの少なくとも一つの原本正解ＣＮＮ分類結果及びそれぞれの少なくとも一つの原本正解ＣＮＮリグレッション結果と同一であるものと予測されるそれぞれの少なくとも一つの確率を表すそれぞれのＣＮＮコンフィデンススコアを前記予測ＲＯＩごとに生成することによって、前記ＣＮＮコンフィデンススコアを含むＣＮＮコンフィデンスマップを生成させる段階；及び（ａ４）前記学習装置が、ロスレイヤをもって、前記ＲＰＮコンフィデンスマップと、前記ＣＮＮコンフィデンスマップと、前記予測物体検出結果と、前記原本正解物体検出結果とを参照して少なくとも一つのＲＰＮロス及び少なくとも一つのＣＮＮロスを生成させ、前記ＲＰＮロス及び前記ＣＮＮロスを利用してバックプロパゲーションを遂行することによって前記ＣＮＮ及び前記ＲＰＮに含まれているパラメータのうち少なくとも一部を学習させる段階；をさらに含むことを特徴とする。

一実施例において、前記（ａ４）段階で、前記学習装置が、前記ロスレイヤをもって、下記数式にしたがって前記ＲＰＮロスを生成させ、

Ｎ_ｒｅｇはアンカー演算を遂行して生成された前記コンボリューション特徴マップのサイズに対応する定数であり、Ｎ_ｃｌｓは前記トレーニングイメージに対応する定数であり、ｃ_ｉは前記ＲＰＮコンフィデンスコアのうち、前記コンボリューション特徴マップの第ｉピクセルに対応する第ｉＲＰＮコンフィデンススコアを意味し、ｐ_ｉは前記第ｉピクセルに対応する第ｉ予測ＲＰＮ分類結果を意味し、ｐ_ｉ ^＊は前記第ｉピクセルに対応する第ｉ原本正解ＲＰＮ分類結果を意味し、ｔ_ｉは前記第ｉピクセルに対応する第ｉ予測ＲＰＮリグレッション結果を意味し、ｔ_ｉ ^＊は前記第ｉピクセルに対応する第ｉ原本正解ＲＰＮリグレッション結果を意味し、前記第ｉ原本正解ＲＰＮ分類結果及び前記第ｉ原本正解ＲＰＮリグレッション結果は、前記原本正解物体検出結果に対応することを特徴とする。

一実施例において、前記（ａ４）段階で、前記学習装置が、前記ロスレイヤをもって、下記数式にしたがって前記ＣＮＮロスを生成させ、

Ｎ_ｒｅｇ及びＮ_ｃｌｓは前記予測ＲＯＩの個数であり、ｃ_ｉは前記ＣＮＮコンフィデンススコアのうち前記予測ＲＯＩから選択された第ｉ予測ＲＯＩに対応する第ｉＣＮＮコンフィデンススコアを意味し、ｐ_ｉは前記第ｉ予測ＲＯＩに対応する第ｉ予測ＣＮＮ分類結果を意味し、ｐ_ｉ ^＊は前記第ｉピクセルに対応する第ｉ原本正解ＣＮＮ分類結果を意味し、ｔ_ｉは前記第ｉ予測ＲＯＩに対応する第ｉ予測ＣＮＮリグレッション結果を意味し、ｔ_ｉ ^＊は前記第ｉピクセルに対応する第ｉ原本正解ＣＮＮリグレッション結果を意味し、前記第ｉ予測ＣＮＮ分類結果及び前記第ｉ予測ＣＮＮリグレッション結果は、前記予測物体検出結果に対応することを特徴とする。

一実施例において、前記（ａ３）段階以後に、前記学習装置が、コンフィデンスレイヤをもって、前記ＲＰＮコンフィデンスマップ及び前記ＣＮＮコンフィデンスマップを参照して、前記トレーニングイメージ内のピクセルごとの統合コンフィデンススコアそれぞれに関する情報を含む統合コンフィデンスマップを生成させることを特徴とする。

一実施例において、前記学習装置が、前記コンフィデンスレイヤをもって、（ｉ）（ｉ−１）前記ＣＮＮから、前記予測物体検出結果を生成するプロセスが遂行される途中に生成される、前記予測ＲＯＩに対するＮＭＳ（Ｎｏｎ−ＭａｘｉｍｕｍＳｕｐｐｒｅｓｓｉｏｎ）結果を取得するプロセス、（ｉ−２）前記ＲＰＮコンフィデンスマップに対してリサイズ（Ｒｅｓｉｚｅ）演算を少なくとも一回適用してリサイズされたＲＰＮコンフィデンスマップを生成するプロセス、及び（ｉｉ）前記ＮＭＳ結果と、前記リサイズされたＲＰＮコンフィデンスマップとを参照して、前記統合コンフィデンスマップを生成するプロセスを遂行させることを特徴とする。

一実施例において、前記学習装置が、前記コンフィデンスレイヤをもって、前記統合コンフィデンススコアのうち、前記トレーニングイメージ上の座標（ｘ，ｙ）に対応する第Ｘ＿Ｙ統合コンフィデンススコアを下記数式にしたがって生成させ、

ｃ’_ｘｙは前記第Ｘ＿Ｙ統合コンフィデンススコアを意味し、ｃ_ｘｙは前記リサイズされたＲＰＮコンフィデンスマップ上の前記座標（ｘ，ｙ）に対応する第Ｘ＿ＹリサイズされたＲＰＮコンフィデンススコアを意味し、ｃ_ｒｉは前記ＮＭＳ結果で決定された、前記座標（ｘ，ｙ）を含みｒ_ｉとして表現される第ｉ予測ＲＯＩに対する第ｉＣＮＮコンフィデンススコアを意味することを特徴とする。

一実施例において、前記（ｂ）段階は、（ｂ１）前記状況イメージが取得されると、前記コンピューティング装置が、前記ＣＮＮに含まれている少なくとも一つのコンボリューションレイヤをもって、前記状況イメージに対してコンボリューション演算を少なくとも一回適用して少なくとも一つのコンボリューション特徴マップを生成させる段階；（ｂ２）前記コンピューティング装置が、前記コンボリューション特徴マップに対してアンカー演算を少なくとも一回適用することによって、前記状況イメージ上の予測ＲＯＩを生成するためのプロセスを遂行しつつ、ＲＰＮに含まれている少なくとも一つのアンカーレイヤをもって、前記予測ＲＯＩが原本正解ＲＯＩと同一である少なくとも一つの確率それぞれを表す、少なくとも一つのＲＰＮコンフィデンススコアそれぞれを前記コンボリューション特徴マップのピクセルごとに生成することによって、前記ＲＰＮコンフィデンススコアを含むＲＰＮコンフィデンスマップを生成させる段階；（ｂ３）前記ＣＮＮに含まれているＲＯＩプーリングレイヤを通じて、前記コンボリューション特徴マップ及び前記予測ＲＯＩを利用して生成された少なくとも一つのＲＯＩプーリング済み特徴マップが取得されると、前記コンピューティング装置が、前記ＲＯＩプーリング済み特徴マップを利用して予測物体検出結果を生成するプロセスを遂行しつつ、前記ＣＮＮに含まれるＦＣレイヤをもって、前記予測物体検出結果に含まれているそれぞれの少なくとも一つの予測ＣＮＮ分類結果及びそれぞれの少なくとも一つの予測ＣＮＮリグレッション結果が原本正解物体検出結果に含まれているそれぞれの少なくとも一つの原本正解ＣＮＮ分類結果及びそれぞれの少なくとも一つの原本正解ＣＮＮリグレッション結果と同一である少なくとも一つの確率それぞれを表すＣＮＮコンフィデンスコアそれぞれを前記予測ＲＯＩごとに生成することによって、前記ＣＮＮコンフィデンススコアを含むＣＮＮコンフィデンスマップを生成させる段階；及び（ｂ４）前記コンピューティング装置が、前記ＣＮＮと連動して作動するコンフィデンスレイヤをもって、前記ＲＰＮコンフィデンスマップ及び前記ＣＮＮコンフィデンスマップを参照して統合コンフィデンスマップを生成させる段階を含み、前記コンピューティング装置は、前記ＣＮＮをもって、前記予測物体検出結果を含む前記初期物体情報及び前記統合コンフィデンスマップを含む前記初期コンフィデンス情報を出力させることを特徴とする。

本発明の他の態様によると、物体検出プロセスと並行して生成された、物体検出の信頼度（Ｃｒｅｄｉｂｉｌｉｔｙ）を表すコンフィデンスコア（ＣｏｎｆｉｄｅｎｃｅＳｃｏｒｅ）を利用することによって、コンピューティングパワーを節約しながらもより優れた自律走行性能を達成するためのコンピューティング装置において、インストラクションを格納する少なくとも一つのメモリ；及び（Ｉ）対象車両に設置された少なくとも一つのパノラマビューセンサ（ＰａｎｏｒａｍａＶｉｅｗＳｅｎｓｏｒ）を通じて前記対象車両の周辺に対する少なくとも一つの状況イメージ（ＣｉｒｃｕｍｓｔａｎｃｅＩｍａｇｅ）を取得するプロセス、（ＩＩ）ＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）をもって、前記状況イメージにＣＮＮ演算を少なくとも一回適用させて、前記状況イメージに関する初期物体情報及び初期コンフィデンス情報を生成させるプロセス、及び（ＩＩＩ）強化学習エージェントのサポートを受けて作動することによって、前記初期物体情報及び前記初期コンフィデンス情報を参照して、前記状況イメージに関する最終物体情報を生成するプロセスを遂行するための前記インストラクションを実行するように構成された少なくとも一つのプロセッサと、を含むことを特徴とする装置が開示される。

一実施例において、前記（ＩＩＩ）プロセスは、（ＩＩＩ−１）（ｉ）前記強化学習エージェントをもって、前記初期コンフィデンス情報を参照して、前記状況イメージ内の一つ以上の領域のうち、再検出プロセスを適用する予定の一つ以上の第１特定領域それぞれを選択させ、（ｉｉ）前記ＣＮＮをもって、前記第１特定領域に前記ＣＮＮ演算を適用して、前記状況イメージに関する第１調整物体情報及び第１調整コンフィデンス情報を生成させる前記再探索プロセスを実行させるプロセス；（ＩＩＩ−２）繰り返して（ｉ）前記強化学習エージェントをもって、以前に生成された第Ｋ−１調整コンフィデンス情報を参照して、前記状況イメージ内の前記領域のうち、前記再検出プロセスを適用する予定の一つ以上の第Ｋ特定領域それぞれを選択させ、（ｉｉ）前記ＣＮＮをもって、前記第Ｋ特定領域に前記ＣＮＮ演算を適用して、前記状況イメージに関する第Ｋ調整物体情報及び第Ｋ調整コンフィデンス情報を生成させる前記再検出プロセスを遂行するプロセス；及び（ＩＩＩ−３）前記再検出プロセスがＮ回遂行されることによって第Ｎ調整物体情報及び第Ｎ調整コンフィデンス情報が生成されると、前記第１調整物体情報ないし前記第Ｎ調整物体情報のうち少なくとも一部及び前記初期物体情報を参照して、前記最終物体情報を生成するプロセス；を含み、前記Ｋは２以上Ｎ以下の整数であり、前記Ｎは前記強化学習エージェントが、前記再検出プロセスが遂行されるべきであると判断した回数であることを特徴とする。

一実施例において、前記プロセッサは、前記第Ｍ再検出確率が閾値以上である場合に、前記ＣＮＮをもって、前記第Ｍ特定領域に前記ＣＮＮ演算を適用させ、前記強化学習エージェントは、第Ｍ−１調整コンフィデンス情報を参照して第Ｍ再検出確率及び一つ以上の第Ｍ特定領域を生成し、Ｍは１以上Ｎ以下の整数であり、前記強化学習エージェントは、Ｍが１である場合、前記初期コンフィデンス情報を参照して第１再検出確率及び前記第１特定領域を生成することを特徴とする。

Ｏは前記第Ｍ再検出確率及び前記第Ｍ特定領域に関する情報を含む第Ｍ原本ベクトルであり、Ｏ’は前記第Ｍ原本ベクトルにノイズを適用して生成された第Ｍ調整ベクトルであり、Ｒ（Ｏ）及びＲ（Ｏ’）はそれぞれ前記第Ｍ原本リワード及び前記第Ｍ調整ベクトルに対応する第Ｍ調整リワードであり、εは前記グラディエントの発散を防止するための定数であることを特徴とする。

一実施例において、前記再検出プロセスが繰り返し遂行されつつ、一つ以上の第Ｌ特定領域（Ｌは１以上Ｎ以下の整数である）が選択されると、前記プロセスが、前記強化学習エージェントをもって、前記第Ｌ特定領域に対応する第Ｌ倍数情報を生成させ、前記第Ｌ倍数情報を参照して前記第Ｌ特定領域にアップサンプリング（Ｕｐｓａｍｐｌｉｎｇ）演算を適用して第Ｌ特定アップサンプリング済みイメージを生成し、前記ＣＮＮをもって、前記第Ｌ特定アップサンプリング済みイメージに前記ＣＮＮ演算を適用して第Ｌ調整物体情報及び第Ｌ調整コンフィデンス情報を生成させることを特徴とする。

一実施例において、前記（ＩＩＩ）プロセスで、前記プロセッサが、複数個の状況イメージを部分イメージとして含む統合イメージを生成しつつ、それぞれの前記状況イメージに関するそれぞれの前記初期物体情報とそれぞれの前記初期コンフィデンス情報とを利用して、前記統合イメージに関する統合最終物体情報を生成し、前記統合最終物体情報は、（ＩＩＩ−４）（ｉ）それぞれの前記初期コンフィデンス情報を参照して、前記統合イメージに関する第１統合コンフィデンス情報を生成し、（ｉｉ）前記強化学習エージェントをもって、前記第１統合コンフィデンス情報を参照して、前記統合イメージ内の一つ以上の領域のうち、前記再検出プロセスを適用する予定の一つ以上の第１特定領域それぞれを選択させ、（ｉｉｉ）前記ＣＮＮをもって、前記第１特定領域に前記ＣＮＮ演算を適用して、前記統合イメージに関するそれぞれの前記第１調整物体情報及びそれぞれの第１調整コンフィデンス情報を生成させる前記再検出プロセスを遂行するプロセス；（ＩＩＩ−５）繰り返して（ｉ）それぞれの第Ｋ−１調整コンフィデンス情報を参照して、前記統合イメージに関する第Ｋ調整統合コンフィデンス情報を生成し、（ｉｉ）前記強化学習エージェントをもって、前記第Ｋ調整統合コンフィデンス情報を参照して、前記統合イメージ内の前記領域のうち、前記再検出プロセスを適用する予定の一つ以上の第Ｋ特定領域それぞれを選択させ、（ｉｉｉ）前記ＣＮＮをもって、前記第Ｋ特定領域に前記ＣＮＮ演算を適用して、前記統合イメージに対するそれぞれの第Ｋ調整物体情報及びそれぞれの第Ｋ調整コンフィデンス情報を生成させる前記再検出プロセスを遂行するプロセス；及び（ＩＩＩ−６）前記再検出プロセスがＮ回遂行されることによって、それぞれの第Ｎ調整物体情報及びそれぞれの第Ｎ調整コンフィデンス情報が生成されると、前記第１調整物体情報ないし第Ｎ調整物体情報のうち少なくとも一部及び前記初期物体情報を参照して前記統合最終物体情報を生成するプロセス；を通じて生成され、前記Ｋは２以上Ｎ以下の整数であり、前記Ｎは、前記強化学習エージェントが、前記再検出プロセスが遂行されるべきであると判断した回数であることを特徴とする。

一実施例において、（ｉ）複数の前記パノラマビューセンサのうちカメラに対応する少なくとも一つの第１パノラマビューセンサを通じて少なくとも一つの第１状況イメージが取得されると、前記プロセスが、３チャンネルイメージに対して最適化された、インプットノード（ＩｎｐｕｔＮｏｄｅ）が３個以上である第１ＣＮＮをもって、前記第１状況イメージに対して第１ＣＮＮ演算を少なくとも一回適用させ、（ｉｉ）デプスセンサ（ＤｅｐｔｈＳｅｎｓｏｒ）に対応する少なくとも一つの第２パノラマビューセンサを通じて少なくとも一つの第２状況イメージが取得されると、前記プロセスが、デプスイメージ（ＤｅｐｔｈＩｍａｇｅ）に対して最適化された、インプットノードが１個以上である第２ＣＮＮをもって、前記第２状況イメージに対して第２ＣＮＮ演算を少なくとも一回適用させることを特徴とする。

一実施例において、前記（Ｉ）プロセス以前に、（Ｉ−１）トレーニングイメージが取得されると、学習装置が、前記ＣＮＮに含まれている少なくとも一つのコンボリューションレイヤをもって、前記トレーニングイメージに対してコンボリューション演算を少なくとも一回適用して少なくとも一つのコンボリューション特徴マップを生成させるプロセス；（Ｉ−２）前記学習装置が、前記コンボリューション特徴マップに対してアンカー（Ａｎｃｈｏｒ）演算を少なくとも一回適用することによって、前記トレーニングイメージ上の予測ＲＯＩ（ＲｅｇｉｏｎＯｆＩｎｔｅｒｅｓｔ）を生成するプロセスを遂行しつつ、ＲＰＮ（ＲｅｇｉｏｎＰｒｏｐｏｓａｌＮｅｔｗｏｒｋ）に含まれている少なくとも一つのアンカーレイヤをもって、前記予測ＲＯＩが原本正解（Ｇｒｏｕｎｄ−Ｔｒｕｔｈ）ＲＯＩと同一であるそれぞれの少なくとも一つの確率を表すそれぞれの少なくとも一つのＲＰＮコンフィデンススコアを前記コンボリューション特徴マップのピクセルごとに生成することによって、前記ＲＰＮコンフィデンススコアを含むＲＰＮコンフィデンスマップを生成させるプロセス；（Ｉ−３）前記ＣＮＮに含まれているＲＯＩプーリングレイヤを通じて、前記コンボリューション特徴マップ及び前記予測ＲＯＩを利用して生成された少なくとも一つのＲＯＩプーリング済み特徴マップが取得されると、前記学習装置は、前記ＲＯＩプーリング済み特徴マップを利用して予測物体検出結果を生成するプロセスを遂行しつつ、前記ＣＮＮに含まれているＦＣレイヤをもって、前記予測物体検出結果に含まれるそれぞれの少なくとも一つの予測ＣＮＮ分類結果と、それぞれの少なくとも一つの予測ＣＮＮリグレッション結果とが、原本正解物体検出結果に含まれているそれぞれの少なくとも一つの原本正解ＣＮＮ分類結果及びそれぞれの少なくとも一つの原本正解ＣＮＮリグレッション結果と同一であるものと予測されるそれぞれの少なくとも一つの確率を表すそれぞれのＣＮＮコンフィデンススコアを前記予測ＲＯＩごとに生成することによって、前記ＣＮＮコンフィデンススコアを含むＣＮＮコンフィデンスマップを生成させるプロセス；及び（Ｉ−４）前記学習装置が、ロスレイヤをもって、前記ＲＰＮコンフィデンスマップと、前記ＣＮＮコンフィデンスマップと、前記予測物体検出結果と、前記原本正解物体検出結果とを参照して少なくとも一つのＲＰＮロス及び少なくとも一つのＣＮＮロスを生成させ、前記ＲＰＮロス及び前記ＣＮＮロスを利用してバックプロパゲーションを遂行することによって前記ＣＮＮ及び前記ＲＰＮに含まれているパラメータのうち少なくとも一部を学習させるプロセス；が遂行されることによって、前記ＣＮＮが学習されることを特徴とする。

一実施例において、前記（Ｉ−４）プロセスで、前記学習装置が、前記ロスレイヤをもって、下記数式にしたがって前記ＲＰＮロスを生成させ、

一実施例において、前記（Ｉ−４）プロセスで、前記学習装置が、前記ロスレイヤをもって、下記数式にしたがって前記ＣＮＮロスを生成させ、

一実施例において、前記（Ｉ−３）プロセス以後に、前記学習装置が、コンフィデンスレイヤをもって、前記ＲＰＮコンフィデンスマップ及び前記ＣＮＮコンフィデンスマップを参照して、前記トレーニングイメージ内のピクセルごとの統合コンフィデンススコアそれぞれに関する情報を含む統合コンフィデンスマップを生成させることを特徴とする。

一実施例において、前記学習装置が、前記コンフィデンスレイヤをもって、（ｉ）（ｉ−１）前記ＣＮＮから、前記予測物体検出結果を生成するプロセスが遂行される途中に生成される、前記予測ＲＯＩに対するＮＭＳ（Ｎｏｎ−ＭａｘｉｍｕｍＳｕｐｐｒｅｓｓｉｏｎ）結果を取得するプロセス、（ｉ−２）前記ＲＰＮコンフィデンスマップに対してリサイズ（Ｒｅｓｉｚｅ）演算を少なくとも一回適用してリサイズされたＲＰＮコンフィデンスマップを生成するプロセス、及び（ｉｉ）前記ＮＭＳ結果及び前記リサイズされたＲＰＮコンフィデンスマップを参照して前記統合コンフィデンスマップを生成するプロセスを遂行させることを特徴とする。

一実施例において、前記（ＩＩ）プロセスは、（ＩＩ−１）前記状況イメージが取得されると、前記ＣＮＮに含まれている少なくとも一つのコンボリューションレイヤをもって、前記状況イメージに対してコンボリューション演算を少なくとも一回適用して少なくとも一つのコンボリューション特徴マップを生成させるプロセス；（ＩＩ−２）前記コンボリューション特徴マップに対してアンカー演算を少なくとも一回適用することによって、前記状況イメージ上の予測ＲＯＩを生成するためのプロセスを遂行しつつ、ＲＰＮに含まれている少なくとも一つのアンカーレイヤをもって、前記予測ＲＯＩが原本正解ＲＯＩと同一である少なくとも一つの確率それぞれを表す、少なくとも一つのＲＰＮコンフィデンススコアそれぞれを前記コンボリューション特徴マップのピクセルごとに生成することによって、前記ＲＰＮコンフィデンススコアを含むＲＰＮコンフィデンスマップを生成させるプロセス；（ＩＩ−３）前記ＣＮＮに含まれているＲＯＩプーリングレイヤを通じて前記コンボリューション特徴マップ及び前記予測ＲＯＩを利用して生成された少なくとも一つのＲＯＩプーリング済み特徴マップが取得されると、前記ＲＯＩプーリング済み特徴マップを利用して予測物体検出結果を生成するプロセスを遂行しつつ、前記ＣＮＮに含まれるＦＣレイヤをもって、前記予測物体検出結果に含まれているそれぞれの少なくとも一つの予測ＣＮＮ分類結果と、それぞれの少なくとも一つの予測ＣＮＮリグレッション結果とが、原本正解物体検出結果に含まれているそれぞれの少なくとも一つの原本正解ＣＮＮ分類結果及びそれぞれの少なくとも一つの原本正解ＣＮＮリグレッション結果と同一である少なくとも一つの確率それぞれを表すＣＮＮコンフィデンスコアそれぞれを前記予測ＲＯＩごとに生成することによって、前記ＣＮＮコンフィデンススコアを含むＣＮＮコンフィデンスマップを生成させるプロセス；及び（ＩＩ−４）前記ＣＮＮと連動して作動するコンフィデンスレイヤをもって、前記ＲＰＮコンフィデンスマップ及び前記ＣＮＮコンフィデンスマップを参照して統合コンフィデンスマップを生成させるプロセスを含み、前記プロセッサは、前記ＣＮＮをもって、前記予測物体検出結果を含む前記初期物体情報と、前記統合コンフィデンスマップを含む前記初期コンフィデンス情報とを出力させることを特徴とする。

その他にも、本発明の方法を実行するためのコンピュータプログラムを記録するためのコンピュータ読取り可能な記録媒体がさらに提供される。

本発明は、強化学習アルゴリズム及びＡＶＭを利用して自律走行の安全性を取得するための、アテンション−ドリブンリソース割り当てのための方法を提供することができる効果がある。

また、本発明は、物体検出過程と並行して、物体検出の信頼度を示すパラメータであるコンフィデンスコア（ＣｏｎｆｉｄｅｎｃｅＳｃｏｒｅ）を生成する方法を提供することができる効果がある。

また、本発明は、コンフィデンスコアを使用して強化学習アルゴリズムを遂行することによって、より正確な物体検出を遂行して、信頼度の高くない領域への物体検出を再度遂行する方法を提供することができる効果がある。

本発明の実施例の説明に利用されるために添付された以下の各図面は、本発明の実施例のうち単に一部であるに過ぎず、本発明の属する技術分野において通常の知識を有する者（以下「通常の技術者」）にとっては、発明的作業が行われずにこれらの図面に基づいて他の各図面が得られ得る。

図１は、本発明の一実施例にしたがって、物体検出プロセスと並行して生成された、物体検出の信頼度を示すコンフィデンススコア（ＣｏｎｆｉｄｅｎｃｅＳｃｏｒｅ）を利用して強化学習アルゴリズムを遂行することによって、コンピューティングパワーを節約しながらも、より優れた自律走行性能を達成するための方法を遂行するコンピューティング装置の構成を簡略に示した図面である。図２は、本発明の一実施例にしたがって、物体検出プロセスと並行して生成された、物体検出の信頼度を示すコンフィデンススコアを利用して強化学習アルゴリズムを遂行することによって、コンピューティングパワーを節約しながらも、より優れた自律走行性能を達成するための方法を示したフローチャートである。図３は、本発明の一実施例にしたがって、物体検出プロセスと並行して生成された、物体検出の信頼度を示すコンフィデンススコアを利用して強化学習アルゴリズムを遂行することによって、コンピューティングパワーを節約しながらも、より優れた自律走行性能を達成するための方法を遂行するのに使用される統合イメージ及びこれに対応する統合最終物体情報の例示を簡略に示した図面である。図４は、本発明の一実施例にしたがって、物体検出プロセスと並行して生成された、物体検出の信頼度を示すコンフィデンススコアを利用して強化学習アルゴリズムを遂行することによって、コンピューティングパワーを節約しながらも、より優れた自律走行性能を達成するための方法を遂行するのに使用されるＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）の学習プロセスを簡略に示したフローチャートである。図５は、本発明の一実施例にしたがって、強化学習及びＶ２Ｘ通信を使用するアテンションドリブンリソース割り当てアルゴリズムを利用して、安全な自律走行を提供する方法を遂行するのに使用される、ＣＮＮと、ＲＰＮと、ロスレイヤと、コンフィデンスレイヤとを含む学習装置の構成を示したフローチャートである。

後述する本発明に関する詳細な説明は、本発明の各目的、各技術的解法、及び各長所を明らかにするために本発明が実施され得る特定の実施例を例示として示す添付図面を参照する。これらの実施例は、当業者が本発明を実施することができるように十分詳細に説明される。

また、本発明の詳細な説明及び各請求項にわたって、「含む」という単語及びそれらの変形は、他の技術的各特徴、各付加物、構成要素又は段階を除外することを意図したものではない。通常の技術者にとって本発明の他の各目的、長所及び各特性が、一部は本説明書から、また一部は本発明の実施から明らかになるであろう。以下の例示及び図面は実例として提供され、本発明を限定することを意図したものではない。

さらに、本発明は、本明細書に示された実施例のすべての可能な組合せを網羅する。本発明の多様な実施例は互いに異なるが、相互に排他的である必要はないことが理解されるべきである。例えば、ここに記載されている特定の形状、構造及び特性は、一実施例に関連して本発明の精神及び範囲を逸脱せず、かつ他の実施例で具現され得る。また、それぞれの開示された実施例内の個別の構成要素の位置又は配置は、本発明の精神及び範囲を逸脱せず、かつ変更され得ることが理解されるべきである。したがって、後述の詳細な説明は、限定的な意味として受け取ろうとするものではなく、本発明の範囲は適切に説明されるのであれば、その請求項が主張することと均等な全ての範囲とともに添付された請求項によってのみ限定される。図面において類似の参照符号は、様々な側面にわたって同一であるか、又は類似の機能を指す。

本発明で言及している各種イメージは、舗装または非舗装道路関連のイメージを含み得、この場合、道路環境で登場し得る物体（例えば、自動車、人、動物、植物、物、建物、飛行機やドローンのような飛行体、その他の障害物）を想定し得るが、必ずしもこれに限定されるものではなく、本発明で言及している各種イメージは、道路と関係のないイメージ（例えば、非舗装道路、路地、空き地、海、湖、川、山、森、砂漠、空、室内と関連したイメージ）でもあり得、この場合、非舗装道路、路地、空き地、海、湖、川、山、森、砂漠、空、室内環境で登場し得る物体（例えば、自動車、人、動物、植物、物、建物、飛行機やドローンのような飛行体、その他の障害物）を想定し得るが、必ずしもこれに限定されるものではない。

以下、本発明の属する技術分野において通常の知識を有する者が本発明を容易に実施し得るようにするために、本発明の好ましい実施例について、添付された図面を参照して詳細に説明することにする。

図１は、本発明の一実施例にしたがって、物体検出プロセスと並行して生成された、物体検出の信頼度を示すコンフィデンススコア（ＣｏｎｆｉｄｅｎｃｅＳｃｏｒｅ）を利用して強化学習アルゴリズムを遂行することによって、コンピューティングパワーを節約しながらも、より優れた自律走行性能を達成するための方法を遂行するコンピューティング装置の構成を簡略に示した図面である。

図１を参照すると、コンピューティング装置１００は、追って詳細に説明する構成要素であるＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）１３０と、ＲＰＮ（ＲｅｇｉｏｎＰｒｏｐｏｓａｌＮｅｔｗｏｒｋ）１４０と、コンフィデンスレイヤ１５０と、強化学習エージェント１６０とを含むことができる。この場合、ＣＮＮ１３０、ＲＰＮ１４０、コンフィデンスレイヤ１５０、及び強化学習エージェント１６０の入出力及び通信の過程は、通信部１１０及びプロセッサ１２０により行われ得る。ただし、図１では、通信部１１０及びプロセッサ１２０の具体的な連結関係を省略した。この際、メモリ１１５は、後述する様々なインストラクション（Ｉｎｓｔｒｕｃｔｉｏｎ）を格納した状態であり得、プロセッサ１２０はメモリ１１５に格納されたインストラクションを遂行するように設定され、プロセッサ１２０は、追って説明するプロセスを遂行することによって本発明を遂行することができる。このようにコンピューティング装置１００が描写されたからといって、コンピューティング装置１００が本発明を実施するためのプロセッサ、ミディアム、メモリまたは他のコンピューティング要素が統合された形態である統合プロセッサ（ＩｎｔｅｇｒａｔｅｄＰｒｏｃｅｓｓｏｒ）を含む場合を排除するわけではない。

以上のコンピューティング装置１００は、対象車両と連動して作動し得、対象車両に設置された少なくとも一つのパノラマビューセンサを通じて撮影されたイメージを取得することができる。パノラマビューセンサは、カメラの形態で具現化されたり、レーダまたはライダ（Ｌｉｄａｒ）などのデプスセンサ（ＤｅｐｔｈＳｅｎｓｏｒ）の形態で具現され得る。

以上、本発明の一実施例にしたがって、物体検出プロセスと並行して生成された、物体検出の信頼度を表すコンフィデンススコアを利用して前記強化学習アルゴリズムを遂行することによって、コンピューティングパワーを節約しながらもより優れた自律走行性能を達成するための方法を遂行するコンピューティング装置１００の構成を説明した。以下、方法自体について図２を参照して説明することにする。

図２は、本発明の一実施例にしたがって、物体検出プロセスと並行して生成された、物体検出の信頼度を示すコンフィデンススコアを利用して前記強化学習アルゴリズムを遂行することによって、コンピューティングパワーを節約しながらも、より優れた自律走行性能を達成するための方法を示したチャート図である。

図２を参照すると、コンピューティング装置１００が、対象車両に搭載されたパノラマビューセンサを通じて、対象車両の周辺に対する少なくとも一つの状況イメージ（ＣｉｒｃｕｍｓｔａｎｃｅＩｍａｇｅ）を取得することができる（Ｓ１００）。以後、コンピューティング装置１００が、ＣＮＮ１３０をもって、状況イメージにＣＮＮ演算を少なくとも一回適用させて、状況イメージに関する初期物体情報及び初期コンフィデンス情報を生成させることができる（Ｓ２００）。以後、コンピューティング装置１００は、強化学習エージェント１６０と連動して作動することによって、初期物体情報及び初期コンフィデンス情報を参照して、状況イメージに関する最終物体情報を生成することができる（Ｓ３００）。

概括的なフローは前記のとおりであり、以下、これについてさらに具体的に説明することにする。まず、状況イメージが単一である一実施例について説明する。

パノラマビューセンサを通じて状況イメージが取得されると、ＣＮＮ１３０をもって、コンピューティング装置１００が状況イメージに対してＣＮＮ演算を適用させることができる。ここで、もし状況イメージが、カメラの形態で設置された第１パノラマビューセンサを通じて取得されたものであれば、コンピューティング装置１００は、３チャンネルイメージに対して最適化された、インプットノード（ＩｎｐｕｔＮｏｄｅ）が３個以上である第１ＣＮＮをもって、状況イメージに対して第１ＣＮＮ演算を少なくとも一回適用させることによってＣＮＮ演算を適用させることができる。または、状況イメージが、デプスセンサ（ＤｅｐｔｈＳｅｎｓｏｒ）の形態で設置された第２パノラマビューセンサを通じて取得されたものであれば、コンピューティング装置１００は、デプスイメージに最適化された、インプットノードが１個以上である第２ＣＮＮをもって、状況イメージに対して第２ＣＮＮ演算を少なくとも一回適用させることによって、ＣＮＮ演算を適用させることができる。この場合、「第１ＣＮＮ」と「第２ＣＮＮ」の記号は、上記特定の場合のように、ＣＮＮ１３０として機能し得るＣＮＮを区分するために使用される。同様に、「第１パノラマビューセンサ」と「第２パノラマビューセンサ」の記号は、上記特定の場合のようにパノラマビューセンサとして機能し得るパノラマビューセンサを区分するために使用される。

このようなＣＮＮ演算を通じて初期物体情報及び初期コンフィデンス情報が取得されると、コンピューティング装置１００は、下記のような再検出（Ｒｅ−ｄｅｔｅｃｔｉｏｎ）プロセスを繰り返し遂行することによって、最終物体情報を生成することができる。この場合、コンピューティング装置１００は、強化学習エージェント１６０によりサポートされ得る。以下、強化学習エージェント１６０の構成及びそのプロセスが説明される。

まず、強化学習エージェント１６０は、ニューラルネットワークの一種であって、複数個のレイヤを含み、それぞれのレイヤ内に複数個の仮想ニューロンを含む状態であり得る。この場合、各ニューロンは、それ自体に入力された値にそれ自体のパラメータを利用して演算、例えばコンボリューション演算を適用した後、それ自体の次のコンボリューションニューロンに入力された値を伝達する機能を遂行することができる。強化学習エージェント１６０は、初期コンフィデンス情報及び追って説明する第１調整コンフィデンス情報ないし第Ｎ調整コンフィデンス情報のうち少なくとも一つを入力として取得し、ニューロンを利用していくつかの演算を該当入力に適用して、当該入力に対する再検出プロセスの必要性を示す情報及び再検出プロセスを適用する予定の該当入力内領域に関する情報を出力することができる。

具体的に、強化学習エージェント１６０が第Ｍ−１調整コンフィデンス情報を取得した場合を仮定すると、この場合Ｍは、１以上Ｎ以下の整数（ｉｎｔｅｇｅｒ）であり、Ｍが１である場合には、初期コンフィデンス情報が強化学習エージェント１６０により取得され得る。この場合、強化学習エージェント１６０は、ニューロンを利用して、それ自体のパラメータを利用することで演算を適用して、再検出プロセスを繰り返して遂行しなければならない確率である第Ｍ再検出確率及び再検出プロセスが適用されるべき領域である第Ｍ特定領域を生成することができる。この場合、コンピューティング装置１００は、第Ｍ再検出確率が閾値以上である場合にのみ、ＣＮＮ１３０をもって第Ｍ特定領域に再検出プロセスを遂行させることができる。これによって、Ｎは、強化学習エージェント１６０が生成した再検出の確率が閾値以上である回数であり得る。

強化学習エージェント１６０は、強化学習アルゴリズムを遂行するため、入力されたコンフィデンス情報をプロセッシングして結果値を出力するごとにそれ自体のパラメータを学習することができる。すなわち、強化学習エージェント１６０は、第Ｍ再検出確率が閾値以上である場合、ＣＮＮ１３０から第Ｍ調整コンフィデンス情報を取得した後、（ｉ）第Ｍ−１調整コンフィデンス情報と、（ｉｉ）第Ｍ調整コンフィデンス情報と、（ｉｉｉ）ＣＮＮ１３０が第Ｍ調整コンフィデンス情報及びこれに対応する第Ｍ調整物体情報を生成するのに使用した第Ｍ演算費用とを参照して第Ｍ原本リワードを計算することができる。この場合、強化学習エージェント１６０は、第Ｍ原本リワードを参照してそれ自体のパラメータを学習することができる。

この際、第Ｍ原本リワードは、再検出プロセスを遂行することによってコンフィデンスコアの増加した量から第Ｍ演算費用を引いた値に対応し得る。追ってさらに詳細に説明するが、強化学習エージェント１６０はリワードが大きくなる方向にパラメータを学習するようになるので、強化学習エージェント１６０は再検出プロセスを通じてコンフィデンススコアが増加するように学習され、コンフィデンススコアを増加するのに必要な演算リソースが過度に多くならないようにする方向に学習され得る。第Ｍ原本リワードは、下記数式によって計算され得る。

前記数式において、Ｗ及びＨは状況イメージの横及び縦の長さをそれぞれ意味し、Ｉ（Ｏ）_ｘｙは第Ｍ調整コンフィデンス情報に含まれている、状況イメージ上の座標（ｘ，ｙ）に対する第Ｍコンフィデンススコアのうち一つを意味し、Ｉ_ｘｙは第Ｍ−１調整コンフィデンス情報に含まれている、（ｘ，ｙ）座標に対する前記第Ｍ−１コンフィデンススコアのうち一つを意味し得る。また、Ｓ_Ｍは第Ｍ特定領域の合計を意味し、ｃは予め設定された定数（ｃｏｎｓｔａｎｔ）を意味し得る。この際、再検出プロセスが適用される領域のサイズが演算リソースの使用量に比例するので、前項に位置するシグマ演算を遂行することによって第Ｍ演算費用を計算することができ、後項に位置するシグマ演算を遂行することによって第Ｍ演算費用を計算することができる。

第Ｍ原本リワードが計算されると、強化学習エージェント１６０は第Ｍ再検出確率及び第Ｍ特定領域を若干調整した後、これに対応する第Ｍ調整リワードを計算することができる。これは強化学習エージェント１６０が探索（ｅｘｐｌｏｒａｔｉｏｎ）を遂行するためのものであって、第Ｍ調整リワードが第Ｍ原本リワードより大きいのであれば、第Ｍ調整リワードに対応する方向にパラメータが学習される。

具体的に、第Ｍ特定領域のうち一つを決定する４チャンネル座標が（ｘ１，ｙ１，ｘ２，ｙ２）である場合、確率分布、例えば、正規分布に対応する各値を各要素に加えて、（ｘ_１+Ｎ（０，１），ｙ_１+Ｎ（０，１），ｘ_２+Ｎ（０，１），ｙ_２+Ｎ（０，１））として第Ｍ特定領域のうち一つを調整することができる。また、第Ｍ再検出確率がｐである場合、バイノミアル演算を活用して、Ｂｉｎｏｍｉａｌ（ｐ）として第Ｍ再検出確率を調整することができる。以後、コンピューティング装置１００は、ＣＮＮ１３０をもって、調整された結果を参照して再検出プロセスを遂行させた後、強化学習エージェント１６０をもって、ＣＮＮ１３０の出力値を使用して第Ｍ調整リワードを計算させることができる。以後、強化学習エージェント１６０は、下記数式に対応する演算を遂行して生成されたグラディエントを利用してパラメータを学習することができる。

この場合、Ｏは第Ｍ再検出確率及び第Ｍ特定領域に関する情報を含む第Ｍ原本ベクトルであり、Ｏ’は第Ｍ原本ベクトルに一部のノイズを適用して生成された第Ｍ調整ベクトルを意味し得る。また、Ｒ（Ｏ）及びＲ（Ｏ’）はそれぞれ第Ｍ原本リワード及び第Ｍ調整ベクトルに対応する第Ｍ調整リワードであり、εはグラディエントの発散を防止するための定数であり得る。

強化学習エージェント１６０に基づいて、コンピューティング装置１００が、強化学習エージェント１６０をもって、初期コンフィデンス情報を参照して、状況イメージの一つ以上の領域のうちそれに対応するコンフィデンススコアが第１閾値未満である、再検出プロセスを適用する予定の一つ以上の第１特定領域それぞれを選択させ、ＣＮＮ１３０をもって、第１特定領域にＣＮＮ演算を適用して状況イメージに対する、第１調整物体情報及び第１調整コンフィデンス情報を生成させることができる。つまり、ＣＮＮ１３０が物体検出の結果、すなわち第１特定領域に対して信頼度が高くない領域を強化学習１６０が検出し、物体検出は再度前記領域に適用される。前述したように、強化学習エージェント１６０は、演算リソースの使用量に関して物体検出を再び適用することが適合であるか否かを判断することができる。物体検出を遂行する間、コンピューティング装置１００を支援してこのようなプロセスを遂行する初期コンフィデンス情報は、ＣＮＮ１３０により生成される。ＣＮＮ１３０がどのように初期コンフィデンス情報を生成するように学習されるのかについては、追って説明される。

以後、コンピューティング装置１００は、再検出プロセスを繰り返して遂行することができる。つまり、コンピューティング装置１００は、強化学習エージェント１６０をもって、第Ｋ−１調整コンフィデンス情報を参照して、状況イメージの領域のうちそれに対応するコンフィデンススコアが前記第１閾値未満である、再検出プロセスを適用する予定の第Ｋ特定領域それぞれを選択させ、ＣＮＮ１３０をもって、第Ｋ特定領域にＣＮＮ演算を適用して、状況イメージに関する第Ｋ調整物体情報及び第Ｋ調整コンフィデンス情報を生成させる再検出プロセスを遂行させることができる。第Ｋ調整物体情報は、第Ｋ特定領域に含まれている一つ以上の物体に関する情報を含むことができ、前記情報は、以前に遂行された第Ｋ−Ｐ再検出プロセスで検出されなかったが、今回検出され得る。この場合、Ｐは１以上Ｋ−１以下の整数である。先に言及したように、再検出プロセスは、ＣＮＮ１３０の信頼度が高くない領域に適用されるものであって、前記情報間の関係は当然であるとみなすことができる。

対応するコンフィデンスコアが少ない前記特定領域に含まれている物体をさらに効率的に検出するための再検出プロセスを遂行するために、選別的プロセス、すなわちアップサンプリング（Ｕｐｓａｍｐｌｉｎｇ）がさらに遂行され得る。再検出プロセスが遂行されつつ、一つ以上の第Ｌ特定領域が選択されると、コンピューティング装置１００が、強化学習エージェント１６０をもって、第Ｌ特定領域に対応する第Ｌ倍数情報を生成させ、第Ｌ倍数情報を参照して前記第Ｌ特定領域に少なくとも一つのアップサンプリング（Ｕｐｓａｍｐｌｉｎｇ）演算を適用して第Ｌ特定アップサンプリング済みイメージを生成し、ＣＮＮ１３０をもって、第Ｌ特定アップサンプリング済みイメージにＣＮＮ演算を適用して第Ｌ調整物体情報及び第Ｌ調整コンフィデンス情報を生成させることができる。第Ｌ倍数情報は、第Ｌ再検出プロセスのために予め設定された倍率として定義することができる。

強化学習エージェント１６０を再検出確率及び特定領域に関する情報と共に倍数情報を出力するように設計するためには、一部の最終出力ノードをその最終レイヤに加えることができる。この場合、第Ｌ倍数情報は、クラシフィケーションと類似する最終ノードから出力された確率を有する多数の候補倍率のうち一つが選択されることによって生成され得る。例えば、候補倍率は２、３、及び４であり得、候補倍率それぞれに対する各確率が最終出力ノードから出力されるに伴って、最も大きな確率が見出され得、これに対応する候補倍率は、アップサンプリング演算を遂行するのに利用され得る。この場合、新たな最終出力ノードが加えられるので、前記数式において条件付き確率（ｃｏｎｄｉｔｉｏｎａｌｐｒｏｂａｂｉｌｉｔｙ）という項が若干修正されて倍数情報を反映することができる。

前記数式において、ｄｍ，ｔｍ，ｑｍはそれぞれ再検出プロセスに適合する候補倍率それぞれに対するそれぞれの確率を表し、ｄｍ’，ｔｍ’，ｑｍ’はそれぞれこれらに対応する調整確率それぞれを表し得る。前記確率の調整過程は、再検出確率及び特定領域を調整した過程と類似し得る。これを通じて、強化学習エージェント１６０は第Ｌ倍数情報を生成することが可能になる。

また、最近傍アルゴリズム（ＮｅａｒｅｓｔＮｅｉｇｈｂｏｒａｌｇｏｒｉｔｈｍ）のように、既に知られているアップサンプリング図式が前記アップサンプリング演算を遂行するのに使用され得る。

このような再検出プロセスがＮ回遂行されることによって第Ｎ調整物体情報及び第Ｎ調整コンフィデンス情報が生成されると、コンピューティング装置１００は、初期物体情報及び第１調整物体情報ないし第Ｎ調整物体情報のうち少なくとも一部を参照して、最終物体情報を生成することができる。

ただし、このように定められた回数だけ、すなわち、Ｎ回次だけ再検出プロセスを遂行しなくても、物体検出結果が十分に導き出される場合もあり得る。この場合には、それまでに生成された物体情報を利用して、最終物体情報を生成することもできる。すなわち、再検出プロセスをＭ回目遂行する途中に選択された少なくとも一つの第Ｍ特定領域の少なくとも一つの広さの和が第１閾値未満である場合、コンピューティング装置１００は、繰り返し遂行する再検出プロセスを中断し、初期物体情報及び第１調整物体情報ないし第Ｍ−１調整物体情報のうち少なくとも一部を参照して、最終物体情報を生成することができるであろう。

ここで、最終物体情報を生成するために、コンピューティング装置１００は初期物体情報、及び第１調整物体情報ないし第Ｎ調整物体情報のうち少なくとも一部を参照して、広く知られている従来技術であるＮＭＳ（Ｎｏｎ−ＭａｘｉｍｕｍＳｕｐｐｒｅｓｓｉｏｎ）アルゴリズム及びボックスボーティング（ＢｏｘＶｏｔｉｎｇ）アルゴリズムのうち少なくとも一つを遂行することができる。このようなアルゴリズムは、通常の技術者によく知られているので、前記説明で十分に理解することができるはずである。

上記のように最終物体情報が生成された後、コンピューティング装置１００は、最終物体情報を対象車両に対する自律走行モジュールに伝達することによって、自律走行モジュールが最終物体情報を利用して前記対象車両の自律走行を遂行し得るように支援することができる。

以上、本発明の一実施例である、状況イメージが単一の場合について説明した。以下、他の実施例において、（ｉ）パノラマである統合イメージを生成するのに使用される複数の状況イメージ、及び（ｉｉ）これに対応する統合最終物体情報について説明することにする。このような他の実施例は、前述した単一の状況イメージに対応する実施例と大同小異であるので、その相違点を中心として簡略に説明する。

複数個の状況イメージを、それに対する部分的なイメージとして含む統合イメージを生成しながら、コンピューティング装置１００は、それぞれの状況イメージに対するそれぞれの初期物体情報とそれぞれの初期コンフィデンス情報とを利用して統合イメージに関する統合最終物体情報を生成することができる。

具体的には、（ｉ）複数のパノラマビューセンサのうちカメラに対応する少なくとも一つの第１パノラマビューセンサを通じて、状況イメージのうち少なくとも一つの第１状況イメージが取得されると、コンピューティング装置１００は、３チャンネルイメージに対して最適化された、インプットノードが３個以上である第１ＣＮＮをもって、前記第１状況イメージに対して第１ＣＮＮ演算を少なくとも一回適用させ、（ｉｉ）前記パノラマビューセンサのうち、デプスセンサに対応する少なくとも一つの第２パノラマビューセンサを通じて、状況イメージのうち少なくとも一つの第２状況イメージが取得されると、コンピューティング装置１００は、デプスイメージに対して最適化された、インプットノードが１個以上である第２ＣＮＮをもって、前記第２状況イメージに対して第２ＣＮＮ演算を少なくとも一回適用させることができる。これに伴い、それぞれの状況イメージに対するそれぞれの初期コンフィデンス情報及びそれぞれの初期物体情報が取得され得る。

次に、コンピューティング装置１００が、初期再検出プロセスとして、（ｉ）それぞれの初期コンフィデンス情報を参照して、状況イメージに関する第１統合初期コンフィデンス情報を生成した後、（ｉｉ）強化学習エージェント１６０をもって、統合イメージ内の一つ以上の領域のうちそれに対応するコンフィデンススコアが第１閾値未満である、再検出プロセスを適用する予定の一つ以上の第１特定領域それぞれを選択させ、（ｉｉｉ）ＣＮＮ１３０をもって、第１特定領域に対してＣＮＮ演算を適用させることによって、統合イメージに対するそれぞれの第１調整物体情報及びそれぞれの第１調整コンフィデンス情報を生成させることができる。

以後、コンピューティング装置１００が、再検出プロセスを繰り返して遂行することができる。すなわち、コンピューティング装置１００が、（ｉ）それぞれの第Ｋ−１調整コンフィデンス情報を参照して、統合イメージに関する第Ｋ調整統合コンフィデンス情報を生成した後、（ｉｉ）強化学習エージェント１６０をもって、第Ｋ調整コンフィデンス情報を参照して、統合イメージ内の領域のうちそれに対応するコンフィデンススコアが第１閾値未満である、再検出プロセスを適用する予定の少なくとも一つの第Ｋ特定領域それぞれを選択し、（ｉｉｉ）ＣＮＮ１３０をもって、第Ｋ特定領域に対してＣＮＮ演算を適用させることによって、統合イメージに関するそれぞれの第Ｋ調整物体情報及びそれぞれの第Ｋ調整コンフィデンス情報を生成させることができる。

最後に、再検出プロセスがＮ回、つまり強化学習エージェント１６０が閾値以上の再検出確率を生成した回数で遂行されることにより、それぞれの第Ｎ調整物体情報及びそれぞれの第Ｎ調整コンフィデンス情報が生成されると、コンピューティング装置１００が、初期物体情報及び第１調整物体情報ないし第Ｎ調整物体情報のうち少なくとも一部を参照して、統合最終物体情報を生成することができる。上記のように、再検出プロセスのそれぞれのイテレーションにおいて、それぞれのコンフィデンス情報及びそれぞれの物体情報が統合されるという点を除けば、他の実施例は前述した一実施例とほぼ同様である。

これを通じて生成された統合イメージ及び統合物体情報の一実施例を確認するために、図３を参照することにする。

図３は、本発明の一実施例にしたがって、物体検出プロセスと並行して生成された、物体検出の信頼度を表すコンフィデンススコアを利用して強化学習アルゴリズムを遂行することによって、コンピューティングパワーを節約しながらもさらに優れた自律走行性能を達成するための方法を遂行するのに使用される統合イメージ、及びこれに対応する統合最終物体情報の例示を簡略に示した図面である。

図３を参照すると、統合イメージ３００は、対象車両２００の周辺を撮影したパノラマイメージであることが分かる。このようなパノラマイメージは、単一のセンサのみを利用することでは取得が困難であり、複数個のセンサを通じて撮影された複数のイメージを統合する方式で通常取得される。この場合、統合イメージ３００に含まれている物体に関する情報、すなわち、第１車両物体３１０に関する情報と第２車両物体３２０に関する情報は、本発明の方法を通じて統合最終物体情報として取得され得る。

以上、本発明の両実施例について説明した。以下、前記両実施例を遂行するために使用されるＣＮＮ１３０を学習する方法について説明するために、図４を参照することにする。

図４は、本発明の一実施例にしたがって、物体検出プロセスと並行して生成された、物体検出の信頼度を表すコンフィデンススコアを利用して強化学習アルゴリズムを遂行することによって、コンピューティングパワーを節約しながらもさらに優れた自律走行性能を達成するための方法を遂行するのに使用されるＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）の学習プロセスを簡略に示したフローチャートである。

図４を参照すると、物体検出プロセスを遂行しつつ、物体検出の信頼度を示すパラメータであるそれぞれのコンフィデンススコアを生成するための学習方法について概括的に考察することができる。

参考までに、以下の説明において、混同を避けるために「学習用」という文言は前述の学習プロセスに関する用語に対して追加され、「テスト用」という文言はテストプロセスに関する用語に対して追加される。

まず、トレーニングイメージが取得されると、学習装置は、ＣＮＮ１３０に含まれているコンボリューションレイヤをもって、トレーニングイメージに対してコンボリューション演算を少なくとも一回適用させて、少なくとも一つのコンボリューション特徴マップを生成させることができる（Ｓ１０）。この場合、トレーニングイメージの幾何学的サイズがＨ×Ｗであり、トレーニングイメージのフォーマットがＲＧＢイメージであるのでトレーニングイメージのチャンネルサイズが３個であれば、トレーニングイメージのサイズはＨ×Ｗ×３である。コンボリューション演算は、出力された特徴マップの幾何学的サイズを、入力されたイメージより小さくし、出力された特徴マップのチャンネル数を、入力されたイメージのチャンネル数より大きくするために、コンボリューション特徴マップのサイズがｈ×ｗ×ｃであれば、コンボリューション特徴マップの幾何学的サイズを表すｈとｗはそれぞれＨとＷより小さく、コンボリューション特徴マップのチャンネル数を表すｃは３より大きいであろう。

以後、学習装置は、ＲＰＮ１４０内のアンカーレイヤをもって、コンボリューション特徴マップに含まれている値に対してアンカー演算を適用して、トレーニングイメージ内の物体を含むものと予想される領域である、予測ＲＯＩ（Ｒｅｇｉｏｎ−ＯｆＩｎｔｅｒｅｓｔ）を出力させることができる（Ｓ２０）。具体的には、ＲＰＮ１４０は、データサイズがｈ×ｗ×ｃであるコンボリューション特徴マップに対してアンカー演算を適用して、トレーニングイメージ上の予測ＲＯＩを生成するのに使用されるように、ｈ×ｗ×（５Ａ+１）のデータサイズを有する、アンカー特徴マップを生成することができる。従来技術にしたがって、アンカー特徴マップのデータサイズはｈ×ｗ×５Ａのサイズで生成されなければならないが、本発明のアンカー特徴マップには、追って説明されるＲＰＮコンフィデンススコアを含むチャンネルをさらに一つ含むことができる。より詳細な説明は、以下に示す。

学習装置は、ＲＰＮ１４０のアンカーレイヤをもって、それぞれのアンカーセットに対応するそれぞれのスライディングウィンドウ（Ｓｌｉｄｉｎｇ−Ｗｉｎｄｏｗ）を使用する方式であるアンカー演算をコンボリューション特徴マップに対して適用して、データサイズがｈ×ｗ×５Ａであるアンカー特徴マップを生成させることができる。この際、アンカーとは物体に対応するコンボリューション特徴マップの値を選択するための一種のグリッド（Ｇｒｉｄ）であり、先に説明したＡはアンカー特徴マップのデータサイズを示すために使用され、ＲＰＮ１４０により使用されるアンカーの個数を示す。このプロセスを遂行することによって、コンボリューション特徴マップに含まれているそれぞれの値が物体に対応するか、決定されないことがあり、このプロセスの結果、すなわち予測ＲＯＩに関する情報は、アンカー特徴マップに格納され得る。アンカー演算は広く知られているので、これに関する詳細な説明は省略することにする。

アンカー特徴マップを生成するプロセスを遂行する間、学習装置は、ＲＰＮ１４０をもって、予測ＲＯＩが原本正解（Ｇｒｏｕｎｄ−Ｔｒｕｔｈ）ＲＯＩと同一であるそれぞれの少なくとも一つの確率を表すそれぞれのＲＰＮコンフィデンススコアをコンボリューションレイヤ特徴マップに含まれているピクセルごとに生成させることができる。つまり、ＲＰＮコンフィデンススコアは、ＲＰＮ１４０により遂行されるプロセスの結果の信頼度、すなわち、予測ＲＯＩの信頼度を表すパラメータである。

説明の便宜上、予測ＲＯＩを決定するプロセスとＲＰＮコンフィデンススコアを生成するプロセスとを分離して述べたが、二つのプロセスは同時に遂行され得る。すなわち、ＲＰＮ１４０にコンボリューション特徴マップが入力されると、ＲＰＮ１４０内のそれぞれのＲＰＮニューロンは、それ自体の演算を遂行して、それ自体が演算した値を次のＲＰＮニューロンに移すことによって、最後のレイヤでアンカー特徴マップを出力することができる。よって、二つのプロセスは互いに影響を及ぼし、従属的に遂行され得る。しかしながら、二つのプロセスは同時に遂行されなくてもよい。例えば、予測ＲＯＩを決定するプロセスが先に遂行され得る。

アンカー特徴マップが生成された以後、学習装置は、予測ＲＯＩに関する情報を含む、アンカー特徴マップ内の５Ａ個のチャンネルの値をＣＮＮ１３０に伝達することができ、アンカー特徴マップ内の残りの１つのチャンネルの値を追って説明するコンフィデンスレイヤ１５０に伝達することができる。まず、ＣＮＮ１３０に伝達される５Ａ個のチャンネルの値がどのように処理されるかについて下記のように説明することにする。

前記５Ａ個のチャンネルの値が伝達された後、学習装置は、ＣＮＮ１３０内のＲＯＩプーリングレイヤをもって、予測ＲＯＩに関する情報を参照してコンボリューション特徴マップに対してＲＯＩプーリング演算を少なくとも一回適用させることによって、ＲＯＩプーリング済み特徴マップ（ＲＯＩ−ＰｏｏｌｅｄＦｅａｔｕｒｅＭａｐ）を生成させ（Ｓ３０）、ＣＮＮ１３０内のＦＣレイヤをもって、ＲＯＩプーリング済み特徴マップに対してＦＣ演算を少なくとも一回適用させて、初期物体検出結果及びＣＮＮコンフィデンススコアを生成させることができる。

ここで、初期物体検出結果は、それぞれの物体を含むそれぞれのバウンディングボックスのそれぞれの予測座標に対するそれぞれの初期予測ＣＮＮリグレッション結果と、それぞれの物体がそれぞれのクラスに含まれるそれぞれの確率を表す、それぞれの物体のそれぞれのクラススコアに対するそれぞれの初期予測ＣＮＮ分類結果とを含むことができる。このような初期物体検出結果の生成プロセスは、従来技術のとおりである。

そして、ＣＮＮコンフィデンススコアは、追って説明する、予測物体検出結果が原本正解物体検出結果と同一である程度に関する情報を含むことができる。この際、予測物体検出結果は、ＮＭＳ演算を初期物体検出結果に適用して生成されたものであり得る。詳細には、それぞれのＣＮＮコンフィデンススコアは、予測物体検出結果に含まれているそれぞれの少なくとも一つの予測ＣＮＮ分類結果及びそれぞれの少なくとも一つの予測ＣＮＮリグレッション結果が原本正解物体検出結果に含まれているそれぞれの少なくとも一つの原本正解ＣＮＮ分類結果及びそれぞれの少なくとも一つの原本正解ＣＮＮリグレッション結果と同一である少なくとも一つの確率それぞれを表すことができる。つまり、ＣＮＮコンフィデンススコアは、ＣＮＮ１３０のＦＣレイヤにより生成された結果の信頼度を示す。

ＲＰＮコンフィデンススコアとＣＮＮコンフィデンススコアとを同時に使用する理由は、ＲＰＮ１４０により初期に決定された予測ＲＯＩがＣＮＮ１３０により処理されることによって予測物体検出結果が生成されるためである。２つのネットワークがいずれも予測物体検出結果を生成するプロセスに関わるため、２つのネットワークは異なる評価がされるべきである。

一例として、特定の予測ＲＯＩがＲＰＮ１４０により誤って決定された場合、ＣＮＮ１３０のＦＣレイヤは、誤って決定された特定の予測ＲＯＩをフィルタリングすることができる。または、特定の予測ＲＯＩがＲＰＮ１４０により正確に予測された場合にも、ＣＮＮ１３０のＦＣレイヤは、特定の予測ＲＯＩがどのような物体も含んでいないものと誤って決定することがあり得る。このような場合において、ＲＰＮ１４０とＣＮＮ１３０とは誤って遂行されたり正しく遂行されたりし得るので、物体検出プロセスを評価する間、このような場合も考慮されなければならない。

ＲＰＮ１４０と同様に、（ｉ）初期物体検出結果とそれに対応する予測物体検出結果とを生成するプロセス、及び（ｉｉ）ＣＮＮコンフィデンスマップを生成するプロセスは、便宜上別々に説明されたが、この２つのプロセスもやはり相互に従属的であり、ＦＣレイヤ内で同時に遂行されてもよいし、この２つのプロセスは独立して遂行されてもよい。

予測ＲＯＩに対するＣＮＮコンフィデンススコアが生成された後、ＣＮＮコンフィデンススコアを含むＣＮＮコンフィデンスマップが生成され得る。

以後、学習装置は、ＣＮＮ１３０をもって、初期物体検出結果に対してＮＭＳを適用して、重複する予測ＲＯＩに対応するバウンディングボックスを統合することによって、予測物体検出結果を生成させることができる。重複する予測ＲＯＩが統合されるに伴って、他の予測ＲＯＩに重複しない特定の予測ＲＯＩに対応する特定のＣＮＮコンフィデンススコアが選択され得る。ここで、ＮＭＳの使用方式は広く知られているので、これ以上の説明は省略することにする。

一方、学習装置は、コンフィデンスレイヤ１５０をもって、ＲＰＮコンフィデンスマップに対応するアンカー特徴マップ内の一つのチャンネルの値を取得させることができ、ＲＰＮ１４０コンフィデンスマップを利用してトレーニングイメージのようなＨ×Ｗの幾何学的サイズを有するリサイズされたＲＰＮコンフィデンスマップを生成させることができる。リサイズされたＲＰＮコンフィデンスマップを生成するために、最近傍サイズ（ＮｅａｒｅｓｔＮｅｉｇｈｂｏｒＳｉｚｅ）、バイリニアリサイズ（ＢｉｌｉｎｅａｒＲｅｓｉｚｅ）、バイキュービックリサイズ（ＢｉｃｕｂｉｃＲｅｓｉｚｅ）、及びランチョスリサイズ（ＬａｎｃｚｏｓＲｅｓｉｚｅ）などのようなリサイズ演算のうちのどれであっても、トレーニングイメージ内のそれぞれのピクセルがそれぞれのＲＰＮコンフィデンススコアとペアリング（Ｐａｉｒｉｎｇ）をなすように、ＲＰＮコンフィデンスマップに対して適用され得る。

予測物体検出結果及びリサイズされたＲＰＮコンフィデンスマップが取得された後、学習装置は、コンフィデンスレイヤ１５０をもって、これらを参照して統合コンフィデンスマップを生成させることができる。ここで、統合コンフィデンスマップに含まれている統合コンフィデンスコアは、下記数式によって算出され得る。

ここで、ｃ’_ｘｙは第Ｘ＿Ｙ統合コンフィデンススコアを意味し得、ｃ_ｘｙはリサイズされたＲＰＮコンフィデンスマップ上で、座標（ｘ，ｙ）に対応する第Ｘ＿ＹリサイズされたＲＰＮコンフィデンススコアを意味し得る。また、ｃ_ｒｉはＮＭＳ結果で決定された、座標を（ｘ，ｙ）を含み、ｒ_ｉとして表現される、第ｉ予測ＲＯＩに対する第ｉＣＮＮコンフィデンススコアを意味し得る。学習装置は、コンフィデンスレイヤ１５０をもって、上記のように生成された統合コンフィデンススコアを利用して統合コンフィデンスマップを生成させることができる。

ただし、正確に統合コンフィデンスマップを生成するためには、ＣＮＮ１３０及びＲＰＮ１４０を学習する必要がある。２つのネットワークをどのように学習するのかについて、以下に説明することにする。

すなわち、学習装置はロスレイヤをもって、ＲＰＮコンフィデンスマップ、ＣＮＮコンフィデンスマップ、予測物体検出結果及び原本正解物体検出結果を参照して少なくとも一つのＲＰＮロス及び少なくとも一つのＣＮＮロスを生成させることができ（Ｓ４０）、ＲＰＮロス及びＣＮＮロスを利用してバックプロパゲーションを遂行することによってＣＮＮ１３０及びＲＰＮ１４０に含まれているパラメータのうち少なくとも一部を学習させることができる。ＲＰＮロス及びＣＮＮロスに関して、以下に詳細に説明することにする。

まず、下記の数式によってＲＰＮロスを生成させることができる。

ここで、Ｎ_ｒｅｇはアンカー演算を遂行して生成されたコンボリューション特徴マップのサイズに対応する定数であり、Ｎ_ｃｌｓは前記トレーニングイメージに対応する定数であり得る。また、ｃ_ｉは前記ＲＰＮコンフィデンスコアのうちコンボリューション特徴マップの第ｉピクセルに対応する第ｉＲＰＮコンフィデンススコアを意味し得、ｐ_ｉは前記第ｉピクセルに対応する第ｉ予測ＲＰＮ分類結果を意味し、ｐ_ｉ ^＊は前記第ｉピクセルに対応する第ｉ原本正解ＲＰＮ分類結果を意味し得る。ｔ_ｉは前記第ｉピクセルに対応する第ｉ予測ＲＰＮリグレッション結果を意味し、ｔ_ｉ ^＊は前記第ｉピクセルに対応する第ｉ原本正解ＲＰＮリグレッション結果を意味し得る。第ｉ原本正解ＲＰＮ分類結果及び第ｉ原本正解ＲＰＮリグレッション結果は、原本正解物体検出結果に対応し得る。また、Ｌ_ｃｌｓ及びＬ_ｒｅｇはスムース−Ｌ１ロス（Ｓｍｏｏｔｈ−Ｌ１Ｌｏｓｓ）のようなロスを生成するための従来技術を、どのようなものであっても利用して実行され得る。

前記公式において、公式の最初の項は分類のロスを意味し得、二番目の項はリグレッションロスを意味し得る。リグレッションロス項、すなわち、二番目の項はよく知られている従来技術であるので、これに関する説明は省略することにする。分類ロス項、すなわち、最初の項について下記で説明することにする。

分類ロス項は、上記のように括弧内に３つのサブ項を含むことができる。最初のサブ項において、条件

は、ＲＰＮ１４０により決定されたアンカー特徴マップの第ｉピクセルに対応する第ｉ予測ＲＰＮ分類結果が第ｉ原本正解ＲＰＮ分類結果と同一である場合を示す。つまり、これはＲＰＮ１４０がコンボリューション特徴マップの第ｉピクセルを正確に分析した場合である。便宜上、ＲＰＮ１４０が第ｉ予測ＲＰＮ分類結果と第ｉ原本正解ＲＰＮ分類結果とが同一である確率を臨界確率、ここでは０．５超過であるものと判断した場合、ＲＰＮ１４０が第ｉピクセルに対して「正確に」分析したケースを想定した。最初の項において、（１．１−ｃ_ｉ）は、ＲＰＮ１４０が第ｉピクセルを正確に分析した場合にＲＰＮ１４０のパラメータがＲＰＮロスより小さくなるように調節されて第ｉＲＰＮコンフィデンススコアが大きくなるようにする。詳細には、上記で示されているように生成された最初のサブ項を含む分類ロス項は、ＲＰＮ１４０のパラメータを調整することができるようにグラディエント（Ｇｒａｄｉｅｎｔ）を生成することによって、未来のＲＰＮロスが小さくなるようにするために適用される。したがって、最初のサブ項を含む分類ロス項を利用すれば、ＲＰＮ１４０がＲＰＮコンフィデンス特徴マップの値を正確に分析する場合、ＲＰＮスコアをより大きく生成することができる。

分類ロス項の二番目の項において、条件

は、ＲＰＮ１４０が第ｉピクセルを正確に分析しなかった場合を示す。二番目のサブ項において、（０．１+ｃ_ｉ）は、ＲＰＮ１４０が第ｉピクセルに対して不正確に分析した場合に第ｉＲＰＮコンフィデンススコアをより小さくする。学習プロセスのメカニズムは、最初のサブ項で述べたようにその機序が同じである。

三番目のサブ項において、ｃ_ｉｌоｇｃ_ｉは、ＲＰＮコンフィデンススコアの分布が階段関数（ＳｔｅｐＦｕｎｃｔｉｏｎ）に近づかないようにする。分類ロス項が最初のサブ項と二番目のサブ項のみを含むと、結局、ＲＰＮコンフィデンススコアはオーバーフィッティング（Ｏｖｅｒｆｉｔｔｉｎｇ）されてそれぞれ０または１に近い極端な値のみを含むことができる。ここで、ｃ_ｉｌоｇｃ_ｉは、ｃ_ｉが０．５である場合に最小化される。よって、本発明によるＲＰＮコンフィデンススコアは、０と１との間のより多様な値を含む分布を有するようになる。上記のように多様な値を含むＲＰＮコンフィデンススコアを利用して様々な状況を扱うことができるため、このような項が必要である。

以上、本発明のＲＰＮロスを生成する方法について考察してみたところ、以下、本発明のＣＮＮロスを生成する方法について考察してみることにする。

Ｎ_ｒｅｇ及びＮ_ｃｌｓは前記予測ＲＯＩの個数を意味し、ｃ_ｉは予測ＲＯＩのうち第ｉ予測ＲＯＩに対応する、ＣＮＮコンフィデンススコアのうち第ｉＣＮＮコンフィデンススコアを意味し得る、また、ｐ_ｉは第ｉ予測ＲＯＩに対応する、第ｉ予測ＣＮＮ分類の結果を意味し、ｐ_ｉ ^＊は前記第ｉピクセルに対応する第ｉ原本正解ＣＮＮ分類結果を意味し得る。そして、ｔ_ｉは第ｉ予測ＲＯＩに対応する、第ｉ予測ＣＮＮリグレッション結果を意味し、ｔ_ｉ ^＊は前記第ｉピクセルに対応する第ｉ原本正解ＣＮＮリグレッション結果を意味し得る。第ｉ予測ＣＮＮ分類結果と第ｉ予測ＣＮＮリグレッション結果とは、予測物体検出結果に対応し得る。本数式において記号は、ＲＰＮロスを示した記号と同一であり得るが、上記のようにその意味は異なり得る。

上記の公式のようなＣＮＮロスは、前述したＲＰＮロスと大同小異の構造を有するが、シグマ関数の条件は例外である。この際、ＲＰＮロスは、ｐ_ｉ＞０．５ではなくｐ_ｉ＝ｌａｒｇｅｓｔｓｃｏｒｅａｍｏｎｇｃｌａｓｓｓｃｏｒｅｓという条件である。これは、ｐ_ｉが、第ｉ予測ＲＯＩ内の特定の物体が最も大きい確率を有する特定のクラスに対する第ｉ予測ＣＮＮ分類結果に対するものであることを示すものである。ＲＰＮロスと同様に、ＣＮＮロス内の分類ロス項の最初のサブ項は、ＣＮＮ１３０が第ｉ予測ＲＯＩを正確に分析した場合を示したものであり、二番目のサブ項は、ＣＮＮ１３０が第ｉ予測ＲＯＩを正確に分析できなかった場合を示す。ＣＮＮロスとＲＰＮロスとは相互に類似するので、以後の説明は省略することにする。

このようにＣＮＮロス及びＲＰＮロスが生成された後、学習装置は、ロスレイヤをもって、ＣＮＮロス及びＲＰＮロスをそれぞれバックプロパゲーションすることによって、ＣＮＮ１３０及びＲＰＮ１４０に含まれているパラメータのうち少なくとも一部を学習させることができる。以後、ＣＮＮ１３０及びＲＰＮ１４０は、入力されたイメージに含まれている物体を検出するプロセスを遂行しつつ、入力される前記イメージに対応するＣＮＮコンフィデンススコア及びＲＰＮコンフィデンススコアをさらに正確に生成することができる。

このような学習過程が完了した後、学習装置は、ＣＮＮ１３０をコンピューティング装置１００に伝達することができる。また、ＲＰＮ１４０及びコンフィデンスレイヤ１５０は、ＣＮＮ１３０に従属的であるので、共にコンピューティング装置１００に伝達され得る。ＣＮＮ１３０と、ＲＰＮ１４０と、コンフィデンスレイヤ１５０とは、学習が完了したパラメータを利用して学習過程で遂行したものと類似する演算を遂行することができる。つまり、ＣＮＮ１３０が状況イメージを取得すると、ＣＮＮ１３０と、ＲＰＮ１４０と、コンフィデンスレイヤ１５０とは、学習過程で統合コンフィデンスマップを生成したものと同一の方式で、初期コンフィデンス情報を初期物体情報とともに生成することができる。

このように信頼度に劣る部分に対して物体検出を再び適用して取得されたさらなる情報を利用して自律走行を支援することによって、さらに安全な自律走行が行われ得るはずである。

ここで、参考説明として、ＣＮＮと１３０、ＲＰＮ１４０と、ロスレイヤ１５０と、コンフィデンスレイヤ１６０とがどのように互いに連動して動作することによって、物体検出を行う途中にコンフィデンススコアを生成することができるのかについて、図５を参照して説明される。

図５は、本発明の一実施例にしたがって、強化学習及びＶ２Ｘ通信を使用するアテンションドリブンリソース割り当てアルゴリズムを利用して、安全な自律走行を提供する方法を遂行するのに使用される、ＣＮＮと、ＲＰＮと、ロスレイヤと、コンフィデンスレイヤとを含む学習装置の構成を示した図面である。

図５を参照すると、学習イメージがＣＮＮ１３０に含まれているコンボリューションレイヤ１３１に入力され、コンボリューションレイヤ１３１からｈ×ｗ×ｃサイズのコンボリューション特徴マップが生成される構成を確認することができる。以後、コンボリューション特徴マップは、ＲＰＮ１４０により演算され、これによってＲＰＮ１４０は、各ＲＯＩの位置である（ｄｘ，ｄｙ，ｄｗ，ｄｈ）及びそれらのＲＰＮコンフィデンススコアが含まれたｈ×ｗ×（５Ａ+１）サイズの特徴マップを出力することができる。このような各ＲＯＩは、ＣＮＮ１３０に含まれているＲＯＩプーリングレイヤ（図示せず）に伝達され、したがって、コンボリューション特徴マップは伝達されたＲＯＩにしたがってプーリングされ得る。以後、ＣＮＮ１３０に含まれているＦＣレイヤ１３２は、Ｒ×ｄサイズのＲＯＩプーリング済み特徴マップを演算して、物体の推定された位置（ｘ１，ｙ１，ｘ２，ｙ２）と、物体が各クラスに含まれる確率と、それぞれの物体に対応するピクセルのＣＮＮコンフィデンススコアとが含まれているＲ×（５Ｃ+１）サイズの初期物体検出結果を生成することができる。最後に、ＣＮＮ１３０は、ＮＭＳ演算を初期物体検出結果に適用することによって、物体の推定された位置（ｘ１，ｙ１，ｘ２，ｙ２）と、各物体に対する推定されたクラスと、物体が各クラスに含まれる確率とに関する情報を含むＲ’×６サイズの予測物体検出結果を生成することができる。ここで、Ｒ’は、ＮＭＳ演算によって足し合わされたＲＯＩ、すなわち物体の位置を示すことができる。そして、予測物体検出結果とともに出力されたＣＮＮコンフィデンスマップは、ｈ×ｗ×１サイズのＲＰＮコンフィデンスマップから生成されたリサイズ済みＲＰＮコンフィデンスマップと統合されることによって、Ｈ×Ｗ×１サイズの統合コンフィデンスマップを生成するようになる。前記の過程は、前述した学習方法と合致するものである。

このように、信頼度の劣る部分に対して物体検出を再度適用して、取得された追加の情報を利用して自律走行をサポートすることによって、さらに安全な自律走行が行われ得るであろう。

以上にて説明された本発明による各実施例は、多様なコンピュータの構成要素を通じて遂行することができるプログラム命令語の形態で具現されて、コンピュータ読取り可能な記録媒体に格納され得る。前記コンピュータ読取り可能な記録媒体は、プログラム命令語、データファイル、データ構造などを単独で又は組み合わせて含むことができる。前記コンピュータ読取り可能な記録媒体に格納されるプログラム命令語は、本発明のために特別に設計され、構成されたものであるか、コンピュータソフトウェア分野の当業者に公知にされて使用可能なものであり得る。コンピュータ読取り可能な記録媒体の例には、ハードディスク、フロッピー（登録商標）ディスク及び磁気テープのような磁気媒体、ＣＤ−ＲＯＭ、ＤＶＤのような光記録媒体、フロプティカルディスク（ＦｌｏｐｔｉｃａＬＤｉｓｋ）のような磁気−光メディア（Ｍａｇｎｅｔｏ−ＯｐｔｉｃａＬＭｅｄｉａ）、及びＲＯＭ、ＲＡＭ、フラッシュメモリなどのようなプログラム命令語を格納して遂行するように特別に構成されたハードウェア装置が含まれる。プログラム命令語の例には、コンパイラによって作られるもののような機械語コードだけでなく、インタープリターなどを使用してコンピュータによって実行され得る高級言語コードも含まれる。前記ハードウェア装置は、本発明による処理を実行するために一つ以上のソフトウェアモジュールとして作動するように構成され得、その反対も同様である。

以上にて本発明が具体的な構成要素などのような特定事項と限定された実施例及び図面によって説明されたが、これは本発明のより全般的な理解の一助とするために提供されたものであるに過ぎず、本発明が前記実施例に限られるものではなく、本発明が属する技術分野において通常の知識を有する者であれば、かかる記載から多様な修正及び変形が行われ得る。

従って、本発明の思想は、前記説明された実施例に局限されて定められてはならず、後述する特許請求の範囲だけでなく、本特許請求の範囲と均等または等価的に変形されたものすべては、本発明の思想の範囲に属するといえる。

Claims

物体検出プロセスと並行して生成された、物体検出の信頼度（Ｃｒｅｄｉｂｉｌｉｔｙ）を表すコンフィデンススコア（ＣｏｎｆｉｄｅｎｃｅＳｃｏｒｅ）を利用することによって、コンピューティングパワーを節約しながらもより優れた自律走行性能を達成するための方法において、
（ａ）コンピューティング装置が、対象車両に設置された少なくとも一つのパノラマビューセンサ（ＰａｎｏｒａｍａＶｉｅｗＳｅｎｓｏｒ）を通じて前記対象車両の周辺に対する少なくとも一つの状況イメージ（ＣｉｒｃｕｍｓｔａｎｃｅＩｍａｇｅ）を取得する段階；
（ｂ）前記コンピューティング装置が、ＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）をもって、前記状況イメージにＣＮＮ演算を少なくとも一回適用させて、前記状況イメージに関する初期物体情報及び初期コンフィデンス情報を生成させる段階；及び
（ｃ）前記コンピューティング装置が、強化学習エージェントのサポートを受けて作動することによって、前記初期物体情報及び前記初期コンフィデンス情報を参照して、前記状況イメージに関する最終物体情報を生成する段階；
を含み、
前記（ｃ）段階は、
（ｃ１）前記コンピューティング装置が、（ｉ）前記強化学習エージェントをもって、前記初期コンフィデンス情報を参照して、前記状況イメージ内の一つ以上の領域のうち、再検出プロセスを適用する予定の一つ以上の第１特定領域それぞれを選択させ、（ｉｉ）前記ＣＮＮをもって、前記第１特定領域に前記ＣＮＮ演算を適用して、前記状況イメージに関する第１調整物体情報及び第１調整コンフィデンス情報を生成させる前記再探索プロセスを遂行させる段階；
（ｃ２）前記コンピューティング装置が、繰り返して（ｉ）前記強化学習エージェントをもって、以前に生成された第Ｋ−１調整コンフィデンス情報を参照して、前記状況イメージ内の前記領域のうち、前記再検出プロセスを適用する予定の一つ以上の第Ｋ特定領域それぞれを選択させ、（ｉｉ）前記ＣＮＮをもって、前記第Ｋ特定領域に前記ＣＮＮ演算を適用して、前記状況イメージに関する第Ｋ調整物体情報及び第Ｋ調整コンフィデンス情報を生成させる前記再検出プロセスを遂行する段階；及び
（ｃ３）前記再検出プロセスがＮ回遂行されることによって第Ｎ調整物体情報及び第Ｎ調整コンフィデンス情報が生成されると、前記コンピューティング装置が、前記第１調整物体情報ないし前記第Ｎ調整物体情報のうち少なくとも一部及び前記初期物体情報を参照して、前記最終物体情報を生成する段階；
を含み、
前記Ｋは２以上Ｎ以下の整数（ｉｎｔｅｇｅｒ）であり、前記Ｎは、前記強化学習エージェントが、前記再検出プロセスが遂行されるべきであると判断した回数であることを特徴とする方法。
前記コンピューティング装置は、第Ｍ再検出確率が閾値以上である場合に、前記ＣＮＮをもって第Ｍ特定領域に前記ＣＮＮ演算を適用させ、前記強化学習エージェントは、第Ｍ−１調整コンフィデンス情報を参照して前記第Ｍ再検出確率及び一つ以上の前記第Ｍ特定領域を生成し、Ｍは１以上Ｎ以下の整数であり、
前記強化学習エージェントは、Ｍが１である場合、前記初期コンフィデンス情報を参照して第１再検出確率及び前記第１特定領域を生成することを特徴とする請求項１に記載の方法。
前記強化学習エージェントは、前記強化学習エージェントに前記第Ｍ−１調整コンフィデンス情報が入力されると、（ｉ）前記強化学習エージェントのパラメータ及び前記第Ｍ−１調整コンフィデンス情報を利用して前記第Ｍ再検出確率及び前記第Ｍ特定領域を生成し、（ｉｉ）前記第Ｍ再検出確率が前記閾値以上である場合、前記ＣＮＮから第Ｍ調整コンフィデンス情報を取得し、（ｉｉｉ）前記第Ｍ調整コンフィデンス情報とこれに対応する第Ｍ調整物体情報とを生成するのに使用された第Ｍ演算費用、前記第Ｍ−１調整コンフィデンス情報、及び前記第Ｍ調整コンフィデンス情報を参照して第Ｍ原本リワードを計算し、（ｉｖ）前記第Ｍ原本リワードを参照して前記パラメータを学習することを特徴とする請求項２に記載の方法。
前記強化学習エージェントは、下記数式にしたがって生成されたグラディエントを利用して前記パラメータを学習し、

Ｏは前記第Ｍ再検出確率及び前記第Ｍ特定領域に関する情報を含む第Ｍ原本ベクトルであり、Ｏ’は前記第Ｍ原本ベクトルにノイズを適用して生成された第Ｍ調整ベクトルであり、Ｒ（Ｏ）及びＲ（Ｏ’）はそれぞれ前記第Ｍ原本リワード及び前記第Ｍ調整ベクトルに対応する第Ｍ調整リワードであり、εは前記グラディエントの発散を防止するための定数（ｃｏｎｓｔａｎｔ）であることを特徴とする請求項３に記載の方法。
前記再検出プロセスが繰り返し遂行されつつ一つ以上の第Ｌ特定領域（Ｌは１以上Ｎ以下の整数である）が選択されると、前記コンピューティング装置が、前記強化学習エージェントをもって、前記第Ｌ特定領域に対応する第Ｌ倍数情報を生成させ、前記第Ｌ倍数情報を参照して前記第Ｌ特定領域にアップサンプリング（Ｕｐｓａｍｐｌｉｎｇ）演算を適用して第Ｌ特定アップサンプリング済みイメージを生成し、前記ＣＮＮをもって、前記第Ｌ特定アップサンプリング済みイメージに前記ＣＮＮ演算を適用して第Ｌ調整物体情報及び第Ｌ調整コンフィデンス情報を生成させることを特徴とする請求項１に記載の方法。
物体検出プロセスと並行して生成された、物体検出の信頼度（Ｃｒｅｄｉｂｉｌｉｔｙ）を表すコンフィデンススコア（ＣｏｎｆｉｄｅｎｃｅＳｃｏｒｅ）を利用することによって、コンピューティングパワーを節約しながらもより優れた自律走行性能を達成するための方法において、
（ａ）コンピューティング装置が、対象車両に設置された少なくとも一つのパノラマビューセンサ（ＰａｎｏｒａｍａＶｉｅｗＳｅｎｓｏｒ）を通じて前記対象車両の周辺に対する少なくとも一つの状況イメージ（ＣｉｒｃｕｍｓｔａｎｃｅＩｍａｇｅ）を取得する段階；
（ｂ）前記コンピューティング装置が、ＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）をもって、前記状況イメージにＣＮＮ演算を少なくとも一回適用させて、前記状況イメージに関する初期物体情報及び初期コンフィデンス情報を生成させる段階；及び
（ｃ）前記コンピューティング装置が、強化学習エージェントのサポートを受けて作動することによって、前記初期物体情報及び前記初期コンフィデンス情報を参照して、前記状況イメージに関する最終物体情報を生成する段階；
を含み、
前記（ｃ）段階で、
前記コンピューティング装置が、複数個の状況イメージを部分イメージとして含む統合イメージを生成しつつ、それぞれの前記状況イメージに対する、それぞれの前記初期物体情報とそれぞれの前記初期コンフィデンス情報とを利用して、前記統合イメージに関する統合最終物体情報を生成し、前記統合最終物体情報は、
（ｃ４）前記コンピューティング装置が、（ｉ）それぞれの前記初期コンフィデンス情報を参照して、前記統合イメージに関する第１統合コンフィデンス情報を生成し、（ｉｉ）前記強化学習エージェントをもって、前記第１統合コンフィデンス情報を参照して、前記統合イメージ内の一つ以上の領域のうち、前記再検出プロセスを適用する予定の一つ以上の第１特定領域それぞれを選択させ、（ｉｉｉ）前記ＣＮＮをもって、前記第１特定領域に前記ＣＮＮ演算を適用して、前記統合イメージに関するそれぞれの第１調整物体情報及びそれぞれの第１調整コンフィデンス情報を生成させる前記再検出プロセスを遂行する段階；
（ｃ５）前記コンピューティング装置が、繰り返して（ｉ）それぞれの第Ｋ−１調整コンフィデンス情報を参照して、前記統合イメージに関する第Ｋ調整統合コンフィデンス情報を生成し、（ｉｉ）前記強化学習エージェントをもって、前記第Ｋ調整統合コンフィデンス情報を参照して、前記統合イメージ内の前記領域のうち、前記再検出プロセスを適用する予定の一つ以上の第Ｋ特定領域それぞれを選択させ、（ｉｉｉ）前記ＣＮＮをもって、前記第Ｋ特定領域に前記ＣＮＮ演算を適用して、前記統合イメージに対するそれぞれの第Ｋ調整物体情報及びそれぞれの第Ｋ調整コンフィデンス情報を生成させる前記再検出プロセスを遂行する段階；及び
（ｃ６）前記再検出プロセスがＮ回遂行されることによって、それぞれの第Ｎ調整物体情報及びそれぞれの第Ｎ調整コンフィデンス情報が生成されると、前記コンピューティング装置が、前記第１調整物体情報ないし第Ｎ調整物体情報のうち少なくとも一部及び前記初期物体情報を参照して前記統合最終物体情報を生成する段階；
を通じて生成され、
前記Ｋは２以上Ｎ以下の整数であり、前記Ｎは、前記強化学習エージェントが、前記再検出プロセスが遂行されるべきであると判断した回数であることを特徴とする方法。
（ｉ）複数の前記パノラマビューセンサのうちカメラに対応する少なくとも一つの第１パノラマビューセンサを通じて少なくとも一つの第１状況イメージが取得されると、前記コンピューティング装置が、３チャンネルイメージに対して最適化された、インプットノード（ＩｎｐｕｔＮｏｄｅ）が３個以上である第１ＣＮＮをもって、前記第１状況イメージに対して第１ＣＮＮ演算を少なくとも一回適用させ、（ｉｉ）デプスセンサ（ＤｅｐｔｈＳｅｎｓｏｒ）に対応する少なくとも一つの第２パノラマビューセンサを通じて少なくとも一つの第２状況イメージが取得されると、前記コンピューティング装置が、デプスイメージ（ＤｅｐｔｈＩｍａｇｅ）に対して最適化された、インプットノードが１個以上である第２ＣＮＮをもって、前記第２状況イメージに対して第２ＣＮＮ演算を少なくとも一回適用させることを特徴とする請求項６に記載の方法。
物体検出プロセスと並行して生成された、物体検出の信頼度（Ｃｒｅｄｉｂｉｌｉｔｙ）を表すコンフィデンススコア（ＣｏｎｆｉｄｅｎｃｅＳｃｏｒｅ）を利用することによって、コンピューティングパワーを節約しながらもより優れた自律走行性能を達成するための方法において、
（ａ）コンピューティング装置が、対象車両に設置された少なくとも一つのパノラマビューセンサ（ＰａｎｏｒａｍａＶｉｅｗＳｅｎｓｏｒ）を通じて前記対象車両の周辺に対する少なくとも一つの状況イメージ（ＣｉｒｃｕｍｓｔａｎｃｅＩｍａｇｅ）を取得する段階；
（ｂ）前記コンピューティング装置が、ＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）をもって、前記状況イメージにＣＮＮ演算を少なくとも一回適用させて、前記状況イメージに関する初期物体情報及び初期コンフィデンス情報を生成させる段階；及び
（ｃ）前記コンピューティング装置が、強化学習エージェントのサポートを受けて作動することによって、前記初期物体情報及び前記初期コンフィデンス情報を参照して、前記状況イメージに関する最終物体情報を生成する段階；
を含み、
前記（ａ）段階以前に、
（ａ１）トレーニングイメージが取得されると、学習装置が、前記ＣＮＮに含まれている少なくとも一つのコンボリューションレイヤをもって、前記トレーニングイメージに対してコンボリューション演算を少なくとも一回適用して少なくとも一つのコンボリューション特徴マップを生成させる段階；
（ａ２）前記学習装置が、前記コンボリューション特徴マップに対してアンカー（Ａｎｃｈｏｒ）演算を少なくとも一回適用することによって前記トレーニングイメージ上の予測ＲＯＩ（ＲｅｇｉｏｎＯｆＩｎｔｅｒｅｓｔ）を生成するプロセスを遂行しつつ、ＲＰＮ（ＲｅｇｉｏｎＰｒｏｐｏｓａｌＮｅｔｗｏｒｋ）に含まれている少なくとも一つのアンカーレイヤをもって、前記予測ＲＯＩが原本正解（Ｇｒｏｕｎｄ−Ｔｒｕｔｈ）ＲＯＩと同一であるそれぞれの少なくとも一つの確率を表すそれぞれの少なくとも一つのＲＰＮコンフィデンススコアを前記コンボリューション特徴マップのピクセルごとに生成することによって、前記ＲＰＮコンフィデンススコアを含むＲＰＮコンフィデンスマップを生成させる段階；
（ａ３）前記ＣＮＮに含まれているＲＯＩプーリングレイヤを通じて、前記コンボリューション特徴マップ及び前記予測ＲＯＩを利用して生成された少なくとも一つのＲＯＩプーリング済み特徴マップが取得されると、前記学習装置は、前記ＲＯＩプーリング済み特徴マップを利用して予測物体検出結果を生成するプロセスを遂行しつつ、前記ＣＮＮに含まれているＦＣレイヤをもって、前記予測物体検出結果に含まれるそれぞれの少なくとも一つの予測ＣＮＮ分類結果と、それぞれの少なくとも一つの予測ＣＮＮリグレッション結果とが、原本正解物体検出結果に含まれているそれぞれの少なくとも一つの原本正解ＣＮＮ分類結果及びそれぞれの少なくとも一つの原本正解ＣＮＮリグレッション結果と同一であるものと予測されるそれぞれの少なくとも一つの確率を表すそれぞれのＣＮＮコンフィデンススコアを前記予測ＲＯＩごとに生成することによって、前記ＣＮＮコンフィデンススコアを含むＣＮＮコンフィデンスマップを生成させる段階；及び
（ａ４）前記学習装置が、ロスレイヤをもって、前記ＲＰＮコンフィデンスマップと、前記ＣＮＮコンフィデンスマップと、前記予測物体検出結果と、前記原本正解物体検出結果とを参照して少なくとも一つのＲＰＮロス及び少なくとも一つのＣＮＮロスを生成させ、前記ＲＰＮロス及び前記ＣＮＮロスを利用してバックプロパゲーションを遂行することによって前記ＣＮＮ及び前記ＲＰＮに含まれているパラメータのうち少なくとも一部を学習させる段階；
をさらに含むことを特徴とする方法。
前記（ａ４）段階で、
前記学習装置が、前記ロスレイヤをもって、下記数式にしたがって前記ＲＰＮロスを生成させ、

Ｎ_ｒｅｇはアンカー演算を遂行して生成された前記コンボリューション特徴マップのサイズに対応する定数であり、Ｎ_ｃｌｓは前記トレーニングイメージに対応する定数であり、ｃ_ｉは前記ＲＰＮコンフィデンススコアのうち、前記コンボリューション特徴マップの第ｉピクセルに対応する第ｉＲＰＮコンフィデンススコアを意味し、ｐ_ｉは前記第ｉピクセルに対応する第ｉ予測ＲＰＮ分類結果を意味し、ｐ_ｉ ^＊は前記第ｉピクセルに対応する第ｉ原本正解ＲＰＮ分類結果を意味し、ｔ_ｉは前記第ｉピクセルに対応する第ｉ予測ＲＰＮリグレッション結果を意味し、ｔ_ｉ ^＊は前記第ｉピクセルに対応する第ｉ原本正解ＲＰＮリグレッション結果を意味し、
前記第ｉ原本正解ＲＰＮ分類結果及び前記第ｉ原本正解ＲＰＮリグレッション結果は、前記原本正解物体検出結果に対応することを特徴とする請求項８に記載の方法。
前記（ａ４）段階で、
前記学習装置が、前記ロスレイヤをもって、下記数式にしたがって前記ＣＮＮロスを生成させ、

Ｎ_ｒｅｇ及びＮ_ｃｌｓは前記予測ＲＯＩの個数であり、ｃ_ｉは前記ＣＮＮコンフィデンススコアのうち前記予測ＲＯＩから選択された第ｉ予測ＲＯＩに対応する第ｉＣＮＮコンフィデンススコアを意味し、ｐ_ｉは前記第ｉ予測ＲＯＩに対応する第ｉ予測ＣＮＮ分類結果を意味し、ｐ_ｉ ^＊は第ｉピクセルに対応する第ｉ原本正解ＣＮＮ分類結果を意味し、ｔ_ｉは前記第ｉ予測ＲＯＩに対応する第ｉ予測ＣＮＮリグレッション結果を意味し、ｔ_ｉ ^＊は前記第ｉピクセルに対応する第ｉ原本正解ＣＮＮリグレッション結果を意味し、
前記第ｉ予測ＣＮＮ分類結果及び前記第ｉ予測ＣＮＮリグレッション結果は、前記予測物体検出結果に対応することを特徴とする請求項８に記載の方法。
前記（ａ３）段階以後に、
前記学習装置が、コンフィデンスレイヤをもって、前記ＲＰＮコンフィデンスマップ及び前記ＣＮＮコンフィデンスマップを参照して、前記トレーニングイメージ内のピクセルごとの統合コンフィデンススコアそれぞれに関する情報を含む統合コンフィデンスマップを生成させることを特徴とする請求項８に記載の方法。
前記学習装置が、前記コンフィデンスレイヤをもって、（ｉ）（ｉ−１）前記ＣＮＮから、前記予測物体検出結果を生成するプロセスが遂行される途中に生成される、前記予測ＲＯＩに対するＮＭＳ（Ｎｏｎ−ＭａｘｉｍｕｍＳｕｐｐｒｅｓｓｉｏｎ）結果を取得するプロセス、（ｉ−２）前記ＲＰＮコンフィデンスマップに対してリサイズ（Ｒｅｓｉｚｅ）演算を少なくとも一回適用してリサイズされたＲＰＮコンフィデンスマップを生成するプロセス、及び（ｉｉ）前記ＮＭＳ結果と、前記リサイズされたＲＰＮコンフィデンスマップとを参照して、前記統合コンフィデンスマップを生成するプロセスを遂行させることを特徴とする請求項１１に記載の方法。
前記学習装置が、前記コンフィデンスレイヤをもって、前記統合コンフィデンススコアのうち、前記トレーニングイメージ上の座標（ｘ，ｙ）に対応する第Ｘ＿Ｙ統合コンフィデンススコアを下記数式にしたがって生成させ、

ｃ’_ｘｙは前記第Ｘ＿Ｙ統合コンフィデンススコアを意味し、ｃ_ｘｙは前記リサイズされたＲＰＮコンフィデンスマップ上の前記座標（ｘ，ｙ）に対応する第Ｘ＿ＹリサイズされたＲＰＮコンフィデンススコアを意味し、ｃ_ｒｉは前記ＮＭＳ結果で決定された、前記座標（ｘ，ｙ）を含みｒ_ｉとして表現される第ｉ予測ＲＯＩに対する第ｉＣＮＮコンフィデンススコアを意味することを特徴とする請求項１２に記載の方法。
物体検出プロセスと並行して生成された、物体検出の信頼度（Ｃｒｅｄｉｂｉｌｉｔｙ）を表すコンフィデンススコア（ＣｏｎｆｉｄｅｎｃｅＳｃｏｒｅ）を利用することによって、コンピューティングパワーを節約しながらもより優れた自律走行性能を達成するための方法において、
（ａ）コンピューティング装置が、対象車両に設置された少なくとも一つのパノラマビューセンサ（ＰａｎｏｒａｍａＶｉｅｗＳｅｎｓｏｒ）を通じて前記対象車両の周辺に対する少なくとも一つの状況イメージ（ＣｉｒｃｕｍｓｔａｎｃｅＩｍａｇｅ）を取得する段階；
（ｂ）前記コンピューティング装置が、ＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）をもって、前記状況イメージにＣＮＮ演算を少なくとも一回適用させて、前記状況イメージに関する初期物体情報及び初期コンフィデンス情報を生成させる段階；及び
（ｃ）前記コンピューティング装置が、強化学習エージェントのサポートを受けて作動することによって、前記初期物体情報及び前記初期コンフィデンス情報を参照して、前記状況イメージに関する最終物体情報を生成する段階；
を含み、
前記（ｂ）段階は、
（ｂ１）前記状況イメージが取得されると、前記コンピューティング装置が、前記ＣＮＮに含まれている少なくとも一つのコンボリューションレイヤをもって、前記状況イメージに対してコンボリューション演算を少なくとも一回適用して少なくとも一つのコンボリューション特徴マップを生成させる段階；
（ｂ２）前記コンピューティング装置が、前記コンボリューション特徴マップに対してアンカー演算を少なくとも一回適用することによって、前記状況イメージ上の予測ＲＯＩを生成するためのプロセスを遂行しつつ、ＲＰＮに含まれている少なくとも一つのアンカーレイヤをもって、前記予測ＲＯＩが原本正解ＲＯＩと同一である少なくとも一つの確率それぞれを表す、少なくとも一つのＲＰＮコンフィデンススコアそれぞれを前記コンボリューション特徴マップのピクセルごとに生成することによって、前記ＲＰＮコンフィデンススコアを含むＲＰＮコンフィデンスマップを生成させる段階；
（ｂ３）前記ＣＮＮに含まれているＲＯＩプーリングレイヤを通じて、前記コンボリューション特徴マップ及び前記予測ＲＯＩを利用して生成された少なくとも一つのＲＯＩプーリング済み特徴マップが取得されると、前記コンピューティング装置が、前記ＲＯＩプーリング済み特徴マップを利用して予測物体検出結果を生成するプロセスを遂行しつつ、前記ＣＮＮに含まれるＦＣレイヤをもって、前記予測物体検出結果に含まれているそれぞれの少なくとも一つの予測ＣＮＮ分類結果及びそれぞれの少なくとも一つの予測ＣＮＮリグレッション結果が原本正解物体検出結果に含まれているそれぞれの少なくとも一つの原本正解ＣＮＮ分類結果及びそれぞれの少なくとも一つの原本正解ＣＮＮリグレッション結果と同一である少なくとも一つの確率それぞれを表すＣＮＮコンフィデンススコアそれぞれを前記予測ＲＯＩごとに生成することによって、前記ＣＮＮコンフィデンススコアを含むＣＮＮコンフィデンスマップを生成させる段階；及び
（ｂ４）前記コンピューティング装置が、前記ＣＮＮと連動して作動するコンフィデンスレイヤをもって、前記ＲＰＮコンフィデンスマップ及び前記ＣＮＮコンフィデンスマップを参照して統合コンフィデンスマップを生成させる段階を含み、
前記コンピューティング装置は、前記ＣＮＮをもって、前記予測物体検出結果を含む前記初期物体情報及び前記統合コンフィデンスマップを含む前記初期コンフィデンス情報を出力させることを特徴とする方法。
物体検出プロセスと並行して生成された、物体検出の信頼度（Ｃｒｅｄｉｂｉｌｉｔｙ）を表すコンフィデンススコア（ＣｏｎｆｉｄｅｎｃｅＳｃｏｒｅ）を利用することによって、コンピューティングパワーを節約しながらもより優れた自律走行性能を達成するためのコンピューティング装置において、
インストラクションを格納する少なくとも一つのメモリ；及び
（Ｉ）対象車両に設置された少なくとも一つのパノラマビューセンサ（ＰａｎｏｒａｍａＶｉｅｗＳｅｎｓｏｒ）を通じて前記対象車両の周辺に対する少なくとも一つの状況イメージ（ＣｉｒｃｕｍｓｔａｎｃｅＩｍａｇｅ）を取得するプロセス、（ＩＩ）ＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）をもって、前記状況イメージにＣＮＮ演算を少なくとも一回適用させて、前記状況イメージに関する初期物体情報及び初期コンフィデンス情報を生成させるプロセス、及び（ＩＩＩ）強化学習エージェントのサポートを受けて作動することによって、前記初期物体情報及び前記初期コンフィデンス情報を参照して、前記状況イメージに関する最終物体情報を生成するプロセスを遂行するための前記インストラクションを実行するように構成された少なくとも一つの
プロセッサと、
を含み、
前記（ＩＩＩ）プロセスは、
（ＩＩＩ−１）（ｉ）前記強化学習エージェントをもって、前記初期コンフィデンス情報を参照して、前記状況イメージ内の一つ以上の領域のうち、再検出プロセスを適用する予定の一つ以上の第１特定領域それぞれを選択させ、（ｉｉ）前記ＣＮＮをもって、前記第１特定領域に前記ＣＮＮ演算を適用して、前記状況イメージに関する第１調整物体情報及び第１調整コンフィデンス情報を生成させる前記再探索プロセスを実行させるプロセス；（ＩＩＩ−２）繰り返して（ｉ）前記強化学習エージェントをもって、以前に生成された第Ｋ−１調整コンフィデンス情報を参照して、前記状況イメージ内の前記領域のうち、前記再検出プロセスを適用する予定の一つ以上の第Ｋ特定領域それぞれを選択させ、（ｉｉ）前記ＣＮＮをもって、前記第Ｋ特定領域に前記ＣＮＮ演算を適用して、前記状況イメージに関する第Ｋ調整物体情報及び第Ｋ調整コンフィデンス情報を生成させる前記再検出プロセスを遂行するプロセス；及び（ＩＩＩ−３）前記再検出プロセスがＮ回遂行されることによって第Ｎ調整物体情報及び第Ｎ調整コンフィデンス情報が生成されると、前記第１調整物体情報ないし前記第Ｎ調整物体情報のうち少なくとも一部及び前記初期物体情報を参照して、前記最終物体情報を生成するプロセス；を含み、前記Ｋは２以上Ｎ以下の整数であり、前記Ｎは前記強化学習エージェントが、前記再検出プロセスが遂行されるべきであると判断した回数であることを特徴とする装置。
前記プロセッサは、第Ｍ再検出確率が閾値以上である場合に、前記ＣＮＮをもって、第Ｍ特定領域に前記ＣＮＮ演算を適用させ、前記強化学習エージェントは、第Ｍ−１調整コンフィデンス情報を参照して前記第Ｍ再検出確率及び一つ以上の前記第Ｍ特定領域を生成し、Ｍは１以上Ｎ以下の整数であり、
前記強化学習エージェントは、Ｍが１である場合、前記初期コンフィデンス情報を参照して第１再検出確率及び前記第１特定領域を生成することを特徴とする請求項１５に記載の装置。
前記強化学習エージェントは、前記強化学習エージェントに前記第Ｍ−１調整コンフィデンス情報が入力されると、（ｉ）前記強化学習エージェントのパラメータ及び前記第Ｍ−１調整コンフィデンス情報を利用して前記第Ｍ再検出確率及び前記第Ｍ特定領域を生成し、（ｉｉ）前記第Ｍ再検出確率が前記閾値以上である場合、前記ＣＮＮから第Ｍ調整コンフィデンス情報を取得し、（ｉｉｉ）前記第Ｍ調整コンフィデンス情報とこれに対応する第Ｍ調整物体情報とを生成するのに使用された第Ｍ演算費用、前記第Ｍ−１調整コンフィデンス情報、及び前記第Ｍ調整コンフィデンス情報を参照して第Ｍ原本リワードを計算し、（ｉｖ）前記第Ｍ原本リワードを参照して前記パラメータを学習することを特徴とする請求項１６に記載の装置。
前記強化学習エージェントは、下記数式にしたがって生成されたグラディエントを利用して前記パラメータを学習し、

Ｏは前記第Ｍ再検出確率及び前記第Ｍ特定領域に関する情報を含む第Ｍ原本ベクトルであり、Ｏ’は前記第Ｍ原本ベクトルにノイズを適用して生成された第Ｍ調整ベクトルであり、Ｒ（Ｏ）及びＲ（Ｏ’）はそれぞれ前記第Ｍ原本リワード及び前記第Ｍ調整ベクトルに対応する第Ｍ調整リワードであり、εは前記グラディエントの発散を防止するための定数であることを特徴とする請求項１７に記載の装置。
前記再検出プロセスが繰り返し遂行されつつ、一つ以上の第Ｌ特定領域（Ｌは１以上Ｎ以下の整数である）が選択されると、前記プロセスが、前記強化学習エージェントをもって、前記第Ｌ特定領域に対応する第Ｌ倍数情報を生成させ、前記第Ｌ倍数情報を参照して前記第Ｌ特定領域にアップサンプリング（Ｕｐｓａｍｐｌｉｎｇ）演算を適用して第Ｌ特定アップサンプリング済みイメージを生成し、前記ＣＮＮをもって、前記第Ｌ特定アップサンプリング済みイメージに前記ＣＮＮ演算を適用して第Ｌ調整物体情報及び第Ｌ調整コンフィデンス情報を生成させることを特徴とする請求項１５に記載の装置。
物体検出プロセスと並行して生成された、物体検出の信頼度（Ｃｒｅｄｉｂｉｌｉｔｙ）を表すコンフィデンススコア（ＣｏｎｆｉｄｅｎｃｅＳｃｏｒｅ）を利用することによって、コンピューティングパワーを節約しながらもより優れた自律走行性能を達成するためのコンピューティング装置において、
インストラクションを格納する少なくとも一つのメモリ；及び
（Ｉ）対象車両に設置された少なくとも一つのパノラマビューセンサ（ＰａｎｏｒａｍａＶｉｅｗＳｅｎｓｏｒ）を通じて前記対象車両の周辺に対する少なくとも一つの状況イメージ（ＣｉｒｃｕｍｓｔａｎｃｅＩｍａｇｅ）を取得するプロセス、（ＩＩ）ＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）をもって、前記状況イメージにＣＮＮ演算を少なくとも一回適用させて、前記状況イメージに関する初期物体情報及び初期コンフィデンス情報を生成させるプロセス、及び（ＩＩＩ）強化学習エージェントのサポートを受けて作動することによって、前記初期物体情報及び前記初期コンフィデンス情報を参照して、前記状況イメージに関する最終物体情報を生成するプロセスを遂行するための前記インストラクションを実行するように構成された少なくとも一つの
プロセッサと、
を含み、
前記（ＩＩＩ）プロセスで、
前記プロセッサが、複数個の状況イメージを部分イメージとして含む統合イメージを生成しつつ、それぞれの前記状況イメージに関するそれぞれの前記初期物体情報とそれぞれの前記初期コンフィデンス情報とを利用して、前記統合イメージに関する統合最終物体情報を生成し、前記統合最終物体情報は、
（ＩＩＩ−４）（ｉ）それぞれの前記初期コンフィデンス情報を参照して、前記統合イメージに関する第１統合コンフィデンス情報を生成し、（ｉｉ）前記強化学習エージェントをもって、前記第１統合コンフィデンス情報を参照して、前記統合イメージ内の一つ以上の領域のうち、前記再検出プロセスを適用する予定の一つ以上の第１特定領域それぞれを選択させ、（ｉｉｉ）前記ＣＮＮをもって、前記第１特定領域に前記ＣＮＮ演算を適用して、前記統合イメージに関するそれぞれの第１調整物体情報及びそれぞれの第１調整コンフィデンス情報を生成させる前記再検出プロセスを遂行するプロセス；（ＩＩＩ−５）繰り返して（ｉ）それぞれの第Ｋ−１調整コンフィデンス情報を参照して、前記統合イメージに関する第Ｋ調整統合コンフィデンス情報を生成し、（ｉｉ）前記強化学習エージェントをもって、前記第Ｋ調整統合コンフィデンス情報を参照して、前記統合イメージ内の前記領域のうち、前記再検出プロセスを適用する予定の一つ以上の第Ｋ特定領域それぞれを選択させ、（ｉｉｉ）前記ＣＮＮをもって、前記第Ｋ特定領域に前記ＣＮＮ演算を適用して、前記統合イメージに対するそれぞれの第Ｋ調整物体情報及びそれぞれの第Ｋ調整コンフィデンス情報を生成させる前記再検出プロセスを遂行するプロセス；及び（ＩＩＩ−６）前記再検出プロセスがＮ回遂行されることによって、それぞれの第Ｎ調整物体情報及びそれぞれの第Ｎ調整コンフィデンス情報が生成されると、前記第１調整物体情報ないし第Ｎ調整物体情報のうち少なくとも一部及び前記初期物体情報を参照して前記統合最終物体情報を生成するプロセス；を通じて生成され、前記Ｋは２以上Ｎ以下の整数であり、前記Ｎは、前記強化学習エージェントが、前記再検出プロセスが遂行されるべきであると判断した回数であることを特徴とする装置。
（ｉ）複数の前記パノラマビューセンサのうちカメラに対応する少なくとも一つの第１パノラマビューセンサを通じて少なくとも一つの第１状況イメージが取得されると、前記プロセッサが、３チャンネルイメージに対して最適化された、インプットノード（ＩｎｐｕｔＮｏｄｅ）が３個以上である第１ＣＮＮをもって、前記第１状況イメージに対して第１ＣＮＮ演算を少なくとも一回適用させ、（ｉｉ）デプスセンサ（ＤｅｐｔｈＳｅｎｓｏｒ）に対応する少なくとも一つの第２パノラマビューセンサを通じて少なくとも一つの第２状況イメージが取得されると、前記プロセスが、デプスイメージ（ＤｅｐｔｈＩｍａｇｅ）に対して最適化された、インプットノードが１個以上である第２ＣＮＮをもって、前記第２状況イメージに対して第２ＣＮＮ演算を少なくとも一回適用させることを特徴とする請求項２０に記載の装置。
物体検出プロセスと並行して生成された、物体検出の信頼度（Ｃｒｅｄｉｂｉｌｉｔｙ）を表すコンフィデンススコア（ＣｏｎｆｉｄｅｎｃｅＳｃｏｒｅ）を利用することによって、コンピューティングパワーを節約しながらもより優れた自律走行性能を達成するためのコンピューティング装置において、
インストラクションを格納する少なくとも一つのメモリ；及び
（Ｉ）対象車両に設置された少なくとも一つのパノラマビューセンサ（ＰａｎｏｒａｍａＶｉｅｗＳｅｎｓｏｒ）を通じて前記対象車両の周辺に対する少なくとも一つの状況イメージ（ＣｉｒｃｕｍｓｔａｎｃｅＩｍａｇｅ）を取得するプロセス、（ＩＩ）ＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）をもって、前記状況イメージにＣＮＮ演算を少なくとも一回適用させて、前記状況イメージに関する初期物体情報及び初期コンフィデンス情報を生成させるプロセス、及び（ＩＩＩ）強化学習エージェントのサポートを受けて作動することによって、前記初期物体情報及び前記初期コンフィデンス情報を参照して、前記状況イメージに関する最終物体情報を生成するプロセスを遂行するための前記インストラクションを実行するように構成された少なくとも一つの
プロセッサと、
を含み、
前記（Ｉ）プロセス以前に、
（Ｉ−１）トレーニングイメージが取得されると、学習装置が、前記ＣＮＮに含まれている少なくとも一つのコンボリューションレイヤをもって、前記トレーニングイメージに対してコンボリューション演算を少なくとも一回適用して少なくとも一つのコンボリューション特徴マップを生成させるプロセス；（Ｉ−２）前記学習装置が、前記コンボリューション特徴マップに対してアンカー（Ａｎｃｈｏｒ）演算を少なくとも一回適用することによって、前記トレーニングイメージ上の予測ＲＯＩ（ＲｅｇｉｏｎＯｆＩｎｔｅｒｅｓｔ）を生成するプロセスを遂行しつつ、ＲＰＮ（ＲｅｇｉｏｎＰｒｏｐｏｓａｌＮｅｔｗｏｒｋ）に含まれている少なくとも一つのアンカーレイヤをもって、前記予測ＲＯＩが原本正解（Ｇｒｏｕｎｄ−Ｔｒｕｔｈ）ＲＯＩと同一であるそれぞれの少なくとも一つの確率を表すそれぞれの少なくとも一つのＲＰＮコンフィデンススコアを前記コンボリューション特徴マップのピクセルごとに生成することによって、前記ＲＰＮコンフィデンススコアを含むＲＰＮコンフィデンスマップを生成させるプロセス；（Ｉ−３）前記ＣＮＮに含まれているＲＯＩプーリングレイヤを通じて、前記コンボリューション特徴マップ及び前記予測ＲＯＩを利用して生成された少なくとも一つのＲＯＩプーリング済み特徴マップが取得されると、前記学習装置は、前記ＲＯＩプーリング済み特徴マップを利用して予測物体検出結果を生成するプロセスを遂行しつつ、前記ＣＮＮに含まれているＦＣレイヤをもって、前記予測物体検出結果に含まれるそれぞれの少なくとも一つの予測ＣＮＮ分類結果と、それぞれの少なくとも一つの予測ＣＮＮリグレッション結果とが、原本正解物体検出結果に含まれているそれぞれの少なくとも一つの原本正解ＣＮＮ分類結果及びそれぞれの少なくとも一つの原本正解ＣＮＮリグレッション結果と同一であるものと予測されるそれぞれの少なくとも一つの確率を表すそれぞれのＣＮＮコンフィデンススコアを前記予測ＲＯＩごとに生成することによって、前記ＣＮＮコンフィデンススコアを含むＣＮＮコンフィデンスマップを生成させるプロセス；及び（Ｉ−４）前記学習装置が、ロスレイヤをもって、前記ＲＰＮコンフィデンスマップと、前記ＣＮＮコンフィデンスマップと、前記予測物体検出結果と、前記原本正解物体検出結果とを参照して少なくとも一つのＲＰＮロス及び少なくとも一つのＣＮＮロスを生成させ、前記ＲＰＮロス及び前記ＣＮＮロスを利用してバックプロパゲーションを遂行することによって前記ＣＮＮ及び前記ＲＰＮに含まれているパラメータのうち少なくとも一部を学習させるプロセス；が遂行されることによって、前記ＣＮＮが学習されることを特徴とする装置。
前記（Ｉ−４）プロセスで、
前記学習装置が、前記ロスレイヤをもって、下記数式にしたがって前記ＲＰＮロスを生成させ、

Ｎ_ｒｅｇはアンカー演算を遂行して生成された前記コンボリューション特徴マップのサイズに対応する定数であり、Ｎ_ｃｌｓは前記トレーニングイメージに対応する定数であり、ｃ_ｉは前記ＲＰＮコンフィデンススコアのうち、前記コンボリューション特徴マップの第ｉピクセルに対応する第ｉＲＰＮコンフィデンススコアを意味し、ｐ_ｉは前記第ｉピクセルに対応する第ｉ予測ＲＰＮ分類結果を意味し、ｐ_ｉ ^＊は前記第ｉピクセルに対応する第ｉ原本正解ＲＰＮ分類結果を意味し、ｔ_ｉは前記第ｉピクセルに対応する第ｉ予測ＲＰＮリグレッション結果を意味し、ｔ_ｉ ^＊は前記第ｉピクセルに対応する第ｉ原本正解ＲＰＮリグレッション結果を意味し、
前記第ｉ原本正解ＲＰＮ分類結果及び前記第ｉ原本正解ＲＰＮリグレッション結果は、前記原本正解物体検出結果に対応することを特徴とする請求項２２に記載の装置。
前記（Ｉ−４）プロセスで、
前記学習装置が、前記ロスレイヤをもって、下記数式にしたがって前記ＣＮＮロスを生成させ、

Ｎ_ｒｅｇ及びＮ_ｃｌｓは前記予測ＲＯＩの個数であり、ｃ_ｉは前記ＣＮＮコンフィデンススコアのうち前記予測ＲＯＩから選択された第ｉ予測ＲＯＩに対応する第ｉＣＮＮコンフィデンススコアを意味し、ｐ_ｉは前記第ｉ予測ＲＯＩに対応する第ｉ予測ＣＮＮ分類結果を意味し、ｐ_ｉ ^＊は第ｉピクセルに対応する第ｉ原本正解ＣＮＮ分類結果を意味し、ｔ_ｉは前記第ｉ予測ＲＯＩに対応する第ｉ予測ＣＮＮリグレッション結果を意味し、ｔ_ｉ ^＊は前記第ｉピクセルに対応する第ｉ原本正解ＣＮＮリグレッション結果を意味し、
前記第ｉ予測ＣＮＮ分類結果及び前記第ｉ予測ＣＮＮリグレッション結果は、前記予測物体検出結果に対応することを特徴とする請求項２２に記載の装置。
前記（Ｉ−３）プロセス以後に、
前記学習装置が、コンフィデンスレイヤをもって、前記ＲＰＮコンフィデンスマップ及び前記ＣＮＮコンフィデンスマップを参照して、前記トレーニングイメージ内のピクセルごとの統合コンフィデンススコアそれぞれに関する情報を含む統合コンフィデンスマップを生成させることを特徴とする請求項２２に記載の装置。
前記学習装置が、前記コンフィデンスレイヤをもって、（ｉ）（ｉ−１）前記ＣＮＮから、前記予測物体検出結果を生成するプロセスが遂行される途中に生成される、前記予測ＲＯＩに対するＮＭＳ（Ｎｏｎ−ＭａｘｉｍｕｍＳｕｐｐｒｅｓｓｉｏｎ）結果を取得するプロセス、（ｉ−２）前記ＲＰＮコンフィデンスマップに対してリサイズ（Ｒｅｓｉｚｅ）演算を少なくとも一回適用してリサイズされたＲＰＮコンフィデンスマップを生成するプロセス、及び（ｉｉ）前記ＮＭＳ結果及び前記リサイズされたＲＰＮコンフィデンスマップを参照して前記統合コンフィデンスマップを生成するプロセスを遂行させることを特徴とする請求項２５に記載の装置。
前記学習装置が、前記コンフィデンスレイヤをもって、前記統合コンフィデンススコアのうち、前記トレーニングイメージ上の座標（ｘ，ｙ）に対応する第Ｘ＿Ｙ統合コンフィデンススコアを下記数式にしたがって生成させ、

ｃ’_ｘｙは前記第Ｘ＿Ｙ統合コンフィデンススコアを意味し、ｃ_ｘｙは前記リサイズされたＲＰＮコンフィデンスマップ上の前記座標（ｘ，ｙ）に対応する第Ｘ＿ＹリサイズされたＲＰＮコンフィデンススコアを意味し、ｃ_ｒｉは前記ＮＭＳ結果で決定された、前記座標（ｘ，ｙ）を含みｒ_ｉとして表現される第ｉ予測ＲＯＩに対する第ｉＣＮＮコンフィデンススコアを意味することを特徴とする請求項２６に記載の装置。
物体検出プロセスと並行して生成された、物体検出の信頼度（Ｃｒｅｄｉｂｉｌｉｔｙ）を表すコンフィデンススコア（ＣｏｎｆｉｄｅｎｃｅＳｃｏｒｅ）を利用することによって、コンピューティングパワーを節約しながらもより優れた自律走行性能を達成するためのコンピューティング装置において、
インストラクションを格納する少なくとも一つのメモリ；及び
（Ｉ）対象車両に設置された少なくとも一つのパノラマビューセンサ（ＰａｎｏｒａｍａＶｉｅｗＳｅｎｓｏｒ）を通じて前記対象車両の周辺に対する少なくとも一つの状況イメージ（ＣｉｒｃｕｍｓｔａｎｃｅＩｍａｇｅ）を取得するプロセス、（ＩＩ）ＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）をもって、前記状況イメージにＣＮＮ演算を少なくとも一回適用させて、前記状況イメージに関する初期物体情報及び初期コンフィデンス情報を生成させるプロセス、及び（ＩＩＩ）強化学習エージェントのサポートを受けて作動することによって、前記初期物体情報及び前記初期コンフィデンス情報を参照して、前記状況イメージに関する最終物体情報を生成するプロセスを遂行するための前記インストラクションを実行するように構成された少なくとも一つの
プロセッサと、
を含み、
前記（ＩＩ）プロセスは、
（ＩＩ−１）前記状況イメージが取得されると、前記ＣＮＮに含まれている少なくとも一つのコンボリューションレイヤをもって、前記状況イメージに対してコンボリューション演算を少なくとも一回適用して少なくとも一つのコンボリューション特徴マップを生成させるプロセス；（ＩＩ−２）前記コンボリューション特徴マップに対してアンカー演算を少なくとも一回適用することによって、前記状況イメージ上の予測ＲＯＩを生成するためのプロセスを遂行しつつ、ＲＰＮに含まれている少なくとも一つのアンカーレイヤをもって、前記予測ＲＯＩが原本正解ＲＯＩと同一である少なくとも一つの確率それぞれを表す、少なくとも一つのＲＰＮコンフィデンススコアそれぞれを前記コンボリューション特徴マップのピクセルごとに生成することによって、前記ＲＰＮコンフィデンススコアを含むＲＰＮコンフィデンスマップを生成させるプロセス；（ＩＩ−３）前記ＣＮＮに含まれているＲＯＩプーリングレイヤを通じて前記コンボリューション特徴マップ及び前記予測ＲＯＩを利用して生成された少なくとも一つのＲＯＩプーリング済み特徴マップが取得されると、前記ＲＯＩプーリング済み特徴マップを利用して予測物体検出結果を生成するプロセスを遂行しつつ、前記ＣＮＮに含まれるＦＣレイヤをもって、前記予測物体検出結果に含まれているそれぞれの少なくとも一つの予測ＣＮＮ分類結果と、それぞれの少なくとも一つの予測ＣＮＮリグレッション結果とが、原本正解物体検出結果に含まれているそれぞれの少なくとも一つの原本正解ＣＮＮ分類結果及びそれぞれの少なくとも一つの原本正解ＣＮＮリグレッション結果と同一である少なくとも一つの確率それぞれを表すＣＮＮコンフィデンススコアそれぞれを前記予測ＲＯＩごとに生成することによって、前記ＣＮＮコンフィデンススコアを含むＣＮＮコンフィデンスマップを生成させるプロセス；及び（ＩＩ−４）前記ＣＮＮと連動して作動するコンフィデンスレイヤをもって、前記ＲＰＮコンフィデンスマップ及び前記ＣＮＮコンフィデンスマップを参照して統合コンフィデンスマップを生成させるプロセスを含み、前記プロセッサは、前記ＣＮＮをもって、前記予測物体検出結果を含む前記初期物体情報と、前記統合コンフィデンスマップを含む前記初期コンフィデンス情報とを出力させることを特徴とする装置。