JP2020038658A

JP2020038658A - エッジイメージを利用して物体を検出する学習方法及び学習装置、並びにそれを利用したテスト方法及びテスト装置

Info

Publication number: JP2020038658A
Application number: JP2019159829A
Authority: JP
Inventors: 桂賢金; Kye-Hyeon Kim; 鎔重金; Yongjoong Kim; 寅洙金; Insu Kim; 鶴京金; Hak-Kyoung Kim; 雲鉉南; Woonhyun Nam; 碩▲ふん▼ 夫; Sukhoon Boo; 明哲成; Myungchul Sung; 東勳呂; Donghun Yeo; 宇宙柳; Wooju Ryu; 泰雄張; Taiyu Cho
Original assignee: Stradvision Inc
Current assignee: Stradvision Inc
Priority date: 2018-09-04
Filing date: 2019-09-02
Publication date: 2020-03-12
Also published as: CN110874841A; EP3620979A1; EP3620979B1; KR20200027428A; EP3620979C0; CN110874841B; US10229346B1; KR102325033B1

Abstract

【課題】特定の物体を検出するＣＮＮ装置において、背景部分の同一クラス内の検出値のバリエーションが大きくても、特定の物体を正確に検出する物体検出の学習方法、テスト方法を提供する。【解決手段】ＣＮＮ装置の学習方法は、入力イメージが取得されると、入力イメージに対してコンボリューション演算を適用して特定の特徴マップを取得するプロセス及び入力イメージからエッジ部分を抽出してエッジイメージを取得し、取得されたエッジイメージから特定の物体と類似した特定の形態を有する特定のエッジ部分に関する情報を含むガイドマップを取得するプロセスを遂行する段階Ｓ０１と、特定の特徴マップにガイドマップを反映して、入力イメージ内の特定の物体を検出するためのセグメンテーション結果を取得する段階Ｓ０４を含む。【選択図】図４

Description

本発明は、ＣＮＮ基盤の特定の物体検出のための方法に関し、具体的には、前記ＣＮＮ基盤の前記特定の物体検出のための方法において、（ａ）入力イメージが取得されると、学習装置が、（ｉ）前記入力イメージに対して少なくとも一回コンボリューション演算を適用して、少なくとも一つの特定の特徴マップを取得するプロセス、及び（ｉｉ）前記入力イメージから少なくとも一つのエッジ部分を抽出してエッジイメージを取得し、前記取得されたエッジイメージにおいて、前記特定の物体と類似した特定の形態を有する少なくとも一つの特定のエッジ部分に関する情報を含む、少なくとも一つのガイドマップを取得するプロセスを遂行する段階；及び（ｂ）前記学習装置が，前記特定の特徴マップに前記ガイドマップを反映して、前記入力イメージ内の前記特定の物体を検出するためのセグメンテーション結果を取得する段階を含むことを特徴とする学習方法及び学習装置、並びにそれに基づいたテスト方法及びテスト装置に関する。

ディープラーニングは、事物やデータを群集化したり分類するのに使用する技術である。例えば、コンピュータは写真だけで犬と猫を区分することができない。しかし、人はとても容易に区分することができる。このため、「機械学習（ＭａｃｈｉｎｅＬｅａｒｎｉｎｇ）」という方法が考案された。これは多くのデータをコンピュータに入力し、類似したもの同士分類するようにする技術である。格納された犬の写真と類似した写真が入力されると、これを犬の写真であると分類するのである。

データをどのように分類するかをめぐり、すでに多くの機械学習アルゴリズムが登場した。「意思決定木」や「ベイジアンネットワーク」「サポートベクターマシン（ＳＶＭ）」「人工神経網」などが代表的である。このうち、ディープラーニングは人工神経網の後裔である。

ディープコンボリューションニューラルネットワーク（ＤｅｅｐＣｏｎｖｏｌｕｔｉｏｎＮｅｕｒａｌＮｅｔｗｏｒｋｓ；ＤｅｅｐＣＮＮ）は、ディープラーニング分野で起きた驚くべき発展の核心である。ＣＮＮは、文字の認識問題を解決するために９０年代にすでに使われていたが、現在のように広く使われるようになったのは最近の研究結果の賜物である。このようなディープＣＮＮは、２０１２年ＩｍａｇｅＮｅｔイメージ分類コンテストで他の競争相手に勝って優勝を収めた。そして、コンボリューションニューラルネットワークは機械学習分野で非常に有用なツールとなった。

図１は、従来技術によってディープＣＮＮを利用して写真において取得しようとする様々な出力の例を示す。

分類（Ｃｌａｓｓｉｆｉｃａｔｉｏｎ）は、写真で識別しようとするクラス（ｃｌａｓｓ）の種類、例えば、図１に示されたように、取得された物体が人であるのか、羊であるのか、犬であるのか、種類を識別する方法であり、検出（Ｄｅｔｅｃｔｉｏｎ）は、すべての物体を探し出して、探し出した物体をパウンディンボックス（ＢｏｕｎｄｉｎｇＢｏｘ）に囲まれた形態で表示する方法であり、セグメンテーション（ｓｅｇｍｅｎｔａｔｉｏｎ）は、写真において特定の物体の領域を他の物体と区別する方法である。最近、ディープラーニング（Ｄｅｅｐｌｅａｒｎｉｎｇ）技術が脚光を浴びるようになり、分類、検出及びセグメンテーション技術もディープラーニングを数多く使用する。

図２は、ＣＮＮを利用した既存の車線検出方法を簡略に示した図であり、図３は、一般的なＣＮＮセグメンテーションプロセスを簡略に示した図である。

まず、図３を参照すると、既存の車線検出方法では、学習装置に入力イメージが入力されて、複数のコンボリューションレイヤでコンボリューション演算とＲｅＬＵなどの非線形演算を数回遂行して特徴マップを取得し、複数のデコンボリューションレイヤでデコンボリューション演算を数回遂行して、最後の特徴マップでソフトマックス（ＳｏｆｔＭａｘ）演算を遂行してセグメンテーション結果を得る。

また、図２を参照すると、既存の車線（Ｌａｎｅ）検出方法のセグメンテーション結果は、図２の中間に示されたように２種類（例えば、車線と背景）で構成される。このようなセグメンテーション結果は、確率予測値として現れる。このように選択された車線上の候補ピクセルの中から車線である確率の高いピクセルのみをサンプリングして車線を探した後、探し出した車線上のピクセルから得た車線モデル関数を利用して最終的に車線を決定する。

しかし、このように車線を含んだ少なくとも一つの特定の物体を検出する従来のＣＮＮ装置は、様々な背景を一つのクラス（つまり、ラベル＝０であるクラス）に分類しなければならないが、背景部分内のインクラスバリエーション（Ｉｎ−ＣｌａｓｓＶａｒｉａｔｉｏｎ）（同一クラス内の検出値のバリエーション）が大きくて特定の物体を正確に検出するのが難しいという問題点が存在する。例えば、少なくとも一つの車線を検出する場合、入力イメージにおいて車線を除いた残りの背景部分は、表示板や建物など様々な形態を含む。しかし、このうち車線とほぼ同じ形態を有する背景が多いため、背景クラス内でもラベル値がいずれも０に近いように算出されず、ラベルの背景クラス内の値のバリエーションが大きくなる。つまり、背景部分に属する物体であるものの、車線とほぼ同じ形態を有する場合、ラベル値が車線（ラベル＝１）と背景（ラベル＝０）のいずれにも近接した値が算出されないため、車線の検出に困難がある問題点がある。

本発明は、上述した全ての問題点を解決しようとすることを目的とする。

本発明は、背景のうち一つに属し、特定の物体と類似した他の物体を検出対象から除外して、容易に特定の物体を検出することができる方法を提供することを他の目的とする。

本発明は、ＣＮＮを通じて得られた少なくとも一つの特徴マップだけでなく、少なくとも一つのエッジイメージを利用してイメージ内で特定の物体を正確に検出する方法を提供することをまた他の目的とする。

本発明の一態様によると、ＣＮＮ基盤の特定の物体検出のための方法において、（ａ）入力イメージが取得されると、学習装置が、（ｉ）前記入力イメージに対して少なくとも一回コンボリューション演算を適用して少なくとも一つの特定の特徴マップを取得するプロセス、及び（ｉｉ）前記入力イメージから少なくとも一つのエッジ部分を抽出してエッジイメージを取得し、前記取得されたエッジイメージにおいて前記特定の物体と類似した特定の形態を有する少なくとも一つの特定のエッジ部分に関する情報を含む少なくとも一つのガイドマップを取得するプロセスを遂行する段階；及び（ｂ）前記学習装置が、前記特定の特徴マップに前記ガイドマップを反映して前記入力イメージ内の前記特定の物体を検出するためのセグメンテーション結果を取得する段階；を含むことを特徴とする。

一実施例において、前記エッジイメージは、前記入力イメージから特定の閾値以下の周波数成分を除去して取得されることを特徴とする。

一実施例において、前記エッジイメージは、前記入力イメージピクセルのグラディエント（Ｇｒａｄｉｅｎｔ）を算出した後、前記入力イメージの前記ピクセルのうち設定済み閾値以上のグラディエントを有する少なくとも一つのピクセルを抽出して生成されたキャニーエッジ（ＣａｎｎｙＥｄｇｅ）イメージであることを特徴とする。

一実施例で、前記ガイドマップは、前記特定の物体と類似した前記特定の形態に第１重み付け値を与え、前記特定の物体と類似した前記特定の形態以外の少なくとも一つの形態には第２重み付け値を付与して取得され、前記第１重み付け値が前記第２重み付け値より大きいことを特徴とする。

一実施例で、前記ガイドマップは、前記エッジイメージに対して膨張（Ｄｉｌａｔｉｏｎ）演算又はモルフォロジー（Ｍｏｒｐｈｏｌｏｇｙ）演算を少なくとも一回適用して、前記特定のエッジ部分を広くして生成されることを特徴とする。

一実施例において、前記（ｂ）段階で、前記学習装置は前記ガイドマップと前記特定の特徴マップとをピクセルごとに掛け合わせて、少なくとも一つのエッジ強化された特徴マップを生成することを特徴とする。

一実施例で、前記（ｂ）段階は、（ｂ１）前記特定の特徴マップが複数個ある状態で、前記学習装置が、前記特定の特徴マップそれぞれのサイズがリサイズされたガイドマップそれぞれのサイズと同じであるように少なくとも一つの前記リサイズされたガイドマップを生成するために、前記ガイドマップの大きさを調整する段階；及び（ｂ２）前記学習装置が、前記ガイドマップと、これに対応する特定の特徴マップとをピクセルごとに掛け合わせ、前記リサイズされたガイドマップと、これに対応する特定の特徴マップとをピクセルごとに掛け合わせて、複数のエッジ強化された特徴マップを生成する段階；を含むことを特徴とする。

一実施例において、前記（ｂ）段階で、前記ガイドマップが反映された前記特定の特徴マップは、前記学習装置のエンコードレイヤから取得した少なくとも一つの特徴マップ、及び前記学習装置のデコードレイヤから取得された少なくとも一つの特徴マップのうちいずれか一つに選択
されることを特徴とする。

一実施例において、前記特定の物体は道路の少なくとも一つの車線であることを特徴とする。

一実施例において、（ｃ）前記学習装置が、前記セグメンテーション結果とそれに対応する原本正解を参照してセグメンテーションロスを算出する段階及び（ｄ）前記学習装置が、前記セグメンテーションロスを利用してバックプロパゲーションを遂行して前記学習装置の少なくとも一つのパラメータを最適化する段階；をさらに含むことを特徴とする。

本発明の他の態様によると、ＣＮＮ基盤イメージに含まれている、少なくとも一つの特定の物体を検出するためのテスト方法において、（ａ）（ｉ）学習装置が、トレーニングイメージに対して少なくとも一回コンボリューション演算を適用して、少なくとも一つの特定の学習用特徴マップを取得するプロセス、（ｉｉ）前記学習装置が、前記トレーニングイメージから少なくとも一つのエッジ部分を抽出して学習用エッジイメージを取得し、前記取得された学習用エッジにおいて前記特定の物体と類似した特定の形態を有する特定の学習用エッジ部分に関する情報を含む少なくとも一つの学習用ガイドマップを取得するプロセス、（ｉｉｉ）前記学習装置が、前記特定の学習用特徴マップに前記学習用ガイドマップを反映して、前記トレーニングイメージ内の前記特定の物体を検出するための学習用セグメンテーション結果を取得するプロセス、（ｉｖ）前記学習装置が、前記検出された学習用セグメンテーション結果とそれに対応する原本正解を参照してセグメンテーションロスを算出するプロセス、及び（ｖ）前記学習装置が、前記セグメンテーションロスを利用してバックプロパゲーションを遂行して前記学習装置の少なくとも一つのパラメータを最適化した状態で、テスト装置がテストイメージを取得する段階（ｂ）前記テスト装置が、（ｉ）前記テストイメージに対して少なくとも一回コンボリューション演算を適用して、少なくとも一つの特定のテスト用特徴マップを取得するプロセス、及び（ｉｉ）前記テストイメージから少なくとも一つのエッジ部分を抽出してテスト用エッジイメージを取得し、前記取得されたテスト用エッジイメージにおいて前記特定の物体と類似した特定の形態を有する少なくとも一つの特定のテスト用エッジ部分に関する情報を含む、少なくとも一つのテスト用ガイドマップを取得するプロセスを遂行する段階；及び（ｃ）前記テスト装置が、前記特定のテスト用特徴マップに前記テスト用ガイドマップを反映して、テストイメージ内の前記特定の物体を検出するためのテスト用セグメンテーション結果を取得する段階を含むことを特徴とする。

一実施例において、前記テスト用エッジイメージは、前記テストイメージから特定の閾値以下の周波数成分を除去して取得されることを特徴とする。

一実施例において、前記テスト用エッジイメージは、前記テストイメージピクセルのグラディエントを算出した後、前記テストイメージの前記ピクセルのうち設定済み閾値以上のグラディエントを有する少なくとも一つのピクセルを抽出して生成されたキャニーエッジイメージであることを特徴とする。

一実施例で、前記テスト用ガイドマップは、前記特定の物体と類似した前記特定の形態に第１重み付け値を与え、前記特定の物体と類似した前記特定の形態以外の少なくとも一つの形態には第２重み付け値を付与して取得され、前記第１重み付け値が前記第２重み付け値よりも大きく、前記テスト用ガイドマップは前記テスト用エッジイメージに対して膨張演算またはモルフォロジー演算を少なくとも一回適用して、前記特定のテスト用エッジ部分を広くして生成されることを特徴とする。

一実施例で、前記（ｃ）段階は、（ｃ１）前記特定のテスト用特徴マップが複数個ある状態で、前記テスト装置が、前記特定のテスト用特徴マップそれぞれのサイズがリサイズされたテスト用ガイドマップそれぞれのサイズと同じであるように少なくとも一つの前記リサイズされたテスト用ガイドマップを生成するために前記テスト用ガイドマップの大きさを調整する段階；及び（ｃ２）前記テスト装置が、前記テスト用ガイドマップと、これに対応する特定のテスト用特徴マップとをピクセルごとに掛け合わせ、前記リサイズされたテスト用ガイドマップと、これに対応する特定のテスト用特徴マップとをピクセルごとに掛け合わせて、複数のテスト用エッジ強化された特徴マップを生成する段階；を含むことを特徴とする。

本発明のまた他の態様によると、ＣＮＮ基盤の特定の物体検出のための学習装置において、トレーニングイメージとしての入力イメージを取得するための通信部；及び（Ｉ）前記入力イメージに対して少なくとも一回コンボリューション演算を適用して、少なくとも一つの特定の特徴マップを取得するプロセス、（ＩＩ）前記入力イメージから少なくとも一つのエッジ部分を抽出してエッジイメージを取得し、前記取得されたエッジイメージで前記特定の物体と類似した特定の形態を有する少なくとも一つの特定のエッジ部分に関する情報を含む少なくとも一つのガイドマップを取得するプロセスを遂行するプロセス、及び（ＩＩＩ）前記特定の特徴マップに前記ガイドマップを反映して前記入力イメージ内の前記特定の物体を検出するためのセグメンテーション結果を取得するプロセスを遂行するプロセッサ；を含むことを特徴とする。

一実施例において、前記エッジイメージは、前記入力イメージにおいて特定の閾値以下の周波数成分を除去して取得されることを特徴とする。

一実施例において、前記エッジイメージは、前記入力イメージピクセルのグラディエントを算出した後、前記入力イメージの前記ピクセルのうち設定済み閾値以上のグラディエントを有する少なくとも一つのピクセルを抽出して生成されたキャニーエッジイメージであることを特徴とする。

一実施例で、前記ガイドマップは、前記エッジイメージに対して膨張演算又はモルフォロジー演算を少なくとも一回適用して、前記特定のエッジ部分を広くして生成されることを特徴とする。

一実施例において、前記（ＩＩＩ）プロセスにおいて、前記プロセッサは、前記ガイドマップと前記特定の特徴マップとをピクセルごとに掛け合わせて、少なくとも一つのエッジ強化された特徴マップを生成することを特徴とする。

一実施例で、前記（ＩＩＩ）プロセスで、（ＩＩＩ−１）前記特定の特徴マップが複数個ある状態で、前記特定の特徴マップそれぞれのサイズがリサイズされたガイドマップそれぞれのサイズと同じであるように少なくとも一つの前記リサイズされたガイドマップを生成するために、前記ガイドマップの大きさを調整するプロセス；及び（ＩＩＩ−２）前記ガイドマップと、これに対応する特定の特徴マップとをピクセルごとに掛け合わせ、前記リサイズされたガイドマップと、これに対応する特定の特徴マップとをピクセルごとに掛け合わせて、複数のエッジ強化された特徴マップを生成するプロセス；を含むことを特徴とする。

一実施例において、前記（ＩＩＩ）プロセスで、前記ガイドマップが反映された前記特定の特徴マップは、そのエンコードレイヤから取得した少なくとも一つの特徴マップ、及び前記学習装置のデコードレイヤから取得された少なくとも一つの特徴マップのうちいずれか一つに選択
されることを特徴とする。

一実施例において、前記プロセッサは、（ＩＶ）前記セグメンテーション結果とそれに対応する原本正解を参照してセグメンテーションロスを算出するプロセス；及び（Ｖ）前記セグメンテーションロスを利用してバックプロパゲーションを遂行してその少なくとも一つのパラメータを最適化するプロセス；をさらに遂行することを特徴とする。

本発明のまた他の態様によると、ＣＮＮ基盤のイメージに含まれた少なくとも一つの特定の物体を検出するためのテスト装置において、（ｉ）学習装置が、トレーニングイメージに対して少なくとも一回コンボリューション演算を適用して、少なくとも一つの特定の学習用特徴マップを取得するプロセス、（ｉｉ）前記学習装置が、前記トレーニングイメージから少なくとも一つのエッジ部分を抽出して学習用エッジイメージを取得し、前記取得された学習用エッジイメージにおいて前記特定の物体に類似した特定の形態を有する特定の学習用エッジ部分に関する情報を含む少なくとも一つの学習用ガイドマップを取得するプロセス、（ｉｉｉ）前記学習装置が、前記特定の学習用特徴マップに前記学習用ガイドマップを反映して、前記トレーニングイメージ内の前記特定の物体を検出するための学習用セグメンテーション結果を取得するプロセス、（ｉｖ）前記学習装置が、前記検出された学習用セグメンテーション結果とそれに対応する原本正解を参照してセグメンテーションロスを算出するプロセス、及び（ｖ）前記学習装置が、前記セグメンテーションロスを利用してバックプロパゲーションを遂行して前記学習装置の少なくとも一つのパラメータを最適化した状態で、テストイメージを取得する通信部；及び（Ｉ）前記テストイメージに対して少なくとも一回コンボリューション演算を適用して、少なくとも一つの特定のテスト用特徴マップを取得し、前記テストイメージにおいて少なくとも一つのエッジ部分を抽出してテスト用エッジイメージを取得し、前記取得されたテスト用エッジイメージにおいて前記特定の物体と類似した特定の形態を有する少なくとも一つの特定のテスト用エッジ部分に関する情報を含む、少なくとも一つのテスト用ガイドマップを取得するプロセス、及び（ＩＩ）前記特定のテスト用特徴マップに前記テスト用ガイドマップを反映して、前記テストイメージ内の前記特定の物体を検出するためのテスト用セグメンテーション結果を取得するプロセスを遂行するプロセス；を含むことを特徴とする。

一実施例で、前記テスト用ガイドマップは、前記特定の物体と類似した前記特定の形態に第１重み付け値を付与し、前記特定の物体と類似した前記特定の形態以外の少なくとも一つの形態には第２重み付け値を付与して取得され、前記第１重み付け値が前記第２重み付け値よりも大きく、前記テスト用ガイドマップは前記テスト用エッジイメージに対して膨張演算またはモルフォロジー演算を少なくとも一回適用して、前記特定のテスト用エッジ部分を広くして生成されることを特徴とする。

一実施例で、前記（ＩＩ）プロセスは、（ＩＩ−１）前記特定のテスト用特徴マップが複数個ある状態で、前記特定のテスト用特徴マップそれぞれのサイズがリサイズされたテスト用ガイドマップそれぞれのサイズと同じであるように少なくとも一つの前記リサイズされたテスト用ガイドマップを生成するために前記テスト用ガイドマップの大きさを調整するプロセス；及び（ＩＩ−２）前記テスト用ガイドマップと、これに対応する特定のテスト用特徴マップとをピクセルごとに掛け合わせ、前記リサイズされたテスト用ガイドマップと、これに対応する特定のテスト用特徴マップとをピクセルごとに掛け合わせて、複数のテスト用エッジ強化された特徴マップを生成するプロセス；を含むことを特徴とする。

本発明によると、エッジイメージを抽出した後、車線や特定の物体に対応する部分のみを残したり、この部分に大きな重みを付与してエッジイメージを加工することにより生成されたガイドマップを通じて特定の物体を容易に検出することができる効果がある。すなわち、エッジ強化されたガイドマップを特定の特徴マップに反映することにより、特定の特徴マップの演算量が相当に減り、背景部分を事前に除去して効果的に特定の物体や車線を検出することができる。

本発明によると、車線検出の場合、ガイドマップを通じて背景部分を特定の特徴マップから除外して、車線のみ明確に検出することができる他の効果がある。

本発明の実施例の説明に利用されるために添付された以下の図面は、本発明の実施例のうち単に一部であるにすぎず、本発明の属する技術分野において通常の知識を有する者（以下「通常の技術者」）にとっては、発明的作業が行われずにこれらの図面に基づいて他の各図面が得られ得る。
既存のＣＮＮを利用した写真において検出しようとする様々な出力の例を示す。既存のＣＮＮを利用した従来の車線検出方法を簡略に示した図である。従来のＣＮＮを利用した一般的なセグメンテーションの従来のプロセスを簡略に示した図である。本発明によるＣＮＮ基盤の物体検出方法を示したチャート図である。本発明の一実施例によるＣＮＮ基盤の物体検出プロセスを示す。本発明によるガイドマップを生成するプロセスの例を示す。本発明によるガイドマップを生成するプロセスの他の例を示す。本発明の他の実施例によるＣＮＮ基盤の物体検出プロセスを示す。

後述する本発明に関する詳細な説明は、本発明が実施され得る特定の実施例を例示として示す添付図面を参照する。これらの実施例は、当業者が本発明を実施することができるように十分詳細に説明される。

また、本発明の詳細な説明及び各請求項にわたって、「含む」という単語及びそれらの変形は、他の技術的各特徴、各付加物、構成要素又は段階を除外することを意図したものではない。通常の技術者にとって本発明の他の各目的、長所及び各特性が、一部は本説明書から、また一部は本発明の実施から明らかになるであろう。以下の例示及び図面は、実例として提供され、本発明を限定することを意図したものではない。

さらに、本発明は本明細書に表示された実施例のすべての可能な組合せを網羅している。本発明の様々な実施例は互いに異なるが、相互に排他的である必要はないことが理解されるべきである。例えば、ここに記載されている特定の形状、構造及び特性は、その実施例に関連して、本発明の精神及び範囲を逸脱せず、他の実施例として具現される。また、それぞれの開示された実施例内の個別の構成要素の位置又は配置は、本発明の精神及び範囲を逸脱せず、かつ変更され得ることが理解されるべきである。したがって、後述の詳細な説明は、限定的な意味として受け取ろうとするものではなく、本発明の範囲は適切に説明されるのであれば、その請求項が主張することと均等な全ての範囲とともに添付された請求項によってのみ限定される。図面において類似の参照符号は、様々な側面にわたって同一であるか、又は類似の機能を指す。

本発明で言及している各種イメージは、舗装または非舗装道路関連のイメージを含み得、この場合、道路環境で登場し得る物体（例えば、自動車、人、動物、植物、物、建物、飛行機やドローンのような飛行体、その他の障害物）を想定し得るが、必ずしもこれに限定されるものではなく、本発明で言及している各種イメージは、道路と関係のないイメージ（例えば、非舗装道路、路地、空き地、海、湖、川、山、森、砂漠、空、室内と関連したイメージ）でもあり得、この場合、非舗装道路、路地、空き地、海、湖、川、山、森、砂漠、空、室内環境で登場し得る物体（例えば、自動車、人、動物、植物、物、建物、飛行機やドローンのような飛行体、その他の障害物）を想定し得るが、必ずしもこれに限定されるものではない。

以下、本発明の属する技術分野において、通常の知識を有する者が本発明を容易に実施することができるようにするために、本発明の好ましい実施例について、添付された図面を参照して詳細に説明することとする。

図４は、本発明によるＣＮＮ基盤の車線検出方法を示したチャート図である。

図４を参照すると、本発明によるＣＮＮ基盤の特定の物体検出方法は、入力イメージ（つまり、トレーニングイメージ）にコンボリューション演算を少なくとも一回適用して、少なくとも一つの特定の特徴マップを取得し、入力イメージから少なくとも一つのエッジ部分を抽出してエッジガイドマップを取得し、取得されたエッジイメージにおいて特定の物体と類似した特定の形態を有する少なくとも一つの特定のエッジ部分に関する情報を含む少なくとも一つのガイドマップを取得する段階（Ｓ０１）、特定の特徴マップそれぞれのサイズがリサイズされたガイドマップそれぞれのサイズと同じであるように少なくとも一つのリサイズされたガイドマップを生成するためにガイドマップの大きさを調整する段階（Ｓ０２）、ガイドマップと、これに対応する特定の特徴マップとをピクセルごとに掛け合わせ、前記リサイズされたガイドマップと、これに対応する特定の特徴マップとをピクセルごとに掛け合わせて、複数のエッジ強化された特徴マップを生成する段階（Ｓ０３）、エッジの強化特徴マップを利用して特定の物体を検出するためのセグメンテーション結果を取得する段階（Ｓ０４）、検出されたセグメンテーション結果とそれに対応する原本正解を参照してセグメンテーションロスを算出する段階（Ｓ０５）、セグメンテーションのロスを利用してバックプロパゲーション（Ｂａｃｋｐｒｏｐａｇａｔｉｏｎ）して学習装置の少なくとも一つのパラメータを最適化する段階（Ｓ０６）、及び学習された学習装置の少なくとも一つのパラメータを利用することにより、テスト装置に特定の物体検出プロセスを遂行する段階（Ｓ０７）を含む。先に説明したＳ０１ないしＳ０７段階に関するさらに詳しい説明は図８で確認することができるが、それに限定されるわけではない。

つまり、Ｓ０１段階で特定の特徴マップを一つだけ取得すると、Ｓ０１段階でガイドマップを一つだけ取得するようになる。この場合、本発明によるＣＮＮ基盤の特定の物体検出のための方法は、入力イメージに対して少なくとも一回コンボリューション演算を適用して特定の特徴マップを取得するプロセスと入力イメージにおいて少なくとも一つのエッジ部分を抽出してエッジイメージを取得するプロセス（Ｓ１０）；取得されたエッジイメージにおいて特定の物体と類似した特定の形態を有する少なくとも一つの特定のエッジ部分に関する情報を含むガイドマップを取得するプロセス（Ｓ２０）；及び特定の特徴マップにガイドマップを反映して入力イメージ内の特定の物体を検出するためのセグメンテーション結果を取得するプロセス（Ｓ３０）を含む。先に説明したＳ１０ないしＳ３０段階に関するさらに詳しい説明は、図５で確認することができる。

図５は、本発明によるＣＮＮ基盤の特定の物体検出のためのプロセスを示し、図６は、本発明によるガイドマップを生成するプロセスの例を示し、図７は、ガイドマップを生成するプロセスの他の例を示し、図８は、本発明の他の実施例によるＣＮＮ基盤の物体検出プロセスを示す。

以下、図４ないし図８を参照してＣＮＮ基盤の特定の物体検出のための学習プロセス及びテストプロセスが説明される。

まず、学習装置を通じて入力イメージを取得すると、学習装置が入力イメージにコンボリューション演算及びＲｅＬＵなどの非線形演算を少なくとも一回適用して、少なくとも一つの特定の特徴マップを取得する。学習装置は、入力イメージから少なくとも一つのエッジ部分を抽出してエッジイメージを取得し、取得されたエッジイメージから前記特定の物体と類似した形態を有する特定のエッジ部分に関する情報を含む少なくとも一つのガイドマップを取得する。この際、エッジイメージを学習装置内のエンコードレイヤを通じて入力イメージから生成することもできるが、学習装置とは別の装置で入力イメージからエッジイメージを生成することもできる。

この際、エッジイメージは入力イメージにおいて所定の閾値以下の周波数成分を除去して取得され得る。また、エッジイメージは、グラディエントが相対的に大きなピクセルを利用して検出されたエッジ部分を含むことができる。例えば、入力イメージピクセルのグラディエントを算出した後、入力イメージのピクセルのうち設定済み閾値以上のグラディエントを有する少なくとも一つのピクセルを抽出してエッジイメージを生成することができる。このように生成されたエッジイメージは、「キャニーエッジ」イメージとなる。

そうした上で、検出しようとする物体部分が十分に表示されるよう、エッジイメージを加工して改善されたエッジイメージ（以下、「ガイドマップ」という）を生成する。一実施例において、ガイドマップはエッジイメージにおいてエッジ部分を広くして生成される。そして、他の実施例において、ガイドマップはエッジイメージにおいて特定の物体と類似した形態を有する部分以外の部分を除去して作ることもできる。

図６を参照すると、ガイドマップは、エッジイメージに対して膨張演算またはモルフォロジー演算（ＭｏｒｐｈｏｌｏｇｙＯｐｅｒａｔｏｒ）を適用して、エッジ部分を広くして生成され得る。

図７を参照すると、他の実施例において、少なくとも一つの車線を検出する場合、ガイドマップはエッジイメージで木の形態であるエッジ部分を除去し、エッジイメージで車線と類似した形態を有するエッジ部分は維持して生成される。この場合、車線と類似した特定の形態には相対的にさらに大きな重み付け値が与えられ、特定の物体と類似した特定の形態以外の少なくとも一つの形態には相対的にさらに小さい重み付け値が付与される。他の実施例において、車線を検出した場合、エッジイメージに対して直線アルゴリズムや曲線アルゴリズムを適用し、車線と類似した形態には大きな重み付け値を付与してガイドマップを生成する。この際、車線と類似した特定の形態以外の形態を有するエッジ部分には、０を掛け合わせて全て除去し、車線と類似した特定の形態を有するエッジ部分にのみ１を掛け合わせて前記エッジ部分を維持することができる。しかし、車線であっても削除される危険があるため、場合によって１と０との間の値を有する重み付け値を付与するのがより適切である。

その後、図５のように特定の特徴マップとガイドマップとをピクセルごとに掛け合わせてエッジ強化された特徴マップを生成する。

本発明の他の実施例による図８におけるように、エンコードレイヤとデコードレイヤにおいて様々な大きさの複数の特定の特徴マップが生成され得る。この場合、ガイドマップは、エンコードレイヤから取得された特定の特徴マップ及びデコードレイヤから取得された特定の特徴マップのうち少なくとも一つに反映され得る。このために、特定の特徴マップそれぞれのサイズがリサイズされたガイドマップそれぞれのサイズと同じになるようにリサイズされたガイドマップを生成するために、ガイドマップの大きさを調整する段階を遂行する。

そして、図８に示されたように、ガイドマップとそれに対応する特定の特徴マップとをピクセルごとに掛け合わせ、リサイズされたガイドマップとそれに対応する特定の特徴マップとをピクセルごとに掛け合わせて、複数のエッジ強化された特徴マップを生成する。

このように生成されたエッジ強化された特徴マップにおいて検出しようとする特定の物体と類似した特定の形態を有するエッジ部分にのみ重み付け値が大きく付与されて、エッジ部分が浮き上がり得る。他の実施例において、エッジ強化された特徴マップにおいて検出しようとする特定の物体と類似した特定の形態を有するエッジ部分だけが残り、他のエッジ部分はエッジ強化された特徴マップから除去される。

つまり、ガイドマップ（つまり、改善されたエッジイメージ）が車線と一部の背景のみ含んだり、ガイドマップが車線と一部背景についてのみ高いピクセル値を有するために、これをマスク（Ｍａｓｋ）またはアテンション（Ａｔｔｅｎｔｉｏｎ）の形態でガイドマップと特定の特徴マップとをピクセルごとに掛け合わせると、図６や図７の黒で表現された部分を除いてインファレンス（Ｉｎｆｅｒｅｎｃｅ）が遂行される。すなわち、高い重み付け値が付与される車線に近い形態を有する部分と低い重み付け値が付与される背景部分を含むガイドマップを通じて、容易に車線を検出することが可能となるのである。

その上で、エッジ強化された特徴マップに対してさらなる演算（例えば、デコンボリューション演算やＦＣレイヤ演算、ソフトマックス演算など）を適用して、入力イメージで車線に関するクラスを背景に関するクラスから区分したセグメンテーション結果を取得する。そして、セグメンテーション結果に基づいて多項式フィッテング（ＰｏｌｙｎｏｍｉａｌＦｉｔｔｉｎｇ）アルゴリズムまたはスプラインフィッティング（ＳｐｌｉｎｅＦｉｔｔｉｎｇ）アルゴリズムを利用して車線を検出する。すなわち、多項式フィッテングアルゴリズムまたはスプライラインフィッティングアルゴリズムをセグメンテーション結果の車線候補ピクセルに適用して車線を検出する。

その上で、セグメンテーション結果とそれに対応する原本正解を参照してセグメンテーションロスを算出し、セグメンテーションロスを利用してバックプロパゲーションして学習装置の少なくとも一つのパラメータを最適化する。

そうした上で、テスト装置を利用して特定の物体を検出するプロセスが、学習装置の少なくとも一つのパラメータを利用して遂行される。

すなわち、（ｉ）学習装置が、トレーニングイメージに対して少なくとも一回コンボリューション演算を適用して、少なくとも一つの特定の学習用特徴マップを取得するプロセス、（ｉｉ）学習装置が、トレーニングイメージから少なくとも一つのエッジ部分を抽出して学習用エッジイメージを取得し、取得された学習用エッジイメージで特定の物体と類似した特定のエッジ部分に関する情報を含む、少なくとも一つの学習用ガイドマップを取得するプロセス、（ｉｉｉ）学習装置が、特定の学習用特徴マップに学習用ガイドマップを反映してトレーニングイメージ内の特定の物体を検出するための学習用セグメンテーション結果を取得するプロセス、（ｉｖ）学習装置が、検出された学習用セグメンテーション結果とそれに対応する原本正解を参照して、セグメンテーションロスを算出するプロセス、及び（ｖ）学習装置が、セグメンテーションロスを利用してバックプロパゲーションを遂行して学習装置の少なくとも一つのパラメータを最適化した状態で、テスト装置がテストイメージを取得する。

その次に、テスト装置が（ｉ）テストイメージに対して少なくとも一回コンボリューション演算を適用して、少なくとも一つの特定のテスト用特徴マップを取得するプロセス、及び（ｉｉ）テストイメージから少なくとも一つのエッジ部分を抽出して、テスト用エッジイメージを取得し、取得されたテスト用エッジイメージから特定の物体と類似した特定の形態を有する少なくとも一つの特定のエッジ部分に関する情報を含む、少なくとも一つのテスト用ガイドマップを取得するプロセスを遂行する。

その後、テスト装置が特定のテスト用特徴マップにテスト用ガイドマップを反映して、テストイメージ内の特定の物体を検出するためのテスト用セグメンテーション結果を取得する。

本発明の技術分野における通常の技術者に理解され得るところとして、上記で説明されたイメージ、例えば、トレーニングイメージ及びテストイメージのようなイメージデータの送受信が学習装置及びテスト装置の各通信部により行われ得、特徴マップと演算を遂行するためのデータが学習装置及びテスト装置のプロセッサ（及び／又はメモリー）によって保有／維持され得、コンボリューション演算、デコンボリューション演算、ロス値演算の過程が主に学習装置及びテスト装置のプロセッサによって遂行され得るが、本発明がこれに限定されはしないであろう。

以上にて説明された本発明による実施例は、多様なコンピュータの構成要素を通じて遂行することができるプログラム命令語の形態で具現されて、コンピュータ読取り可能な記録媒体に格納され得る。前記コンピュータ読取り可能な記録媒体はプログラム命令語、データファイル、データ構造などを単独で又は組み合わせて含むことができる。前記コンピュータ読取り可能な記録媒体に格納されるプログラム命令語は、本発明のために特別に設計され、構成されたものであるか、コンピュータソフトウェア分野の当業者に公知にされて使用可能なものであり得る。コンピュータ読取り可能な記録媒体の例には、ハードディスク、フロッピーディスク及び磁気テープのような磁気媒体、ＣＤ−ＲＯＭ、ＤＶＤのような光記録媒体、フロプティカル・ディスク（ｆｌｏｐｔｉｃａｌｄｉｓｋ）のような磁気−光メディア（ｍａｇｎｅｔｏ−ｏｐｔｉｃａｌｍｅｄｉａ）、及びＲＯＭ、ＲＡＭ、フラッシュメモリなどのようなプログラム命令語を格納して遂行するように特別に構成されたハードウェア装置が含まれる。プログラム命令語の例には、コンパイラによって作られるもののような機械語コードだけでなく、インタープリターなどを使用してコンピュータによって実行される高級言語コードも含まれる。前記ハードウェア装置は、本発明による処理を実行するために一つ以上のソフトウェアモジュールとして作動するように構成され得、その反対も同様である。

以上にて本発明が具体的な構成要素などのような特定事項と限定された実施例及び図面によって説明されたが、これは本発明のより全般的な理解の一助とするために提供されたものであるに過ぎず、本発明が前記実施例に限定されるものではなく、本発明が属する技術分野において通常の知識を有する者であれば、係る記載から多様な修正及び変形が行われ得る。

従って、本発明の思想は、前記説明された実施例に局限されて定められてはならず、後述する特許請求の範囲だけでなく、本特許請求の範囲と均等または等価的に変形されたものすべては、本発明の思想の範囲に属するといえる。

Claims

ＣＮＮ基盤の特定の物体検出のための方法において、
（ａ）入力イメージが取得されると、学習装置が、（ｉ）前記入力イメージに対して少なくとも一回コンボリューション演算を適用して少なくとも一つの特定の特徴マップを取得するプロセス、及び（ｉｉ）前記入力イメージから少なくとも一つのエッジ部分を抽出してエッジイメージを取得し、前記取得されたエッジイメージにおいて前記特定の物体と類似した特定の形態を有する少なくとも一つの特定のエッジ部分に関する情報を含む、少なくとも一つのガイドマップを取得するプロセスを遂行する段階；及び
（ｂ）前記学習装置が、前記特定の特徴マップに前記ガイドマップを反映して前記入力イメージ内の前記特定の物体を検出するためのセグメンテーション結果を取得する段階；
を含むことを特徴とする学習方法。
前記エッジイメージは、前記入力イメージから特定の閾値以下の周波数成分を除去して取得されることを特徴とする請求項１に記載の学習方法。
前記エッジイメージは、前記入力イメージピクセルのグラディエントを算出した後、前記入力イメージの前記ピクセルのうち設定済み閾値以上のグラディエントを有する少なくとも一つのピクセルを抽出して生成されたキャニーエッジイメージであることを特徴とする請求項１に記載の学習方法。
前記ガイドマップは、前記特定の物体と類似した前記特定の形態に第１重み付け値を与え、前記特定の物体と類似した前記特定の形態以外の少なくとも一つの形態には第２重み付け値を付与して取得され、
前記第１重み付け値が前記第２重み付け値より大きいことを特徴とする請求項１に記載の学習方法。
前記ガイドマップは、前記エッジイメージに対して膨張演算またはモルフォロジー演算を少なくとも一回適用して、前記特定のエッジ部分を広くして生成されることを特徴とする請求項１に記載の方法。
前記（ｂ）段階で、
前記学習装置は、前記ガイドマップと前記特定の特徴マップとをピクセルごとに掛け合わせて少なくとも一つのエッジ強化された特徴マップを生成することを特徴とする請求項１に記載の方法。
前記（ｂ）段階は、
（ｂ１）前記特定の特徴マップが複数個ある状態で、前記学習装置が、前記特定の特徴マップそれぞれのサイズがリサイズされたガイドマップそれぞれのサイズと同じであるように少なくとも一つの前記リサイズされたガイドマップを生成するために前記ガイドマップの大きさを調整する段階；及び（ｂ２）前記学習装置が、前記ガイドマップと、これに対応する特定の特徴マップとをピクセルごとに掛け合わせ、前記リサイズされたガイドマップと、これに対応する特定の特徴マップとをピクセルごとに掛け合わせて、複数のエッジ強化された特徴マップを生成する段階；
を含むことを特徴とする請求項１に記載の方法。
前記（ｂ）段階で、
前記ガイドマップが反映された前記特定の特徴マップは、前記学習装置のエンコードレイヤから取得した少なくとも一つの特徴マップ、及び前記学習装置のデコードレイヤから取得された少なくとも一つの特徴マップのうちいずれか一つに選択されることを特徴とする請求項１に記載の方法。
前記特定の物体は、道路の少なくとも一つの車線であることを特徴とする請求項１に記載の学習方法。
（ｃ）前記学習装置が、前記セグメンテーション結果とそれに対応する原本正解を参照してセグメンテーションロスを算出する段階及び、
（ｄ）前記学習装置が、前記セグメンテーションロスを利用してバックプロパゲーションを遂行して前記学習装置の少なくとも一つのパラメータを最適化する段階；
をさらに含むことを特徴とする請求項１に記載の学習方法。
ＣＮＮ基盤イメージに含まれた少なくとも一つの特定の物体を検出するためのテスト方法において、
（ａ）（ｉ）学習装置が、トレーニングイメージに対して少なくとも一回コンボリューション演算を適用して、少なくとも一つの特定の学習用特徴マップを取得するプロセス、（ｉｉ）前記学習装置が、前記トレーニングイメージから少なくとも一つのエッジ部分を抽出して学習用エッジイメージを取得し、前記取得された学習用エッジイメージで前記特定の物体と類似した特定の形態を有する特定の学習用エッジ部分に関する情報を含む少なくとも一つの学習用ガイドマップを取得するプロセス、（ｉｉｉ）前記学習装置が、前記特定の学習用特徴マップに前記学習用ガイドマップを反映して、前記トレーニングイメージ内の前記特定の物体を検出するための学習用セグメンテーション結果を取得するプロセス、（ｉｖ）前記学習装置が、前記検出された学習用セグメンテーション結果とそれに対応する原本正解を参照してセグメンテーションロスを算出するプロセス、及び（ｖ）前記学習装置が、前記セグメンテーションロスを利用してバックプロパゲーションを遂行して前記学習装置の少なくとも一つのパラメータを最適化した状態で、テスト装置がテストイメージを取得する段階；
（ｂ）前記テスト装置が、（ｉ）前記テストイメージに対して、少なくとも一回コンボリューション演算を適用して少なくとも一つの特定のテスト用特徴マップを取得するプロセス、及び（ｉｉ）前記テストイメージから少なくとも一つのエッジ部分を抽出してテスト用エッジイメージを取得し、前記取得されたテスト用エッジイメージにおいて前記特定の物体と類似した特定の形態を有する少なくとも一つの特定のテスト用エッジ部分に関する情報を含む、少なくとも一つのテスト用ガイドマップを取得するプロセスを遂行する段階；及び
（ｃ）前記テスト装置が、前記特定のテスト用特徴マップに前記テスト用ガイドマップを反映して、前記テストイメージ内の前記特定の物体を検出するためのテスト用セグメンテーション結果を取得する段階；
を含むことを特徴とするテスト方法。
前記テスト用エッジイメージは、前記テストイメージから特定の閾値以下の周波数成分を除去して取得されることを特徴とする請求項１１に記載のテスト方法。
前記テスト用エッジイメージは、前記テストイメージピクセルのグラディエントを算出した後、前記テストイメージの前記ピクセルのうち設定済み閾値以上のグラディエントを有する少なくとも一つのピクセルを抽出して生成されたキャニーエッジイメージであることを特徴とする請求項１１に記載のテスト方法。
前記テスト用ガイドマップは、前記特定の物体と類似した前記特定の形態に第１重み付け値を与え、前記特定の物体と類似した前記特定の形態以外の少なくとも一つの形態には第２重み付け値を付与して取得され、
前記第１重み付け値が前記第２重み付け値よりも大きく、
前記テスト用ガイドマップは、前記テスト用エッジイメージに対して膨張演算またはモルフォロジー演算を少なくとも一回適用して、前記特定のテスト用エッジ部分を広くして生成されることを特徴とする請求項１１に記載の方法。
前記（ｃ）段階は、
（ｃ１）前記特定のテスト用特徴マップが複数個ある状態で、前記テスト装置が、前記特定のテスト用特徴マップそれぞれのサイズがリサイズされたテスト用ガイドマップそれぞれのサイズと同じであるように少なくとも一つの前記リサイズされたテスト用ガイドマップを生成するために前記テスト用ガイドマップの大きさを調整する段階；及び
（ｃ２）前記テスト装置が、前記テスト用ガイドマップと、これに対応する特定のテスト用特徴マップとをピクセルごとに掛け合わせ、前記リサイズされたテスト用ガイドマップと、これに対応する特定のテスト用特徴マップとをピクセルごとに掛け合わせて、複数のテスト用エッジ強化された特徴マップを生成する段階；
を含むことを特徴とする請求項１１に記載の方法。
ＣＮＮ基盤の特定の物体検出のための学習装置において、
トレーニングイメージとしての入力イメージを取得するための通信部；及び
（Ｉ）前記入力イメージに対して、少なくとも一回コンボリューション演算を適用して、少なくとも一つの特定の特徴マップを取得するプロセス、（ＩＩ）前記入力イメージから少なくとも一つのエッジ部分を抽出してエッジイメージを取得し、前記取得されたエッジイメージにおいて前記特定の物体と類似した特定の形態を有する少なくとも一つの特定のエッジ部分に関する情報を含む、少なくとも一つのガイドマップを取得するプロセスを遂行するプロセス、及び（ＩＩＩ）前記特定の特徴マップに前記ガイドマップを反映して、前記入力イメージ内の前記特定の物体を検出するためのセグメンテーション結果を取得するプロセスを遂行するプロセッサ；
を含むことを特徴とする学習装置。
前記エッジイメージは、前記入力イメージにおいて特定の閾値以下の周波数成分を除去して取得されることを特徴とする請求項１６に記載の学習装置。
前記エッジイメージは、前記入力イメージピクセルのグラディエントを算出した後、前記入力イメージの前記ピクセルのうち設定済み閾値以上のグラディエントを有する少なくとも一つのピクセルを抽出して生成されたキャニーエッジイメージであることを特徴とする請求項１６に記載の学習装置。
前記ガイドマップは、前記特定の物体と類似した前記特定の形態に第１重み付け値を与え、前記特定の物体と類似した前記特定の形態以外の少なくとも一つの形態には第２重み付け値を付与して取得され、
前記第１重み付け値が、前記第２重み付け値より大きいことを特徴とする請求項１６に記載の学習装置。
前記ガイドマップは、前記エッジイメージに対して膨張演算またはモルフォロジー演算を少なくとも一回適用して、前記特定のエッジ部分を広くして生成されることを特徴とする請求項１６に記載の学習装置。
前記（ＩＩＩ）プロセスで、
前記プロセッサは、前記ガイドマップと前記特定の特徴マップとをピクセルごとに掛け合わせて少なくとも一つのエッジ強化された特徴マップを生成することを特徴とする請求項１６に記載の装置。
前記（ＩＩＩ）プロセスで、
（ＩＩＩ−１）前記特定の特徴マップが複数個ある状態で、前記特定の特徴マップそれぞれのサイズがリサイズされたガイドマップそれぞれのサイズと同じであるように少なくとも一つの前記リサイズされたガイドマップを生成するために、前記ガイドマップの大きさを調整するプロセス；及び
（ＩＩＩ−２）前記ガイドマップと、これに対応する特定の特徴マップとをピクセルごとに掛け合わせ、前記リサイズされたガイドマップと、これに対応する特定の特徴マップとをピクセルごとに掛け合わせて、複数のエッジ強化された特徴マップを生成するプロセス；
を含むことを特徴とする請求項２１に記載の装置。
前記（ＩＩＩ）プロセスで、
前記ガイドマップが反映された前記特定の特徴マップは、そのエンコードレイヤから取得した少なくとも一つの特徴マップ、及び前記学習装置のデコードレイヤから取得された少なくとも一つの特徴マップのうちいずれか一つに選択されることを特徴とする請求項１６に記載の装置。
前記特定の物体は、道路の少なくとも一つの車線であることを特徴とする請求項１６に記載の学習装置。
前記プロセッサは、
（ＩＶ）前記セグメンテーション結果とそれに対応する原本正解を参照してセグメンテーションロスを算出するプロセス；及び
（Ｖ）前記セグメンテーションロスを利用してバックプロパゲーションを遂行して、その少なくとも一つのパラメータを最適化するプロセス；
をさらに遂行することを特徴とする請求項１６に記載の学習装置。
ＣＮＮ基盤イメージに含まれた少なくとも一つの特定の物体を検出するためのテスト装置において、
（ｉ）学習装置が、トレーニングイメージに対して少なくとも一回コンボリューション演算を適用して、少なくとも一つの特定の学習用特徴マップを取得するプロセス、（ｉｉ）前記学習装置が、前記トレーニングイメージから少なくとも一つのエッジ部分を抽出して学習用エッジイメージを取得し、前記取得された学習用エッジイメージにおいて前記特定の物体と類似した特定の形態を有する特定の学習用エッジ部分に関する情報を含む、少なくとも一つの学習用ガイドマップを取得するプロセス、（ｉｉｉ）前記学習装置が、前記特定の学習用特徴マップに前記学習用ガイドマップを反映して前記トレーニングイメージ内の前記特定の物体を検出するための学習用セグメンテーション結果を取得するプロセス、（ｉｖ）前記学習装置が、前記検出された学習用セグメンテーション結果とそれに対応する原本正解を参照してセグメンテーションロスを算出するプロセス、及び（ｖ）前記学習装置が、前記セグメンテーションロスを利用してバックプロパゲーションを遂行して前記学習装置の少なくとも一つのパラメータを最適化した状態で、テストイメージを取得する通信部；及び
（Ｉ）前記テストイメージに対して少なくとも一回コンボリューション演算を適用して少なくとも一つの特定のテスト用特徴マップを取得し、前記テストイメージから少なくとも一つのエッジ部分を抽出してテスト用エッジイメージを取得し、前記取得されたテスト用エッジイメージで前記特定の物体と類似した特定の形態を有する少なくとも一つの特定のテスト用エッジ部分に関する情報を含む、少なくとも一つのテスト用ガイドマップを取得するプロセス、及び（ＩＩ）前記特定のテスト用特徴マップに前記テスト用ガイドマップを反映して前記テストイメージ内の前記特定の物体を検出するためのテスト用セグメンテーション結果を取得するプロセスを遂行するプロセッサ；
を含むことを特徴とするテスト装置。
前記テスト用エッジイメージは、前記テストイメージから特定の閾値以下の周波数成分を除去して取得されることを特徴とする請求項２６に記載のテスト装置。
前記テスト用エッジイメージは、前記テストイメージピクセルのグラディエントを算出した後、前記テストイメージの前記ピクセルのうち設定済み閾値以上のグラディエントを有する少なくとも一つのピクセルを抽出して生成されたキャニーエッジイメージであることを特徴とする請求項２６に記載のテスト装置。
前記テスト用ガイドマップは、前記特定の物体と類似した前記特定の形態に第１重み付け値を付与し、前記特定の物体と類似した前記特定の形態以外の少なくとも一つの形態には第２重み付け値を付与して取得され、
前記第１重み付け値が前記第２重み付け値よりも大きく、
前記テスト用ガイドマップは、前記テスト用エッジイメージに対して膨張演算またはモルフォロジー演算を少なくとも一回適用して、前記特定のテスト用エッジ部分を広くして生成されることを特徴とする請求項２６に記載の装置。
前記（ＩＩ）プロセスは、
（ＩＩ−１）前記特定のテスト用特徴マップが複数個ある状態で、前記特定のテスト用特徴マップそれぞれのサイズがリサイズされたテスト用ガイドマップそれぞれのサイズと同じであるように少なくとも一つの前記リサイズされたテスト用ガイドマップを生成するために前記テスト用ガイドマップの大きさを調整するプロセス；及び
（ＩＩ−２）前記テスト用ガイドマップと、これに対応する特定のテスト用特徴マップとをピクセルごとに掛け合わせ、前記リサイズされたテスト用ガイドマップと、これに対応する特定のテスト用特徴マップとをピクセルごとに掛け合わせて、複数のテスト用エッジ強化された特徴マップを生成するプロセス；
を含むことを特徴とする請求項２６に記載の装置。