JP6856851B2

JP6856851B2 - イメージエンコーディングのための方法及び装置そしてこれを利用したテスト方法及びテスト装置

Info

Publication number: JP6856851B2
Application number: JP2019163898A
Authority: JP
Inventors: 桂賢金; 鎔重金; 寅洙金; 鶴京金; 雲鉉南; 碩▲ふん▼ 夫; 明哲成; 東勳呂; 宇宙柳; 泰雄張; 景中鄭; 泓模諸; 浩辰趙
Original assignee: Stradvision Inc
Current assignee: Stradvision Inc
Priority date: 2018-09-17
Filing date: 2019-09-09
Publication date: 2021-04-14
Anticipated expiration: 2039-09-09
Also published as: US10282864B1; KR20200031993A; CN110910395A; CN110910395B; EP3624016A1; KR102309702B1; JP2020047271A

Description

本発明は、ＣＮＮ基盤イメージエンコーディング方法に関し、具体的には；前記ＣＮＮ基盤イメージエンコーディング方法において、（ａ）第１ないし第ｎコンボリューションレイヤを含む学習装置が、少なくとも一つの入力イメージを獲得する段階；（ｂ）前記コンボリューションレイヤの少なくとも一部各々をもって、（ｉ）前記入力イメージまたは以前コンボリューションレイヤから獲得された入力特徴マップに対して、転置コンボリューション演算（ＴｒａｎｓｐｏｓｅｄＣｏｎｖｏｌｕｔｉｏｎＯｐｅｒａｔｉｏｎ）を少なくとも一度適用して各々異なるサイズを有する少なくとも一つの転置特徴マップを生成し、（ｉｉ）異なるストライド（Ｓｔｒｉｄｅ）と異なるカーネルサイズとを有するコンボリューション演算を、これに対応される各々の転置特徴マップに少なくとも一度適用して、少なくとも一つのインセプション（Ｉｎｃｅｐｔｉｏｎ）特徴マップを第１グループとして生成する段階；及び（ｃ）前記学習装置が、前記第１グループに含まれた前記インセプション特徴マップをコンカチネートするか、要素ごとの加算（Ｅｌｅｍｅｎｔ−ＷｉｓｅＡｄｄｉｎｇ）をして、これに対応する出力特徴マップを生成する段階；を含むことを特徴とする学習方法及び学習装置そしてこれを利用したテスト方法及びテスト装置に関する。

ディープラーニング（ＤｅｅｐＬｅａｒｎｉｎｇ）は、モノやデータを群集化・分類するのに用いられる技術である。例えば、コンピュータは写真だけで犬と猫を区別することができない。しかし、人はとても簡単に区別できる。このため「機械学習（ＭａｃｈｉｎｅＬｅａｒｎｉｎｇ）」という方法が考案された。多くのデータをコンピュータに入力し、類似したものを分類するようにする技術である。保存されている犬の写真と似たような写真が入力されると、これを犬の写真だとコンピュータが分類するようにしたのである。

データをどのように分類するかをめぐり、すでに多くの機械学習アルゴリズムが登場した。「決定木」や「ベイジアンネットワーク」「サポートベクターマシン（ＳＶＭ）」「人工神経網」などが代表的だ。このうち、ディープラーニングは人工神経網の後裔だ。

ディープコンボリューションニューラルネットワーク（ＤｅｅｐＣｏｎｖｏｌｕｔｉｏｎＮｅｕｒａｌＮｅｔｗｏｒｋｓ；ＤｅｅｐＣＮＮ）は、ディープラーニング分野で起きた驚くべき発展の核心である。ＣＮＮは、文字の認識問題を解くために９０年代にすでに使われたが、現在のように広く使われるようになったのは最近の研究結果のおかげだ。このようなディープＣＮＮは２０１２年ＩｍａｇｅＮｅｔイメージ分類コンテストで他の競争相手に勝って優勝を収めた。そして、コンボリューションニューラルネットワークは機械学習分野で非常に有用なツールとなった。

図１は、一般的なＣＮＮセグメンテーションプロセスを簡略的に示した図面である。

図１を参照すれば、従来の車線検出方法では、学習装置が、入力イメージの入力を受けて、複数のコンボリューションレイヤでコンボリューション演算やＲｅＬＵなどの非線形演算を複数回遂行してエンコード済み特徴マップを獲得し、最後の特徴マップに対して、複数のデコンボリューションレイヤでデコンボリューション演算とソフトマックス演算を複数回遂行してセグメンテーション結果を得る。

図２ａ及び図２ｂは、従来のインセプション方法でイメージをエンコーディングするためのコンボリューションレイヤの多様な構成を各々示す。

図２ａに示した従来のインセプション方法は、多様なカーネルサイズ、例えば、１×１、３×３、５×５又はこれらの組合のカーネルサイズを有するコンボリューションユニットを通じて以前レイヤから送られた入力特徴マップに対してコンボリューション演算を遂行した上で、コンボリューション演算がされた様々な特徴マップをコンカチネートする。このような方法で、一つのスケール（Ｓｃａｌｅ）から様々なレセプティブフィールド（ＲｅｃｅｐｔｉｖｅＦｉｅｌｄ）を考慮する中間（Ｉｎｔｅｒｍｅｄｉａｔｅ）特徴マップ、すなわちインセプション特徴マップを得ることができた。

図２ｂに示した従来のインセプション方法は、演算量を減らすために１×１コンボリューションフィルタを利用してチャネル数を減らすプロセスを追加した。

前記のようなインセプション概念を利用した従来のイメージエンコーディング方法は、特徴マップをコンボリューション演算する際、様々なカーネルサイズで様々なレセプティブフィールドを考慮し得るが、従来の方法では、１×１以上のカーネルサイズのみを考慮し得るという問題があったため、イメージの多様な特徴をすべて考慮することができなかった。従って、より多様なカーネルサイズを考慮して、より多様な特性を有する特徴を抽出し得る新しい方法の提示が求められている。

本発明は、前述した問題点を全て解決することを目的とする。

本発明は、入力特徴マップに対して適用される１×１より小さなカーネルサイズを考慮できる新しいイメージのエンコーディング方法を提供することを他の目的とする。

本発明は、入力特徴マップにおいて従来の方法よりも多様な特性が得られる新しいイメージエンコーディング方法を提供することをまた他の目的とする。

本発明の一態様によれば、ＣＮＮ基盤イメージエンコーディング方法において、（ａ）第１ないし第ｎコンボリューションレイヤを含む学習装置が、少なくとも一つの入力イメージを獲得する段階；（ｂ）前記学習装置が、前記コンボリューションレイヤの少なくとも一部各々をもって、（ｉ）前記入力イメージまたは以前コンボリューションレイヤから獲得された入力特徴マップに対して、転置コンボリューション演算を少なくとも一度適用して各々異なるサイズを有する少なくとも一つの転置特徴マップを生成し、（ｉｉ）異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を、これに対応される各々の転置特徴マップに少なくとも一度適用して、少なくとも一つのインセプション特徴マップを第１グループとして生成する段階；及び（ｃ）前記学習装置が、前記第１グループに含まれた前記インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、これに対応する出力特徴マップを生成する段階；を含むことを特徴とする。

一例として、前記第１グループに含まれた前記インセプション特徴マップはサイズが同一だが、各々互いに異なる特性を有することを特徴とする。

一例として、少なくとも一つの前記コンボリューションレイヤが第ｋコンボリューションレイヤである場合、前記（ｂ）段階は、（ｂ−１）前記学習装置が、前記第ｋコンボリューションレイヤをもって、前記入力イメージまたは第ｋ−１コンボリューションレイヤで獲得した第ｋ−１特徴マップに対して、第１ないし第ｍ転置コンボリューション演算（ｍは、２以上の自然数）を適用するようにし、第１ないし第ｍサイズを有する第１ないし第ｍ転置特徴マップを生成する段階；（ｂ−２）前記学習装置が、（ｉ）前記第ｋ−１特徴マップのサイズと前記第１ないし前記第ｍ転置特徴マップ各々のサイズの比率を各々参照にして第１ないし第ｍストライドのサイズを決定して、（ｉｉ）前記第１ないし前記第ｍ転置特徴マップに対して、前記第１ないし前記第ｍストライドサイズ及び第１ないし第ｍカーネルサイズを有する第１ないし第ｍコンボリューションフィルタを各々適用し、第１ないし第ｍインセプション特徴マップを前記第１グループとして生成する段階；（ｂ−２）前記学習装置が、（ｉ）前記第ｋ−１特徴マップのサイズと前記第１ないし前記第ｍ転置特徴マップ各々のサイズの比率を各々参照にして第１ないし第ｍストライドサイズを決定して、（ｉｉ）前記第１ないし前記第ｍ転置特徴マップに対して、前記第１ないし前記第ｍストライドサイズ及び第１ないし第ｍカーネルサイズを有する第１ないし第ｍコンボリューションフィルタを各々適用し、第１ないし第ｍインセプション特徴マップを前記第１グループとして生成する段階；を含むことを特徴とする。

一例として、前記（ｂ）段階で、前記学習装置は、前記入力イメージまたは以前コンボリューションレイヤから獲得した前記入力特徴マップに対して、前記コンボリューション演算を適用して少なくとも一つのインセプション特徴マップを第２グループとして生成し、前記（ｃ）段階で、前記学習装置は、前記第１グループの前記インセプション特徴マップ及び前記第２グループの前記インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、前記出力特徴マップを生成することを特徴とする。

一例として、少なくとも一つの前記コンボリューションレイヤが第ｋコンボリューションレイヤである場合、前記（ｂ）段階は、（ｂ−１）前記学習装置が、前記第ｋコンボリューションレイヤをもって、前記入力イメージまたは第ｋ−１コンボリューションレイヤから獲得した第ｋ−１特徴マップに対して、第１ないし第ｍ転置コンボリューション演算（ｍは２以上の自然数）を適用するようにして、第１ないし第ｍサイズを有する第１ないし第ｍ転置特徴マップを生成する段階；（ｂ−２）前記学習装置が、（ｉ）前記第ｋ−１特徴マップのサイズと前記第１ないし前記第ｍ転置特徴マップ各々のサイズの割合を各々参照にして第１ないし第ｍストライドのサイズを決定して、（ｉｉ）前記第１ないし前記第ｍ転置特徴マップに対し、前記第１ないし前記第ｍストライドサイズ及び第１ないし第ｍカーネルサイズを有する第１ないし第ｍコンボリューションフィルタを各々適用して、第１ないし第ｍインセプション特徴マップを前記第１グループとして生成する段階；及び（ｂ−３）前記学習装置が、前記入力イメージまたは前記第ｋ−１コンボリューションレイヤから獲得した前記第ｋ−１特徴マップに対して、第ｍ＋１ないし第ｍ＋ｎカーネルサイズを有する第ｍ＋１ないし第ｍ＋ｎコンボリューションフィルタを適用して、第ｍ＋１ないし第ｍ＋ｎインセプション特徴マップを前記第２グループとして生成する段階；を含むことを特徴とする。

一例として、前記（ｂ）段階で、前記学習装置は、前記入力イメージまたは以前コンボリューションレイヤから獲得した前記入力特徴マップに対して、互いに異なるサイズのマックスプーリング（ＭａｘＰｏｏｌｉｎｇ）演算を少なくとも一度適用し、少なくとも一つのマックスプーリング特徴マップを第３グループとして生成し、前記（ｃ）段階で、前記学習装置は、前記第１グループの前記インセプション特徴マップ、前記第２グループの前記インセプション特徴マップ及び前記第３グループの前記マックスプーリング特徴マップをコンカチネートするか、要素ごとの加算をして、前記出力特徴マップを生成することを特徴とする。

一例として、前記（ｂ）段階で、前記学習装置は、前記第１コンボリューションレイヤをもって（ｉ）前記入力イメージに対して転置コンボリューション演算を少なくとも一度適用し、各々異なるサイズを有する少なくとも一つの転置特徴マップを生成し、（ｉｉ）異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を、これに対応される各々の転置特徴マップに少なくとも一度適用し、少なくとも一つのインセプション特徴マップを前記第１グループとして生成することを特徴とする。

一例として、前記方法は、（ｄ）前記学習装置が、前記第ｎコンボリューションレイヤから出力された前記出力特徴マップを基にＣＮＮ出力を獲得し、前記ＣＮＮ出力とこれに対応する原本正解（Ｇｒｏｕｎｄｔｒｕｔｈ）を参照に獲得したセグメンテーションロスのバックプロパゲーションを遂行する段階；をさらに含むことを特徴とする。

本発明の他の態様によれば、ＣＮＮ基盤イメージエンコーディング方法において、（ａ）（ｉ）第１ないし第ｎコンボリューションレイヤを含む学習装置が、前記コンボリューションレイヤの少なくとも一部各々をもって、入力イメージまたは以前コンボリューションレイヤから獲得された学習用入力特徴マップに対して、転置コンボリューション演算を少なくとも一度適用して各々異なるサイズを有する少なくとも一つの学習用転置特徴マップを生成するプロセス、（ｉｉ）前記学習装置が、前記学習用転置特徴マップに対し、これに対応して異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を少なくとも一度適用して、少なくとも一つの学習用インセプション特徴マップを学習用第１グループとして生成するプロセス、（ｉｉｉ）前記学習装置が、前記学習用第１グループに含まれた前記学習用インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、これに対応する学習用出力特徴マップを生成するプロセス及び（ｉｖ）前記学習装置が、前記学習用出力特徴マップを基に学習用ＣＮＮ出力を獲得し、前記学習用ＣＮＮ出力とこれに対応する原本正解を参照に獲得したセグメンテーションロスのバックプロパゲーション（Ｂａｃｋｐｒｏｐａｇａｔｉｏｎ）を遂行するプロセスを遂行した状態で、テスト装置が、少なくとも一つのテストイメージを獲得する段階；（ｂ）前記テスト装置が、前記コンボリューションレイヤの少なくとも一部各々をもって、（ｉ）前記テストイメージまたは以前コンボリューションレイヤから獲得されたテスト用入力特徴マップに対して、前記転置コンボリューション演算を少なくとも一度適用して各々異なるサイズを有する少なくとも一つのテスト用転置特徴マップを生成し、（ｉｉ）前記テスト用転置特徴マップ対し、これに対応して異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を少なくとも一度適用して、少なくとの一つのテスト用インセプション特徴マップをテスト用第１グループとして生成する段階；及び（ｃ）前記テスト装置が、前記テスト用第１グループに含まれた前記テスト用インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、これに対応するテスト用出力特徴マップを生成する段階；を含むことを特徴とする。

一例として、前記テスト用第１グループに含まれた前記テスト用インセプション特徴マップはサイズが同一だが、各々互いに異なる特性を有することを特徴とする。

一例として、少なくとも一つの前記コンボリューションレイヤが第ｋコンボリューションレイヤである場合、前記（ｂ）段階は、（ｂ−１）前記テスト装置が、前記第ｋコンボリューションレイヤをもって、前記テストイメージまたは第ｋ−１コンボリューションレイヤで獲得したテスト第ｋ−１特徴マップに対して、第１ないし第ｍ転置コンボリューション演算（ｍは、２以上の自然数）を適用するようにし、第１ないし第ｍサイズを有するテスト用第１ないし第ｍ転置特徴マップを生成する段階；（ｂ−２）前記テスト装置が、（ｉ）前記テスト用第ｋ−１特徴マップのサイズと前記テスト用第１ないし前記テスト用第ｍ転置特徴マップ各々のサイズの比率を各々参照にして第１ないし第ｍストライドのサイズを決定して、（ｉｉ）前記テスト用第１ないし前記テスト用第ｍ転置特徴マップに対して、前記第１ないし前記第ｍストライドサイズ及び第１ないし第ｍカーネルサイズを有する第１ないし第ｍコンボリューションフィルタを各々適用し、テスト用第１ないしテスト用第ｍインセプション特徴マップを前記テスト用第１グループとして生成する段階；を含むことを特徴とする。

一例として、前記（ｂ）段階で、前記テスト装置は、前記テストイメージまたは以前コンボリューションレイヤから獲得した前記テスト用入力特徴マップに対して、前記コンボリューション演算を適用して少なくとも一つのインセプション特徴マップをテスト用第２グループとして生成し、前記（ｃ）段階で、前記テスト装置は、前記テスト用第１グループの前記テスト用インセプション特徴マップ及び前記テスト用第２グループの前記テスト用インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、前記テスト用出力特徴マップを生成することを特徴とする。

一例として、少なくとも一つの前記コンボリューションレイヤが第ｋコンボリューションレイヤである場合、前記（ｂ）段階は、（ｂ−１）前記テスト装置が、前記第ｋコンボリューションレイヤをもって、前記テストイメージまたは第ｋ−１コンボリューションレイヤから獲得したテスト用第ｋ−１特徴マップに対して、第１ないし第ｍ転置コンボリューション演算（ｍは２以上の自然数）を適用するようにして、第１ないし第ｍサイズを有するテスト用第１ないしテスト用第ｍ転置特徴マップを生成する段階；（ｂ−２）前記テスト装置が、（ｉ）前記テスト用第ｋ−１特徴マップのサイズと前記テスト用第１ないし前記テスト用第ｍ転置特徴マップ各々のサイズの割合を各々参照にして第１ないし第ｍストライドのサイズを決定し、（ｉｉ）前記テスト用第１ないし前記テスト用第ｍ転置特徴マップに対して、前記第１ないし前記第ｍストライドサイズ及び第１ないし第ｍカーネルサイズを有する第１ないし第ｍコンボリューションフィルタを各々適用して、テスト用第１ないしテスト用第ｍインセプション特徴マップを前記テスト用第１グループとして生成する段階；及び（ｂ−３）前記テスト装置が、前記テストイメージまたは前記第ｋ−１コンボリューションレイヤから獲得した前記テスト用第ｋ−１特徴マップに対して、第ｍ＋１ないし第ｍ＋ｎカーネルサイズを有する第ｍ＋１ないし第ｍ＋ｎコンボリューションフィルタを適用して、テスト用第ｍ＋１ないしテスト用第ｍ＋ｎインセプション特徴マップを前記テスト用第２グループとして生成する段階；を含むことを特徴とする。

一例として、前記（ｂ）段階で、前記テスト装置は、前記テストイメージまたは以前コンボリューションレイヤから獲得した前記テスト用特徴マップに対して、互いに異なるサイズのマックスプーリング（ＭａｘＰｏｏｌｉｎｇ）演算を少なくとも一度適用し、少なくとも一つのテスト用マックスプーリング特徴マップをテスト用第３グループとして生成し、前記（ｃ）段階で、前記テスト装置は、前記テスト用第１グループの前記テスト用インセプション特徴マップ、前記テスト用第２グループの前記テスト用インセプション特徴マップ及び前記テスト用第３グループの前記テスト用マックスプーリング特徴マップをコンカチネートするか、要素ごとの加算をして、前記テスト用出力特徴マップを生成することを特徴とする。

本発明のまた他の態様によれば、第１ないし第ｎコンボリューションレイヤを含む、ＣＮＮ基盤イメージエンコーディングのための学習装置において、少なくとも一つのトレーニングイメージを入力イメージとして獲得するための通信部；及び（Ｉ）前記コンボリューションレイヤの少なくとも一部各々をもって、（ｉ）入力イメージまたは以前コンボリューションレイヤから獲得された入力特徴マップに対して、転置コンボリューション演算を少なくとも一度適用して各々異なるサイズを有する少なくとも一つの転置特徴マップを生成し、（ｉｉ）異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を、これに対応する各々の転置特徴マップに少なくとも一度適用して、少なくとも一つのインセプション特徴マップを第１グループとして生成するプロセス、及び、（ＩＩ）前記第１グループに含まれた前記インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、これに対応する出力特徴マップを生成するプロセスを遂行するプロセッサ；を含むことを特徴とする。

一例として、少なくとも一つの前記コンボリューションレイヤが第ｋコンボリューションレイヤである場合、前記（Ｉ）プロセスは、（Ｉ−１）前記第ｋコンボリューションレイヤをもって、前記入力イメージまたは第ｋ−１コンボリューションレイヤで獲得した第ｋ−１特徴マップに対して、第１ないし第ｍ転置コンボリューション演算（ｍは、２以上の自然数）を適用するようにし、第１ないし第ｍサイズを有する第１ないし第ｍ転置特徴マップを生成するプロセス；（Ｉ−２）（ｉ）前記第ｋ−１特徴マップのサイズと前記第１ないし前記第ｍ転置特徴マップ各々のサイズの割合を各々参照にして第１ないし第ｍストライドのサイズを決定し、（ｉｉ）前記第１ないし前記第ｍ転置特徴マップに対して、前記第１ないし前記第ｍストライドサイズ及び第１ないし第ｍカーネルサイズを有する第１ないし第ｍコンボリューションフィルタを各々適用して、第１ないし第ｍインセプション特徴マップを前記第１グループとして生成するプロセス；を含むことを特徴とする。

一例として、前記（Ｉ）プロセスで、前記プロセッサは、前記入力イメージまたは以前コンボリューションレイヤから獲得した前記入力特徴マップに対して、前記コンボリューション演算を適用して少なくとも一つのインセプション特徴マップを第２グループとして生成し、前記（ＩＩ）プロセスで、前記プロセッサは、前記第１グループの前記インセプション特徴マップ及び前記第２グループの前記インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、前記出力特徴マップを生成することを特徴とする。

一例として、少なくとも一つの前記コンボリューションレイヤが第ｋコンボリューションレイヤである場合、
前記（Ｉ）プロセスは、（Ｉ−１）前記第ｋコンボリューションレイヤをもって、前記入力イメージまたは第ｋ−１コンボリューションレイヤから獲得した第ｋ−１特徴マップに対して、第１ないし第ｍ転置コンボリューション演算（ｍは２以上の自然数）を適用するようにして、第１ないし第ｍサイズを有する第１ないし第ｍ転置特徴マップを生成するプロセス；（Ｉ−２）（ｉ）前記第ｋ−１特徴マップのサイズと前記第１ないし前記第ｍ転置特徴マップ各々のサイズの割合を各々参照にして第１ないし第ｍストライドのサイズを決定し、（ｉｉ）前記第１ないし前記第ｍ転置特徴マップに対して、前記第１ないし前記第ｍストライドサイズ及び第１ないし第ｍカーネルサイズを有する第１ないし第ｍコンボリューションフィルタを各々適用して、第１ないし第ｍインセプション特徴マップを前記第１グループとして生成するプロセス；及び（Ｉ−３）前記入力イメージまたは前記第ｋ−１コンボリューションレイヤから獲得した前記第ｋ−１特徴マップに対して、第ｍ＋１ないし第ｍ＋ｎカーネルサイズを有する第ｍ＋１ないし第ｍ＋ｎコンボリューションフィルタを適用して、第ｍ＋１ないし第ｍ＋ｎインセプション特徴マップを前記第２グループとして生成するプロセス；を含むことを特徴とする。

一例として、前記（I）プロセスで、前記プロセッサは、前記入力イメージまたは以前コンボリューションレイヤから獲得した前記入力特徴マップに対して、互いに異なるサイズのマックスプーリング（ＭａｘＰｏｏｌｉｎｇ）演算を少なくとも一度適用し、少なくとも一つのマックスプーリング特徴マップを第３グループとして生成して、前記（ＩＩ）プロセスで、前記プロセッサは、前記第１グループの前記インセプション特徴マップ、前記第２グループの前記インセプション特徴マップ及び前記第３グループの前記マックスプーリング特徴マップをコンカチネートするか、要素ごとの加算をして、前記出力特徴マップを生成することを特徴とする。

一例として、前記（Ｉ）プロセスで、前記プロセッサは、前記第１コンボリューションレイヤをもって（ｉ）前記入力イメージに対して転置コンボリューション演算を少なくとも一度適用し、各々異なるサイズを有する少なくとも一つの転置特徴マップを生成し、（ｉｉ）前記転置特徴マップに対し、異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を少なくとも一度適用して、少なくとも一つのインセプション特徴マップを前記第１グループとして生成することを特徴とする。

一例として、前記プロセッサは、（ＩＩＩ）前記第ｎコンボリューションレイヤから出力された前記出力特徴マップを基にＣＮＮ出力を獲得し、前記ＣＮＮ出力とこれに対応する原本正解を参照に獲得したセグメンテーションロスのバックプロパゲーションを遂行するプロセス；をさらに遂行することを特徴とする。

本発明のまた他の態様によれば、ＣＮＮ基盤イメージエンコーディングのためのテスト装置において、（ｉ）第１ないし第ｎコンボリューションレイヤを含む学習装置が、前記コンボリューションレイヤの少なくとも一部各々をもって、入力イメージまたは以前コンボリューションレイヤから獲得された学習用入力特徴マップに対して、転置コンボリューション演算を少なくとも一度適用して各々異なるサイズを有する少なくとも一つの学習用転置特徴マップを生成するプロセス、（ｉｉ）前記学習装置が、異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を、これに対応する前記学習用転置特徴マップに対して少なくとも一度適用して、少なくとも一つの学習用インセプション特徴マップ（ＩｎｃｅｐｔｉｏｎＦｅａｔｕｒｅＭａｐｓＦｏｒＴｒａｉｎｉｎｇ）を学習用第１グループとして生成するプロセス、（ｉｉｉ）前記学習装置が、前記学習用第１グループに含まれた前記学習用インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、これに対応する学習用出力特徴マップを生成するプロセス及び（ｉｖ）前記学習装置が、前記学習用出力特徴マップを基に学習用ＣＮＮ出力を獲得し、前記学習用ＣＮＮ出力とこれに対応する原本正解を参照に獲得したセグメンテーションロスのバックプロパゲーションを遂行するプロセスを遂行した状態で、少なくとも一つのテストイメージを獲得する通信部；及び（Ｉ）前記コンボリューションレイヤの少なくとも一部各々をもって、（ｉ）前記テストイメージまたは以前コンボリューションレイヤから獲得された前記テスト用入力特徴マップに対して、前記転置コンボリューション演算を少なくとも一度適用して各々異なるサイズを有する少なくとも一つのテスト用転置特徴マップを生成し、（ｉｉ）前記テスト用転置特徴マップ対し、これに対応して異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を少なくとも一度適用して、少なくとの一つのテスト用インセプション特徴マップ（ＩｎｃｅｐｔｉｏｎＦｅａｔｕｒｅＭａｐｓ）をテスト用第１グループとして生成するプロセス；及び（ＩＩ）前記テスト用第１グループに含まれた前記テスト用インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、これに対応するテスト用出力特徴マップを生成するプロセス；を遂行するプロセッサ；を含むことを特徴とする。

一例として、少なくとも一つの前記コンボリューションレイヤが第ｋコンボリューションレイヤである場合、前記（Ｉ）プロセスは、（Ｉ−１）前記第ｋコンボリューションレイヤをもって、前記テストイメージまたは第ｋ−１コンボリューションレイヤで獲得したテスト用第ｋ−１特徴マップに対して、第１ないし第ｍ転置コンボリューション演算（ｍは、２以上の自然数）を適用するようにし、第１ないし第ｍサイズを有するテスト用第１ないし第ｍ転置特徴マップを生成するプロセス；（Ｉ−２）（ｉ）前記テスト用第ｋ−１特徴マップのサイズと前記テスト用第１ないし前記第ｍ転置特徴マップ各々のサイズの割合を各々参照にして第１ないし第ｍストライドのサイズを決定し、（ｉｉ）前記テスト用第１ないし前記テスト用第ｍ転置特徴マップに対して、前記第１ないし前記第ｍストライドサイズ及び第１ないし第ｍカーネルサイズを有する第１ないし第ｍコンボリューションフィルタを各々適用して、テスト用第１ないしテスト用第ｍインセプション特徴マップを前記テスト用第１グループとして生成するプロセス；を含むことを特徴とする。

一例として、前記（Ｉ）プロセスで、前記プロセッサは、前記テストイメージまたは以前コンボリューションレイヤから獲得した前記テスト用入力特徴マップに対して、前記コンボリューション演算を適用して少なくとも一つのテスト用インセプション特徴マップを第２グループとして生成し、前記（ＩＩ）プロセスで、前記プロセッサは、前記テスト用第１グループの前記テスト用インセプション特徴マップ及び前記テスト用第２グループの前記テスト用インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、前記テスト用出力特徴マップを生成することを特徴とする。

一例として、少なくとも一つの前記コンボリューションレイヤが第ｋコンボリューションレイヤである場合、前記（ＩＩ）プロセスは、（ＩＩ−１）前記第ｋコンボリューションレイヤをもって、前記テストイメージまたは第ｋ−１コンボリューションレイヤから獲得したテスト用第ｋ−１特徴マップに対して、第１ないし第ｍ転置コンボリューション演算（ｍは２以上の自然数）を適用するようにして、第１ないし第ｍサイズを有するテスト用第１ないしテスト用第ｍ転置特徴マップを生成するプロセス；（ＩＩ−２）（ｉ）前記テスト用第ｋ−１特徴マップのサイズと前記テスト用第１ないし前記テスト用第ｍ転置特徴マップ各々のサイズの割合を各々参照にして第１ないし第ｍストライドのサイズを決定し、（ｉｉ）前記テスト用第１ないし前記テスト用第ｍ転置特徴マップに対して、前記第１ないし前記第ｍストライドサイズ及び第１ないし第ｍカーネルサイズを有する第１ないし第ｍコンボリューションフィルタを各々適用して、テスト用第１ないしテスト用第ｍインセプション特徴マップを前記テスト用第１グループとして生成するプロセス；及び（ＩＩ−３）前記テストイメージまたは前記第ｋ−１コンボリューションレイヤから獲得した前記テスト用第ｋ−１特徴マップに対して、第ｍ＋１ないし第ｍ＋ｎカーネルサイズを有する第ｍ＋１ないし第ｍ＋ｎコンボリューションフィルタを適用して、テスト用第ｍ＋１ないしテスト用第ｍ＋ｎインセプション特徴マップを前記テスト用第２グループとして生成するプロセス；を含むことを特徴とする。

一例として、前記（I）プロセスで、前記プロセッサは、前記テストイメージまたは以前コンボリューションレイヤから獲得した前記テスト用入力特徴マップに対して、互いに異なるサイズのマックスプーリング（ＭａｘＰｏｏｌｉｎｇ）演算を少なくとも一度適用し、少なくとも一つのテスト用マックスプーリング特徴マップをテスト用第３グループとして生成して、前記（ＩＩ）プロセスで、前記プロセッサは、前記テスト用第１グループの前記テスト用インセプション特徴マップ、前記テスト用第２グループの前記テスト用インセプション特徴マップ及び前記テスト用第３グループの前記テスト用マックスプーリング特徴マップをコンカチネートするか、要素ごとの加算をして、前記テスト用出力特徴マップを生成することを特徴とする。

本発明によれば、入力イメージまたは以前コンボリューションレイヤで獲得した入力特徴マップに対して、多様なサイズの転置コンボリューションを適用して特徴マップのサイズを拡大し、これに対応するストライドを有するコンボリューション演算を適用してカーネルサイズを整数から実数範囲に広げ得る効果がある。

本発明によれば、以前コンボリューションレイヤで獲得された入力特徴マップから考慮し得るレセプティブフィールド（ＲｅｃｅｐｔｉｖｅＦｉｅｌｄ）が多様になり、多様な特徴を有する特徴を得られるまたの特徴がある。

本発明の実施例の説明に利用されるために添付された以下の各図面は、本発明の実施例のうちの一部に過ぎず、本発明が属する技術分野でおいて、通常の知識を有する者（以下「通常の技術者」）は、発明的作業が行われることなくこの図面に基づいて他の図面が得られ得る。
一般的なＣＮＮセグメンテーションプロセスを簡略的に示した図面である。従来のインセプション方法を利用してイメージをエンコーディングするためのコンボリューションレイヤの多様な構成を各々示した図面である。従来のインセプション方法を利用してイメージをエンコーディングするためのコンボリューションレイヤの多様な構成を各々示した図面である。本発明の一例に係るイメージエンコーディング方法を示した図面である。本発明の他の一例に係るイメージエンコーディング方法を示した図面である。本発明のまた他の一例に係るイメージエンコーディング方法を示した図面である。

後述する本発明に関する詳細な説明は、本発明が実施され得る特定の実施例を例示として示す添付図面を参照する。これらの実施例は、当業者が本発明を実施することができるように十分詳細に説明される。

また、本発明の詳細な説明及び各請求項にわたって、「含む」という単語及びそれらの変形は、他の技術的各特徴、各付加物、構成要素又は段階を除外することを意図したものではない。通常の技術者にとって本発明の他の各目的、長所及び各特性が、一部は本説明書から、また一部は本発明の実施から明らかになるであろう。以下の例示及び図面は、実例として提供され、本発明を限定することを意図したものではない。

さらに、本発明は本明細書に表示された実施例のあらゆる可能な組合せを網羅する。本発明の多様な実施例は相互異なるが、相互排他的である必要はないことを理解されたい。例えば、ここに記載されている特定の形状、構造及び特性は一実施例と関連して、本発明の精神及び範囲を逸脱せず、かつ他の実施例で具現され得る。また、各々の開示された実施例内の個別構成要素の位置または配置は、本発明の精神及び範囲を逸脱せずに変更され得ることを理解されたい。従って、後述する詳細な説明は限定的な意味で捉えようとするものではなく、本発明の範囲は、適切に説明されれば、その請求項が主張することと均等なすべての範囲と、併せて添付された請求項によってのみ限定される。図面において類似する参照符号は、いくつかの側面にわたって同一であるか、類似する機能を指す。

本発明で言及している各種イメージは、舗装または非舗装道路関連のイメージを含み得、この場合、道路環境で登場し得る物体（例えば、自動車、人、動物、植物、物、建物、飛行機やドローンのような飛行体、その他の障害物）を想定し得るが、必ずしもこれに限定されるものではなく、本発明で言及している各種イメージは、道路と関係のないイメージ（例えば、非舗装道路、路地、空き地、海、湖、川、山、森、砂漠、空、室内と関連したイメージ）でもあり得、この場合、非舗装道路、路地、空き地、海、湖、川、山、森、砂漠、空、室内環境で登場し得る物体（例えば、自動車、人、動物、植物、物、建物、飛行機やドローンのような飛行体、その他の障害物）を想定し得るが、必ずしもこれに限定されるものではない。

以下、本発明が属する技術分野で通常の知識を有する者が本発明を容易に実施することができるようにするために、本発明の好ましい実施例について添付の図面に基づいて詳細に説明する。

図３は、本発明の一例に係るイメージエンコーディング方法を示した図面である。

ＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）基盤学習装置またはテスト装置において、第１ないし第ｎコンボリューションレイヤ各々は、入力イメージまたは以前コンボリューションレイヤで獲得した入力特徴マップに対してコンボリューション演算を少なくとも一度適用して第１ないし第ｎ特徴マップを生成する。

この際、図３に示した第１ないし第ｎコンボリューションレイヤの中から少なくとも一つのコンボリューションレイヤ各々は、以前コンボリューションレイヤから獲得された入力特徴マップ３０１（または入力イメージ）に対して一つ以上の転置コンボリューション演算３１０、３２０を適用して各々サイズが異なるように拡大された一つ以上の転置特徴マップを生成する。ここで、前記転置コンボリューション演算３１０、３２０は、デコンボリューションレイヤを利用して特徴マップのサイズを拡張するコンボリューション演算を意味し得るが、補間法（Ｉｎｔｅｒｐｏｌａｔｉｏｎ）やリサイズ（例えば、最近隣法（ＮｅａｒｅｓｔＮｅｉｇｈｂｏｒ）、直線補間（ＬｉｎｅａｒＩｎｔｅｒｐｏｌａｔｉｏｎ）なども含み得る。入力特徴マップ３０１（または入力イメージ）に対して、前記一つ以上の転置コンボリューション演算３１０、３２０を適用すれば、一つ以上の転置特徴マップ３１１、３２１が生成される。図３の例で、第１転置コンボリューション演算３１０は、入力特徴マップ３０１のサイズを２倍に拡大し、第１転置特徴マップ３１１のサイズは入力特徴マップ３０１サイズの２倍になり、第２転置コンボリューション演算３２０は、入力特徴マップ３０１のサイズを４倍拡大し、第２転置特徴マップ３２１のサイズは、入力特徴マップ３０１サイズの４倍になる。もちろん、このようなサイズの拡大程度は例示的なものであり、本発明の範囲はこれに限られない。

その後、前記一つ以上の転置特徴マップ３１１、３２１に対してそれに対応して一つ以上のコンボリューション演算３３０、３４０を随行する。より詳細には、コンボリューション演算３３０、３４０は、前記転置特徴マップに対して、それに対応して各々異なるストライド及び異なるカーネルサイズが適用されるもので、これに対応する一つ以上のインセプション特徴マップを第１グループ３０２として生成する。例えば、第１コンボリューション演算３３０のストライドの値が２であり、第２コンボリューション演算３４０のストライドの値が４である状況で、（ｉ）第１転置特徴マップ３１１のサイズが入力特徴マップ３０１に比べて２倍になったので、ストライドが２である第１コンボリューション演算３３０を適用して、第１転置特徴マップ３１１のサイズを入力特徴マップ３０１のサイズと同様に変形させて、（ｉｉ）同様に、第２転置特徴マップ３２１のサイズが入力特徴マップ３０１に比べて４倍になったので、ストライドが４である第２コンボリューション演算３４０を通じて、第２転置特徴マップ３２１のサイズを入力特徴マップ３０１のサイズと同様に変形させる。これによって、第１グループ３０２内のインセプション特徴マップ３３１、３４１のサイズは同一に形成される。

併せて、第１コンボリューション演算３３０及び第２コンボリューション演算３４０に適用されるカーネルサイズは、各々ｅ×ｆとｇ×ｈのように互いに異なるように決定できる。これによって、入力特徴マップ３０１対して多様なレセプティブフィールド（ＲｅｃｅｐｔｉｖｅＦｉｅｌｄ）を考慮し得る。特に、入力特徴マップ３０１のサイズを多様に変形させた後も様々なレセプティブフィールドを適用するため、各々の特定倍数に縮小されたカーネルサイズが適用される効果が得られるが、前記各々の特定倍数は、転置コンボリューション演算によって、これに対応してサイズが増加した倍数である。例えば、図３で入力特徴マップ３０１に対して、第１転置コンボリューション演算３１０を適用して生成された第１転置コンボリューション特徴マップ３１１にｅ×ｆのカーネルサイズを適用すれば、第１転置コンボリューション特徴マップ３１１に対してはｅ×ｆサイズのレセプティブフィールドが提供されるが、入力特徴マップ３０１に対してはｅ／２×ｆ／２のレセプティブフィールドが提供され得る。

図３の例で、第１コンボリューション演算３３０のストライドが２で３×３のカーネルサイズを有すれば、第１グループ３０２の第１インセプション特徴マップ３３１は、入力特徴マップ３０１に対して３／２×３／２サイズのレセプティブフィールドを考慮して生成されたと見ることができ、第２コンボリューション演算３４０のストライドが４で５×５のカーネルサイズを有すれば、第１グループ３０２の第２インセプション特徴マップ３４１は、入力特徴マップ３０１に対して５／４×５／４サイズのレセプティブフィールドを考慮して生成されたと見ることができる。

この際、第１グループ３０２のインセプション特徴マップ３３１、３４１は、同一サイズを有するが、多様なレセプティブフィールドを考慮して生成された様々な特性を有する。

そしてこのように生成された第１グループ３０２に含まれたインセプション特徴マップ３３１、３４１をコンカチネート（Ｃｏｎｃａｔｅｎａｔｅ）するか、要素ごとの加算をして、一つの出力特徴マップ３０３に統合される。そして出力特徴マップ３０３は、これに対応するコンボリューションレイヤの出力でもあり得、出力特徴マップ３０３から生成された修正済み特徴マップは、これに対応するコンボリューションレイヤの出力でもあり得る。例えば、第ｋコンボリューションレイヤに入力される入力特徴マップ３０１がｎ個のコンボリューションレイヤのうち第（ｋ−１）コンボリューションレイヤから出力された第（ｋ−１）特徴マップなら、図３に示した演算は、第ｋコンボリューションレイヤで遂行されるもので、出力特徴マップ３０３は、前記第ｋコンボリューションレイヤから出力された第ｋ特徴マップでもあり得る。他の例として、チャネルとサイズを変更するために前記出力特徴マップ３０３に対して追加コンボリューション演算及びＲｅＬＵのような非線形演算を適用して生成された修正済み特徴マップが、前記第ｋコンボリューションレイヤから出力された第ｋ特徴マップでもあり得る。

一方、本発明のエンコーディング方法で、第１コンボリューションレイヤは、以前コンボリューションレイヤがないため入力特徴マップではない入力イメージを利用して図３に示した出力特徴マップを生成するプロセスを遂行する。つまり、学習装置は、第１コンボリューションレイヤをもって（ｉ）入力イメージに対して転置コンボリューションを少なくとも一度適用し、各々異なるサイズを有する少なくとも一つの転置特徴マップを生成し、（ｉｉ）前記少なくとも一つの転置特徴マップ各々にコンボリューション演算を遂行にあたって、前記転置特徴マップに対して異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を適用して、少なくとも一つのインセプション特徴マップを第１グループとして生成する。

図４は、本発明の他の一例に係るイメージエンコーディング方法を示した図面である。

図４に示した本発明の他の実施例によれば、図３に示された方法に加えて第１グループ３０２の他に、第２グループ４０２のインセプション特徴マップを追加的に生成し、第１グループ３０２のインセプション特徴マップ及び第２グループ４０２のインセプション特徴マップをコンカチネートするか、要素ごとの加算をして出力特徴マップ３０３に統合する。

具体的に、入力特徴マップ３０１に対して少なくとも一つ以上のカーネルでコンボリューション演算４１０、４２０を適用して、少なくとも一つのインセプション特徴マップ４１１、４２１を第２グループ４０２として生成する。

例えば、入力特徴マップ３０１につ対してａ×ｂサイズのカーネルを有する第３コンボリューション演算４１０を適用して第２グループ４０２内の第３インセプション特徴マップ４１１を生成し、入力特徴マップ３０１に対してｃ×ｄサイズのカーネルを有する第４コンボリューション演算４２０を適用して第２グループ４０２内の第４インセプション特徴マップ４２１を生成する。第３インセプション特徴マップ４１１は、入力特徴マップ３０１に対してａ×ｂのサイズのレセプティブフィールドを考慮して生成され、第４インセプション特徴マップ４２１は、入力特徴マップ３０１に対してｃ×ｄサイズのレセプティブフィールドを考慮して生成された。

その後、学習装置は、第１グループ３０２のインセプション特徴マップ３３１、３４１及び第２グループ４０２のインセプション特徴マップ４１１、４２１をコンカチネートするか、要素ごとの加算をして出力特徴マップ３０３に統合する。

図５は、本発明のまた他の一例に係るイメージエンコーディング方法を示した図面である。

図５に示した本発明のもう一つの実施例によれば、図３または図４に示した方法に加えて、第３グループ５０２内のインセプション特徴マップを追加的に生成する。例えば、学習装置は、第３グループ５０２内のインセプション特徴マップ及び第１グループ３０２内のインセプション特徴マップをコンカチネートまたは要素ごとの加算するか、第１グループ３０２内のインセプション特徴マップ、第２グループ４０２のインセプション特徴マップ及び第３グループ５０２のインセプション特徴マップをコンカチネートまたは要素ごとの加算をして出力特徴マップ３０３に統合する方法を利用する。

具体的に、入力特徴マップ３０１に対して互いに異なるサイズのマックスプーリング（ＭａｘＰｏｏｌｉｎｇ）演算（例えば、図５に示した３×３マックスプーリング）を適用してマックスプーリング特徴マップ５１１を第３グループ５０２として生成する。このマックスプーリング演算は、入力特徴マップ３０１からコンボリューション演算なしに最大値だけを抽出して、マックスプーリング特徴マップ５１１を生成する役割を果たす。

その後、学習装置は、第１グループ３０２のインセプション特徴マップ３３１、３４１、第３グループ５０２のインセプション特徴マップ５１１をコンカチネートまたは要素ごとの加算するか、第１グループ３０２のインセプション特徴マップ３３１、３４１、第２グループ４０２のインセプション特徴マップ４１１、４２１、第３グループ５０２のインセプション特徴マップ５１１をコンカチネートまたは要素ごとの加算をして出力特徴マップ３０３として統合する。

一方、本発明によれば、演算量を減らすために、チャネル数を減らすための１×１コンボリューション演算も、第１グループないし第３グループの特徴マップを生成する中間に利用され得る。

学習装置は、獲得された特徴マップを基にＣＮＮ出力を獲得し、ＣＮＮ出力とこれに対応する原本正解を参照に獲得したセグメンテーションロスをバックプロパゲーションする。

そして、図３ないし図５に図示されたイメージエンコーディング方法は、テスト装置にも適用され得る。

つまり、（ｉ）第１ないし第ｎコンボリューションレイヤを含む学習装置が、前記コンボリューションレイヤの少なくとも一部各々をもって、入力イメージまたは以前コンボリューションレイヤから獲得された学習用入力特徴マップに対して、転置コンボリューション演算を少なくとも一度適用して各々異なるサイズを有する少なくとも一つの学習用転置特徴マップを生成し、（ｉｉ）学習装置が、学習用転置特徴マップに対してこれに対応して異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を少なくとも一度適用して、少なくとも一つの学習用インセプション特徴マップを学習用第１グループとして生成し、（ｉｉｉ）学習装置が、学習用第１グループに含まれた学習用インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、これに対応する学習用出力特徴マップを生成し、（ｉｖ）学習装置が、学習用出力特徴マップを基に学習用ＣＮＮ出力を獲得し、学習用ＣＮＮ出力とこれに対応する原本正解を参照に獲得したセグメンテーションロスのバックプロパゲーションを遂行した状態で、テスト装置がテストイメージを獲得し得る。

そして、テスト装置がコンボリューションレイヤの少なくとも一部各々をもって、（ｉ）テストイメージまたは以前コンボリューションレイヤから獲得されたテスト用入力特徴マップに対して転置コンボリューション演算を少なくとも一度適用して各々異なるサイズを有する少なくとも一つのテスト用転置特徴マップを生成し、（ｉｉ）前記テスト用転置特徴マップ対し、これに対応して異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を少なくとも一度適用して、少なくとの一つのテスト用インセプション特徴マップをテスト用第１グループとして生成し得る。

その後、テスト装置が、テスト用第１グループに含まれたテスト用インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、これに対応するテスト用出力特徴マップを生成し得る。

本発明の技術分野における通常の技術者に理解され得るところであって、前記で説明されたイメージ、例えばトレーニングイメージ、テストイメージのようなイメージデータの送受信が学習装置及びテスト装置の通信部によって行われ得るのであり、特徴マップと演算を遂行するためのデータが学習装置及びテスト装置のプロセッサー（及び／又はメモリー）によって保有／維持され得、コンボリューション演算、デコンボリューション演算、ロス値の演算過程が主に学習装置及びテスト装置のプロセッサによって遂行され得るが、本発明がこれに限定されはしないであろう。

以上にて説明された本発明による実施例は、多様なコンピュータの構成要素を介して遂行することができるプログラム命令語の形態で具現されて、コンピュータ判読可能な記録媒体に記録され得る。前記コンピュータ判読可能な記録媒体はプログラム命令語、データファイル、データ構造などを単独で又は組み合わせて含むことができる。前記コンピュータ判読可能な記録媒体に記録されるプログラム命令語は、本発明のために特別に設計され、構成されたものであるか、コンピュータソフトウェア分野の当業者に公知にされて使用可能なものであり得る。コンピュータ判読可能な記録媒体の例には、ハードディスク、フロッピーディスク及び磁気テープのような磁気媒体、ＣＤ−ＲＯＭ、ＤＶＤのような光記録媒体、フロプティカル・ディスク（ｆｌｏｐｔｉｃａｌｄｉｓｋ）のような磁気−光メディア（ｍａｇｎｅｔｏ−ｏｐｔｉｃａｌｍｅｄｉａ）、及びＲＯＭ、ＲＡＭ、フラッシュメモリーなどのようなプログラム命令語を保存して遂行するように特別に構成されたハードウェア装置が含まれる。プログラム命令語の例には、コンパイラによって作られるもののような機械語コードだけでなく、インタープリターなどを使用してコンピュータによって実行される高級言語コードも含まれる。前記ハードウェア装置は、本発明による処理を実行するために一つ以上のソフトウェアモジュールとして作動するように構成され得、その反対も同様である。

以上にて本発明が具体的な構成要素などのような特定事項と限定された実施例及び図面によって説明されたが、これは本発明のより全般的な理解の一助とするために提供されたものであるに過ぎず、本発明が前記実施例に限られるものではなく、本発明が属する技術分野において通常の知識を有する者であれば、係る記載から多様な修正及び変形が行われ得る。

従って、本発明の思想は前記説明された実施例に局限されて定められてはならず、後述する特許請求の範囲だけでなく、本特許請求の範囲と均等または等価的に変形されたものすべては、本発明の思想の範囲に属するといえる。

Claims

ＣＮＮ基盤イメージエンコーディング方法において、
（ａ）第１ないし第ｎコンボリューションレイヤを含む学習装置が、少なくとも一つの入力イメージを獲得する段階；
（ｂ）前記学習装置が、前記コンボリューションレイヤの少なくとも一部各々をもって、（ｉ）前記入力イメージまたは以前コンボリューションレイヤから獲得された入力特徴マップに対して、転置コンボリューション演算を少なくとも二度適用して各々異なるサイズを有する少なくとも二つの転置特徴マップを生成し、（ｉｉ）異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を、これに対応される各々の転置特徴マップに少なくとも一度適用して、少なくとも二つのインセプション特徴マップを第１グループとして生成する段階；及び
（ｃ）前記学習装置が、前記第１グループに含まれた前記インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、これに対応する出力特徴マップを生成する段階；
を含むことを特徴とする方法。
前記第１グループに含まれた前記インセプション特徴マップはサイズが同一だが、各々互いに異なる特性を有することを特徴とする請求項１に記載の方法。
少なくとも一つの前記コンボリューションレイヤが第ｋコンボリューションレイヤである場合、
前記（ｂ）段階は、
（ｂ−１）前記学習装置が、前記第ｋコンボリューションレイヤをもって、前記入力イメージまたは第ｋ−１コンボリューションレイヤで獲得した第ｋ−１特徴マップに対して、第１ないし第ｍ転置コンボリューション演算（ｍは、２以上の自然数）を適用するようにし、第１ないし第ｍサイズを有する第１ないし第ｍ転置特徴マップを生成する段階；
（ｂ−２）前記学習装置が、（ｉ）前記第ｋ−１特徴マップのサイズと前記第１ないし前記第ｍ転置特徴マップ各々のサイズの比率を各々参照にして第１ないし第ｍストライドサイズを決定して、（ｉｉ）前記第１ないし前記第ｍ転置特徴マップに対して、前記第１ないし前記第ｍストライドサイズ及び第１ないし第ｍカーネルサイズを有する第１ないし第ｍコンボリューションフィルタを各々適用し、第１ないし第ｍインセプション特徴マップを前記第１グループとして生成する段階；
を含むことを特徴とする請求項１に記載の方法。
前記（ｂ）段階で、
前記学習装置は、前記入力イメージまたは以前コンボリューションレイヤから獲得した前記入力特徴マップに対して、前記コンボリューション演算を適用して少なくとも一つのインセプション特徴マップを第２グループとして生成し、
前記（ｃ）段階で、
前記学習装置は、前記第１グループの前記インセプション特徴マップ及び前記第２グループの前記インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、前記出力特徴マップを生成することを特徴とする請求項１に記載の方法。
少なくとも一つの前記コンボリューションレイヤが第ｋコンボリューションレイヤである場合、
前記（ｂ）段階は、
（ｂ−１）前記学習装置が、前記第ｋコンボリューションレイヤをもって、前記入力イメージまたは第ｋ−１コンボリューションレイヤから獲得した第ｋ−１特徴マップに対して、第１ないし第ｍ転置コンボリューション演算（ｍは２以上の自然数）を適用するようにして、第１ないし第ｍサイズを有する第１ないし第ｍ転置特徴マップを生成する段階；
（ｂ−２）前記学習装置が、（ｉ）前記第ｋ−１特徴マップのサイズと前記第１ないし前記第ｍ転置特徴マップ各々のサイズの割合を各々参照にして第１ないし第ｍストライドのサイズを決定して、（ｉｉ）前記第１ないし前記第ｍ転置特徴マップに対し、前記第１ないし前記第ｍストライドサイズ及び第１ないし第ｍカーネルサイズを有する第１ないし第ｍコンボリューションフィルタを各々適用して、第１ないし第ｍインセプション特徴マップを前記第１グループとして生成する段階；及び
（ｂ−３）前記学習装置が、前記入力イメージまたは前記第ｋ−１コンボリューションレイヤから獲得した前記第ｋ−１特徴マップに対して、第ｍ＋１ないし第ｍ＋ｎカーネルサイズを有する第ｍ＋１ないし第ｍ＋ｎコンボリューションフィルタを適用して、第ｍ＋１ないし第ｍ＋ｎインセプション特徴マップを前記第２グループとして生成する段階；
を含むことを特徴とする請求項４に記載の方法。
前記（ｂ）段階で、
前記学習装置は、前記入力イメージまたは以前コンボリューションレイヤから獲得した前記入力特徴マップに対して、互いに異なるサイズのマックスプーリング（ＭａｘＰｏｏｌｉｎｇ）演算を少なくとも一度適用し、少なくとも一つのマックスプーリング特徴マップを第３グループとして生成し、
前記（ｃ）段階で、
前記学習装置は、前記第１グループの前記インセプション特徴マップ、前記第２グループの前記インセプション特徴マップ及び前記第３グループの前記マックスプーリング特徴マップをコンカチネートするか、要素ごとの加算をして、前記出力特徴マップを生成することを特徴とする請求項４に記載の方法。
前記（ｂ）段階で、
前記学習装置は、前記第１コンボリューションレイヤをもって（ｉ）前記入力イメージに対して転置コンボリューション演算を少なくとも二度適用し、各々異なるサイズを有する少なくとも二つの転置特徴マップを生成し、（ｉｉ）異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を、これに対応される各々の転置特徴マップに少なくとも一度適用し、少なくとも二つのインセプション特徴マップを前記第１グループとして生成することを特徴とする請求項１に記載の方法。
前記方法は、
（ｄ）前記学習装置が、前記第ｎコンボリューションレイヤから出力された前記出力特徴マップを基にＣＮＮ出力を獲得し、前記ＣＮＮ出力とこれに対応する原本正解を参照に獲得したセグメンテーションロスのバックプロパゲーションを遂行する段階；
をさらに含むことを特徴とする請求項１に記載の方法。
ＣＮＮ基盤イメージエンコーディング方法において、
（ａ）（ｉ）第１ないし第ｎコンボリューションレイヤを含む学習装置が、前記コンボリューションレイヤの少なくとも一部各々をもって、入力イメージまたは以前コンボリューションレイヤから獲得された学習用入力特徴マップに対して、転置コンボリューション演算を少なくとも二度適用して各々異なるサイズを有する少なくとも二つの学習用転置特徴マップを生成するプロセス、（ｉｉ）前記学習装置が、前記学習用転置特徴マップに対し、これに対応して異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を少なくとも一度適用して、少なくとも二つの学習用インセプション特徴マップを学習用第１グループとして生成するプロセス、（ｉｉｉ）前記学習装置が、前記学習用第１グループに含まれた前記学習用インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、これに対応する学習用出力特徴マップを生成するプロセス及び（ｉｖ）前記学習装置が、前記学習用出力特徴マップを基に学習用ＣＮＮ出力を獲得し、前記学習用ＣＮＮ出力とこれに対応する原本正解を参照に獲得したセグメンテーションロスのバックプロパゲーションを遂行するプロセスを遂行した状態で、テスト装置が、少なくとも一つのテストイメージを獲得する段階；
（ｂ）前記テスト装置が、前記コンボリューションレイヤの少なくとも一部各々をもって、（ｉ）前記テストイメージまたは以前コンボリューションレイヤから獲得されたテスト用入力特徴マップに対して、前記転置コンボリューション演算を少なくとも二度適用して各々異なるサイズを有する少なくとも二つのテスト用転置特徴マップを生成し、（ｉｉ）前記テスト用転置特徴マップ対し、これに対応して異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を少なくとも一度適用して、少なくとの二つのテスト用インセプション特徴マップをテスト用第１グループとして生成する段階；及び
（ｃ）前記テスト装置が、前記テスト用第１グループに含まれた前記テスト用インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、これに対応するテスト用出力特徴マップを生成する段階；
を含むことを特徴とする方法。
前記テスト用第１グループに含まれた前記テスト用インセプション特徴マップはサイズが同一だが、各々互いに異なる特性を有することを特徴とする請求項９に記載の方法。
少なくとも一つの前記コンボリューションレイヤが第ｋコンボリューションレイヤである場合、
前記（ｂ）段階は、
（ｂ−１）前記テスト装置が、前記第ｋコンボリューションレイヤをもって、前記テストイメージまたは第ｋ−１コンボリューションレイヤで獲得したテスト第ｋ−１特徴マップに対して、第１ないし第ｍ転置コンボリューション演算（ｍは、２以上の自然数）を適用するようにし、第１ないし第ｍサイズを有するテスト用第１ないし第ｍ転置特徴マップを生成する段階；
（ｂ−２）前記テスト装置が、（ｉ）前記テスト用第ｋ−１特徴マップのサイズと前記テスト用第１ないし前記テスト用第ｍ転置特徴マップ各々のサイズの比率を各々参照にして第１ないし第ｍストライドのサイズを決定して、（ｉｉ）前記テスト用第１ないし前記テスト用第ｍ転置特徴マップに対して、前記第１ないし前記第ｍストライドサイズ及び第１ないし第ｍカーネルサイズを有する第１ないし第ｍコンボリューションフィルタを各々適用し、テスト用第１ないしテスト用第ｍインセプション特徴マップを前記テスト用第１グループとして生成する段階；
を含むことを特徴とする請求項９に記載の方法。
前記（ｂ）段階で、
前記テスト装置は、前記テストイメージまたは以前コンボリューションレイヤから獲得した前記テスト用入力特徴マップに対して、前記コンボリューション演算を適用して少なくとも一つのインセプション特徴マップをテスト用第２グループとして生成し、
前記（ｃ）段階で、
前記テスト装置は、前記テスト用第１グループの前記テスト用インセプション特徴マップ及び前記テスト用第２グループの前記テスト用インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、前記テスト用出力特徴マップを生成することを特徴とする請求項９に記載の方法。
少なくとも一つの前記コンボリューションレイヤが第ｋコンボリューションレイヤである場合、
前記（ｂ）段階は、
（ｂ−１）前記テスト装置が、前記第ｋコンボリューションレイヤをもって、前記テストイメージまたは第ｋ−１コンボリューションレイヤから獲得したテスト用第ｋ−１特徴マップに対して、第１ないし第ｍ転置コンボリューション演算（ｍは２以上の自然数）を適用するようにして、第１ないし第ｍサイズを有するテスト用第１ないしテスト用第ｍ転置特徴マップを生成する段階；
（ｂ−２）前記テスト装置が、（ｉ）前記テスト用第ｋ−１特徴マップのサイズと前記テスト用第１ないし前記テスト用第ｍ転置特徴マップ各々のサイズの割合を各々参照にして第１ないし第ｍストライドのサイズを決定し、（ｉｉ）前記テスト用第１ないし前記テスト用第ｍ転置特徴マップに対して、前記第１ないし前記第ｍストライドサイズ及び第１ないし第ｍカーネルサイズを有する第１ないし第ｍコンボリューションフィルタを各々適用して、テスト用第１ないしテスト用第ｍインセプション特徴マップを前記テスト用第１グループとして生成する段階；及び
（ｂ−３）前記テスト装置が、前記テストイメージまたは前記第ｋ−１コンボリューションレイヤから獲得した前記テスト用第ｋ−１特徴マップに対して、第ｍ＋１ないし第ｍ＋ｎカーネルサイズを有する第ｍ＋１ないし第ｍ＋ｎコンボリューションフィルタを適用して、テスト用第ｍ＋１ないしテスト用第ｍ＋ｎインセプション特徴マップを前記テスト用第２グループとして生成する段階；
を含むことを特徴とする請求項１２に記載の方法。
前記（ｂ）段階で、
前記テスト装置は、前記テストイメージまたは以前コンボリューションレイヤから獲得した前記テスト用特徴マップに対して、互いに異なるサイズのマックスプーリング（ＭａｘＰｏｏｌｉｎｇ）演算を少なくとも一度適用し、少なくとも一つのテスト用マックスプーリング特徴マップをテスト用第３グループとして生成し、
前記（ｃ）段階で、
前記テスト装置は、前記テスト用第１グループの前記テスト用インセプション特徴マップ、前記テスト用第２グループの前記テスト用インセプション特徴マップ及び前記テスト用第３グループの前記テスト用マックスプーリング特徴マップをコンカチネートするか、要素ごとの加算をして、前記テスト用出力特徴マップを生成することを特徴とする請求項１２に記載の方法。
第１ないし第ｎコンボリューションレイヤを含む、ＣＮＮ基盤イメージエンコーディングのための学習装置において、
少なくとも一つのトレーニングイメージを入力イメージとして獲得するための通信部；及び
（Ｉ）前記コンボリューションレイヤの少なくとも一部各々をもって、（ｉ）入力イメージまたは以前コンボリューションレイヤから獲得された入力特徴マップに対して、転置コンボリューション演算を少なくとも二度適用して各々異なるサイズを有する少なくとも二つの転置特徴マップを生成し、（ｉｉ）異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を、これに対応する各々の転置特徴マップに少なくとも一度適用して、少なくとも二つのインセプション特徴マップを第１グループとして生成するプロセス、及び、（ＩＩ）前記第１グループに含まれた前記インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、これに対応する出力特徴マップを生成するプロセスを遂行するプロセッサ；
を含むことを特徴とする装置。
前記第１グループに含まれた前記インセプション特徴マップはサイズが同一だが、各々互いに異なる特性を有することを特徴とする請求項１５に記載の装置。
少なくとも一つの前記コンボリューションレイヤが第ｋコンボリューションレイヤである場合、
前記（Ｉ）プロセスは、
（Ｉ−１）前記第ｋコンボリューションレイヤをもって、前記入力イメージまたは第ｋ−１コンボリューションレイヤで獲得した第ｋ−１特徴マップに対して、第１ないし第ｍ転置コンボリューション演算（ｍは、２以上の自然数）を適用するようにし、第１ないし第ｍサイズを有する第１ないし第ｍ転置特徴マップを生成するプロセス；
（Ｉ−２）（ｉ）前記第ｋ−１特徴マップのサイズと前記第１ないし前記第ｍ転置特徴マップ各々のサイズの割合を各々参照にして第１ないし第ｍストライドのサイズを決定し、（ｉｉ）前記第１ないし前記第ｍ転置特徴マップに対して、前記第１ないし前記第ｍストライドサイズ及び第１ないし第ｍカーネルサイズを有する第１ないし第ｍコンボリューションフィルタを各々適用して、第１ないし第ｍインセプション特徴マップを前記第１グループとして生成するプロセス；
を含むことを特徴とする請求項１５に記載の装置。
前記（Ｉ）プロセスで、
前記プロセッサは、前記入力イメージまたは以前コンボリューションレイヤから獲得した前記入力特徴マップに対して、前記コンボリューション演算を適用して少なくとも一つのインセプション特徴マップを第２グループとして生成し、
前記（ＩＩ）プロセスで、
前記プロセッサは、前記第１グループの前記インセプション特徴マップ及び前記第２グループの前記インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、前記出力特徴マップを生成することを特徴とする請求項１５に記載の装置。
少なくとも一つの前記コンボリューションレイヤが第ｋコンボリューションレイヤである場合、
前記（Ｉ）プロセスは、
（Ｉ−１）前記第ｋコンボリューションレイヤをもって、前記入力イメージまたは第ｋ−１コンボリューションレイヤから獲得した第ｋ−１特徴マップに対して、第１ないし第ｍ転置コンボリューション演算（ｍは２以上の自然数）を適用するようにして、第１ないし第ｍサイズを有する第１ないし第ｍ転置特徴マップを生成するプロセス；
（Ｉ−２）（ｉ）前記第ｋ−１特徴マップのサイズと前記第１ないし前記第ｍ転置特徴マップ各々のサイズの割合を各々参照にして第１ないし第ｍストライドのサイズを決定し、（ｉｉ）前記第１ないし前記第ｍ転置特徴マップに対して、前記第１ないし前記第ｍストライドサイズ及び第１ないし第ｍカーネルサイズを有する第１ないし第ｍコンボリューションフィルタを各々適用して、第１ないし第ｍインセプション特徴マップを前記第１グループとして生成するプロセス；及び
（Ｉ−３）前記入力イメージまたは前記第ｋ−１コンボリューションレイヤから獲得した前記第ｋ−１特徴マップに対して、第ｍ＋１ないし第ｍ＋ｎカーネルサイズを有する第ｍ＋１ないし第ｍ＋ｎコンボリューションフィルタを適用して、第ｍ＋１ないし第ｍ＋ｎインセプション特徴マップを前記第２グループとして生成するプロセス；
を含むことを特徴とする請求項１８に記載の装置。
前記（I）プロセスで、
前記プロセッサは、前記入力イメージまたは以前コンボリューションレイヤから獲得した前記入力特徴マップに対して、互いに異なるサイズのマックスプーリング（ＭａｘＰｏｏｌｉｎｇ）演算を少なくとも一度適用し、少なくとも一つのマックスプーリング特徴マップを第３グループとして生成して、
前記（ＩＩ）プロセスで、
前記プロセッサは、前記第１グループの前記インセプション特徴マップ、前記第２グループの前記インセプション特徴マップ及び前記第３グループの前記マックスプーリング特徴マップをコンカチネートするか、要素ごとの加算をして、前記出力特徴マップを生成することを特徴とする請求項１８に記載の装置。
前記（Ｉ）プロセスで、
前記プロセッサは、前記第１コンボリューションレイヤをもって（ｉ）前記入力イメージに対して転置コンボリューション演算を少なくとも二度適用し、各々異なるサイズを有する少なくとも二つの転置特徴マップを生成し、（ｉｉ）前記転置特徴マップに対し、異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を少なくとも一度適用して、少なくとも二つのインセプション特徴マップを前記第１グループとして生成することを特徴とする請求項１５に記載の装置。
前記プロセッサは、
（ＩＩＩ）前記第ｎコンボリューションレイヤから出力された前記出力特徴マップを基にＣＮＮ出力を獲得し、前記ＣＮＮ出力とこれに対応する原本正解を参照に獲得したセグメンテーションロスのバックプロパゲーションを遂行するプロセス；
をさらに遂行することを特徴とする請求項１５に記載の装置。
ＣＮＮ基盤イメージエンコーディングのためのテスト装置において、
（ｉ）第１ないし第ｎコンボリューションレイヤを含む学習装置が、前記コンボリューションレイヤの少なくとも一部各々をもって、入力イメージまたは以前コンボリューションレイヤから獲得された学習用入力特徴マップに対して、転置コンボリューション演算を少なくとも二度適用して各々異なるサイズを有する少なくとも二つの学習用転置特徴マップを生成するプロセス、（ｉｉ）前記学習装置が、異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を、これに対応する前記学習用転置特徴マップに対して少なくとも一度適用して、少なくとも二つの学習用インセプション特徴マップ（ＩｎｃｅｐｔｉｏｎＦｅａｔｕｒｅＭａｐｓＦｏｒＴｒａｉｎｉｎｇ）を学習用第１グループとして生成するプロセス、（ｉｉｉ）前記学習装置が、前記学習用第１グループに含まれた前記学習用インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、これに対応する学習用出力特徴マップを生成するプロセス及び（ｉｖ）前記学習装置が、前記学習用出力特徴マップを基に学習用ＣＮＮ出力を獲得し、前記学習用ＣＮＮ出力とこれに対応する原本正解を参照に獲得したセグメンテーションロスのバックプロパゲーションを遂行するプロセスを遂行した状態で、少なくとも一つのテストイメージを獲得する通信部；及び
（Ｉ）前記コンボリューションレイヤの少なくとも一部各々をもって、（ｉ）前記テストイメージまたは以前コンボリューションレイヤから獲得された前記テスト用入力特徴マップに対して、前記転置コンボリューション演算を少なくとも二度適用して各々異なるサイズを有する少なくとも二つのテスト用転置特徴マップを生成し、（ｉｉ）前記テスト用転置特徴マップ対し、これに対応して異なるストライドと異なるカーネルサイズとを有するコンボリューション演算を少なくとも一度適用して、少なくとも二つのテスト用インセプション特徴マップ（ＩｎｃｅｐｔｉｏｎＦｅａｔｕｒｅＭａｐｓ）をテスト用第１グループとして生成するプロセス；及び（ＩＩ）前記テスト用第１グループに含まれた前記テスト用インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、これに対応するテスト用出力特徴マップを生成するプロセス；を遂行するプロセッサ；
を含むことを特徴とする装置。
前記テスト用第１グループに含まれた前記テスト用インセプション特徴マップはサイズが同一だが、各々互いに異なる特性を有することを特徴とする請求項２３に記載の装置。
少なくとも一つの前記コンボリューションレイヤが第ｋコンボリューションレイヤである場合、
前記（Ｉ）プロセスは、
（Ｉ−１）前記第ｋコンボリューションレイヤをもって、前記テストイメージまたは第ｋ−１コンボリューションレイヤで獲得したテスト用第ｋ−１特徴マップに対して、第１ないし第ｍ転置コンボリューション演算（ｍは、２以上の自然数）を適用するようにし、第１ないし第ｍサイズを有するテスト用第１ないし第ｍ転置特徴マップを生成するプロセス；
（Ｉ−２）（ｉ）前記テスト用第ｋ−１特徴マップのサイズと前記テスト用第１ないし前記第ｍ転置特徴マップ各々のサイズの割合を各々参照にして第１ないし第ｍストライドのサイズを決定し、（ｉｉ）前記テスト用第１ないし前記テスト用第ｍ転置特徴マップに対して、前記第１ないし前記第ｍストライドサイズ及び第１ないし第ｍカーネルサイズを有する第１ないし第ｍコンボリューションフィルタを各々適用して、テスト用第１ないしテスト用第ｍインセプション特徴マップを前記テスト用第１グループとして生成するプロセス；
を含むことを特徴とする請求項２３に記載の装置。
前記（Ｉ）プロセスで、
前記プロセッサは、前記テストイメージまたは以前コンボリューションレイヤから獲得した前記テスト用入力特徴マップに対して、前記コンボリューション演算を適用して少なくとも一つのテスト用インセプション特徴マップを第２グループとして生成し、
前記（ＩＩ）プロセスで、
前記プロセッサは、前記テスト用第１グループの前記テスト用インセプション特徴マップ及び前記テスト用第２グループの前記テスト用インセプション特徴マップをコンカチネートするか、要素ごとの加算をして、前記テスト用出力特徴マップを生成することを特徴とする請求項２３に記載の装置。
少なくとも一つの前記コンボリューションレイヤが第ｋコンボリューションレイヤである場合、
前記（ＩＩ）プロセスは、
（ＩＩ−１）前記第ｋコンボリューションレイヤをもって、前記テストイメージまたは第ｋ−１コンボリューションレイヤから獲得したテスト用第ｋ−１特徴マップに対して、第１ないし第ｍ転置コンボリューション演算（ｍは２以上の自然数）を適用するようにして、第１ないし第ｍサイズを有するテスト用第１ないしテスト用第ｍ転置特徴マップを生成するプロセス；
（ＩＩ−２）（ｉ）前記テスト用第ｋ−１特徴マップのサイズと前記テスト用第１ないし前記テスト用第ｍ転置特徴マップ各々のサイズの割合を各々参照にして第１ないし第ｍストライドのサイズを決定し、（ｉｉ）前記テスト用第１ないし前記テスト用第ｍ転置特徴マップに対して、前記第１ないし前記第ｍストライドサイズ及び第１ないし第ｍカーネルサイズを有する第１ないし第ｍコンボリューションフィルタを各々適用して、テスト用第１ないしテスト用第ｍインセプション特徴マップを前記テスト用第１グループとして生成するプロセス；及び
（ＩＩ−３）前記テストイメージまたは前記第ｋ−１コンボリューションレイヤから獲得した前記テスト用第ｋ−１特徴マップに対して、第ｍ＋１ないし第ｍ＋ｎカーネルサイズを有する第ｍ＋１ないし第ｍ＋ｎコンボリューションフィルタを適用して、テスト用第ｍ＋１ないしテスト用第ｍ＋ｎインセプション特徴マップを前記テスト用第２グループとして生成するプロセス；
を含むことを特徴とする請求項２６に記載の装置。
前記（I）プロセスで、
前記プロセッサは、前記テストイメージまたは以前コンボリューションレイヤから獲得した前記テスト用入力特徴マップに対して、互いに異なるサイズのマックスプーリング（ＭａｘＰｏｏｌｉｎｇ）演算を少なくとも一度適用し、少なくとも一つのテスト用マックスプーリング特徴マップをテスト用第３グループとして生成して、
前記（ＩＩ）プロセスで、
前記プロセッサは、前記テスト用第１グループの前記テスト用インセプション特徴マップ、前記テスト用第２グループの前記テスト用インセプション特徴マップ及び前記テスト用第３グループの前記テスト用マックスプーリング特徴マップをコンカチネートするか、要素ごとの加算をして、前記テスト用出力特徴マップを生成することを特徴とする請求項２６に記載の装置。