JP2024027790A

JP2024027790A - 推定装置、推定方法、及び、推定プログラム

Info

Publication number: JP2024027790A
Application number: JP2022130890A
Authority: JP
Inventors: 拓也日野; ひろみ近藤; 久市阿部; 弘一安藤; 弘之渡邉; 浩二千葉
Original assignee: 匠ソリューションズ株式会社
Priority date: 2022-08-19
Filing date: 2022-08-19
Publication date: 2024-03-01

Abstract

【課題】処理負荷を抑制することが可能な推定装置、推定方法及び推定プログラムを提供する。【解決手段】画像情報に対して、複数の畳み込み層によって、入力される情報が有する領域の外縁から縮小された領域を有する情報を出力するＣＮＮを用いてセマンティックセグメンテーションを行う推定装置１０であって、第１ＣＮＮ処理部１０３と、第２ＣＮＮ処理部１０６と、を備える。第１ＣＮＮ処理部は、第１分割数の第１分割領域のそれぞれに対して、画像情報のうちの、着目領域と隣接する他の第１分割領域との境界に沿って、当該着目領域を拡大した第１処理領域に対応する部分を第１ＣＮＮ部に入力する。第２ＣＮＮ処理部は、第２分割数の第２分割領域のそれぞれに対して、出力された第１分割数の第１ＣＮＮ部情報のうちの、着目領域と隣接する他の第２分割領域との境界に沿って、当該着目領域を拡大した第２処理領域に対応する部分を第２ＣＮＮ部に入力する。【選択図】図１

Description

本発明は、推定装置、推定方法、及び、推定プログラムに関する。

複数の画素からなる画像領域を有する画像情報に対して、複数の畳み込み層を含むＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）を用いてセマンティックセグメンテーションを行う推定装置が知られている。例えば、特許文献１に記載の推定装置は、画像領域を分割することにより取得される分割数の分割領域のそれぞれに対して、画像情報のうちの、当該分割領域を含む処理領域に対応する部分を、ＣＮＮに入力することによりＣＮＮ処理を実行する。

ところで、ＣＮＮは、複数の畳み込み層によって、入力される情報が有する領域の外縁から縮小幅の画素だけ縮小された領域を有する情報を出力する。また、セマンティックセグメンテーションにおいては、分割領域間の境界に隙間を生じさせることなく、推定結果を得る必要がある。このため、特許文献１に記載の推定装置は、分割領域を縮小幅の画素だけ拡大した領域を処理領域として用いる。

特表２０２２－５０２７３９号公報

しかしながら、ＣＮＮに含まれる畳み込み層の数は、比較的多い。このため、縮小幅は、比較的大きくなる。従って、ＣＮＮ処理の対象となる分割数の処理領域に含まれる画素の総数は、分割数が多くなるほど多くなるとともに、畳み込み層の数が多くなるほど多くなる。このように、画像領域を分割することにより取得される分割領域に対してＣＮＮ処理を実行する場合、ＣＮＮ処理における演算量が過大になりやすい。この結果、処理負荷が過大になる虞があった。

本発明の目的の一つは、処理負荷を抑制することである。

一つの側面では、推定装置は、複数の画素からなる画像領域を有する画像情報に対して、複数の畳み込み層によって、入力される情報が有する領域の外縁からＸ画素だけ縮小された領域を有する情報を出力するＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）を用いてセマンティックセグメンテーションを行う。Ｘは、２以上の整数を表す。

推定装置は、第１ＣＮＮ処理部と、第２ＣＮＮ処理部と、を備える。
第１ＣＮＮ処理部は、画像領域を分割することにより取得される第１分割数の第１分割領域のそれぞれに対して、画像情報のうちの、当該第１分割領域である着目領域と、当該着目領域に隣接する他の第１分割領域と、の境界に沿って、当該着目領域をＫ画素だけ拡大した第１処理領域に対応する部分を、第１ＣＮＮ部に入力することにより第１ＣＮＮ部情報を出力する第１ＣＮＮ処理を実行する。第１ＣＮＮ部は、ＣＮＮのうちの、少なくとも１つの畳み込み層によって、入力される情報が有する領域の外縁からＹ画素だけ縮小された領域を有する情報を出力する部分である。Ｙは、Ｘよりも小さい自然数を表す。Ｋは、Ｙ以上であり、且つ、Ｘよりも小さい整数を表す。

第２ＣＮＮ処理部は、画像領域を分割することにより取得される第２分割数の第２分割領域のそれぞれに対して、出力された第１分割数の第１ＣＮＮ部情報のうちの、当該第２分割領域である着目領域と、当該着目領域に隣接する他の第２分割領域と、の境界に沿って、当該着目領域をＬ画素だけ拡大した第２処理領域に対応する部分を、第２ＣＮＮ部に入力することにより第２ＣＮＮ部情報を出力する第２ＣＮＮ処理を実行する。第２ＣＮＮ部は、ＣＮＮのうちの、第１ＣＮＮ部に後続するとともに、少なくとも１つの畳み込み層によって、入力される情報が有する領域の外縁からＺ画素だけ縮小された領域を有する情報を出力する部分である。Ｚは、ＸからＹを減じた値以下の整数を表す。Ｌは、Ｚ以上の整数を表す。

他の一つの側面では、推定方法は、複数の画素からなる画像領域を有する画像情報に対して、複数の畳み込み層によって、入力される情報が有する領域の外縁からＸ画素だけ縮小された領域を有する情報を出力するＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）を用いてセマンティックセグメンテーションを行う。Ｘは、２以上の整数を表す。

推定方法は、画像領域を分割することにより取得される第１分割数の第１分割領域のそれぞれに対して、画像情報のうちの、当該第１分割領域である着目領域と、当該着目領域に隣接する他の第１分割領域と、の境界に沿って、当該着目領域をＫ画素だけ拡大した第１処理領域に対応する部分を、第１ＣＮＮ部に入力することにより第１ＣＮＮ部情報を出力する第１ＣＮＮ処理を実行することを含む。第１ＣＮＮ部は、ＣＮＮのうちの、少なくとも１つの畳み込み層によって、入力される情報が有する領域の外縁からＹ画素だけ縮小された領域を有する情報を出力する部分である。Ｙは、Ｘよりも小さい自然数を表す。Ｋは、Ｙ以上であり、且つ、Ｘよりも小さい整数を表す。

推定方法は、画像領域を分割することにより取得される第２分割数の第２分割領域のそれぞれに対して、出力された第１分割数の第１ＣＮＮ部情報のうちの、当該第２分割領域である着目領域と、当該着目領域に隣接する他の第２分割領域と、の境界に沿って、当該着目領域をＬ画素だけ拡大した第２処理領域に対応する部分を、第２ＣＮＮ部に入力することにより第２ＣＮＮ部情報を出力する第２ＣＮＮ処理を実行することを含む。第２ＣＮＮ部は、ＣＮＮのうちの、第１ＣＮＮ部に後続するとともに、少なくとも１つの畳み込み層によって、入力される情報が有する領域の外縁からＺ画素だけ縮小された領域を有する情報を出力する部分である。Ｚは、ＸからＹを減じた値以下の整数を表す。Ｌは、Ｚ以上の整数を表す。

他の一つの側面では、推定プログラムは、複数の画素からなる画像領域を有する画像情報に対して、複数の畳み込み層によって、入力される情報が有する領域の外縁からＸ画素だけ縮小された領域を有する情報を出力するＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）を用いてセマンティックセグメンテーションを行う推定処理をコンピュータに実行させるプログラムである。Ｘは、２以上の整数を表す。

推定処理は、画像領域を分割することにより取得される第１分割数の第１分割領域のそれぞれに対して、画像情報のうちの、当該第１分割領域である着目領域と、当該着目領域に隣接する他の第１分割領域と、の境界に沿って、当該着目領域をＫ画素だけ拡大した第１処理領域に対応する部分を、第１ＣＮＮ部に入力することにより第１ＣＮＮ部情報を出力する第１ＣＮＮ処理を実行することを含む。第１ＣＮＮ部は、ＣＮＮのうちの、少なくとも１つの畳み込み層によって、入力される情報が有する領域の外縁からＹ画素だけ縮小された領域を有する情報を出力する部分である。Ｙは、Ｘよりも小さい自然数を表す。Ｋは、Ｙ以上であり、且つ、Ｘよりも小さい整数を表す。

推定処理は、画像領域を分割することにより取得される第２分割数の第２分割領域のそれぞれに対して、出力された第１分割数の第１ＣＮＮ部情報のうちの、当該第２分割領域である着目領域と、当該着目領域に隣接する他の第２分割領域と、の境界に沿って、当該着目領域をＬ画素だけ拡大した第２処理領域に対応する部分を、第２ＣＮＮ部に入力することにより第２ＣＮＮ部情報を出力する第２ＣＮＮ処理を実行することを含む。第２ＣＮＮ部は、ＣＮＮのうちの、第１ＣＮＮ部に後続するとともに、少なくとも１つの畳み込み層によって、入力される情報が有する領域の外縁からＺ画素だけ縮小された領域を有する情報を出力する部分である。Ｚは、ＸからＹを減じた値以下の整数を表す。Ｌは、Ｚ以上の整数を表す。

処理負荷を抑制することができる。

第１実施形態の推定装置の構成を表すブロック図である。第１実施形態の推定装置が使用する、第１分割領域及び第２分割領域を概念的に表す説明図である。第１実施形態の推定装置が使用する、第１分割領域及び第１処理領域を概念的に表す説明図である。第１実施形態の推定装置が使用する、第２分割領域及び第２処理領域を概念的に表す説明図である。第１実施形態の推定装置が実行する第１推定処理を表すフローチャートである。第１実施形態の推定装置が実行する第２推定処理を表すフローチャートである。第１実施形態の推定装置における領域の変化を概念的に表す説明図である。比較例の推定装置における領域の変化を概念的に表す説明図である。第２実施形態の推定装置が使用する、第１分割領域及び第２分割領域を概念的に表す説明図である。第２実施形態の推定装置が使用する、第１分割領域及び第２処理領域を概念的に表す説明図である。第２実施形態の推定装置が実行する第２推定処理を表すフローチャートである。第３実施形態の推定装置が使用する、第１分割領域及び第２分割領域を概念的に表す説明図である。第３実施形態の推定装置が使用する、第１分割領域及び第２処理領域を概念的に表す説明図である。第３実施形態の推定装置が実行する第２推定処理を表すフローチャートである。各実施形態の変形例の推定装置が使用する、第１分割領域又は第２分割領域を概念的に表す説明図である。各実施形態の変形例の推定装置が使用する、第１分割領域又は第２分割領域を概念的に表す説明図である。

以下、本発明の、推定装置、推定方法、及び、推定プログラムに関する各実施形態について図１乃至図１６を参照しながら説明する。

＜第１実施形態＞
（概要）
第１実施形態の推定装置は、複数の画素からなる画像領域を有する画像情報に対して、複数の畳み込み層によって、入力される情報が有する領域の外縁からＸ画素だけ縮小された領域を有する情報を出力するＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）を用いてセマンティックセグメンテーションを行う。Ｘは、２以上の整数を表す。

これによれば、第１処理領域は、ＣＮＮの全体に対する縮小幅であるＸよりも小さいＫ画素だけ第１分割領域を拡大した領域である。従って、第１ＣＮＮ処理の対象となる第１分割数の第１処理領域に含まれる画素の総数を抑制できる。これにより、画像情報のうちの、分割領域をＸ画素だけ拡大した処理領域に対応する部分をＣＮＮに入力する場合よりも、第１ＣＮＮ処理における演算量を抑制できる。この結果、処理負荷を抑制できる。
次に、第１実施形態の推定装置について、図１乃至図８を参照しながら詳細に説明する。

（構成）
図１に表されるように、第１実施形態の推定装置１０は、複数の画素からなる画像領域を有する画像情報に対して、ＣＮＮを用いてセマンティックセグメンテーションを行う。

本例では、画像情報は、カメラによって撮影された画像を表す。なお、画像情報は、コンピュータによって生成された画像を表してもよい。本例では、画像は、静止画像である。なお、画像は、動画像であってもよい。本例では、画像領域を構成する複数の画素は、列方向において複数の画素が並ぶとともに、列方向に直交する行方向において複数の画素が並ぶように格子状の配列を有する。

ＣＮＮは、複数の画素からなる画像領域を有する画像情報に対して、複数の畳み込み層によって、当該ＣＮＮに入力される情報が有する領域の外縁からＸ画素だけ縮小された領域（換言すると、出力領域）を有する情報を出力する。Ｘは、２以上の整数を表す。
本例では、ＣＮＮによって出力される情報は、出力領域を構成する複数の画素のそれぞれに対して、当該画素を分類する分類情報を含む。例えば、分類情報は、ラベル、クラス、タグ、又は、カテゴリを表す情報を含む。

例えば、ＣＮＮは、ＦＣＮ（ＦｕｌｌｙＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｔｗｏｒｋｓ）、ＳｅｇＮｅｔ、Ｕ－Ｎｅｔ、ＨＲＮｅｔ、ＰＳＰＮｅｔ、又は、ＤｅｅｐＬａｂと呼ばれるＣＮＮである。例えば、ＣＮＮは、エンコーダー・デコーダ―構造を有していてもよい。

本例では、ＣＮＮは、畳み込み層（換言すると、Ｃｏｎｖｏｌｕｔｉｏｎ層）に加えて、Ｐｏｏｌｉｎｇ層（例えば、ＭａｘＰｏｏｌｉｎｇ層、ＡｖｅｒａｇｅＰｏｏｌｉｎｇ層、又は、ＳｕｍＰｏｏｌｉｎｇ層）、及び、Ｕｐｓａｍｐｌｉｎｇ層（例えば、Ｕｐｃｏｎｖｏｌｕｔｉｏｎ層、Ｄｅｃｏｎｖｏｌｕｔｉｏｎ層、ＴｒａｎｓｐｏｓｅｄＣｏｎｖｏｌｕｔｉｏｎ層、ＮｅａｒｅｓｔＮｅｉｇｈｂｏｒＩｎｔｅｒｐｏｒａｔｉｏｎ層、ＢｉｌｉｎｅａｒＩｎｔｅｒｐｏｒａｔｉｏｎ層、ＢｅｄｏｆＮａｉｌｓ層、Ｕｎｐｏｏｌｉｎｇ層、又は、ＭａｘＵｎｐｏｏｌｉｎｇ層）を含む。なお、ＣＮＮは、Ｐｏｏｌｉｎｇ層、及び、Ｕｐｓａｍｐｌｉｎｇ層の少なくとも１つを含まなくてもよい。

畳み込み層は、当該畳み込み層に入力される情報が有する領域に対して、カーネル（換言すると、フィルタ）が適用される局所領域をストライドずつ移動させながら畳み込み演算を行う処理を含む。
Ｐｏｏｌｉｎｇ層は、当該Ｐｏｏｌｉｎｇ層に入力される情報が有する領域に対して、局所領域毎に当該局所領域を縮小する処理を含む。
Ｕｐｓａｍｐｌｉｎｇ層は、当該Ｕｐｓａｍｐｌｉｎｇ層に入力される情報が有する領域に対して、局所領域毎に当該局所領域を拡大する処理を含む。

例えば、Ｕ個の畳み込み層を含むＣＮＮにおいて、当該ＣＮＮに入力される情報が有する領域の外縁に対する、当該ＣＮＮから出力される情報が有する領域の外縁の縮小幅Ｘは、数式１により表される。Ｕは、２以上の整数を表す。

α_ｕは、ｕ番目の畳み込み層に対するプーリング因子を表す。プーリング因子α_ｕは、ＣＮＮのうちの、ｕ番目の畳み込み層より前の部分に含まれる、Ｐｏｏｌｉｎｇ層、及び、Ｕｐｓａｍｐｌｉｎｇ層に基づいて定められる係数である。プーリング因子α_ｕは、数式２により表される。

γ_ｖは、ｖ番目のＰｏｏｌｉｎｇ層に入力される情報が有する領域の行方向における画素数（又は、列方向における画素数）に対する、ｖ番目のＰｏｏｌｉｎｇ層から出力される情報が有する領域の行方向における画素数（又は、列方向における画素数）の比を表す。γ_ｖは、１よりも小さい。Ｖ_ｕは、ＣＮＮのうちの、ｕ番目の畳み込み層より前の部分に含まれる、Ｐｏｏｌｉｎｇ層の数を表す。

θ_ｗは、ｗ番目のＵｐｓａｍｐｌｉｎｇ層に入力される情報が有する領域の行方向における画素数（又は、列方向における画素数）に対する、ｗ番目のＵｐｓａｍｐｌｉｎｇ層から出力される情報が有する領域の行方向における画素数（又は、列方向における画素数）の比を表す。θ_ｗは、１よりも大きい。Ｗ_ｕは、ＣＮＮのうちの、ｕ番目の畳み込み層より前の部分に含まれる、Ｕｐｓａｍｐｌｉｎｇ層の数を表す。

β_ｕは、ｕ番目の畳み込み層において、当該ｕ番目の畳み込み層に入力される情報が有する領域の外縁に対する、当該ｕ番目の畳み込み層から出力される情報が有する領域の外縁の縮小幅を表す。

κ_ｕは、ｕ番目の畳み込み層のカーネルの行方向における画素数（又は、列方向における画素数）を表す。λ_ｕは、ｕ番目の畳み込み層のストライドを表す。τ_ｕは、ｕ番目の畳み込み層に入力される情報が有する領域の行方向における画素数（又は、列方向における画素数）を表す。

なお、ｕ番目の畳み込み層において、当該ｕ番目の畳み込み層に入力される情報が有する領域の外縁に沿って、当該領域をω_ｕ画素だけ拡大するパディング領域が設けられる場合、β_ｕは、数式３に代えて、数式４により表される。

推定装置１０は、画像情報入力部１０１と、第１処理領域情報取得部１０２と、第１ＣＮＮ処理部１０３と、第１ＣＮＮ部情報記憶部１０４と、第２処理領域情報取得部１０５と、第２ＣＮＮ処理部１０６と、第２ＣＮＮ部情報記憶部１０７と、出力情報生成部１０８と、を備える。

本例では、推定装置１０は、ＦＰＧＡ（Ｆｉｅｌｄ－ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）により構成される。本例では、ＦＰＧＡは、記憶装置を含む。なお、推定装置１０は、ＦＰＧＡに接続される外部の記憶装置を備えていてもよい。

また、推定装置１０は、ＦＰＧＡに代えて、又は、ＦＰＧＡに加えて、ＬＳＩ（ＬａｒｇｅＳｃａｌｅＩｎｔｅｇｒａｔｉｏｎ）回路、及び、プログラム可能な論理回路（例えば、ＰＬＤ（ＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ）の少なくとも１つを備えていてもよい。

また、推定装置１０は、ＦＰＧＡに代えて、又は、ＦＰＧＡに加えて、処理装置と、記憶装置と、を備え、記憶装置に記憶されたプログラムを処理装置が実行することにより推定装置１０の機能が実現されるように構成されていてもよい。この場合、推定装置１０は、コンピュータを構成する。

例えば、処理装置は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＭＰＵ（ＭｉｃｒｏＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＧＰＵ（ＧｒａｐｈｉｃａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、又は、ＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）を含む。例えば、記憶装置は、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、半導体メモリ、有機メモリ、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、又は、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）を含む。

画像情報入力部１０１は、複数の画素からなる画像領域を有する画像情報が入力される。本例では、画像情報入力部１０１は、推定装置１０の外部から画像情報が入力される。例えば、推定装置１０は、画像情報を供給する外部装置と有線又は無線により接続されてよい。また、推定装置１０は、画像情報を供給する外部装置と通信可能に接続されていてもよい。
なお、画像情報入力部１０１は、推定装置１０の記憶装置に記憶された画像情報を読み込むことにより画像情報が入力されてもよい。

第１処理領域情報取得部１０２は、画像情報入力部１０１に入力された画像情報が有する画像領域を分割することにより取得される、第１分割数Ｐの第１分割領域のそれぞれに対して、第１処理領域情報を取得する。本例では、第１分割数Ｐは、４である。なお、第１分割数Ｐは、２、３、又は、５以上の整数であってもよい。

本例では、図２（Ａ）に表されるように、画像領域ＩＲを列方向において等間隔にて分割することにより、第１分割数Ｐの第１分割領域ＤＲ１－１～ＤＲ１－Ｐが取得される。

本例では、図３に表されるように、ｐ番目の第１分割領域ＤＲ１－ｐに対する第１処理領域情報は、画像情報入力部１０１に入力された画像情報のうちの、ｐ番目の第１分割領域ＤＲ１－ｐである着目領域と、当該着目領域に隣接する他の第１分割領域と、の境界に沿って、当該着目領域をＫ画素だけ拡大した第１処理領域ＥＲ１－ｐに対応する部分である。ｐは、１乃至Ｐの整数を表す。Ｋは、Ｙ以上であり、且つ、Ｘよりも小さい整数を表す。Ｙは、後述される。本例では、Ｋは、Ｙと等しい。なお、Ｋは、Ｙよりも大きくてもよい。

本例では、第１処理領域情報は、パディング領域情報を含む。パディング領域情報は、着目領域の外縁のうちの、当該着目領域と、当該着目領域に隣接する他の第１分割領域と、の境界以外の部分に沿って、当該着目領域をＫ画素だけ拡大するパディング領域において、所定のパディング値（例えば、０）を有する情報である。なお、パディング領域は、図３において図示が省略されている。なお、第１処理領域情報は、パディング領域情報を含まなくてもよい。

第１ＣＮＮ処理部１０３は、第１分割数Ｐの第１分割領域ＤＲ１－１～ＤＲ１－Ｐのそれぞれに対して、第１処理領域情報取得部１０２によって取得された第１処理領域情報を、第１ＣＮＮ部に入力することにより第１ＣＮＮ部情報を出力する第１ＣＮＮ処理を実行する。

第１ＣＮＮ部は、ＣＮＮのうちの、ＣＮＮの先頭（換言すると、入力側の端）から連続するとともに、Ｕ_１個の畳み込み層を含む部分である。Ｕ_１は、１以上であり、且つ、Ｕよりも小さい整数を表す。換言すると、第１ＣＮＮ部は、ＣＮＮのうちの、Ｕ_１個の畳み込み層によって、当該第１ＣＮＮ部に入力される情報が有する領域の外縁からＹ画素だけ縮小された領域を有する情報を出力する部分である。Ｙは、数式５により表される。

本例では、第１ＣＮＮ部は、ＣＮＮのうちの、ＣＮＮに含まれる畳み込み層の数Ｕの半分Ｕ／２を含む前半の部分である。数式１、及び、数式５に表されるように、Ｙは、Ｘよりも小さい自然数を表す。本例では、Ｙは、Ｘ／２と等しい。なお、Ｙは、Ｘ／２と異なっていてもよい。

第１ＣＮＮ部情報記憶部１０４は、第１分割数Ｐの第１分割領域ＤＲ１－１～ＤＲ１－Ｐのそれぞれに対して、第１ＣＮＮ処理部１０３によって出力される第１ＣＮＮ部情報を記憶する。本例では、第１ＣＮＮ部情報記憶部１０４は、記憶されている第１ＣＮＮ部情報を、第２ＣＮＮ処理部１０６による使用後に消去する。なお、第１ＣＮＮ部情報記憶部１０４は、記憶されている第１ＣＮＮ部情報を、第２ＣＮＮ処理部１０６による使用後も記憶し続けてもよい。

第２処理領域情報取得部１０５は、画像情報入力部１０１に入力された画像情報が有する画像領域を分割することにより取得される、第２分割数Ｑの第２分割領域のそれぞれに対して、第２処理領域情報を取得する。本例では、第２分割数Ｑは、第１分割数Ｐと等しい。なお、第２分割数Ｑは、第１分割数Ｐと異なっていてもよい。

本例では、図２（Ｂ）に表されるように、画像領域ＩＲを列方向において等間隔にて分割することにより、第２分割数Ｑの第２分割領域ＤＲ２－１～ＤＲ２－Ｑが取得される。

本例では、図４に表されるように、ｑ番目の第２分割領域ＤＲ２－ｑに対する第２処理領域情報は、第１ＣＮＮ処理部１０３によって出力された第１分割数Ｐの第１ＣＮＮ部情報のうちの、ｑ番目の第２分割領域ＤＲ２－ｑである着目領域と、当該着目領域に隣接する他の第２分割領域と、の境界に沿って、当該着目領域をＬ画素だけ拡大した第２処理領域ＥＲ２－ｑに対応する部分である。ｑは、１乃至Ｑの整数を表す。Ｌは、Ｚ以上の整数を表す。Ｚは、後述される。本例では、Ｌは、Ｚと等しい。なお、Ｌは、Ｚよりも大きくてもよい。

本例では、第２処理領域情報は、パディング領域情報を含む。パディング領域情報は、着目領域の外縁のうちの、当該着目領域と、当該着目領域に隣接する他の第２分割領域と、の境界以外の部分に沿って、当該着目領域をＬ画素だけ拡大するパディング領域において、所定のパディング値（例えば、０）を有する情報である。なお、パディング領域は、図４において図示が省略されている。なお、第２処理領域情報は、パディング領域情報を含まなくてもよい。

第２ＣＮＮ処理部１０６は、第２分割数Ｑの第２分割領域ＤＲ２－１～ＤＲ２－Ｑのそれぞれに対して、第２処理領域情報取得部１０５によって取得された第２処理領域情報を、第２ＣＮＮ部に入力することにより第２ＣＮＮ部情報を出力する第２ＣＮＮ処理を実行する。

第２ＣＮＮ部は、ＣＮＮのうちの、第１ＣＮＮ部に後続するとともに、Ｕ_２個の畳み込み層を含む部分である。Ｕ_２は、１以上であり、且つ、Ｕ－Ｕ_１以下である整数を表す。換言すると、第２ＣＮＮ部は、ＣＮＮのうちの、第１ＣＮＮ部に後続するとともに、Ｕ_２個の畳み込み層によって、当該第２ＣＮＮ部に入力される情報が有する領域の外縁からＺ画素だけ縮小された領域を有する情報を出力する部分である。Ｚは、数式６により表される。

本例では、Ｕ_２は、Ｕ－Ｕ_１と等しい。換言すると、第２ＣＮＮ部は、ＣＮＮのうちの、第１ＣＮＮ部に後続するとともに、ＣＮＮの末尾に至る部分である。本例では、第２ＣＮＮ部は、ＣＮＮのうちの、ＣＮＮに含まれる畳み込み層の数Ｕの半分Ｕ／２を含む後半の部分である。数式１、数式５、及び、数式６に表されるように、Ｚは、ＸからＹを減じた値以下の整数を表す。本例では、Ｚは、Ｘ／２と等しい。なお、Ｚは、Ｘ／２と異なっていてもよい。

本例では、動作の説明において詳述のように、第２ＣＮＮ処理部１０６は、ｎ_ｐ＋１番目の第１分割領域ＤＲ１－ｎ_ｐ＋１に対する第１ＣＮＮ処理の実行に続いて、当該ｎ_ｐ＋１番目の第１分割領域ＤＲ１－ｎ_ｐ＋１と少なくとも一部が重複する、ｎ_ｐ番目の第２分割領域ＤＲ２－ｎ_ｐに対する第２ＣＮＮ処理を実行する。ｎ_ｐは、ｐを表す。ｎ_ｐ＋１は、ｐ＋１を表す。

第２ＣＮＮ部情報記憶部１０７は、第２分割数Ｑの第２分割領域ＤＲ２－１～ＤＲ２－Ｑのそれぞれに対して、第２ＣＮＮ処理部１０６によって出力される第２ＣＮＮ部情報を記憶する。

出力情報生成部１０８は、第２ＣＮＮ部情報記憶部１０７に記憶されている第２分割数Ｑの第２ＣＮＮ部情報を連結することにより、画像情報が有する画像領域の少なくとも一部を構成する複数の画素のそれぞれに対する分類情報を含む出力情報を生成する。
推定装置１０の構成の説明は、以下の推定装置１０の動作の説明によって補足されてよい。

（動作）
次に、第１実施形態の推定装置１０の動作について図５及び図６を参照しながら説明する。
推定装置１０は、図５に表される第１推定処理を実行する。第１推定処理において、先ず、推定装置１０は、第１カウンタｐを「０」に設定する（図５のステップＳ１０１）。次いで、推定装置１０は、第１カウンタｐが、第１分割数Ｐよりも小さいか否かを判定する（図５のステップＳ１０２）。

この時点では、第１カウンタｐが「０」であるとともに、第１分割数Ｐが「４」である。従って、推定装置１０は、「Ｙｅｓ」と判定し、第１カウンタｐを「ｐ＋１」（この時点では、「１」）に設定する（図５のステップＳ１０３）。次いで、推定装置１０は、入力された画像情報に基づいて、ｐ（この時点では、「１」）番目の第１処理領域情報を取得する（図５のステップＳ１０４）。

次いで、推定装置１０は、ステップＳ１０４にて取得されたｐ番目の第１処理領域情報を第１ＣＮＮ部に入力する（図５のステップＳ１０５）。次いで、推定装置１０は、ｐ番目の第１処理領域情報に対する第１ＣＮＮ部情報（換言すると、ｐ番目の第１ＣＮＮ部情報）が第１ＣＮＮ部から出力されるまで待機する（図５のステップＳ１０６の「Ｎｏ」ルート）。

その後、ｐ番目の第１ＣＮＮ部情報が第１ＣＮＮ部から出力される。この時点では、推定装置１０は、ステップＳ１０６にて「Ｙｅｓ」と判定し、第１ＣＮＮ部から出力されたｐ番目の第１ＣＮＮ部情報を記憶する（図５のステップＳ１０７）。

次いで、推定装置１０は、図５のステップＳ１０２へ戻る。その後、推定装置１０は、第１カウンタｐが第１分割数Ｐと等しくなるまで、図５のステップＳ１０２～ステップＳ１０７を繰り返し実行する。そして、推定装置１０は、第１カウンタｐが第１分割数Ｐと等しくなると、図５のステップＳ１０２にて「Ｎｏ」と判定し、図５に表される第１推定処理を終了する。

更に、推定装置１０は、図６に表される第２推定処理を実行する。第２推定処理において、先ず、推定装置１０は、第２カウンタｑを「０」に設定する（図６のステップＳ２０１）。次いで、推定装置１０は、第２カウンタｑが、第２分割数Ｑよりも小さいか否かを判定する（図６のステップＳ２０２）。上述のように、本例では、第２分割数は、第１分割数と等しい。

この時点では、第２カウンタｑが「０」であるとともに、第２分割数Ｑが「４」である。従って、推定装置１０は、「Ｙｅｓ」と判定し、第２カウンタｑを「ｑ＋１」（この時点では、「１」）に設定する（図６のステップＳ２０３）。次いで、推定装置１０は、第２カウンタｑが、第２分割数Ｑと等しいか否かを判定する（図６のステップＳ２０４）。

この時点では、第２カウンタｑが「１」であるとともに、第２分割数Ｑが「４」である。従って、推定装置１０は、「Ｎｏ」と判定し、第１推定処理において、ｑ＋１（この時点では、「２」）番目の第１ＣＮＮ部情報が第１ＣＮＮ部から出力されるまで待機する（図６のステップＳ２０５の「Ｎｏ」ルート）。

その後、第１推定処理において、ｑ＋１番目の第１ＣＮＮ部情報が第１ＣＮＮ部から出力される。この時点では、推定装置１０は、ステップＳ２０５にて「Ｙｅｓ」と判定し、ステップＳ２０６へ進む。
なお、推定装置１０は、ステップＳ２０４へ進んだ時点にて、第２カウンタｑが、第２分割数Ｑと等しい場合、ステップＳ２０４にて「Ｙｅｓ」と判定し、ステップＳ２０５へ進むことなくステップＳ２０６へ進む。

次いで、推定装置１０は、第１ＣＮＮ部から出力された第１ＣＮＮ部情報に基づいて、ｑ（この時点では、「１」）番目の第２処理領域情報を取得する（図６のステップＳ２０６）。

次いで、推定装置１０は、ステップＳ２０６にて取得されたｑ番目の第２処理領域情報を第２ＣＮＮ部に入力するとともに、記憶されている第１ＣＮＮ部情報のうちの、ｑ＋１番目の第２処理領域情報に使用されない部分を消去する（図６のステップＳ２０７）。

このようにして、推定装置１０は、ｑ＋１番目の第１分割領域に対する第１ＣＮＮ処理の実行に続いて、当該ｑ＋１番目の第１分割領域と少なくとも一部が重複する、ｑ番目の第２分割領域に対する第２ＣＮＮ処理を実行する。

次いで、推定装置１０は、ｑ番目の第２処理領域情報に対する第２ＣＮＮ部情報（換言すると、ｑ番目の第２ＣＮＮ部情報）が第２ＣＮＮ部から出力されるまで待機する（図６のステップＳ２０８の「Ｎｏ」ルート）。

その後、ｑ番目の第２ＣＮＮ部情報が第２ＣＮＮ部から出力される。この時点では、推定装置１０は、ステップＳ２０８にて「Ｙｅｓ」と判定し、第２ＣＮＮ部から出力されたｑ番目の第２ＣＮＮ部情報を記憶する（図６のステップＳ２０９）。

次いで、推定装置１０は、図６のステップＳ２０２へ戻る。その後、推定装置１０は、第２カウンタｑが第２分割数Ｑと等しくなるまで、図６のステップＳ２０２～ステップＳ２０９を繰り返し実行する。そして、推定装置１０は、第２カウンタｑが第２分割数Ｑと等しくなると、図６のステップＳ２０２にて「Ｎｏ」と判定し、ステップＳ２１０へ進む。

次いで、推定装置１０は、記憶されている第２分割数Ｑの第２ＣＮＮ部情報を連結することにより出力情報を生成する（図６のステップＳ２１０）。次いで、推定装置１０は、図６に表される第２推定処理を終了する。
このようにして、推定装置１０は、入力された画像情報に対して、ＣＮＮを用いてセマンティックセグメンテーションを行う。

以上、説明したように、第１実施形態の推定装置１０は、複数の画素からなる画像領域を有する画像情報に対して、複数の畳み込み層によって、入力される情報が有する領域の外縁からＸ画素だけ縮小された領域を有する情報を出力するＣＮＮを用いてセマンティックセグメンテーションを行う。Ｘは、２以上の整数を表す。

推定装置１０は、第１ＣＮＮ処理部１０３と、第２ＣＮＮ処理部１０６と、を備える。
第１ＣＮＮ処理部１０３は、画像領域を分割することにより取得される第１分割数Ｐの第１分割領域ＤＲ１－１～ＤＲ１－Ｐのそれぞれに対して、画像情報のうちの、当該第１分割領域ＤＲ１－ｐである着目領域と、当該着目領域に隣接する他の第１分割領域と、の境界に沿って、当該着目領域をＫ画素だけ拡大した第１処理領域に対応する部分を、第１ＣＮＮ部に入力することにより第１ＣＮＮ部情報を出力する第１ＣＮＮ処理を実行する。

第１ＣＮＮ部は、ＣＮＮのうちの、少なくとも１つの畳み込み層によって、入力される情報が有する領域の外縁からＹ画素だけ縮小された領域を有する情報を出力する部分である。Ｙは、Ｘよりも小さい自然数を表す。Ｋは、Ｙ以上であり、且つ、Ｘよりも小さい整数を表す。

第２ＣＮＮ処理部１０６は、画像領域を分割することにより取得される第２分割数Ｑの第２分割領域ＤＲ２－１～ＤＲ２－Ｑのそれぞれに対して、出力された第１分割数Ｐの第１ＣＮＮ部情報のうちの、当該第２分割領域ＤＲ２－ｑである着目領域と、当該着目領域に隣接する他の第２分割領域と、の境界に沿って、当該着目領域をＬ画素だけ拡大した第２処理領域に対応する部分を、第２ＣＮＮ部に入力することにより第２ＣＮＮ部情報を出力する第２ＣＮＮ処理を実行する。

第２ＣＮＮ部は、ＣＮＮのうちの、第１ＣＮＮ部に後続するとともに、少なくとも１つの畳み込み層によって、入力される情報が有する領域の外縁からＺ画素だけ縮小された領域を有する情報を出力する部分である。Ｚは、ＸからＹを減じた値以下の整数を表す。Ｌは、Ｚ以上の整数を表す。

図７は、第１実施形態の推定装置１０における領域の変化を表す。図７（Ａ）の実線は、第１ＣＮＮ部に入力される情報が有する領域を表す。本例では、この領域は、破線により表される第１分割領域をＫ（本例では、Ｋは、Ｙと等しい）画素だけ拡大した領域である。図７（Ｂ）の実線は、第１ＣＮＮ部から出力される情報が有する領域を表す。本例では、この領域は、第１分割領域に一致する。

図７（Ｃ）の実線は、第２ＣＮＮ部に入力される情報が有する領域を表す。本例では、この領域は、破線により表される第２分割領域（本例では、第１分割領域と一致する）をＬ（本例では、Ｌは、Ｚと等しい）画素だけ拡大した領域である。図７（Ｄ）の実線は、第２ＣＮＮ部から出力される情報が有する領域を表す。本例では、この領域は、第２分割領域に一致する。

また、図８は、比較例の推定装置（例えば、特許文献１の推定装置）における領域の変化を表す。比較例の推定装置においては、分割領域を、ＣＮＮの全体に対する縮小幅であるＸ画素だけ拡大した領域を有する情報がＣＮＮに入力される。図８（Ａ）の実線は、ＣＮＮに入力される情報が有する領域を表す。本例では、この領域は、破線により表される分割領域をＸ画素だけ拡大した領域である。図８（Ｂ）の実線は、ＣＮＮのうちの、第１ＣＮＮ部から出力される情報が有する領域を表す。この領域は、ＣＮＮに入力される領域（図８（Ａ）の実線の領域）をＹ画素だけ縮小した領域である。

図８（Ｃ）の実線は、ＣＮＮのうちの、第２ＣＮＮ部に入力される情報が有する領域を表す。本例では、この領域は、図８（Ｂ）の実線の領域と一致する。図８（Ｄ）の実線は、ＣＮＮから出力される情報が有する領域を表す。

このように、第１実施形態の推定装置１０によれば、第１処理領域は、ＣＮＮの全体に対する縮小幅であるＸよりも小さいＫ画素だけ第１分割領域ＤＲ１－ｐを拡大した領域である。従って、第１ＣＮＮ処理の対象となる第１分割数Ｐの第１処理領域に含まれる画素の総数を抑制できる。これにより、画像情報のうちの、分割領域をＸ画素だけ拡大した処理領域に対応する部分をＣＮＮに入力する場合（例えば、比較例の推定装置）と比較して、第１ＣＮＮ処理における演算量を抑制できる。この結果、処理負荷を抑制できる。

更に、第１実施形態の推定装置１０において、第２ＣＮＮ処理部１０６は、ｎ_ｐ＋１番目の第１分割領域ＤＲ１－ｎ_ｐ＋１に対する第１ＣＮＮ処理の実行に続いて、当該ｎ_ｐ＋１番目の第１分割領域ＤＲ１－ｎ_ｐ＋１と少なくとも一部が重複する、ｎ_ｐ番目の第２分割領域ＤＲ２－ｎ_ｐに対する第２ＣＮＮ処理を実行する。ｎ_ｐは、ｐを表す。ｎ_ｐ＋１は、ｐ＋１を表す。

これによれば、ｎ_ｐ＋１番目の第１分割領域ＤＲ１－ｎ_ｐ＋１に対する第１ＣＮＮ処理の実行に続いて、当該ｎ_ｐ＋１番目の第１分割領域ＤＲ１－ｎ_ｐ＋１と少なくとも一部が重複するｎ_ｐ番目の第２分割領域ＤＲ２－ｎ_ｐに対する第２ＣＮＮ処理が実行される。従って、第２ＣＮＮ処理に備えて第１ＣＮＮ部情報を保持するためのリソース（換言すると、記憶装置の記憶容量）を抑制できる。

＜第２実施形態＞
次に、第２実施形態の推定装置について説明する。第２実施形態の推定装置は、第１実施形態の推定装置に対して、第１分割数が第２分割数よりも小さい点において相違している。以下、相違点を中心として説明する。なお、第２実施形態の説明において、第１実施形態にて使用した符号と同じ符号を付したものは、同一又は略同様のものである。

本例では、図９（Ａ）に表されるように、画像領域ＩＲを列方向において等間隔にて分割することにより、第１分割数Ｐの第１分割領域ＤＲ１－１～ＤＲ１－Ｐが取得される。本例では、第１分割数Ｐは、４である。なお、第１分割数Ｐは、２、３、又は、５以上の整数であってもよい。
本例では、各第１分割領域ＤＲ１－ｐの列方向における画素数は、５Ｌである。

また、本例では、図９（Ｂ）に表されるように、画像領域ＩＲを列方向において等間隔にて分割することにより、第２分割数Ｑの第２分割領域ＤＲ２－１～ＤＲ２－Ｑが取得される。第２分割数Ｑは、第１分割数Ｐよりも１だけ大きい。従って、本例では、第２分割数Ｑは、５である。本例では、各第２分割領域ＤＲ２－ｑの列方向における画素数は、４Ｌである。

本例では、図９に表されるように、１番目の第２分割領域ＤＲ２－１は、１番目の第１分割領域ＤＲ１－１である着目領域と、当該着目領域に隣接する他の第１分割領域と、の境界に沿って、当該着目領域をＭ（本例では、Ｌ）画素だけ縮小した領域である。Ｍは、ＫからＹを減じた値を、Ｚから減じた値以上の整数を表す。本例では、Ｍは、Ｌと等しい。なお、Ｍは、Ｌよりも大きくてもよい。

本例では、図１０に表されるように、１番目の第２分割領域ＤＲ２－１に対する第２処理領域情報は、第１ＣＮＮ処理部１０３によって出力された第１分割数Ｐの第１ＣＮＮ部情報のうちの、１番目の第１分割領域ＤＲ１－１と一致する第２処理領域ＥＲ２－１に対応する部分である。

２番目の第２分割領域ＤＲ２－２に対する第２処理領域情報は、第１ＣＮＮ処理部１０３によって出力された第１分割数Ｐの第１ＣＮＮ部情報のうちの、１番目の第１分割領域ＤＲ１－１の中の末尾側の列方向における２Ｌ画素の部分と、２番目の第１分割領域ＤＲ１－２の中の先頭側の列方向における４Ｌ画素の部分と、からなる第２処理領域ＥＲ２－２に対応する部分である。

３番目の第２分割領域ＤＲ２－３に対する第２処理領域情報は、第１ＣＮＮ処理部１０３によって出力された第１分割数Ｐの第１ＣＮＮ部情報のうちの、２番目の第１分割領域ＤＲ１－２の中の末尾側の列方向における３Ｌ画素の部分と、３番目の第１分割領域ＤＲ１－３の中の先頭側の列方向における３Ｌ画素の部分と、からなる第２処理領域ＥＲ２－３に対応する部分である。

４番目の第２分割領域ＤＲ２－４に対する第２処理領域情報は、第１ＣＮＮ処理部１０３によって出力された第１分割数Ｐの第１ＣＮＮ部情報のうちの、３番目の第１分割領域ＤＲ１－３の中の末尾側の列方向における４Ｌ画素の部分と、４番目の第１分割領域ＤＲ１－４の中の先頭側の列方向における２Ｌ画素の部分と、からなる第２処理領域ＥＲ２－４に対応する部分である。

５番目の第２分割領域ＤＲ２－５に対する第２処理領域情報は、第１ＣＮＮ処理部１０３によって出力された第１分割数Ｐの第１ＣＮＮ部情報のうちの、４番目の第１分割領域ＤＲ１－４と一致する第２処理領域ＥＲ２－５に対応する部分である。

第２実施形態の推定装置１０は、図６の第２推定処理に代えて、図１１の第２推定処理を実行する。図１１の第２推定処理は、図６の第２推定処理に対して、ステップＳ２０５の処理がステップＳ２０５Ａの処理に置き換えられた点において相違している。

従って、本例では、推定装置１０は、ステップＳ２０４にて「Ｎｏ」と判定した場合、ステップＳ２０５Ａに進み、第１推定処理において、ｑ番目の第１ＣＮＮ部情報が第１ＣＮＮ部から出力されるまで待機する（図１１のステップＳ２０５Ａの「Ｎｏ」ルート）。

その後、第１推定処理において、ｑ番目の第１ＣＮＮ部情報が第１ＣＮＮ部から出力されると、推定装置１０は、ステップＳ２０５Ａにて「Ｙｅｓ」と判定し、ステップＳ２０６へ進む。

その後、推定装置１０は、第１実施形態の推定装置１０と同様に、ステップＳ２０６以降の処理を実行することにより、図１１に表される第２推定処理を実行する。
従って、本例では、推定装置１０は、ｎ_ｐ番目の第１分割領域ＤＲ１－ｎ_ｐに対する第１ＣＮＮ処理の実行に続いて、当該ｎ_ｐ番目の第１分割領域ＤＲ１－ｎ_ｐと少なくとも一部が重複する、ｎ_ｐ番目の第２分割領域ＤＲ２－ｎ_ｐに対する第２ＣＮＮ処理を実行する。ｎ_ｐは、ｐを表す。

以上、説明したように、第２実施形態の推定装置１０は、第１実施形態の推定装置１０と同様の構成を有するので、第１実施形態の推定装置１０と同様の作用及び効果が奏される。
更に、第２実施形態の推定装置１０において、第１分割数Ｐは、第２分割数Ｑよりも小さい。

ところで、推定装置１０においては、第１ＣＮＮ処理の対象となる第１分割数Ｐの第１処理領域に含まれる画素の総数を抑制できる。従って、第１分割数Ｐを第２分割数Ｑよりも小さくしても、１つの第１分割領域に対する第１ＣＮＮ処理の処理負荷が過大になることを抑制できる。そこで、第２実施形態の推定装置１０においては、第１分割数Ｐを第２分割数Ｑよりも小さくする。この結果、第１分割数Ｐを第２分割数Ｑと等しくする場合と比較して、第１ＣＮＮ処理の対象となる第１分割数Ｐの第１処理領域に含まれる画素の総数をより一層抑制できる。

更に、第２実施形態の推定装置１０において、第２ＣＮＮ処理部１０６は、第１分割領域ＤＲ１－ｎ_ｐに対する第１ＣＮＮ処理の実行に続いて、当該第１分割領域ＤＲ１－ｎ_ｐと少なくとも一部が重複する第２分割領域ＤＲ２－ｎ_ｐに対する第２ＣＮＮ処理を実行する。ｎ_ｐは、ｐを表す。

これによれば、ｎ_ｐ番目の第１分割領域ＤＲ１－ｎ_ｐに対する第１ＣＮＮ処理の実行に続いて、当該ｎ_ｐ番目の第１分割領域ＤＲ１－ｎ_ｐと少なくとも一部が重複するｎ_ｐ番目の第２分割領域ＤＲ２－ｎ_ｐに対する第２ＣＮＮ処理が実行される。従って、第２ＣＮＮ処理に備えて第１ＣＮＮ部情報を保持するためのリソース（換言すると、記憶装置の記憶容量）を抑制できる。

更に、第２実施形態の推定装置１０において、第２ＣＮＮ処理部１０６が１番目に実行する第２ＣＮＮ処理の対象となる第２分割領域ＤＲ２－１は、第１ＣＮＮ処理部１０３が１番目に実行する第１ＣＮＮ処理の対象となる第１分割領域ＤＲ１－１である着目領域と、当該着目領域に隣接する他の第１分割領域と、の境界に沿って、当該着目領域をＭ画素だけ縮小した領域である。Ｍは、ＫからＹを減じた値を、Ｚから減じた値以上の整数を表す。

これによれば、１番目に第２ＣＮＮ処理を実行する際に、２番目以降に実行される第１ＣＮＮ処理の完了を待つことなく第２ＣＮＮ処理を実行できるので、処理時間を短縮できる。

＜第３実施形態＞
次に、第３実施形態の推定装置について説明する。第３実施形態の推定装置は、第１実施形態の推定装置に対して、第２分割数の第２分割領域のうちの一部において、列方向における画素数が他の第２分割領域と異なる点において相違している。以下、相違点を中心として説明する。なお、第３実施形態の説明において、第１実施形態にて使用した符号と同じ符号を付したものは、同一又は略同様のものである。

本例では、図１２（Ａ）に表されるように、画像領域ＩＲを列方向において等間隔にて分割することにより、第１分割数Ｐの第１分割領域ＤＲ１－１～ＤＲ１－Ｐが取得される。本例では、第１分割数Ｐは、４である。なお、第１分割数Ｐは、２、３、又は、５以上の整数であってもよい。
本例では、各第１分割領域ＤＲ１－ｐの列方向における画素数は、５Ｌである。

また、本例では、図９（Ｂ）に表されるように、画像領域ＩＲを列方向において、異なる間隔にて分割することにより、第２分割数Ｑの第２分割領域ＤＲ２－１～ＤＲ２－Ｑが取得される。第２分割数Ｑは、第１分割数Ｐと等しい。従って、本例では、第２分割数Ｑは、４である。なお、第２分割数Ｑは、第１分割数Ｐよりも大きくてもよい。

本例では、１番目の第２分割領域ＤＲ２－１の列方向における画素数は、４Ｌである。本例では、２番目の第２分割領域ＤＲ２－２、及び、３番目の第２分割領域ＤＲ２－３の列方向における画素数は、５Ｌである。本例では、４番目の第２分割領域ＤＲ２－４の列方向における画素数は、６Ｌである。

本例では、図１２に表されるように、１番目の第２分割領域ＤＲ２－１は、１番目の第１分割領域ＤＲ１－１である着目領域と、当該着目領域に隣接する他の第１分割領域と、の境界に沿って、当該着目領域をＭ（本例では、Ｌ）画素だけ縮小した領域である。Ｍは、ＫからＹを減じた値を、Ｚから減じた値以上の整数を表す。本例では、Ｍは、Ｌと等しい。なお、Ｍは、Ｌよりも大きくてもよい。

また、本例では、図１２に表されるように、ｉ（ｉは、２以上であるとともに第２分割数Ｑよりも小さい整数を表す）番目の第２分割領域ＤＲ２－ｉ（換言すると、第２ＣＮＮ処理部１０６がｉ番目に実行する第２ＣＮＮ処理の対象となる第２分割領域ＤＲ２－ｉ）は、ｉ番目の第１分割領域ＤＲ１－ｉ（換言すると、第１ＣＮＮ処理部１０３がｉ番目に実行する第１ＣＮＮ処理の対象となる第１分割領域ＤＲ１－ｉ）である着目領域と、当該着目領域に隣接する他の第１分割領域のうちの、ｉ＋１番目の第１分割領域と、の境界に沿って、当該着目領域をＭ（本例では、Ｌ）画素だけ縮小するとともに、当該着目領域と、当該着目領域に隣接する他の第１分割領域のうちの、ｉ－１番目の第１分割領域と、の境界に沿って、当該着目領域をＭ（本例では、Ｌ）画素だけ拡大した領域である。

また、本例では、図１２に表されるように、ｎ_Ｑ番目の第２分割領域ＤＲ２－ｎ_Ｑは、ｎ_Ｑ番目の第１分割領域ＤＲ１－ｎ_Ｑである着目領域と、当該着目領域と、当該着目領域に隣接する他の第１分割領域のうちの、ｎ_Ｑ－１番目の第１分割領域ＤＲ１－ｎ_Ｑ－１と、の境界に沿って、当該着目領域をＭ（本例では、Ｌ）画素だけ拡大した領域である。ｎ_Ｑは、Ｑを表す。ｎ_Ｑ－１は、Ｑ－１を表す。

本例では、図１３に表されるように、１番目の第２分割領域ＤＲ２－１に対する第２処理領域情報は、第１ＣＮＮ処理部１０３によって出力された第１分割数Ｐの第１ＣＮＮ部情報のうちの、１番目の第１分割領域ＤＲ１－１と一致する第２処理領域ＥＲ２－１に対応する部分である。

２番目の第２分割領域ＤＲ２－２に対する第２処理領域情報は、第１ＣＮＮ処理部１０３によって出力された第１分割数Ｐの第１ＣＮＮ部情報のうちの、１番目の第１分割領域ＤＲ１－１の中の末尾側の列方向における２Ｌ画素の部分と、２番目の第１分割領域ＤＲ１－２と、からなる第２処理領域ＥＲ２－２に対応する部分である。

３番目の第２分割領域ＤＲ２－３に対する第２処理領域情報は、第１ＣＮＮ処理部１０３によって出力された第１分割数Ｐの第１ＣＮＮ部情報のうちの、２番目の第１分割領域ＤＲ１－２の中の末尾側の列方向における２Ｌ画素の部分と、３番目の第１分割領域ＤＲ１－３と、からなる第２処理領域ＥＲ２－３に対応する部分である。

４番目の第２分割領域ＤＲ２－４に対する第２処理領域情報は、第１ＣＮＮ処理部１０３によって出力された第１分割数Ｐの第１ＣＮＮ部情報のうちの、３番目の第１分割領域ＤＲ１－３の中の末尾側の列方向における２Ｌ画素の部分と、４番目の第１分割領域ＤＲ１－４と、からなる第２処理領域ＥＲ２－４に対応する部分である。

第３実施形態の推定装置１０は、図６の第２推定処理に代えて、図１４の第２推定処理を実行する。図１４の第２推定処理は、図６の第２推定処理に対して、ステップＳ２０４及びステップＳ２０５の処理がステップＳ２０５Ｂの処理に置き換えられた点において相違している。

従って、本例では、推定装置１０は、ステップＳ２０３を実行した後、ステップＳ２０５Ｂに進み、第１推定処理において、ｑ番目の第１ＣＮＮ部情報が第１ＣＮＮ部から出力されるまで待機する（図１４のステップＳ２０５Ｂの「Ｎｏ」ルート）。

その後、第１推定処理において、ｑ番目の第１ＣＮＮ部情報が第１ＣＮＮ部から出力されると、推定装置１０は、ステップＳ２０５Ｂにて「Ｙｅｓ」と判定し、ステップＳ２０６へ進む。

その後、推定装置１０は、第１実施形態の推定装置１０と同様に、ステップＳ２０６以降の処理を実行することにより、図１４に表される第２推定処理を実行する。
従って、本例では、推定装置１０は、ｎ_ｐ番目の第１分割領域ＤＲ１－ｎ_ｐに対する第１ＣＮＮ処理の実行に続いて、当該ｎ_ｐ番目の第１分割領域ＤＲ１－ｎ_ｐと少なくとも一部が重複する、ｎ_ｐ番目の第２分割領域ＤＲ２－ｎ_ｐに対する第２ＣＮＮ処理を実行する。ｎ_ｐは、ｐを表す。

以上、説明したように、第３実施形態の推定装置１０は、第１実施形態の推定装置１０と同様の構成を有するので、第１実施形態の推定装置１０と同様の作用及び効果が奏される。
更に、第３実施形態の推定装置１０において、第２ＣＮＮ処理部１０６は、第１分割領域ＤＲ１－ｎ_ｐに対する第１ＣＮＮ処理の実行に続いて、当該第１分割領域ＤＲ１－ｎ_ｐと少なくとも一部が重複する第２分割領域ＤＲ２－ｎ_ｐに対する第２ＣＮＮ処理を実行する。ｎ_ｐは、ｐを表す。

更に、第３実施形態の推定装置１０において、第２ＣＮＮ処理部１０６が１番目に実行する第２ＣＮＮ処理の対象となる第２分割領域ＤＲ２－１は、第１ＣＮＮ処理部１０３が１番目に実行する第１ＣＮＮ処理の対象となる第１分割領域ＤＲ１－１である着目領域と、当該着目領域に隣接する他の第１分割領域と、の境界に沿って、当該着目領域をＭ画素だけ縮小した領域である。Ｍは、ＫからＹを減じた値を、Ｚから減じた値以上の整数を表す。

更に、第３実施形態の推定装置１０において、第２ＣＮＮ処理部１０６がｉ（ｉは、２以上であるとともに第２分割数Ｑよりも小さい整数を表す）番目に実行する第２ＣＮＮ処理の対象となる第２分割領域ＤＲ２－ｉは、第１ＣＮＮ処理部１０３がｉ番目に実行する第１ＣＮＮ処理の対象となる第１分割領域ＤＲ１－ｉである着目領域と、当該着目領域に隣接する他の第１分割領域のうちの、第１ＣＮＮ処理部１０３がｉ＋１番目に実行する第１ＣＮＮ処理の対象となる第１分割領域と、の境界に沿って、当該着目領域をＭ画素だけ縮小するとともに、当該着目領域と、当該着目領域に隣接する他の第１分割領域のうちの、第１ＣＮＮ処理部１０３がｉ－１番目に実行する第１ＣＮＮ処理の対象となる第１分割領域と、の境界に沿って、当該着目領域をＭ画素だけ拡大した領域である。

これによれば、ｉ番目に第２ＣＮＮ処理を実行する際に、未だ実行されていない第１ＣＮＮ処理の完了を待つことなく第２ＣＮＮ処理を実行できるので、処理時間を短縮できる。更に、第２ＣＮＮ処理に備えて第１ＣＮＮ部情報を保持するためのリソース（換言すると、記憶装置の記憶容量）を抑制できる。

なお、本発明は、上述した実施形態に限定されない。例えば、上述した実施形態に、本発明の趣旨を逸脱しない範囲内において当業者が理解し得る様々な変更が加えられてよい。

例えば、図１５に表されるように、第１分割領域、及び、第２分割領域の少なくとも一方は、画像領域ＩＲを行方向において分割することにより取得されてよい。また、例えば、図１６に表されるように、第１分割領域、及び、第２分割領域の少なくとも一方は、画像領域ＩＲを、行方向及び列方向の両方において分割することにより取得されてよい。

ところで、上述した実施形態において、ＣＮＮが、第１ＣＮＮ部及び第２ＣＮＮ部からなる２つの部分に分割されるとともに、第１ＣＮＮ部及び第２ＣＮＮ部に対して、第１分割領域及び第２分割領域がそれぞれ設定される。なお、ＣＮＮがＨ個の部分に分割されるとともに、Ｈ個の部分に対して、Ｈ種類の分割領域がそれぞれ設定されてもよい。Ｈは、３以上の整数を表す。例えば、ＣＮＮが、第１ＣＮＮ部、第２ＣＮＮ部、及び、第３ＣＮＮ部からなる３つの部分に分割されるとともに、第１ＣＮＮ部、第２ＣＮＮ部、及び、第３ＣＮＮ部に対して、第１分割領域、第２分割領域、及び、第３分割領域がそれぞれ設定されてもよい。

１０推定装置
１０１画像情報入力部
１０２第１処理領域情報取得部
１０３第１ＣＮＮ処理部
１０４第１ＣＮＮ部情報記憶部
１０５第２処理領域情報取得部
１０６第２ＣＮＮ処理部
１０７第２ＣＮＮ部情報記憶部
１０８出力情報生成部
ＤＲ１－１～ＤＲ１－Ｐ第１分割領域
ＥＲ１－１～ＥＲ１－Ｐ第１処理領域
ＤＲ２－１～ＤＲ２－Ｑ第２分割領域
ＥＲ２－１～ＥＲ２－Ｑ第２処理領域
ＩＲ画像領域

Claims

複数の画素からなる画像領域を有する画像情報に対して、複数の畳み込み層によって、入力される情報が有する領域の外縁からＸ画素だけ縮小された領域を有する情報を出力するＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）を用いてセマンティックセグメンテーションを行う推定装置であって、
前記画像領域を分割することにより取得される第１分割数の第１分割領域のそれぞれに対して、前記画像情報のうちの、当該第１分割領域である着目領域と、当該着目領域に隣接する他の第１分割領域と、の境界に沿って、当該着目領域をＫ画素だけ拡大した第１処理領域に対応する部分を、前記ＣＮＮのうちの、少なくとも１つの畳み込み層によって、入力される情報が有する領域の外縁からＹ画素だけ縮小された領域を有する情報を出力する部分である第１ＣＮＮ部に入力することにより第１ＣＮＮ部情報を出力する第１ＣＮＮ処理を実行する第１ＣＮＮ処理部と、
前記画像領域を分割することにより取得される第２分割数の第２分割領域のそれぞれに対して、前記出力された第１分割数の第１ＣＮＮ部情報のうちの、当該第２分割領域である着目領域と、当該着目領域に隣接する他の第２分割領域と、の境界に沿って、当該着目領域をＬ画素だけ拡大した第２処理領域に対応する部分を、前記ＣＮＮのうちの、前記第１ＣＮＮ部に後続するとともに、少なくとも１つの畳み込み層によって、入力される情報が有する領域の外縁からＺ画素だけ縮小された領域を有する情報を出力する部分である第２ＣＮＮ部に入力することにより第２ＣＮＮ部情報を出力する第２ＣＮＮ処理を実行する第２ＣＮＮ処理部と、を備え、
Ｘは、２以上の整数を表し、
Ｙは、Ｘよりも小さい自然数を表し、
Ｚは、ＸからＹを減じた値以下の整数を表し、
Ｋは、Ｙ以上であり、且つ、Ｘよりも小さい整数を表し、
Ｌは、Ｚ以上の整数を表す、推定装置。
請求項１に記載の推定装置であって、
前記第１分割数は、前記第２分割数よりも小さい、推定装置。
請求項１又は請求項２に記載の推定装置であって、
前記第２ＣＮＮ処理部は、前記第１分割領域に対する前記第１ＣＮＮ処理の実行に続いて、当該第１分割領域と少なくとも一部が重複する第２分割領域に対する前記第２ＣＮＮ処理を実行する、推定装置。
請求項３に記載の推定装置であって、
前記第２ＣＮＮ処理部が１番目に実行する前記第２ＣＮＮ処理の対象となる第２分割領域は、前記第１ＣＮＮ処理部が１番目に実行する前記第１ＣＮＮ処理の対象となる第１分割領域である着目領域と、当該着目領域に隣接する他の第１分割領域と、の境界に沿って、当該着目領域をＭ画素だけ縮小した領域であり、
Ｍは、ＫからＹを減じた値を、Ｚから減じた値以上の整数を表す、推定装置。
請求項４に記載の推定装置であって、
前記第２ＣＮＮ処理部がｉ（ｉは、２以上であるとともに前記第２分割数よりも小さい整数を表す）番目に実行する前記第２ＣＮＮ処理の対象となる第２分割領域は、前記第１ＣＮＮ処理部がｉ番目に実行する前記第１ＣＮＮ処理の対象となる第１分割領域である着目領域と、当該着目領域に隣接する他の第１分割領域のうちの、前記第１ＣＮＮ処理部がｉ＋１番目に実行する前記第１ＣＮＮ処理の対象となる第１分割領域と、の境界に沿って、当該着目領域をＭ画素だけ縮小するとともに、当該着目領域と、当該着目領域に隣接する他の第１分割領域のうちの、前記第１ＣＮＮ処理部がｉ－１番目に実行する前記第１ＣＮＮ処理の対象となる第１分割領域と、の境界に沿って、当該着目領域をＭ画素だけ拡大した領域である、推定装置。
複数の画素からなる画像領域を有する画像情報に対して、複数の畳み込み層によって、入力される情報が有する領域の外縁からＸ画素だけ縮小された領域を有する情報を出力するＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）を用いてセマンティックセグメンテーションを行う推定方法であって、
前記画像領域を分割することにより取得される第１分割数の第１分割領域のそれぞれに対して、前記画像情報のうちの、当該第１分割領域である着目領域と、当該着目領域に隣接する他の第１分割領域と、の境界に沿って、当該着目領域をＫ画素だけ拡大した第１処理領域に対応する部分を、前記ＣＮＮのうちの、少なくとも１つの畳み込み層によって、入力される情報が有する領域の外縁からＹ画素だけ縮小された領域を有する情報を出力する部分である第１ＣＮＮ部に入力することにより第１ＣＮＮ部情報を出力する第１ＣＮＮ処理を実行し、
前記画像領域を分割することにより取得される第２分割数の第２分割領域のそれぞれに対して、前記出力された第１分割数の第１ＣＮＮ部情報のうちの、当該第２分割領域である着目領域と、当該着目領域に隣接する他の第２分割領域と、の境界に沿って、当該着目領域をＬ画素だけ拡大した第２処理領域に対応する部分を、前記ＣＮＮのうちの、前記第１ＣＮＮ部に後続するとともに、少なくとも１つの畳み込み層によって、入力される情報が有する領域の外縁からＺ画素だけ縮小された領域を有する情報を出力する部分である第２ＣＮＮ部に入力することにより第２ＣＮＮ部情報を出力する第２ＣＮＮ処理を実行する、ことを含み、
Ｘは、２以上の整数を表し、
Ｙは、Ｘよりも小さい自然数を表し、
Ｚは、ＸからＹを減じた値以下の整数を表し、
Ｋは、Ｙ以上であり、且つ、Ｘよりも小さい整数を表し、
Ｌは、Ｚ以上の整数を表す、推定方法。
複数の画素からなる画像領域を有する画像情報に対して、複数の畳み込み層によって、入力される情報が有する領域の外縁からＸ画素だけ縮小された領域を有する情報を出力するＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）を用いてセマンティックセグメンテーションを行う推定処理をコンピュータに実行させる推定プログラムであって、
前記推定処理は、
前記画像領域を分割することにより取得される第１分割数の第１分割領域のそれぞれに対して、前記画像情報のうちの、当該第１分割領域である着目領域と、当該着目領域に隣接する他の第１分割領域と、の境界に沿って、当該着目領域をＫ画素だけ拡大した第１処理領域に対応する部分を、前記ＣＮＮのうちの、少なくとも１つの畳み込み層によって、入力される情報が有する領域の外縁からＹ画素だけ縮小された領域を有する情報を出力する部分である第１ＣＮＮ部に入力することにより第１ＣＮＮ部情報を出力する第１ＣＮＮ処理を実行し、
前記画像領域を分割することにより取得される第２分割数の第２分割領域のそれぞれに対して、前記出力された第１分割数の第１ＣＮＮ部情報のうちの、当該第２分割領域である着目領域と、当該着目領域に隣接する他の第２分割領域と、の境界に沿って、当該着目領域をＬ画素だけ拡大した第２処理領域に対応する部分を、前記ＣＮＮのうちの、前記第１ＣＮＮ部に後続するとともに、少なくとも１つの畳み込み層によって、入力される情報が有する領域の外縁からＺ画素だけ縮小された領域を有する情報を出力する部分である第２ＣＮＮ部に入力することにより第２ＣＮＮ部情報を出力する第２ＣＮＮ処理を実行する、ことを含み、
Ｘは、２以上の整数を表し、
Ｙは、Ｘよりも小さい自然数を表し、
Ｚは、ＸからＹを減じた値以下の整数を表し、
Ｋは、Ｙ以上であり、且つ、Ｘよりも小さい整数を表し、
Ｌは、Ｚ以上の整数を表す、推定プログラム。