JP7042092B2 - 画像情報変換器およびそのプログラム - Google Patents
画像情報変換器およびそのプログラム Download PDFInfo
- Publication number
- JP7042092B2 JP7042092B2 JP2018011613A JP2018011613A JP7042092B2 JP 7042092 B2 JP7042092 B2 JP 7042092B2 JP 2018011613 A JP2018011613 A JP 2018011613A JP 2018011613 A JP2018011613 A JP 2018011613A JP 7042092 B2 JP7042092 B2 JP 7042092B2
- Authority
- JP
- Japan
- Prior art keywords
- image information
- feature amount
- converter
- resolutions
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004364 calculation method Methods 0.000 claims description 84
- 238000006243 chemical reaction Methods 0.000 claims description 28
- 230000002194 synthesizing effect Effects 0.000 claims description 23
- 239000000203 mixture Substances 0.000 claims description 10
- 230000010354 integration Effects 0.000 claims description 7
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 description 30
- 238000003786 synthesis reaction Methods 0.000 description 30
- 239000002131 composite material Substances 0.000 description 18
- 238000013528 artificial neural network Methods 0.000 description 14
- 239000000284 extract Substances 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000000034 method Methods 0.000 description 10
- 238000011176 pooling Methods 0.000 description 9
- 210000002569 neuron Anatomy 0.000 description 8
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000001537 neural effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000007429 general method Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Images
Landscapes
- Image Processing (AREA)
Description
DNNは、1つまたは複数の値を入力して、1つの値を出力するニューロンと呼ばれる単純なユニットを大量に組み合わせることで、複雑な数値情報を変換する変換器(ネットワーク)である。ニューロンは、それぞれの内部に変更可能なパラメータを持ち、そのパラメータを適切に調整することで、目的に応じた変換器を構築することができる。例えば、白黒画像の画素値を入力して、カラー画像の画素値を出力するカラー変換器等である。このパラメータの調整を学習と呼び、この学習は、一般的に誤差逆伝搬法と呼ばれる手法により行われる。
図15に示すFCNは、コンボリューション層(Conv)Cにおける畳み込みにより、画像の空間的サイズを徐々に浅い層から深い層に向かって縮小していくことで特徴を抽出し、その後、深い層から浅い層に向かって徐々に拡大することで画像内の領域を抽出する構造を有している。ここでは、画像の空間的サイズがより小さいコンボリューション層Cを、深い層と呼ぶ。
図16に示すU-Netは、FCNと同様に、コンボリューション層Cにおける畳み込みにより、画像の空間的サイズを徐々に浅い層から深い層に向かって縮小し、その後、徐々に拡大するネットワークである。しかし、U-Netは、縮小される前のコンボリューション層(例えば、C1)の出力を、中間のコンボリューション層を飛ばして、直接後方の同じ画像の空間的サイズを対象とするコンボリューション層(例えば、C2)に伝達する(スキップ・コネクション)。これによって、局所的特徴(例えば、入力画像のエッジ特徴等)を劣化させずに直接後方に伝達している。
一方、従来のU-Netは、スキップ・コネクションにより、コンボリューション層の空間的サイズの大きい特徴から小さい特徴まで段階的に後方に伝達することができる。しかし、U-Netが浅い層で伝達する空間的サイズのより大きい画像の特徴ほど、画像の大域的特徴(形状等)が十分に抽出されていない。そのため、U-Netは、浅い層において有効な特徴を抽出できておらず、出力画像の細部の精度を高めるためにさらなる改善の余地があった。
画像情報変換器は、複数のマルチスケール変換器を連結することで、特徴量生成部および画像情報生成部において、畳み込み演算によるスケールの異なる解像度における特徴量の抽出と異なるスケールへの振り分けとを繰り返し実行する。これによって、画像情報変換器は、異なるスケールの特徴の組み合わせにより、画像情報の複雑な特徴をより正確に抽出可能な構成となる。
マルチスケール変換器に画像合成部を備えることで、画像情報変換器は、マルチスケール変換器が順次後段のマルチスケール変換器に出力する画像情報に対して、畳み込み演算を行わない画像情報をさらに合成して後段に伝達する。これによって、画像情報変換器は、畳み込み演算による空間的な縮小により失われる可能性のある情報を後段に伝達することが可能になる。
本発明に係る画像情報変換器によれば、複数のマルチスケール変換器によって、逐次、画像情報の畳み込み演算による複数の解像度における特徴量の抽出を繰り返すとともに、畳み込み演算を行わない画像情報と畳み込み演算を行った画像情報とを直接合成することができる。
これによって、本発明に係る画像情報変換器は、曖昧性を抑えた局所的特徴を大域的特徴とともに伝達することができ、出力画像情報における細部の精度の劣化を抑えることができる。
≪第1実施形態≫
<画像情報変換器の構成>
まず、図1を参照して、本発明の第1実施形態に係る画像情報変換器1の構成について説明する。
入力する画像情報は、空間的構造を有する画像データであって、1チャンネルの白黒画像、3チャンネル(RGB)のカラー画像等である。また、出力する変換対象の情報は、空間的構造を有する画像データ、画像に類似する高次元の数値情報等である。
例えば、画像情報変換器1は、白黒画像の画素値を入力し、カラー画像の画素値(RGB)を出力する変換器として構成することができる。また、例えば、画像情報変換器1は、白黒画像の画素値やカラー画像の画素値(RGB)を入力し、画像内の被写体の領域を分類(領域分割)した情報を出力する変換器として構成することができる。
図1に示すように、画像情報変換器1は、入力側から出力側に向かって、複数のマルチスケール変換器10(101,…1015)を、入出力を対応付けて連結して構成する。
入力側から予め定めた中間のMSNB108までのMSNB101~107については、出力する画像情報の解像度の数(種類)を段階的に増加させた構成とする。また、予め定めた中間のMSNB108から出力側までのMSNB109~1015については、出力する画像情報の解像度の数(種類)を段階的に減少させた構成とする。
なお、図1に示すように、入出力が同じMSNB10(例えば、MSNB105,106等)を続けて連結してもよい。また、なお、中間のMSNB10は、複数のMSNB10の厳密な中間(前段のMSNB10の数と後段のMSNB10の数とが同じ)に位置する必要はない。
なお、画像情報変換器1を構成するMSNB10の畳み込み演算に用いるフィルタの重み等のパラメータは、予め変換前の画像情報と変換後の既知の正解情報である画像情報とから、誤差逆伝搬法等により、学習しておく。
これによって、画像情報変換器1は、MSNB10単位で、畳み込みを行っていない画像情報(曖昧性を抑えた局所的特徴)を、畳み込みを行って生成された特徴が抽出された画像情報(大域的特徴)に合成して後段に伝達することができる。
まず、図2を参照して、MSNB105(10)の概要について説明する。図2に示すように、MSNB105は、入力系統が3つ(入力1~3)である画像情報を出力系統が3つ(出力1~3)の画像情報に変換するものである。MSNB105は、入力1として、縦H〔画素〕、横W〔画素〕の空間的サイズ、チャンネル数C1のフル解像度[H×W×C1]の画像情報を入力する。また、MSNB105は、入力2として、縦H/2〔画素〕、横W/2〔画素〕の空間的サイズ、チャンネル数C2の1/2解像度[H/2×W/2×C2]の画像情報を入力する。また、MSNB105は、入力3として、縦H/4〔画素〕、横W/4〔画素〕の空間的サイズ、チャンネル数C3の1/4解像度[H/4×W/4×C3]の画像情報を入力する。なお、出力1~3は、入力1~3と同じ空間的サイズの画像情報である。ただし、チャンネル数は入出力で同じである必要はない。
そして、MSNB105は、出力1~3の次元(チャンネル数、空間的サイズ)に変換された画像情報と、経路Sk1(スキップ・コネクション)により入力される畳み込み演算を行わない画像情報とを合成し(Su2)、出力する。
これによって、MSNB105は、空間的サイズの大きい画像情報であっても、有効に特徴量が抽出された画像情報とともに、後段に伝達することができる。
次に、図3を参照して、MSNB105(10)の構成について説明する。
図3に示すように、MSNB105は、特徴量生成部20と、画像情報生成部30と、画像合成部40と、を備える。
特徴量生成部20は、解像度ごとの個別特徴計算部21(211,212,213)と、特徴合成部22と、合成特徴計算部23と、を備える。
個別特徴計算部212は、1/2解像度[H/2×W/2×C2]の画像情報を入力し、学習済みのパラメータを用いた畳み込み演算により特徴量を計算する。
個別特徴計算部213は、1/4解像度[H/4×W/4×C3]の画像情報を入力し、学習済みのパラメータを用いた畳み込み演算により特徴量を計算する。
個別特徴計算部21(211,212,213)は、計算した特徴量を特徴合成部22に出力する。
特徴合成部22は、合成した特徴量を合成特徴計算部23に出力する。
図5に示すように、特徴合成部22は、カーネル(kernel)“3”(3×3の畳み込みフィルタ)、パディング(padding)“1”、ストライド(stride)“4”、チャンネル(channel)“C3”で畳み込み演算を行うことで、フル解像度の画像情報D1から、最小の解像度(ここでは、1/4解像度)と同じ次元(チャンネル数、空間的サイズ)の特徴量D2を生成する。
また、特徴合成部22は、カーネル“3”、パディング“1”、ストライド“2”、チャンネル“C3”で畳み込み演算を行うことで、1/2解像度の画像情報D3から、最小の解像度(ここでは、1/4解像度)と同じ次元の特徴量D4を生成する。
また、特徴合成部22は、カーネル“3”、パディング“1”、ストライド“1”、チャンネル“C3”で畳み込み演算を行うことで、1/4解像度の画像情報D5から、最小の解像度(ここでは、1/4解像度)と同じ次元の特徴量D6を生成する。
この各解像度の画像情報の畳み込み演算に使用する畳み込みフィルタの値は、ニューラルネットワークの学習により求められるパラメータである。
そして、特徴合成部22は、生成した特徴量D2および特徴量D4を、1/4解像度の特徴量D6と連結することで、[H/4×W/4×(C1+C2+C3)]の特徴量D7を生成する。
図3に戻って、MSNB105の構成について説明を続ける。
合成特徴計算部23は、計算した合成特徴量を、画像情報生成部30に出力する。
画像情報生成部30は、個別情報振分部31と、スケールの異なる解像度ごとの個別特徴計算部32(321,322,323)と、を備える。
個別情報振分部31は、合成特徴量のチャンネル数を、出力する画像情報のチャンネル数と同じにするため、畳み込み演算を行い、さらに、空間的サイズを同じにするために、拡大処理を行う。なお、個別情報振分部31は、合成特徴量から、出力の解像度に応じた次元(チャンネル数、空間的サイズ)の画像情報を生成するために、逆畳み込み(デコンボリューション)演算を行ってもよい。
個別情報振分部31は、解像度別の画像情報を、それぞれの解像度に対応する個別特徴計算部32(321,322,323)に出力する。
図6に示すように、個別情報振分部31は、カーネル“3”、パディング“1”、ストライド“2”、チャンネル“C3”で畳み込み演算を行うことで、空間的サイズがH/4×W/4で、チャンネル数C3の1/4解像度の画像情報(特徴量)D1から、空間的サイズが同じ(H/4×W/4)で、チャンネル数をC1とした画像情報D2を生成する。
そして、個別情報振分部31は、画像情報D2の空間的サイズをチャンネル単位で縦横4倍に拡大することで、空間的サイズがH×Wで、チャンネル数C1のフル解像度の画像情報D3を生成する。なお、個別情報振分部31が行う拡大には、バイリニア拡大、ニアレストネイバー拡大等の一般的な手法を用いればよい。
そして、個別情報振分部31は、画像情報D4の空間的サイズをチャンネル単位で縦横2倍に拡大することで、空間的サイズがH/2×W/2で、チャンネル数C2の1/2解像度の画像情報D5を生成する。
なお、各解像度の画像情報の畳み込み演算に使用する畳み込みフィルタの値は、ニューラルネットワークの学習により求められるパラメータである。
これによって、個別情報振分部31は、1つの合成特徴量から、出力する解像度に合わせた次元の画像情報を生成することができる。
図3に戻って、MSNB105の構成について説明を続ける。
個別特徴計算部32は、計算した特徴量を、画像合成部40に出力する。
画像合成部40は、出力する画像情報(特徴量)の解像度に応じて、複数のスキップ合成部41(411,412,413)を備える。
スキップ合成部412は、個別特徴計算部322で畳み込み演算により生成された1/2解像度の画像情報(特徴量)と、MSNB105に入力された1/2解像度の画像情報(特徴量)とを、要素ごとに加算(または連結)し、後段に出力する。
スキップ合成部413は、個別特徴計算部323で畳み込み演算により生成された1/4解像度の画像情報(特徴量)と、MSNB105に入力された1/4解像度の画像情報(特徴量)とを、要素ごとに加算(または連結)し、後段に出力する。
以上、基本構成をすべて含むMSNB105の構成について説明したが、MSNB105以外のMSNB10については、各基本構成を増減させて構成すればよい。
以下、代表的な構成について説明する。
(1入力2出力のMSNB)
図7を参照して、1つの解像度の画像情報を2つの解像度の画像情報に変換する非対称なMSNB101(10)の構成について説明する。
図7に示すように、1入力2出力のMSNB101は、図3で説明したMSNB105から、個別特徴計算部212,213,323およびスキップ合成部412,413を省略して構成することができる。
なお、個別特徴計算部21は1つであるため、特徴合成部22は合成を行わず、生成した1/2解像度の特徴量を合成特徴量として、合成特徴計算部23に出力する。他の構成は、図3で説明したMSNB105の構成と同じであるため、説明を省略する。
図8に、2つの解像度の画像情報を3つの解像度の画像情報に変換する非対称なMSNB104(10)の構成例を示す。
図8に示すように、2入力3出力のMSNB104は、図3で説明したMSNB105から、個別特徴計算部213およびスキップ合成部413を省略して構成することができる。
図9に、3つの解像度の画像情報を2つの解像度の画像情報に変換する非対称なMSNB1012(10)の構成例を示す。
図9に示すように、3入力2出力のMSNB1012は、図3で説明したMSNB105から、個別特徴計算部323およびスキップ合成部413を省略して構成することができる。
図10に、2つの解像度の画像情報を1つの解像度の画像情報に変換する非対称なMSNB1015(10)の構成例を示す。
図10に示すように、2入力1出力のMSNB1015は、図3で説明したMSNB105から、個別特徴計算部213,322,323およびスキップ合成部412,413を省略して構成することができる。
以上、MSNB10の構成例について説明したが、例示したMSNB10よりも多くの入力および出力とする場合、個別特徴計算部21,32およびスキップ合成部41を、入出力の数に応じて備える構成とすればよい。
例えば、図3で説明したMSNB105を、図11に示すMSNB10B5として構成してもよい。なお、図11に示したMSNB10B5は、個別特徴計算部211,212を省略したことに伴い特徴合成部22および合成特徴計算部23も省略している。
これによって、画像情報変換器1は、エッジの位置情報等の局所的特徴の曖昧性を抑えることができ、出力画像の細部の精度を高めることができる。
なお、画像情報変換器1は、図示を省略したコンピュータを、MSNB10を連結したニューラルモデルネットワークとして機能するためのプログラムで動作させることができる。
次に、図12を参照(構成については、適宜図1,図3参照)して、本発明の第1実施形態に係る画像情報変換器1の動作について説明する。
ステップS1において、MSNB10の個別特徴計算部21は、入力系統の数だけ、畳み込み演算により、特徴量を計算する。
ステップS2において、MSNB10の特徴合成部22は、ステップS1で計算した入力系統数分の特徴量を、次元(チャンネル数、空間的サイズ)を揃えるように畳み込み演算により変換する。このとき、特徴合成部22は、次元をMSNB10の出力となる最小の解像度と同じにする。
ステップS4において、MSNB10の合成特徴計算部23は、ステップS3で合成された特徴量に対して、畳み込み演算を行うことで、合成特徴量を生成する。
ステップS6において、MSNB10の個別情報振分部31は、さらに、ステップS5で出力系統に振り分けたそれぞれの画像情報を、出力系統のそれぞれの空間的サイズに合わせて拡大する。
一方、ステップS8において、後段にMSNB10が接続されていない場合(No)、画像情報変換器1は、動作を終了する。
これによって、画像情報変換器1は、局所的特徴に対して大局的特徴を対応付けた精度の高い特徴量を抽出することができ、変換精度の高いニューラルネットワークとして動作することができる。
次に、図13を参照して、本発明の第2実施形態に係る画像情報変換器1Bについて説明する。
図1で説明した画像情報変換器1は、予め定めた中間のMSNB108から出力側までのMSNB10については、出力する画像情報の解像度の数(種類)を段階的に減少させた構成としている。この解像度の数の減少は、中間のMSNB108からの出力を合成することで実現してもよい。
図13に示すように、スケール統合部50は、スケール変換部51と、合成部52と、特徴計算部53と、を備える。
スケール変換部51は、解像度をフル解像度の空間サイズに揃えるため、拡大処理を行う。このスケール変換部51における拡大には、バイリニア拡大、ニアレストネイバー拡大等の一般的な手法を用いればよい。
スケール変換部512は、1/4解像度の画像情報を縦4倍、横4倍に拡大することで、フル解像度の画像情報に変換し、合成部52に出力する。
スケール変換部513は、1/8解像度の画像情報を縦8倍、横8倍に拡大することで、フル解像度の画像情報に変換し、合成部52に出力する。
合成部52は、最後段のMSNB10(108)の出力であるフル解像度の画像情報と、スケール変換部51(511,512,513)でフル解像度にスケール変換された画像情報とを合成する。合成部52の合成処理は、例えば、すべてのフル解像度の画像情報を連結することで行うことができる。
合成部52は、合成した画像情報を、特徴計算部53に出力する。
特徴計算部53は、入力された画像情報に対して、畳み込み演算を行うことで、変換対象の画像情報に変換する。また、畳み込みフィルタの値は、ニューラルネットワークの学習により求められるパラメータである。
なお、画像情報変換器1Bは、図示を省略したコンピュータを、複数のMSNB10とスケール統合部50とで構成されたニューラルモデルネットワークとして機能するためのプログラムで動作させることができる。
例えば、MSNB10の前後、あるいは、MSNB10の内部の伝達経路において、他の演算処理、例えば、ノーマライゼーション層を設け、画像情報の全体の数値を正規化することとしてもよい。
また、例えば、出力として、3チャンネルのカラー画像と、カラー画像の画素に対応した色の確率分布(例えば、xクラスに量子化した色の確率分布〔xチャンネル分〕)の2つとしてもよい。
次に、本発明の実施形態に係る画像情報変換器1,1Bの適用例について説明する。
図14は、画像情報変換器1,Bを、カラー化装置として構成した例を示す構成図である。図14に示すカラー化装置100は、縦H〔画素〕、横W〔画素〕、1チャンネルの白黒画像BWを、縦H〔画素〕、横W〔画素〕、3チャンネル(RGB)のカラー画像CLに変換するものである。
図14に示すように、カラー化装置100は、情報入力手段110と、情報変換手段120と、情報出力手段130と、を備える。
情報入力手段110は、入力した白黒画像BWを情報変換手段120に出力する。
これによって、カラー化装置100は、画像情報変換器1,1Bにより、例えば、エッジの色の区分等、精度の高いカラー画像を生成することができる。
10 マルチスケール変換器(MSNB)
20 特徴量生成部
21 個別特徴計算部
22 特徴合成部
23 合成特徴計算部
30 画像情報生成部
31 個別情報振分部
32 個別特徴計算部
40 画像合成部
41 スキップ合成部
50 スケール統合部
51 スケール変換部
52 合成部
53 特徴計算部
100 カラー化装置
110 情報入力手段
120 情報変換手段
130 情報出力手段
Claims (6)
- m(mは1以上の整数)個の解像度の画像情報を入力し、n(nは1以上の整数)個の解像度の画像情報に変換する複数のマルチスケール変換器を、入力側から出力側に向かって連結した畳み込みニューラルネットワークの画像情報変換器であって、
前記マルチスケール変換器は、
前記m個の解像度の画像情報から、学習済みのパラメータを用いた畳み込み演算により予め定めた1個の解像度分の特徴量を生成する特徴量生成部と、
前記特徴量生成部で生成された特徴量から、学習済みのパラメータを用いた畳み込み演算により前記n個の解像度の画像情報を生成する画像情報生成部と、
前記画像情報生成部で生成された画像情報に対して、当該マルチスケール変換器に入力された画像情報の中で解像度が同じ画像情報を合成する画像合成部と、を備え、
前記mが2以上である前記マルチスケール変換器の前記特徴量生成部は、前記m個の解像度の画像情報を、当該マルチスケール変換器の入出力の中で最小の解像度の画像情報に畳み込み演算し、演算結果を加算または連結することで、前記特徴量を生成することを特徴とする画像情報変換器。 - m(mは1以上の整数)個の解像度の画像情報を入力し、n(nは1以上の整数)個の解像度の画像情報に変換する複数のマルチスケール変換器を、入力側から出力側に向かって連結した畳み込みニューラルネットワークの画像情報変換器であって、
前記マルチスケール変換器は、
前記m個の解像度の画像情報から、学習済みのパラメータを用いた畳み込み演算により予め定めた1個の解像度分の特徴量を生成する特徴量生成部と、
前記特徴量生成部で生成された特徴量から、学習済みのパラメータを用いた畳み込み演算により前記n個の解像度の画像情報を生成する画像情報生成部と、
前記画像情報生成部で生成された画像情報に対して、当該マルチスケール変換器に入力された画像情報の中で解像度が同じ画像情報を合成する画像合成部と、を備え、
前記nが2以上である前記マルチスケール変換器の前記画像情報生成部は、前記特徴量に対してn個分の畳み込み演算を行い、演算結果を前記n個の解像度に応じて拡大することで前記n個の解像度の画像情報を生成することを特徴とする画像情報変換器。 - m(mは1以上の整数)個の解像度の画像情報を入力し、n(nは1以上の整数)個の解像度の画像情報に変換する複数のマルチスケール変換器を、入力側から出力側に向かって連結した畳み込みニューラルネットワークの画像情報変換器であって、
前記マルチスケール変換器は、
前記m個の解像度の画像情報から、学習済みのパラメータを用いた畳み込み演算により予め定めた1個の解像度分の特徴量を生成する特徴量生成部と、
前記特徴量生成部で生成された特徴量から、学習済みのパラメータを用いた畳み込み演算により前記n個の解像度の画像情報を生成する画像情報生成部と、
前記画像情報生成部で生成された画像情報に対して、当該マルチスケール変換器に入力された画像情報の中で解像度が同じ画像情報を合成する画像合成部と、を備え、
前記nが2以上である前記マルチスケール変換器の前記画像情報生成部は、前記特徴量に対してn個分の逆畳み込み演算を行い、前記n個の解像度の画像情報を生成することを特徴とする画像情報変換器。 - m(mは1以上の整数)個の解像度の画像情報を入力し、n(nは1以上の整数)個の解像度の画像情報に変換する複数のマルチスケール変換器を、入力側から出力側に向かって連結した畳み込みニューラルネットワークの画像情報変換器であって、
前記マルチスケール変換器は、
前記m個の解像度の画像情報から、学習済みのパラメータを用いた畳み込み演算により予め定めた1個の解像度分の特徴量を生成する特徴量生成部と、
前記特徴量生成部で生成された特徴量から、学習済みのパラメータを用いた畳み込み演算により前記n個の解像度の画像情報を生成する画像情報生成部と、
前記画像情報生成部で生成された画像情報に対して、当該マルチスケール変換器に入力された画像情報の中で解像度が同じ画像情報を合成する画像合成部と、を備え、
前記入力側から予め定めた中間のマルチスケール変換器までの前記マルチスケール変換器が出力する画像情報の解像度の数を段階的に増加させ、
前記中間のマルチスケール変換器から前記出力側までの前記マルチスケール変換器が出力する画像情報の解像度の数を段階的に減少させて構成したことを特徴とする画像情報変換器。 - m(mは1以上の整数)個の解像度の画像情報を入力し、n(nは1以上の整数)個の解像度の画像情報に変換する複数のマルチスケール変換器を、入力側から出力側に向かって連結した畳み込みニューラルネットワークの画像情報変換器であって、
前記マルチスケール変換器は、
前記m個の解像度の画像情報から、学習済みのパラメータを用いた畳み込み演算により予め定めた1個の解像度分の特徴量を生成する特徴量生成部と、
前記特徴量生成部で生成された特徴量から、学習済みのパラメータを用いた畳み込み演算により前記n個の解像度の画像情報を生成する画像情報生成部と、
前記画像情報生成部で生成された画像情報に対して、当該マルチスケール変換器に入力された画像情報の中で解像度が同じ画像情報を合成する画像合成部と、
最後段のマルチスケール変換器の出力を統合するスケール統合部と、を備え、
前記マルチスケール変換器は、
前記m個の解像度の画像情報から畳み込み演算により予め定めた1個の解像度分の特徴量を生成する特徴量生成部と、
前記特徴量生成部で生成された特徴量から、前記n個の解像度の画像情報を畳み込み演算により生成する画像情報生成部と、
前記画像情報生成部で生成された画像情報に対して、入力した画像情報の中で解像度が同じ画像情報を合成する画像合成部と、を備え、
前記スケール統合部は、
前記最後段のマルチスケール変換器で生成された複数の解像度の画像情報の解像度を揃えるスケール変換部と、
前記スケール変換部で解像度を揃えた複数の画像情報を合成する合成部と、
前記合成部で合成された画像情報から畳み込み演算により変換後の画像情報を生成する特徴計算部と、
を備えることを特徴とする画像情報変換器。 - コンピュータを、請求項1から請求項5のいずれか一項に記載の画像情報変換器として機能させるための画像情報変換プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018011613A JP7042092B2 (ja) | 2018-01-26 | 2018-01-26 | 画像情報変換器およびそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018011613A JP7042092B2 (ja) | 2018-01-26 | 2018-01-26 | 画像情報変換器およびそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019128889A JP2019128889A (ja) | 2019-08-01 |
JP7042092B2 true JP7042092B2 (ja) | 2022-03-25 |
Family
ID=67473173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018011613A Active JP7042092B2 (ja) | 2018-01-26 | 2018-01-26 | 画像情報変換器およびそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7042092B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110392264B (zh) * | 2019-08-26 | 2022-10-28 | 中国科学技术大学 | 一种基于神经网络的对齐外插帧方法 |
JPWO2021070000A1 (ja) * | 2019-10-11 | 2021-04-15 | ||
JPWO2021130593A1 (ja) | 2019-12-27 | 2021-07-01 | ||
JP7365697B2 (ja) | 2020-01-17 | 2023-10-20 | 国立大学法人東京農工大学 | プログラム及びクラスタリング装置 |
JP7351358B2 (ja) * | 2020-02-13 | 2023-09-27 | 日本電気株式会社 | 画像処理システム、画像処理方法および画像処理プログラム |
US20230059499A1 (en) * | 2020-02-13 | 2023-02-23 | Nec Corporation | Image processing system, image processing method, and non-transitory computer readable medium |
CN111402140B (zh) * | 2020-03-25 | 2023-08-22 | 中国计量大学 | 单张图像超分辨率重建系统及方法 |
JP7166415B1 (ja) | 2021-09-28 | 2022-11-07 | Pciソリューションズ株式会社 | 特徴量抽出装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010093816A (ja) | 2008-10-09 | 2010-04-22 | Samsung Electronics Co Ltd | 視覚的関心に基づいた2次元映像の3次元映像変換器および変換方法 |
JP2016168046A (ja) | 2015-03-09 | 2016-09-23 | 学校法人法政大学 | 植物病診断システム、植物病診断方法、及びプログラム |
JP2017045430A (ja) | 2015-08-28 | 2017-03-02 | パナソニックIpマネジメント株式会社 | 画像処理装置、画像処理システム、画像処理方法及びプログラム |
-
2018
- 2018-01-26 JP JP2018011613A patent/JP7042092B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010093816A (ja) | 2008-10-09 | 2010-04-22 | Samsung Electronics Co Ltd | 視覚的関心に基づいた2次元映像の3次元映像変換器および変換方法 |
US20100266198A1 (en) | 2008-10-09 | 2010-10-21 | Samsung Electronics Co., Ltd. | Apparatus, method, and medium of converting 2D image 3D image based on visual attention |
JP2016168046A (ja) | 2015-03-09 | 2016-09-23 | 学校法人法政大学 | 植物病診断システム、植物病診断方法、及びプログラム |
JP2017045430A (ja) | 2015-08-28 | 2017-03-02 | パナソニックIpマネジメント株式会社 | 画像処理装置、画像処理システム、画像処理方法及びプログラム |
Non-Patent Citations (1)
Title |
---|
岡谷 貴之,画像認識のための深層学習の研究動向 -畳込みニューラルネットワークとその利用法の発展-,人工知能 第31巻 第2号,(一社)人工知能学会,2016年,第31巻 第2号,169~179 |
Also Published As
Publication number | Publication date |
---|---|
JP2019128889A (ja) | 2019-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7042092B2 (ja) | 画像情報変換器およびそのプログラム | |
CN109905624B (zh) | 一种视频帧插值方法、装置及设备 | |
KR102061408B1 (ko) | 가상 3차원 심층 신경망을 이용하는 영상 분석 장치 및 방법 | |
US10970600B2 (en) | Method and apparatus for training neural network model used for image processing, and storage medium | |
Gao et al. | Pixel transposed convolutional networks | |
EP3678059B1 (en) | Image processing method, image processing apparatus, and a neural network training method | |
CN110059598B (zh) | 基于姿态关节点的长时程快慢网络融合的行为识别方法 | |
CN109308679A (zh) | 一种图像风格转换方及装置、设备、存储介质 | |
JP2022500734A (ja) | 畳み込みニューラルネットワークを利用したコンピュータ実現方法、合成画像生成用の装置及びコンピュータプログラム製品 | |
CN114549731A (zh) | 视角图像的生成方法、装置、电子设备及存储介质 | |
CN110136067B (zh) | 一种针对超分辨率b超影像的实时影像生成方法 | |
US20180137665A1 (en) | Facial feature adding method, facial feature adding apparatus, and facial feature adding device | |
Wan et al. | Learning dense and continuous optical flow from an event camera | |
KR20210056149A (ko) | 깊이 영상 생성 방법 및 깊이 영상 생성 장치 | |
Karmouni et al. | Image analysis using separable Krawtchouk-Tchebichef's moments | |
CN113298717A (zh) | 基于多注意力残差特征融合的医学图像超分辨率重建方法 | |
CN109447897B (zh) | 一种真实场景图像合成方法及系统 | |
CN112132741A (zh) | 一种人脸照片图像和素描图像的转换方法及系统 | |
CN113066475B (zh) | 一种基于生成式对抗网络的语音合成方法 | |
JP7010783B2 (ja) | 画像処理装置、画像処理システム、画像処理方法及びプログラム | |
CN112785498B (zh) | 一种基于深度学习的病理图像超分建模方法 | |
Liu et al. | Hyperspectral image super-resolution employing nonlocal block and hybrid multiscale three-dimensional convolution | |
Zhang et al. | Lightweight Portrait Segmentation Via Edge-Optimized Attention | |
Rubio-Ibáñez et al. | Efficient VHDL Implementation of an Upscaling Function for Real Time Video Applications | |
TWI748426B (zh) | 單視角影像深度圖序列生成方法、系統與電腦程式產品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220314 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7042092 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |