JP2020027557A - 超解像装置およびそのプログラム - Google Patents

超解像装置およびそのプログラム Download PDF

Info

Publication number
JP2020027557A
JP2020027557A JP2018153358A JP2018153358A JP2020027557A JP 2020027557 A JP2020027557 A JP 2020027557A JP 2018153358 A JP2018153358 A JP 2018153358A JP 2018153358 A JP2018153358 A JP 2018153358A JP 2020027557 A JP2020027557 A JP 2020027557A
Authority
JP
Japan
Prior art keywords
resolution
super
unit
parameter
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018153358A
Other languages
English (en)
Other versions
JP7174568B2 (ja
Inventor
俊枝 三須
Toshie Misu
俊枝 三須
市ヶ谷 敦郎
Atsuro Ichigaya
敦郎 市ヶ谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2018153358A priority Critical patent/JP7174568B2/ja
Publication of JP2020027557A publication Critical patent/JP2020027557A/ja
Application granted granted Critical
Publication of JP7174568B2 publication Critical patent/JP7174568B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)

Abstract

【課題】入力信号を高品質に超解像化することが可能な超解像装置を提供する。【解決手段】超解像装置1は、予め定めた超解像の拡大率の逆数倍で学習用の入力信号をダウンサンプリングして低解像信号を生成するダウンサンプリング手段11と、パラメータに応じて低解像信号をアップサンプリングし、学習用の入力信号を模擬した復元模擬信号を生成するとともに、パラメータの更新中に、新たなパラメータで低解像信号をアップサンプリングし、パラメータの更新後に、更新後のパラメータで超解像対象の入力信号をアップサンプリングすることにより超解像信号を生成するアップサンプリング手段13と、低解像信号と復元模擬信号との誤差が小さくなるようにパラメータを更新するパラメータ更新手段14と、を備える。【選択図】図1

Description

本発明は、信号を高解像度化させる超解像装置およびそのプログラムに関する。
従来、画像の解像度を向上させる手法として、入力画像に対して、ウェーブレット変換等の直交変換を行った後、高解像度化した画像の空間高周波スペクトルを推定し、入力画像に逆直交変換を行うことで、入力画像を高解像度化する手法が開示されている(特許文献1参照)。
この手法は、入力画像と高解像度化後の画像との間には自己相似性が存在すると仮定して、入力画像を直交変換した空間高周波スペクトルから、高解像度化後の帯域の空間高周波スペクトルを補間生成する。
そして、この手法は、入力画像が予め原画像を低解像度化した画像であって、原画像をオクターブ分解した帯域別のスペクトルパワー代表値を既知の情報として外部から入力する。あるいは、この手法は、自己相似性を前提として、入力画像をオクターブ分解した帯域別のスペクトルパワー代表値を、そのまま、水平・垂直方向に2倍した帯域のスペクトルパワー代表値とする。
さらに、この手法は、入力画像のスペクトルと空間高周波スペクトルとを、外部から入力したスペクトルパワー代表値、あるいは、帯域別に入力画像から求めたスペクトルパワー代表値となるように補正する。
そして、この手法は、補正した入力画像のスペクトルと空間高周波スペクトルとに対して、逆直交変換を行うことで、高解像度化した画像を生成する。
また、画像の解像度を向上させる他の手法として、入力画像の拡大で生じる劣化成分を、入力画像のブロック単位の局所的な相似性から推定し、拡大画像に合成することで、入力画像を高解像度化する手法が開示されている(特許文献2参照)。
この手法は、入力画像を予め定めた大きさの処理ブロックを順次切り出し、水平・垂直方向に2倍した拡大ブロックを生成する。
また、この手法は、拡大ブロックと同じ大きさの参照ブロックを入力画像から順次切り出し、縮小劣化させて複数の劣化ブロックを生成する。そして、この手法は、劣化ブロックを水平・垂直方向に2倍し、処理ブロックとの間の損失成分を生成する。
そして、この手法は、処理ブロックを水平・垂直方向に2倍し、拡大後の処理ブロックに、拡大前の処理ブロックと劣化ブロックとの類似度に応じて損失成分を合成することで、超解像ブロックを生成する。
特開2012−59138号公報 特開2012−113513号公報
前記した特許文献1に記載された手法(以下、従来手法1)は、空間高周波スペクトルを推定するために、入力画像を生成した原画像をオクターブ分解した帯域別のスペクトルパワー代表値を既知の情報として用い、空間高周波スペクトルを推定する。
しかし、このような原画像に対する情報は、必ずしも得られるわけではない。そのため、従来手法1では、元となる原画像がない画像からは、高解像度の画像を生成することができないという問題がある。
また、従来手法1は、別の手法として、自己相似性を前提として、入力画像をオクターブ分解した帯域別のスペクトルパワー代表値を用いて、空間高周波スペクトルを推定する。
しかし、この別の手法は、スペクトルパワーの調整のみでしか、空間高周波スペクトルを推定することができない。このように、スペクトルパワー代表値を用いたスペクトルパワーの調整のみでは、細かい空間周波数単位でのスペクトルの調整には限界がある。そのため、従来の手法に対して、さらなる高画質化の要望があった。
また、前記した特許文献2に記載された手法(以下、従来手法2)は、ブロック単位の局所的な相似性を利用するため、画像内に、被写体像の形状やパターンとしての自己相似性の存在が必要となる。そのため、従来手法2は、局所的に相似する画像がない、あるいは、少ないブロックについては、高画質な超解像ブロックを生成することが困難であり、さらなる高画質化の要望があった。
本発明は、このような問題や要望に鑑みてなされたものであり、自己相似性の存在を仮定した(すなわち、水平X/R垂直Y/Sの解像度から水平X垂直Yの解像度への超解像のパラメータを以て、水平X垂直Yの解像度から水平RX垂直SYへの超解像度をも実行できると仮定できる)超解像のパラメータを予め学習することで、入力信号を高品質に超解像化することが可能な超解像装置およびそのプログラムを提供することを課題とする。
前記課題を解決するため、本発明に係る超解像装置は、入力信号を予め設定された超解像の拡大率で高解像度化する超解像装置であって、ダウンサンプリング手段と、アップサンプリング手段と、パラメータ更新手段と、を備える構成とした。
かかる構成において、超解像装置は、ダウンサンプリング手段によって、予め設定された超解像の拡大率の逆数倍で学習用の入力信号をダウンサンプリングして低解像信号を生成する。
また、超解像装置は、アップサンプリング手段によって、パラメータに応じて低解像信号をアップサンプリングし、学習用の入力信号を模擬した復元模擬信号を生成する。この復元模擬信号と学習用の入力信号との誤差が小さければ、パラメータは、超解像のパラメータとして適していることになる。
そして、超解像装置は、パラメータ更新手段によって、入力信号と復元模擬信号との誤差が小さくなるようにパラメータを更新する。
そして、超解像装置は、パラメータ更新手段におけるパラメータの更新中に、アップサンプリング手段によって、新たなパラメータで低解像信号をアップサンプリングする。これによって、パラメータ更新手段は、順次、入力信号と復元模擬信号との誤差を小さくして、新たなパラメータとして更新する。
このように、低解像信号から入力信号と近似する相似的な復元模擬信号を生成するようにパラメータを学習することで、当該パラメータは、自己相似性を仮定したパラメータとなる。
そして、超解像装置は、パラメータ更新手段におけるパラメータの更新後に、アップサンプリング手段によって、更新後のパラメータで超解像対象の入力信号をアップサンプリングすることにより超解像信号を生成する。
なお、超解像装置は、コンピュータを、前記した各手段として機能させるための超解像プログラムで動作させることができる。
本発明は、以下に示す優れた効果を奏するものである。
本発明によれば、入力信号と、ダウンサンプリングおよびアップサンプリングを行った復元模擬信号との誤差を小さくする方向にパラメータを学習するため、自己相似性に基づいた超解像を実現するパラメータを学習することができる。これによって、本発明は、学習したパラメータを用いて、入力信号から高品質な超解像信号を生成することができる。
本発明の実施形態に係る超解像装置の構成を示すブロック構成図である。 本発明の実施形態に係る超解像装置のアップサンプリング手段の構成を示すブロック構成図である。 本発明の実施形態に係る超解像装置の学習モードの動作を示すフローチャートである。 本発明の実施形態に係る超解像装置の実行モードの動作を示すフローチャートである。 本発明の実施形態に係る超解像装置のアップサンプリング手段の他の構成を示すブロック構成図である。
以下、本発明の実施形態について図面を参照して説明する。
<超解像装置の構成>
まず、図1を参照して、本発明の実施形態に係る超解像装置1の構成について説明する。
超解像装置1は、予め設定された超解像の拡大率で入力信号を高解像度化して超解像信号を生成するものである。超解像の拡大率とは、入力信号の標本化方向の倍率である。本実施形態では、入力信号および超解像信号として、2次元の画像(入力画像、超解像画像)を例として説明する。
なお、入力画像は、画像全体であってもよいし、所定区間(ブロック等、画像の一部分)であっても構わない。
ここでは、入力画像の画像座標(x,y)における画素値をI(x,y)とする。また、入力画像の解像度を幅X画素、高さY画素とする。
また、超解像画像の画像座標(x,y)における画素値をJ(x,y)とする。また、超解像画像の解像度を幅R×X画素、高さS×Y画素とする。ここで、実数Rは水平方向の倍率、実数Sは垂直方向の倍率(以下、RおよびSを総称して超解像の拡大率と称する)である。RおよびSの少なくとも一方は、1よりも大きい値とする。例えば、R=S=2とする。
超解像装置1は、学習モードおよび実行モードの2つの動作モードで動作する。
学習モードは、学習用の入力画像の解像度を向上させる変換処理(アップサンプリング)のパラメータを学習するモードである。
実行モードは、学習モードで学習したパラメータを用いて変換処理を行い、超解像対象の入力画像Iを超解像画像Jに変換するモードである。
なお、学習モードで入力する学習用の画像は任意の画像でよいが、実行モードで実際に超解像を行う超解像対象の画像を入力画像としてもよい。
図1に示すように、超解像装置1は、切替手段(第1切替手段)10と、ダウンサンプリング手段11と、パラメータ記憶手段12と、アップサンプリング手段13と、パラメータ更新手段14と、切替手段(第2切替手段)15と、を備える。
切替手段10は、動作モードによって、入力画像Iの出力先を切り替えるものである。切替手段10は、パラメータ更新手段14から動作モードとしてモード切替信号を入力されることで、入力画像Iの出力先を切り替える。
モード切替信号mが学習モードを示す(例えば、m=0)場合、切替手段10は、入力画像Iを、ダウンサンプリング手段11およびパラメータ更新手段14に出力する。一方、モード切替信号mが実行モードを示す(例えば、m=1)場合、切替手段10は、入力画像Iを、アップサンプリング手段13に出力する。
ダウンサンプリング手段11は、入力画像Iを標本化方向に解像度を減少させて、低解像画像(低解像信号)Dを生成するものである。なお、入力画像Iに対する低解像画像Dの解像度の比率は、入力画像Iの標本化方向である水平方向(x軸方向)および垂直方向(y軸方向)について、それぞれ、予め設定された超解像の拡大率の逆数倍とする。
例えば、ダウンサンプリング手段11は、標本(画素)の間引きによって、入力画像Iの解像度を減少させることができる。
具体的には、ダウンサンプリング手段11は、以下の式(1)によって、入力画像Iを低解像画像Dに変換する。
Figure 2020027557
ここで、round(z)は、実数zを整数に端数処理する関数である。なお、端数処理としては、例えば、四捨五入、五捨六入、切り捨て、切り上げ、床関数、天井関数、偶数への丸め、奇数への丸め、ゼロ方向への丸め等を用いることができる。
また、ダウンサンプリング手段11は、間引きフィルタを用いた畳み込み処理によって、入力画像Iの解像度を減少させてもよい。
例えば、ダウンサンプリング手段11は、以下の式(2)によって、間引きフィルタhと標本の間引きとにより、入力画像Iを低解像画像Dに変換する。
Figure 2020027557
なお、間引きフィルタhは、特に限定するものではないが、例えば、平均平滑化、双一次補間、双三次補間、Lanczos−3関数、打ち切りSinc関数等を用いることができる。
例えば、平均平滑化による間引きフィルタhは、以下の式(3)となる。
Figure 2020027557
また、例えば、双一次補間による間引きフィルタhは、以下の式(4)となる。
Figure 2020027557
さらに、例えば、Lanczos−3関数による間引きフィルタhは、以下の式(5)となる。
Figure 2020027557
具体的には、R=S=2の場合において、前記式(3)の平均平滑化による間引きフィルタhを用いた場合、ダウンサンプリング手段11は、以下の式(6)により、入力画像Iを低解像画像Dに変換する。
Figure 2020027557
ダウンサンプリング手段11は、変換後の低解像画像Dをアップサンプリング手段13に出力する。
パラメータ記憶手段12は、アップサンプリング手段13で行う変換処理(アップサンプリング)のパラメータを記憶するものである。このパラメータ記憶手段12は、半導体メモリ等の一般的な記憶媒体で構成することができる。
なお、パラメータは、後記するアップサンプリング手段13を、ニューラルネットワークで構成する場合、ニューラルネットワークの結合重み係数、バイアス値等である。また、このパラメータは、後記するアップサンプリング手段13を、デジタルフィルタを用いた畳み込み手段で構成した場合、そのデジタルフィルタに設定されるタップ係数列である。
パラメータの初期値は、学習前のパラメータの値であって、特に限定するものではないが、例えば、予め定めた固定値(数値または数値列)であってもよいし、予め乱数によって生成された乱数値(数値または数値列)であってもよい。
このパラメータは、アップサンプリング手段13およびパラメータ更新手段14によって参照され、パラメータ更新手段14によって更新される。
アップサンプリング手段13は、切替手段10から入力される入力画像Iまたはダウンサンプリング手段11でダウンサンプリングされた低解像画像Dを、アップサンプリングするものである。
このアップサンプリング手段13は、学習モードにおいて、パラメータ記憶手段12に記憶されているパラメータを用いて、ダウンサンプリング手段11でダウンサンプリングされた低解像画像Dをアップサンプリングする。なお、学習モードにおいて、アップサンプリング手段13は、パラメータ更新手段14から、新たなパラメータを用いて、アップサンプリングを行う旨の指示を通知されるたびに、低解像画像Dをアップサンプリングする。
また、アップサンプリング手段13は、実行モードにおいて、パラメータ記憶手段12に記憶されているパラメータを用いて、切替手段10から入力される入力画像Iをアップサンプリングする。
ここで、図2を参照して、アップサンプリング手段13の構成例について説明する。図2に示したアップサンプリング手段13は、ニューラルネットワークの一形態である深層残差学習(Deep Residual Network〔ResNet〕)により構成した例である。
図2に示すように、アップサンプリング手段13は、内挿手段20と、畳み込み手段21(21〜21)と、活性化関数適用手段22(22〜22)と、加算手段23(23〜23)と、を備える。
内挿手段20は、低解像画像Dまたは入力画像I(以下、代表して処理前画像Lと記す)を入力し、内挿処理を行うものである。
この内挿手段20は、処理前画像Lの標本化の密度を、超解像の拡大率である水平方向にR倍、垂直方向にS倍にすることで、補間画像(補間信号)Mを生成する。
この内挿手段20における内挿処理は、例えば、0次補間、双一次補間、双三次補間、Lanczos−3補間等、一般的な手法を用いることができる。
例えば、内挿手段20は、内挿処理として0次補間により内挿を行うものとした場合、以下の式(7)により、処理前画像L(低解像画像Dまたは入力画像I)から、補間画像Mを生成する。
Figure 2020027557
内挿手段20は内挿処理後の画像を畳み込み手段21に出力する。
なお、内挿手段20は、必須の構成ではない。しかし、拡大率に応じて処理前画像Lの標本化の密度を拡大することで、学習モード時におけるパラメータの収束時間を早めることができる効果があり、内挿手段20を備えることが好ましい。
畳み込み手段21(図2では、kは1以上8以下の整数;21〜21)は、パラメータ記憶手段12に記憶されているパラメータpを用いて入力されたデータに対して畳み込み演算を行うものである。
ここで、畳み込み手段21が行う畳み込み演算を、4階テンソルAと3階テンソルXとに対する演算として、以下の式(8)により定義する。なお、P,Q,N,W,H,D,Nは、畳み込み手段21ごとに、予めニューラルネットワークのモデルとして定めた定数である。
Figure 2020027557
ただし、[xp,q,d]において、定義されていない範囲の添字p,qが参照された場合、当該成分の値を零とみなし、ゼロパディングを行う。
畳み込み手段21は、入力された3階テンソルXと、結合重み係数(4階テンソルA)およびバイアス(1階テンソルB)とにより、以下の式(9)により畳み込み演算を行うことで、3階テンソルYを生成する。なお、1階テンソルBの次元数は、4階テンソルAの定数N(N)と同じ次元とする。
Figure 2020027557
畳み込み手段21は、畳み込み演算により生成した3階テンソルYを、予め定めたモデルに応じて、後段の活性化関数適用手段22に出力する。
活性化関数適用手段22(図2では、kは1以上8以下の整数;22〜22)は、畳み込み手段21の出力(3階テンソルY)に対して、活性化関数を用いた演算を行うものである。
活性化関数適用手段22は、以下の式(10)に示すように、入力された3階テンソルYの各成分に対して、活性化関数φを適用し、3階テンソルZを生成する。
Figure 2020027557
なお、活性化関数適用手段22(22〜22)は、一部または全部を省略してもよい。その場合、省略された活性化関数適用手段22への入力と省略された活性化関数適用手段22からの出力とをテンソルの成分ごとに直結すればよい。例えば、活性化関数適用手段22を省略する場合、以下の式(11)としたことと動作は等価である。
Figure 2020027557
活性化関数φは、非線形関数であっても、線形関数であっても、恒等関数であっても構わない。
例えば、活性化関数φを非線形関数とする場合、活性化関数φとして、以下の式(12)に示すReLU(Rectified Linear Unit)を用いることができる。
Figure 2020027557
あるいは、活性化関数φとして、以下の式(13)に示すシグモイド(sigmoid)関数を用いることができる。
Figure 2020027557
あるいは、活性化関数φとして、以下の式(14)に示す双曲線正接関数を用いることができる。
Figure 2020027557
加算手段23(23〜23)は、直前の畳み込み処理後の出力に、それよりも前の畳み込み処理後の出力をテンソルの成分ごとに加算するものである。
例えば、加算手段23は、直前の活性化関数適用手段22の出力に活性化関数適用手段22の出力を加算して、畳み込み手段21に出力する。また、例えば、加算手段23は、直前の活性化関数適用手段22の出力に加算手段23の出力を加算して、畳み込み手段21に出力する。
なお、加算手段23(23〜23)は、必須の構成ではない。しかし、加算手段23を用いて、畳み込み処理をショートカットさせることで、少ない畳み込み処理の階層でも、その階層の深度を深めることで、より推定精度の高いニューラルネットワークを構成することができる。
図1に戻って、超解像装置1の構成について説明を続ける。
アップサンプリング手段13は、低解像画像Dまたは入力画像Iをアップサンプリングして、切替手段15に出力する。
このとき、アップサンプリング手段13において、低解像画像Dをアップサンプリングした画像は、入力画像Iを模擬して復元した画像(復元模擬画像I^〔Iハット〕)となる。
また、アップサンプリング手段13において、入力画像Iをアップサンプリングした画像は、入力画像Iを超解像した画像(超解像画像J)となる。
パラメータ更新手段14は、アップサンプリング手段13で行う変換処理(アップサンプリング)のパラメータを更新するものである。
パラメータ更新手段14は、切替手段10から入力される入力画像Iと、入力画像Iをダウンサンプリングおよびアップサンプリングすることで生成された切替手段15から入力される復元模擬画像I^との誤差をより小さくするようにパラメータを更新する。
例えば、パラメータ更新手段14は、アップサンプリング手段13で使用するパラメータpの変化が出力値(復元模擬画像I^)に及ぼす変化(勾配)を考慮して、勾配降下法によって、新たなパラメータp′を算出する。なお、パラメータ更新手段14は、勾配降下法によってパラメータp′を算出する1つの方法として、アップサンプリング手段13のニューラルネットワークにおいて、誤差逆伝播法を適用してパラメータp′を算出してもよい。
パラメータ更新手段14は、更新したパラメータp′をパラメータ記憶手段12に記憶する。このとき、パラメータ更新手段14は、アップサンプリング手段13に、新たなパラメータでアップサンプリングを行う旨を指示する。
さらに、パラメータ更新手段14は、初期状態または最初の入力画像Iが入力された直後において、動作モードとして学習モードを示すモード切替信号(例えば、m=0)を、切替手段10,15に出力する。
このパラメータ更新手段14は、更新動作の回数が所定回数(例えば、100万回)に達した場合、入力画像Iと復元模擬画像I^との誤差が所定の基準に達した場合(所定値以下あるいは所定値未満となった場合)、更新動作回数に対する誤差の変化量が所定の基準に達した場合(所定値以下あるいは所定値未満となった場合)、あるいは、それらの組み合わせの基準に達した場合に、動作モードとして実行モードを示すモード切替信号(例えば、m=1)を、切替手段10,15に出力する。これによって、パラメータ更新手段14は、動作モードを学習モードから実行モードに切り替える。
切替手段15は、動作モードによって、アップサンプリング手段13でアップサンプリングされた画像の出力先を切り替えるものである。
切替手段15は、パラメータ更新手段14から動作モードとしてモード切替信号を入力されることで画像の出力先を切り替える。
モード切替信号mが学習モードを示す(例えば、m=0)場合、切替手段15は、アップサンプリング後の画像(復元模擬画像I^)を、パラメータ更新手段14に出力する。一方、モード切替信号mが実行モードを示す(例えば、m=1)場合、切替手段15は、アップサンプリング後の画像(超解像画像J)を、超解像装置1の出力結果として外部に出力する。
以上説明したように超解像装置1を構成することで、超解像装置1は、学習モードと実行モードとを順に動作させることで、入力画像の解像度に対してスケールが1階層異なる自己相似型の超解像を実現することができる。
これによって、超解像装置1は、入力画像を高品質に高解像度化することができる。
なお、超解像装置1は、コンピュータを、前記した各手段として機能させるためのプログラム(超解像プログラム)により動作させることができる。
<超解像装置の動作>
次に、図3,図4を参照して、本発明の実施形態に係る超解像装置1の動作について説明する。図3は、超解像装置1の学習モードの動作を示すフローチャートである。図4は、超解像装置1の実行モードの動作を示すフローチャートである。
以下、超解像装置1における学習モードの動作と実行モードの動作とを順に説明する。
(学習モードの動作)
まず、図3を参照(構成については、適宜図1,図2参照)して、超解像装置1の学習モードの動作について説明する。なお、パラメータ記憶手段12には、予めパラメータの初期値が記憶されているものとする。
ステップS1において、切替手段10および切替手段15は、初期動作として、パラメータ更新手段14からのモード切替信号により、動作モードを学習モードに設定する。これによって、切替手段10は、入力画像Iの出力先を、ダウンサンプリング手段11およびパラメータ更新手段14に切り替える。また、切替手段15は、アップサンプリング手段13の出力先をパラメータ更新手段14に切り替える。
ステップS2において、ダウンサンプリング手段11は、予め設定された超解像の拡大率の逆数倍で入力画像Iをダウンサンプリングし、低解像画像Dを生成する。
ステップS3において、アップサンプリング手段13は、ステップS2で生成された低解像画像Dを、パラメータ記憶手段12に記憶されているパラメータを用いて、予め設定された超解像の拡大率でアップサンプリングし、復元模擬画像I^を生成する。
このステップS3では、アップサンプリング手段13は、内挿手段20によって、低解像画像Dに対して超解像の拡大率に応じた内挿処理を行うことで、補間画像を生成する。
そして、アップサンプリング手段13は、畳み込み手段21と、活性化関数適用手段22と、加算手段23とで構成されるニューラルネットワークにより、補間画像から復元模擬画像I^を生成する。
ステップS4において、パラメータ更新手段14は、入力画像IとステップS3で生成した復元模擬画像I^との誤差をより小さくするようにパラメータを更新し、パラメータ記憶手段12に記憶する。ここでは、パラメータ更新手段14は、例えば、誤差逆伝播法を用いてパラメータを更新する。
ステップS5において、パラメータ更新手段14は、更新動作の回数が所定回数に達した等の予め定めた基準でパラメータの学習の終了を判定する。
ここで、パラメータの学習が終了したと判定されなかった場合(ステップS5でNo)、超解像装置1は、ステップS3に戻って、更新後のパラメータを用いてアップサンプリングを行い、順次、パラメータの更新を行う処理を行う。
一方、パラメータの学習が終了したと判定された場合(ステップS5でYes)、超解像装置1は、学習モードでの動作を終了し、後記する図4で説明する実行モードの動作に移行する。
以上の動作によって、超解像装置1は、入力画像を超解像するための自己相似性を仮定したパラメータを学習することができる。
(実行モードの動作)
次に、図4を参照(構成については、適宜図1,図2参照)して、超解像装置1の実行モードの動作について説明する。
ステップS10において、パラメータ更新手段14は、モード切替信号により、切替手段10および切替手段15に対して、動作モードを実行モードに設定する。これによって、切替手段10は、入力画像Iの出力先を、アップサンプリング手段13に切り替える。また、切替手段15は、アップサンプリング手段13の出力先を外部に切り替える。
ステップS11において、アップサンプリング手段13は、入力画像Iを、パラメータ記憶手段12に記憶されているパラメータを用いて、予め設定された超解像の拡大率でアップサンプリングし、超解像画像Jを生成する。
このステップS11では、アップサンプリング手段13は、内挿手段20によって、入力画像Iに対して超解像の拡大率に応じた内挿処理を行うことで、補間画像を生成する。
そして、アップサンプリング手段13は、畳み込み手段21と、活性化関数適用手段22と、加算手段23とで構成されるニューラルネットワークにより、補間画像から超解像画像Jを生成する。
以上の動作によって、超解像装置1は、自己相似性を仮定したパラメータを用いて、入力画像から高精細な超解像画像を生成することができる。
また、超解像装置1は、自己相似性を仮定したパラメータを用いるため、入力画像が自己相似性を有する画像の場合、例えば、画像中に直線等の同様の幾何学的パターンや、植物の葉、海岸線等の同様の形状のパターンが含まれている場合、さらに、高精細に画像を超解像化することができる。
以上、本発明の実施形態に係る超解像装置1の構成および動作について説明したが、本発明は、この実施形態に限定されるものではない。
ここでは、アップサンプリング手段13をニューラルネットワークで構成したが、デジタルフィルタを用いて実現してもよい。
その場合、アップサンプリング手段13は、図5に示すように、内挿手段20と、複数の畳み込み手段21(21〜21)で構成したアップサンプリング手段13Bとすればよい。
内挿手段20および畳み込み手段21は、図2で説明したものと同じ構成であるため説明を省略する。この内挿手段20は省略しても構わない。
なお、畳み込み手段21において、前記式(8)で説明した4階テンソルAおよび1階テンソルBが、デジタルフィルタのタップ係数列で、パラメータpに相当する。
この場合、パラメータ更新手段14は、前の動作時点と現在の動作時点とにおける入力画像Iと復元模擬画像I^との誤差が小さくなったか否かに応じてパラメータpを更新する。例えば、パラメータ更新手段14は、誤差が小さくなった場合、前の動作時点と同様の更新の方向性、例えば、パラメータの成分ごとの値の変化における符号(増減)やその変化量を、前の動作時点で行った更新と同様にして、パラメータpを更新する。また、パラメータ更新手段14は、誤差が小さくならなかった場合、前の動作時点とは異なる更新の方向性、例えば、パラメータの成分ごとの値の変化の符号を反転、あるいは、変化量の絶対値を小さくして、パラメータpを更新する。
また、ここでは、超解像装置1への入力信号を、2次元の画像として説明した。
しかし、入力信号は、2次元の画像に限定されるものではない。
例えば、入力信号は、2次元の画像をフレームとして構成する映像であっても構わない。また、例えば、入力信号は、標本化方向が3次元である立体画像や立体映像であっても構わない。また、例えば、入力信号は、標本化方向が1次元である音声信号であっても構わない。なお、これらの信号は、標本化方向であるダウンサンプリングやアップサンプリングの標本化対象が増減するだけで、処理内容は、入力信号を2次元の画像とした場合と同様である。例えば、3次元の立体画像を入力信号とする場合、前記式(8),式(9)において、p,qおよびw,hにそれぞれさらに1次元の変数を追加すればよい。
これによって、超解像装置1は、2次元画像だけでなく、映像、立体画像、立体映像、音声についても超解像化することができる。
1 超解像装置
10 切替手段(第1切替手段)
11 ダウンサンプリング手段
12 パラメータ記憶手段
13,13B アップサンプリング手段
14 パラメータ更新手段
15 切替手段(第2切替手段)
20 内挿手段
21,…,21 畳み込み手段
22,…,22 活性化関数適用手段
23,…,23 加算手段

Claims (6)

  1. 予め設定された超解像の拡大率で入力信号を高解像度化する超解像装置であって、
    学習用の入力信号を前記拡大率の逆数倍でダウンサンプリングして低解像信号を生成するダウンサンプリング手段と、
    パラメータに応じて前記低解像信号をアップサンプリングし、前記学習用の入力信号を模擬した復元模擬信号を生成するアップサンプリング手段と、
    前記低解像信号と前記復元模擬信号との誤差が小さくなるように前記パラメータを更新するパラメータ更新手段と、を備え、
    前記アップサンプリング手段は、前記パラメータ更新手段における前記パラメータの更新中に、新たなパラメータで前記低解像信号をアップサンプリングし、前記パラメータの更新後に、更新後のパラメータで超解像対象の入力信号をアップサンプリングすることにより超解像信号を生成することを特徴とする超解像装置。
  2. 請求項1に記載の超解像装置において、
    前記パラメータを学習する学習モードと前記超解像信号を生成する実行モードとで、出力先を切り替える第1切替手段と第2切替手段とを備え、
    前記第1切替手段は、前記学習モードにおいて、前記学習用の入力信号を前記ダウンサンプリング手段および前記パラメータ更新手段に出力し、前記実行モードにおいて、前記超解像対象の入力信号を前記アップサンプリング手段に出力し、
    前記第2切替手段は、前記学習モードにおいて、前記アップサンプリング手段で生成される前記復元模擬信号を前記パラメータ更新手段に出力し、前記実行モードにおいて、前記アップサンプリング手段で生成される前記超解像信号を外部に出力することを特徴とする超解像装置。
  3. 請求項1または請求項2に記載の超解像装置において、
    前記アップサンプリング手段は、畳み込み手段を備えたニューラルネットワークで構成され、
    前記パラメータ更新手段は、前記パラメータを誤差逆伝播法により更新することを特徴とする超解像装置。
  4. 請求項1または請求項2に記載の超解像装置において、
    前記アップサンプリング手段は、タップ係数列による畳み込みを行う畳み込み手段を備え、
    前記パラメータ更新手段は、前記タップ係数列を前記パラメータとして更新することを特徴とする超解像装置。
  5. 請求項3または請求項4に記載の超解像装置において、
    前記アップサンプリング手段は、前記畳み込み手段の前段に、当該アップサンプリング手段に入力される信号に対して前記拡大率で内挿を行う内挿手段を備えることを特徴とする超解像装置。
  6. コンピュータを、請求項1から請求項5のいずれか一項に記載の超解像装置として機能させるための超解像プログラム。
JP2018153358A 2018-08-17 2018-08-17 超解像装置およびそのプログラム Active JP7174568B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018153358A JP7174568B2 (ja) 2018-08-17 2018-08-17 超解像装置およびそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018153358A JP7174568B2 (ja) 2018-08-17 2018-08-17 超解像装置およびそのプログラム

Publications (2)

Publication Number Publication Date
JP2020027557A true JP2020027557A (ja) 2020-02-20
JP7174568B2 JP7174568B2 (ja) 2022-11-17

Family

ID=69620550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018153358A Active JP7174568B2 (ja) 2018-08-17 2018-08-17 超解像装置およびそのプログラム

Country Status (1)

Country Link
JP (1) JP7174568B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111667409A (zh) * 2020-06-09 2020-09-15 云南电网有限责任公司电力科学研究院 一种基于超分辨率算法的绝缘子影像分辨率增强方法
JP2021170271A (ja) * 2020-04-16 2021-10-28 タオソフトウエア株式会社 プログラム
WO2023112172A1 (ja) * 2021-12-14 2023-06-22 日本電信電話株式会社 学習装置、画像処理装置、学習方法、画像処理方法及びプログラム
US11769221B2 (en) 2020-03-12 2023-09-26 Axell Corporation Learning apparatus, inferring apparatus, computer program, computer system, inferring method, and learning method
WO2023184525A1 (en) * 2022-04-02 2023-10-05 Covidien Lp System and method for deep learning based hybrid image enlargement

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017150204A1 (en) * 2016-03-03 2017-09-08 Mitsubishi Electric Corporation Computer system and method for upsampling image
WO2018048507A1 (en) * 2016-09-06 2018-03-15 Han Xiao Neural network for generating synthetic medical images

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017150204A1 (en) * 2016-03-03 2017-09-08 Mitsubishi Electric Corporation Computer system and method for upsampling image
WO2018048507A1 (en) * 2016-09-06 2018-03-15 Han Xiao Neural network for generating synthetic medical images

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHAO DONG, ET AL: "Image Super-Resoluion using deep convolutional networks", IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, vol. 38, no. 2, JPN6022027682, February 2016 (2016-02-01), pages 295 - 307, ISSN: 0004817131 *
仁井田 輝 ほか1名: "SRCNNによるMRI画像の高解像度化とその工学的評価", 電子情報通信学会技術研究報告, vol. 117, no. 518, JPN6022027680, 12 March 2018 (2018-03-12), pages 1 - 4, ISSN: 0004817130 *
菅原 佑介 ほか2名: "畳み込みニューラルネットワークを用いた超解像の並列計算法", 電子情報通信学会技術研究報告, vol. 116, no. 463, JPN6022027675, 13 February 2017 (2017-02-13), pages 13 - 18, ISSN: 0004817129 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11769221B2 (en) 2020-03-12 2023-09-26 Axell Corporation Learning apparatus, inferring apparatus, computer program, computer system, inferring method, and learning method
JP2021170271A (ja) * 2020-04-16 2021-10-28 タオソフトウエア株式会社 プログラム
CN111667409A (zh) * 2020-06-09 2020-09-15 云南电网有限责任公司电力科学研究院 一种基于超分辨率算法的绝缘子影像分辨率增强方法
CN111667409B (zh) * 2020-06-09 2024-03-22 云南电网有限责任公司电力科学研究院 一种基于超分辨率算法的绝缘子影像分辨率增强方法
WO2023112172A1 (ja) * 2021-12-14 2023-06-22 日本電信電話株式会社 学習装置、画像処理装置、学習方法、画像処理方法及びプログラム
WO2023184525A1 (en) * 2022-04-02 2023-10-05 Covidien Lp System and method for deep learning based hybrid image enlargement

Also Published As

Publication number Publication date
JP7174568B2 (ja) 2022-11-17

Similar Documents

Publication Publication Date Title
JP7174568B2 (ja) 超解像装置およびそのプログラム
Sun et al. Learned image downscaling for upscaling using content adaptive resampler
US9652830B2 (en) Method and apparatus for performing hierarchical super-resolution of an input image
JP4162610B2 (ja) 複数の低解像度の画像を使用して解像度が向上された画像を生成するための方法
JP2011180798A (ja) 画像処理装置、および画像処理方法、並びにプログラム
CN110322400B (zh) 图像处理方法及装置、图像处理系统及其训练方法
JP2003018398A (ja) ピクセル画像から超解像度画像を生成する方法
WO2011111819A1 (ja) 画像処理装置、画像処理プログラム、および、画像を生成する方法
KR100860968B1 (ko) 해상도 향상 장치 및 방법
KR101756841B1 (ko) 블록 기반 영상의 해상도 변환 방법 및 장치
Makwana et al. Single image super-resolution via iterative back projection based Canny edge detection and a Gabor filter prior
WO2011018878A1 (ja) 画像処理システム、画像処理方法および画像処理用プログラム
JP5717548B2 (ja) 超解像補助情報生成装置、符号化装置、復号装置、及びこれらのプログラム
CN113628115A (zh) 图像重建的处理方法、装置、电子设备和存储介质
JP5514132B2 (ja) 画像縮小装置、画像拡大装置、及びこれらのプログラム
KR102624154B1 (ko) 이미지 복원 방법 및 장치
KR101556625B1 (ko) 영상 확대 보간 방법
JP5198500B2 (ja) 信号処理装置及びプログラム
JP2016115318A (ja) ぼやけ補正装置、超解像装置およびプログラム
Yamaguchi et al. Fast and high quality image interpolation for single-frame using multi-filtering and weighted mean
JP5410232B2 (ja) 画像復元装置、そのプログラム、及び、多次元画像復元装置
JP5498970B2 (ja) 画像縮小装置、画像拡大装置、及びこれらのプログラム
Prendergast et al. A block-based super-resolution for video sequences
JP6059899B2 (ja) フレーム補間装置及びプログラム
JP5846048B2 (ja) 画像処理装置および撮像装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210713

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220607

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220829

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221011

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221107

R150 Certificate of patent or registration of utility model

Ref document number: 7174568

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150