JP6957197B2 - 画像処理装置および画像処理方法 - Google Patents

画像処理装置および画像処理方法 Download PDF

Info

Publication number
JP6957197B2
JP6957197B2 JP2017098231A JP2017098231A JP6957197B2 JP 6957197 B2 JP6957197 B2 JP 6957197B2 JP 2017098231 A JP2017098231 A JP 2017098231A JP 2017098231 A JP2017098231 A JP 2017098231A JP 6957197 B2 JP6957197 B2 JP 6957197B2
Authority
JP
Japan
Prior art keywords
image
error
image processing
resolution
frequency component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017098231A
Other languages
English (en)
Other versions
JP2018195069A (ja
Inventor
良範 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017098231A priority Critical patent/JP6957197B2/ja
Priority to US15/978,555 priority patent/US20180336662A1/en
Publication of JP2018195069A publication Critical patent/JP2018195069A/ja
Application granted granted Critical
Publication of JP6957197B2 publication Critical patent/JP6957197B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4053Super resolution, i.e. output image resolution higher than sensor resolution
    • G06T3/4076Super resolution, i.e. output image resolution higher than sensor resolution by iteratively correcting the provisional high resolution image using the original low-resolution image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4046Scaling the whole image or part thereof using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4053Super resolution, i.e. output image resolution higher than sensor resolution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4084Transform-based scaling, e.g. FFT domain scaling
    • G06T5/70
    • G06T5/73
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20052Discrete cosine transform [DCT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Description

本発明は、畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)を用いた超解像手法であるSRCNNにおいて、高精度に高周波成分を回復する画像処理技術に関する。
SRCNNは、非特許文献1にて開示されているように、CNNを用いて低解像度画像から高解像度画像を生成する超解像(super-resolution:SR)手法である。CNNは、入力画像に対してフィルタの畳み込み(convolution)を行った後に非線形処理を繰り返すことで、目的とする出力画像を生成する画像処理手法である。
フィルタは後述する訓練画像から学習によって生成され、一般に複数存在する。また、入力画像に対してフィルタの畳み込みを行った後に非線形処理を行うことで得られる複数の画像は特徴マップ(feature map)と呼ばれる。さらに、入力画像に対してフィルタの畳み込みを行った後に非線形処理を行う一連の処理は、層(layer)という単位で表現される。例えば、1層目のフィルタや2層目の特徴マップ等と呼ばれる。例えばフィルタの畳み込みと非線形処理を3回繰り返すCNNは、3層のネットワーク構造と呼ばれる。
CNNは、以下のように定式化できる。
Figure 0006957197
式(1)において、Wはn層目のフィルタであり、bはn層目のバイアスである。fは非線形処理演算子であり、Xはn層目の特徴マップであり、*は畳み込み演算子である。右辺の(l)はl番目のフィルタまたは特徴マップを表している。また、非線形処理としては、従来のシグモイド関数(sigmoid function)や収束性に優れたReLU(Rectified Linear Unit)が用いられる。ReLUは、
Figure 0006957197
により与えられる。すなわち、入力ベクトルZの要素のうち負のものに対しては0を出力し、正のものに対してはそのままZを出力する非線形な処理である。
超解像とは、画素が粗い(画素サイズが大きい)イメージセンサで取得した低解像度画像から元の高解像度画像を生成(推定)する画像処理である。超解像には、光学像を形成する光学系と該光学像を光電変換するイメージセンサの画素開口で失われる高解像度画像の高周波成分を高精度に回復すること(ぼけを除去して鮮鋭化すること)が求められる。
SRCNNでは、まず低解像度な訓練画像とこれに対応する高解像度な訓練画像(正解画像)からなる訓練画像の組を用意する。次に、低解像度な入力画像を高解像度な変換画像に高精度に変換することができるように、訓練画像の組を用いてCNNのネットワークパラメータ(前述したフィルタおよびバイアス)を学習により設定する。CNNのネットワークパラメータの学習は、以下のように定式化できる。
Figure 0006957197
式(3)において、Wはフィルタであり、Lは損失関数(loss function)、ηは学習率である。損失関数は、低解像度訓練画像をCNNに入力した際に、得られる高解像度の推定画像定と正解画像との誤差を評価する関数である。また、学習率ηは、勾配法(gradient descent method)におけるステップ幅と同じ役割を有する。また、各フィルタに関する損失関数の勾配は、微分の連鎖律により求められる。また、式(3)は、フィルタに対する学習を示したが、バイアスに対しても同様である。
式(3)は、推定画像と正解画像との誤差が小さくなるようにネットワークパラメータを更新する学習法を表す。この学習法は、誤差逆伝搬法(back propagation method)と呼ばれる。また、損失関数については、後に本発明の実施例において詳細に説明する。
次にSRCNNでは、学習により生成したCNNのネットワークパラメータを用いて、式(1)に従って任意の低解像度画像から高解像度画像を生成する超解像処理を行う。
SRCNNの学習には反復計算を要し、一般には時間がかかる。しかし、一度ネットワークパラメータを学習すれば、それを用いて高速に超解像処理を行える。また、SRCNNは高い汎化性能、すなわち学習に用いていない画像でも良好に超解像できる性質を有する。これにより、SRCNNは他の技術と比べて高速かつ高精度な超解像処理を可能とする。
Chao Dong、Chen Change Loy、Kaiming He、Xiaoou Tang、「Image super-resolution using deep convolutional networks」、IEEE Transactions on Pattern Analysis and Machine Intelligence、アメリカ合衆国、2015、pp.295-307
特開2014−195333号公報
SRCNNでは、高解像度画像の高周波成分を高精度に回復することができない。これは、SRCNNが用いている損失関数を見ると明らかである。SRCNNが用いている損失関数は、以下で与えられる。
Figure 0006957197
式(4)式において、Xは低解像度訓練画像をCNNに入力した際に、得られる高解像度な推定画像であり、Yは入力した低解像度訓練画像に対応する高解像度な訓練画像(正解画像)である。
Figure 0006957197
はL2ノルムであり、簡単にはベクトルZの要素の2乗和の平方根である。式(4)は、ともに高解像度な推定画像と正解画像の誤差として、両画像の差分の2乗和を用いる。
式(4)は、周波数的には、低周波成分から高周波成分までに等しい重みを付けて、高解像度な推定画像と正解画像との差分をとっていることと等価である。しかし、一般に自然画像は低周波成分を主として含み、高周波成分はそれに比べて少ないため、このように誤差を評価すると、高解像度な推定画像における高周波成分の回復を評価することができない。つまり、損失関数は、高解像度画像の推定において低周波成分さえ回復できれば誤差が小さくなるために、高周波成分を回復しない関数であると言える。
以上の理由から、SRCNNが用いている損失関数により学習したCNNのネットワークパラメータでは、高解像度画像の高周波成分を高精度に回復することができない。
本発明は、高解像度画像の高周波成分を高精度に回復することが可能なCNNのネットワークパラメータを設定できるようにした画像処理装置および画像処理方法等を提供する。
本発明の一側面としての画像処理装置は、畳み込みニューラルネットワークに入力画像を与えることで得られる推定画像と前記入力画像に対応する訓練画像との誤差を算出し、前記誤差の高周波成分に前記誤差の低周波成分よりも大きい重み付けを行うように前記誤差の周波数成分に対して重み付けを行う誤差重み付け手段と、重み付けが行われた誤差から勾配を算出し、該勾配を用いて畳み込みニューラルネットワークのネットワークパラメータを設定するパラメータ設定手段とを有することを特徴とする。なお、上記画像処理装置を備えた撮像装置も、本発明の他の一側面を構成する。
また、本発明の他の一側面としての画像処理方法は、畳み込みニューラルネットワークに入力画像を与えることで得られる推定画像と入力画像に対応する訓練画像との誤差を算出し、前記誤差の高周波成分に前記誤差の低周波成分よりも大きい重み付けを行うように前記誤差の周波数成分に対して重み付けを行うステップと、重み付けが行われた誤差から勾配を算出し、該勾配を用いて畳み込みニューラルネットワークのネットワークパラメータを設定するステップとを有することを特徴とする。なお、上記画像処理方法をコンピュータに実行させる画像処理プログラムも、本発明の他の一側面を構成する。





本発明によれば、CNNを用いた超解像手法であるSRCNNにおいて、高精度に高周波成分を回復することができる。
本発明の実施例である画像処理装置を備えた撮像装置の構成を示すブロック図。 上記画像処理装置が行う画像処理方法を示すフローチャート。 本発明の実施例1に用いるステップ関数状の重み付け係数を説明する図。 実施例1の効果を説明する数値計算結果を示す図。 従来技術の効果を説明する数値計算結果を示す図。 実施例1と従来技術の周波数領域の比較図。 本発明の実施例2に用いる線形関数状の重み付け係数を説明する図。 実施例2の効果を説明する数値計算結果を示す図。
以下、本発明の実施例について図面を参照しながら説明する。
まず本発明の具体的な実施例(数値例)を説明する前に、本発明の代表的な実施例について説明する。図1には、本発明の実施例である画像処理装置103を備えた撮像装置100の構成を示している。
撮像装置100は、結像光学系101と、撮像素子102と、画像処理装置103とを有する。結像光学系101は、撮像素子102の撮像面上に光学像(被写体像)を形成する。結像光学系101は、1又は複数のレンズにより構成されてもよいし、反射鏡、屈折率分布素子またはDMD(Digital Mirror Device)等の光学素子により構成されてもよい。結像光学系101の結像特性は、未知でもよいが、既知であることが望ましい。結像特性は、画角、被写体距離、波長および輝度等の条件に対する光学像のぼけを点像強度分布(Point Spread Function:PSF)で表したものである。また、結像光学系101の働きは、画像処理的にはPSFの畳み込み積分で与えられる。
撮像素子102は、CMOS(Complementary Metal Oxide Semiconductor)イメージセンサにより構成され、その撮像面上に形成された被写体像を光電変化し、該被写体像の光強度に応じた電気信号を出力する。撮像素子102は、CMOSイメージセンサに限らず、光強度に応じた電気信号が出力できれば、他のものであってもよい。例えば、CCD(Charge Coupled Device)イメージセンサを用いてもよい。また、撮像素子102の働きは、画像処理的には、高解像度な光学像の光電変換により得られる複数画素が1画素の広がり(開口)により平均化されて低解像度画像における1画素となるダウンサンプリングで与えられる。
画像処理装置103は、パーソナルコンピュータやワークステーション等の演算装置により構成され、撮像素子102が出力する電気信号を用いて生成される撮像画像を入力画像として後述する画像処理を行う。画像処理装置103は、不図示の内部記憶部に格納されたコンピュータプログラムである画像処理プログラム(アプリケーション)を実行してもよいし、該プログラムを回路として実装したボード等を有していてもよい。また、外部記憶媒体(半導体メモリや光ディスク等)に記憶された画像処理プログラムを読み込んで画像処理を実行してもよい。
撮像装置100は、結像光学系101が撮像素子102と一体に設けられた光学系一体型であってもよいし、結像光学系101の着脱交換が可能な光学系交換型であってもよい。光学系交換型である場合は、後述する画像処理で用いるパラメータ(CNNのネットワークパラメータ)として、使用する結像光学系101に適したものを用いる必要がある。これは、該パラメータは、結像光学系101の結像特性に応じて設定されるべきだからである。
次に、画像処理装置103が実行する画像処理(方法)について、図2に示したフローチャートを用いて説明する。なお、Sはステップまたは処理を示す。画像処理装置103は、誤差重み付け手段およびパラメータ設定手段として機能する。
ステップS201では、画像処理装置103は、入力画像としての低解像度訓練画像とこれに対応する高解像度訓練画像(正解画像)からなる訓練画像の組を準備する。なお、結像光学系101の結像特性が既知である場合は、計算機を用いたシミュレーションにより、高解像度訓練画像から低解像度訓練画像を生成してもよい。すなわち、高解像度訓練画像に対して結像光学系101の結像特性であるPSFを畳み込み、得られる光学像に撮像素子102の影響を付加(ダウンサンプリング)することで、低解像度訓練画像を生成してもよい。
また、結像光学系101の結像特性が未知である場合は、撮像装置100を用いて既知の高解像度パターン(バーチャート等)を撮像することで、低解像度訓練画像を生成してもよい。
また、各訓練画像はカラー画像でもモノクロ画像でもよいが、以下の説明では、各訓練画像をモノクロ画像として説明する。訓練画像がカラー画像である場合は、カラーチャンネルごとに又はカラー画像の輝度成分にのみ、以下で説明する画像処理を適用すればよい。
さらに、本実施例では、非特許文献1に倣って、低解像度訓練画像をバイキュービック(Bicubic)補間して、高解像度訓練画像と同じサイズにしている。例えば、2倍超解像を行う場合、低解像度画像は高解像度画像と比べてそのサイズが半分になるが、補間処理により低解像度画像のサイズを2倍にして両訓練画像のサイズを揃える。
ステップS202では、画像処理装置103は、訓練画像から畳み込みニューラルネットワーク(CNN)のネットワークパラメータを学習する。この際、損失関数として以下の式(5)で与えられる関数を用いる。
Figure 0006957197
式(5)において、Xは低解像度訓練画像をCNNに入力して得られる高解像度推定画像であり、Yは入力した低解像度訓練画像に対応する高解像度訓練画像(正解画像)である。Ψは高周波成分に重み付けする行列(高周波重み付け行列)であり、以下の式(6)で与えられる。
Figure 0006957197
式(6)において、Φは周波数分解を行う離散コサイン変換(Discrete Cosine Transform:DCT)に用いられるDCT行列であり、Γは重み付け係数行列である。重み付け係数行列Γは、DCT行列により得られるDCT係数(離散コサイン変換係数)に重み付けする係数(重み付け係数)を対角成分に有する対角行列である。この重み付け係数の決定方法については後の実施例で詳細に説明する。
式(6)では、まず高解像度推定画像と正解画像との差分(誤差)を示す差分画像をDCT変換して得られる周波数成分ごとのDCT係数(周波数係数)のうち、所定の高周波成分に対応する高周波係数(高周波DCT係数)に対して重み付け係数行列を適用する。これにより、高周波DCT係数に対する重み付けを行う。さらに、式(6)では、その重み付けした高周波DCT係数(加重高周波係数)をDCT逆変換することを意味する。言い換えると、式(6)は、自然画像にはあまり含まれていない高周波成分に重み付けすることで、高解像度推定画像の高周波成分が良好に回復しなければ、大きなペナルティが加わるようにすることを意味する。上記損失関数を用いて学習したCNNのネットワークパラメータを用いることで、高精度に高周波成分を回復することが可能となる。また、学習には、式(3)で説明した誤差逆伝搬法を用いる。誤差逆伝搬法において用いる損失関数の勾配は、以下の式(7)で与えられる。
Figure 0006957197
式(7)において、Y’は高周波重み付け行列Ψで重み付けした高解像度正解画像Yである。
このように、本実施例では、推定誤差の高周波成分に重み付けをして、ネットワークを学習する。
従来、画像の高周波成分に重み付けをする超解像は行われてきたが、重み付けをした後に学習することは行われておらず、また式(5)と式(6)に示した損失関数とそれを用いた学習法(式(7))も従来にはなかったものである。
また、特開2014−195333号公報では、周波数領域または実空間において重み付けした測度を用いて、ビデオ信号の予測誤差信号の量子化誤差を評価し、周波数空間と実空間のどちらで量子化するかを選択する方法が開示されている。予測誤差信号とは、前フレームとの差分を予測した信号である。しかし、上記公報で開示されている重み付けは、エッジでは誤差を許容し、フラットであれば誤差を許容しないという本実施例とは逆の目的でなされている。しかも、周波数領域において重み付けした測度を用いてネットワークを学習することは開示されていない。
以上の処理を予め行って学習したCNNのネットワークパラメータを不図示の記憶部に記憶しておいてもよい。また、半導体メモリや光ディスク等の記憶媒体にネットワークパラメータを記憶しておき、その記憶媒体から以下の処理を行う前に記憶されたネットワークパラメータ読み込んでもよい。
ステップS203では、画像処理装置103は、撮像装置100(撮像素子102)により取得した任意の低解像度画像(入力画像)に対して、学習したCNNのネットワークパラメータを用いて高解像度画像を生成(推定)する。ここでは、式(1)で示した超解像方法を用いる。
また、取得した低解像度画像がカラー画像である場合は、カラーチャンネルごとに学習したCNNのネットワークパラメータを用いて、カラーチャンネルごとに低解像度画像から高解像度画像を生成し、それぞれのカラーチャンネルの高解像度画像を合成すればよい。または、カラー画像の輝度成分から学習したCNNのネットワークパラメータを用いて低解像度輝度画像から高解像度輝度画像を生成し、その高解像度輝度画像を、補間した色差画像と融合すればよい。
さらに、画像処理結果を不図示の記憶部に記憶してもよいし、不図示の表示部に表示してもよい。
以上の処理により、撮像装置100で取得した任意の低解像度画像から高解像度画像を生成することができる。
次に、具体的な実施例について説明する。
実施例1では、先に説明した画像処理によって生成した超解像画像(高解像度画像)の数値計算結果を示す。
CNNは、非特許文献1にて開示された3層のネットワーク構造を有している。1層目のフィルタサイズは9×9を64個であり、2層目のフィルタサイズは64×1×1×32であり、3層目のフィルタサイズは5×5を32個である。2層目のフィルタは、入力画像サイズをNy×Nxとして、1層目が出力するNx×Ny×64次元の行列をNx×Ny×32次元の行列に変換するものである。
1層目から3層目のフィルタの学習率はそれぞれ、10−4、10−6および10−8である。また、1層目から3層目のバイアスの学習率は10−5、10−7および10−9である。各層のフィルタの初期値は正規分布乱数で与え、各層のバイアスの初期値はゼロとした。1層目と2層目の活性化関数として、前述したReLUを用いた。また、誤差逆伝搬の回数は3×10回とした。
光学系は、F値が2.8、波長が0.55μmかつ等倍である収差を考慮しない理想レンズとした。光学系は結像特性が既知であればどのような構成のものでもよい。本実施例では、簡単のために収差を考慮しなかった。イメージセンサは、1画素のサイズが1.5μmであり、開口率が100%のものを用いた。簡単のため、イメージセンサノイズは考慮しなかった。
また、超解像倍率を2倍とした。光学系が等倍で、イメージセンサの1画素サイズが1.5μmであるので、高解像度画像の1画素サイズは0.75μmとなる。
訓練画像は、32×32画素のモノクロの高解像度訓練画像と低解像度訓練画像との組が計15000組集まったものである。低解像度訓練画像は、前述したF値2.8、波長0.55μm、等倍という光学条件および1画素サイズが1.5μmで開口率が100%というイメージセンサを仮定して、複数の高解像度訓練画像から数値計算により生成した。すなわち、1画素サイズが0.75μmの高解像度訓練画像を、上記光学条件でぼけさせた後、上記イメージセンサで取得して1画素サイズが1.5μmの低解像度訓練画像を生成する。また、前述したように、高解像度訓練画像と低解像度訓練画像は互いに同じサイズになるようにバイキュービック補間処理を行った。撮像装置100で取得される低解像度画像に対してもバイキュービック補間した後、その補間画像に対して超解像処理を行った。高解像度訓練画像を、画素値の最大値が1になるように規格化した。
損失関数の重み付け係数は、図3に示すステップ関数状のものを用いた。具体的には、高解像度推定画像と正解画像との差分画像から算出されるDCT係数のうち高周波側1/2の高周波成分である高周波DCT係数を2.5倍するものとした。
なお、重み付け係数は、高周波DCT係数に一様な重みを加えられればどのようなものでもよい。例えば、本実施例のようにステップ関数状のものでもよいし、ステップ関数が鈍ったシグモイド関数状のものを用いてもよい。また、一様に重み付けをする高周波DCT係数は、厳密に高周波側1/2の高周波成分に対応するものである必要はなく、高周波側1/2以上、2/3以下の高周波成分に対応するものであればよい。さらに、高周波DCT係数に一様に加える重みは、厳密に2.5倍である必要はなく、1.5倍以上、2.5倍以下の範囲であればよい。すなわち、重み付け係数の大きさは、1.5以上、2.5以下であればよい。
図4(a)〜(c)は、本実施例での画像処理の結果を示す。図4(a)は低解像度画像のバイキュービック補間画像を示し、図4(b)は本実施例における高解像度推定画像、図4(c)は正解画像を示す。各画像はモノクロ画像であり、画像サイズはNx=Ny=256画素である。これらの図から、本実施例では、バイキュービック補間画像に比べて正解画像に近い鮮鋭な(ぼけによる劣化が少ない)推定画像が得られたことが分かる。
本実施例の効果を2乗平均平方根誤差(Root Mean Square Error:RMSE)で定量的に評価した。RMSEは以下の式(8)で与えられる。
Figure 0006957197
式(8)において、P,Qは任意のM×1次元ベクトルであり、p,qはそれぞれP,Qのi番目の要素である。RMSEがゼロに近いほど、P,Qがより類似していることを示す。すなわち、高解像度推定画像と正解画像のRMSEがゼロに近いほど、推定画像が高精度に超解像できていると言える。
表1は、低解像度画像のバイキュービック補間画像と正解画像のRMSEおよび本実施例により得られた高解像度推定画像と正解画像のRMSEを示す。前者のRMSEより後者のRMSE方がゼロに近いので、本実施例によれば、より高精度に超解像できることが分かる。
Figure 0006957197
次に、本実施例と従来技術とを比較する。従来技術としては、非特許文献1で開示されているSRCNNを用いる。また、従来技術は損失関数の重み付けを除いて本実施例と同様なので、説明は省略する。
図5は、従来技術により得られた高解像度推定画像を示す。表2に、従来技術により得られた高解像度推定画像と正解画像のRMSEを示す。このRMSEよりも本実施例により得られた高解像度推定画像と正解画像のRMSEの方がゼロに近いので、本実施例によれば、より高精度に超解像できることが分かる。
Figure 0006957197
図6は、本実施例と従来技術との1次元スペクトルによる比較結果を示す。1次元スペクトルとは、画像を2次元フーリエ変換することで得られる2次元スペクトルの絶対値をとり、動径方向に積算して1次元のベクトルとして表現したスペクトルである。図6において、横軸は規格化された空間周波数を示し、図の右側ほど高周波数であることを示している。縦軸は1次元スペクトルの対数値を示している。実線は正解画像の1次元スペクトルを示し、点線は従来技術により得られた高解像度推定画像の1次元スペクトルを示している。一点鎖線は本実施例により得られた高解像度推定画像の1次元スペクトルを示している。
この図において、高周波領域において一点鎖線が点線より実線に近いことから、従来技術より本実施例の方が多くの高周波成分を回復できていることが分かる。なお、画像にノイズ様の高周波成分を加えることでも、高周波成分を増やすことはできる。しかし、その場合は高周波成分を増やした画像の画質が低下し、該画像と正解画像のRMSEがゼロから離れる。一方、本実施例により得られた高解像度推定画像と正解画像のRMSEは、従来技術よりゼロに近くなっていることから、高周波成分を高精度に回復できていることが分かる。
以上のことから、本実施例によれば、従来技術に比べて、高周波成分をより高精度に回復することができると言える。
実施例2では、損失関数の重み付け係数として、線形関数状のもの(正確には区分線形関数)を用いた数値計算の結果を示す。実施例1とは損失関数の重み付け係数が異なるだけであるので、それ以外についての説明は省略する。
図7は、本実施例における線形関数状の重み付け係数を示す。この重み付け係数は、高解像度推定画像と正解画像との差分画像から算出されるDCT係数のうち高周波側2/3の高周波成分である高周波DCT係数に、最大値が3倍となるように線形に重み付けするものである。
なお、重み付け係数は、高周波DCT係数に対して単調増加する重みを加えられればどのようなものでもよい。例えば、本実施例のように線形関数状のものでもよいし、累乗関数や指数関数等の曲線状のものでもよい。また、単調増加する重みを加える高周波DCT係数は、厳密に高周波側2/3の高周波成分に対応するものである必要はなく、高周波側2/3以上、4/5以下の高周波成分に対応するものであればよい。また、高周波DCT係数に対して単調増加するように加える重みは、最大値が厳密に3倍である必要はなく、最大値が3倍以上、6倍以下の範囲であればよい。すなわち、重み付け係数の最大値が3以上、6以下であればよい。
図8は、本実施例により得られた高解像度推定画像を示す。低解像度画像(のバイキュービック補間画像)と正解画像は実施例1と同じである。表3に、本実施例により得られた高解像度推定画像と正解画像のRMSEを示す。このRMSEは、従来技術により得られた高解像度推定画像と正解画像のRMSEよりゼロに近い。また、1次元スペクトルによる周波数空間での評価も、具体的には示さないが、実施例1と同様である。このため、本実施例によれば、従来技術に比べて、より正解画像に近い鮮鋭な(ぼけによる劣化が少ない)高解像度推定画像を得ることができる。
Figure 0006957197
実施例3では、超解像ではなく、ノイズ除去を行う場合について説明する。ノイズ除去においても、高周波成分の高精度な回復は重要となっている。その理由は、ノイズにより劣化したノイズ劣化画像のうち本来の画像の高周波成分と高周波ノイズとを見分けることが難しく、ノイズ劣化画像から高周波ノイズを良好に除去することが難しいためである。
例えば、画像処理分野においては、メジアンフィルタ(median filter)を用いてノイズ劣化画像からスパイクノイズが除去される。メジアンフィルタは、ノイズ劣化画像中の注目画素の画素値を、該注目画素の隣接範囲内の画素の中間値(メジアン)と置き換えるフィルタである。このメジアンフィルタを用いることにより、周囲の画素に比べて顕著に大きい又は小さい画素値はノイズと判断されて除去される。しかし、同時にエッジ等の画像の高周波成分も平均化されて鈍る。このため、画像の高周波成分を高精度に回復することが必要である。
実施例1,2で説明した画像処理をノイズ除去に適用するには、学習で用いる訓練画像を変えるだけでよい。具体的には、低解像度訓練画像(入力画像)と高解像度訓練画像の代わりに、訓練ノイズ劣化画像とこれよりもノイズによる劣化が少ない訓練鮮鋭画像とを用いて、CNNのネットワークパラメータを学習すればよい。その他は、実施例1,2と同様であるので、説明は省略する。
実施例4では、超解像ではなく、ぼけ除去を行う場合について説明する。ぼけ除去においても、高周波成分の高精度な回復は重要である。その理由は、ぼけ除去の目的が光学系やイメージセンサの開口により失われた画像の高周波成分を回復することだからである。
実施例1,2で説明した画像処理をぼけ除去に適用するには、学習で用いる訓練画像を変えるだけでよい。具体的には、低解像度訓練画像(入力画像)と高解像度訓練画像の代わりに、ぼけを含む訓練ぼけ画像とこれよりもぼけによる劣化が少ない訓練鮮鋭画像とを用いて、CNNのネットワークパラメータを学習すればよい。その他は、実施例1,2と同様であるので、説明は省略する。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
以上説明した各実施例は代表的な例にすぎず、本発明の実施に際しては、各実施例に対して種々の変形や変更が可能である。
103 画像処理装置

Claims (17)

  1. 畳み込みニューラルネットワークに入力画像を与えることで得られる推定画像と前記入力画像に対応する訓練画像との誤差を算出し、前記誤差の高周波成分に前記誤差の低周波成分よりも大きい重み付けを行うように前記誤差の周波数成分に対して重み付けを行う誤差重み付け手段と、
    前記重み付けが行われた前記誤差から勾配を算出し、該勾配を用いて前記畳み込みニューラルネットワークのネットワークパラメータを設定するパラメータ設定手段とを有することを特徴とする画像処理装置。
  2. 前記誤差は、前記入力画像と前記訓練画像との差分を示す画像であることを特徴とする請求項1に記載の画像処理装置。
  3. 前記誤差重み付け手段は、
    前記誤差の周波数分解を行って周波数成分ごとの周波数係数を算出し、
    前記周波数係数のうち、所定の高周波成分に対応する高周波係数に対して重み付け係数を適用して加重高周波係数を算出し、
    前記加重高周波係数に対して前記周波数分解の逆変換を行うことを特徴とする請求項1または2に記載の画像処理装置。
  4. 前記周波数分解は離散コサイン変換であり、前記周波数係数は離散コサイン変換係数であることを特徴とする請求項3に記載の画像処理装置。
  5. 前記重み付け係数は、前記高周波係数に対して一様に重みを加えるように設定されていることを特徴とする請求項3または4に記載の画像処理装置。
  6. 前記重み付け係数の大きさは、1.5以上、2.5以下であることを特徴とする請求項5に記載の画像処理装置。
  7. 前記所定の高周波成分は、高周波側1/2以上、2/3以下の高周波成分であることを特徴とする請求項5または6に記載の画像処理装置。
  8. 前記重み付け係数は、前記高周波係数に対して単調増加する重みを加えるように設定されていることを特徴とする請求項3または4に記載の画像処理装置。
  9. 前記重み付け係数の最大値は、3以上、6以下であることを特徴とする請求項8に記載の画像処理装置。
  10. 前記所定の高周波成分は、高周波側2/3以上、4/5以下の高周波成分であることを特徴とする請求項8または9に記載の画像処理装置。
  11. 前記入力画像は、正解画像に対して劣化した劣化画像であり、
    前記訓練画像は、前記正解画像であることを特徴とする請求項1から10のいずれか一項に記載の画像処理装置。
  12. 前記入力画像は、低解像度画像であり、
    前記推定画像は、前記低解像度画像より高解像度の推定画像であり、
    前記訓練画像は、前記低解像度画像より高解像度の訓練画像であることを特徴とする請求項1から10のいずれか一項に記載の画像処理装置。
  13. 前記入力画像は、ノイズにより劣化したノイズ劣化画像であり、
    前記推定画像は、前記ノイズ劣化画像よりノイズによる劣化が少ない推定画像であり、
    前記訓練画像は、前記ノイズ劣化画像よりノイズによる劣化が少ない訓練画像であることを特徴とする請求項1から10のいずれか一項に記載の画像処理装置。
  14. 前記入力画像は、ぼけを含むぼけ画像であり、
    前記推定画像は、前記ぼけ画像よりぼけによる劣化が少ない推定画像であり、
    前記訓練画像は、前記ぼけ画像よりぼけによる劣化が少ない訓練画像であることを特徴とする請求項1から10のいずれか一項に記載の画像処理装置。
  15. 撮像素子と、
    該撮像素子を通して得られた画像を入力画像とする請求項1から14のいずれか一項に記載の画像処理装置とを有することを特徴とする撮像装置。
  16. 畳み込みニューラルネットワークに入力画像を与えることで得られる推定画像と前記入力画像に対応する訓練画像との誤差を算出し、前記誤差の高周波成分に前記誤差の低周波成分よりも大きい重み付けを行うように前記誤差の周波数成分に対して重み付けを行うステップと、
    前記重み付けが行われた前記誤差から勾配を算出し、該勾配を用いて前記畳み込みニューラルネットワークのネットワークパラメータを設定するステップとを有することを特徴とする画像処理方法。
  17. コンピュータに画像処理を実行させるコンピュータプログラムであって、
    前記画像処理は、
    畳み込みニューラルネットワークに入力画像を与えることで得られる推定画像と前記入力画像に対応する訓練画像との誤差を算出し、前記誤差の高周波成分に前記誤差の低周波成分よりも大きい重み付けを行うように前記誤差の周波数成分に対して重み付けを行う処理と、
    前記重み付けが行われた前記誤差から勾配を算出し、該勾配を用いて前記畳み込みニューラルネットワークのネットワークパラメータを設定する処理とを有することを特徴とする画像処理プログラム。
JP2017098231A 2017-05-17 2017-05-17 画像処理装置および画像処理方法 Active JP6957197B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017098231A JP6957197B2 (ja) 2017-05-17 2017-05-17 画像処理装置および画像処理方法
US15/978,555 US20180336662A1 (en) 2017-05-17 2018-05-14 Image processing apparatus, image processing method, image capturing apparatus, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017098231A JP6957197B2 (ja) 2017-05-17 2017-05-17 画像処理装置および画像処理方法

Publications (2)

Publication Number Publication Date
JP2018195069A JP2018195069A (ja) 2018-12-06
JP6957197B2 true JP6957197B2 (ja) 2021-11-02

Family

ID=64271934

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017098231A Active JP6957197B2 (ja) 2017-05-17 2017-05-17 画像処理装置および画像処理方法

Country Status (2)

Country Link
US (1) US20180336662A1 (ja)
JP (1) JP6957197B2 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6554253B2 (ja) * 2017-06-05 2019-07-31 楽天株式会社 画像処理装置、画像処理方法、および画像処理プログラム
KR102174777B1 (ko) * 2018-01-23 2020-11-06 주식회사 날비컴퍼니 이미지의 품질 향상을 위하여 이미지를 처리하는 방법 및 장치
WO2020059446A1 (ja) * 2018-09-20 2020-03-26 富士フイルム株式会社 学習装置及び学習方法
CN109510943A (zh) * 2018-12-17 2019-03-22 三星电子(中国)研发中心 用于拍摄图像的方法和装置
DE102018222147A1 (de) 2018-12-18 2020-06-18 Leica Microsystems Cms Gmbh Optikkorrektur durch Maschinenlernen
JP7278766B2 (ja) * 2018-12-21 2023-05-22 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
JP7258604B2 (ja) * 2019-03-05 2023-04-17 キヤノン株式会社 画像処理方法、画像処理装置、プログラム、および学習済みモデルの製造方法
JP7167832B2 (ja) * 2019-04-19 2022-11-09 日本電信電話株式会社 画像変換装置、画像変換モデル学習装置、方法、及びプログラム
CN109996085B (zh) * 2019-04-30 2021-05-14 北京金山云网络技术有限公司 模型训练方法、图像处理方法、装置及电子设备
CN111881927B (zh) 2019-05-02 2021-12-21 三星电子株式会社 电子装置及其图像处理方法
WO2020246150A1 (ja) * 2019-06-03 2020-12-10 浜松ホトニクス株式会社 半導体検査方法及び半導体検査装置
JP7312026B2 (ja) 2019-06-12 2023-07-20 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
KR20210017185A (ko) 2019-08-07 2021-02-17 한국전자통신연구원 심층 신경망을 기반으로 영상의 압축 포아송 잡음을 제거하는 방법 및 장치
CN112396558A (zh) * 2019-08-15 2021-02-23 株式会社理光 图像处理方法、装置及计算机可读存储介质
JP7284688B2 (ja) * 2019-10-31 2023-05-31 浜松ホトニクス株式会社 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
CN110827219B (zh) 2019-10-31 2023-04-07 北京小米智能科技有限公司 图像处理模型的训练方法、装置及介质
CN110827200B (zh) * 2019-11-04 2023-04-07 Oppo广东移动通信有限公司 一种图像超分重建方法、图像超分重建装置及移动终端
CN114651439B (zh) * 2019-11-08 2024-03-05 奥林巴斯株式会社 信息处理系统、内窥镜系统、信息存储介质及信息处理方法
JPWO2021095256A1 (ja) * 2019-11-15 2021-05-20
CN111161156A (zh) * 2019-11-28 2020-05-15 东南大学 一种基于深度学习的水下桥墩病害图像分辨率增强方法
WO2021157062A1 (ja) * 2020-02-07 2021-08-12 日本電信電話株式会社 量子化ビット数拡張のための学習装置、信号推定装置、学習方法、信号推定方法、およびプログラム
CN111507902B (zh) * 2020-04-15 2023-09-26 京东城市(北京)数字科技有限公司 一种高分辨率图像获取方法及装置
CN111709890B (zh) 2020-06-12 2023-11-24 北京小米松果电子有限公司 一种图像增强模型的训练方法、装置及存储介质
US20220067879A1 (en) 2020-09-03 2022-03-03 Nvidia Corporation Image enhancement using one or more neural networks
WO2023224320A1 (ko) * 2022-05-17 2023-11-23 삼성전자 주식회사 영상의 화질을 향상시키기 위한 영상 처리 장치 및 방법

Also Published As

Publication number Publication date
JP2018195069A (ja) 2018-12-06
US20180336662A1 (en) 2018-11-22

Similar Documents

Publication Publication Date Title
JP6957197B2 (ja) 画像処理装置および画像処理方法
US11354537B2 (en) Image processing apparatus, imaging apparatus, image processing method, and storage medium
KR101233013B1 (ko) 화상 촬영 장치 및 그 거리 연산 방법과 합초 화상 취득 방법
RU2431889C1 (ru) Способ суперразрешения изображений и нелинейный цифровой фильтр для его осуществления
US8649628B2 (en) Adaptive PSF estimation technique using a sharp preview and a blurred image
US9036032B2 (en) Image pickup device changing the size of a blur kernel according to the exposure time
Delbracio et al. Removing camera shake via weighted fourier burst accumulation
US8432479B2 (en) Range measurement using a zoom camera
WO2011099244A1 (ja) 画像処理装置および画像処理方法
JP2017208641A (ja) 圧縮センシングを用いた撮像装置、撮像方法および撮像プログラム
JP2017010095A (ja) 画像処理装置、撮像装置、画像処理方法、画像処理プログラム、および、記憶媒体
KR20070085364A (ko) 열화 정보 복원 방법, 복원 장치 및 프로그램이 기록된 기록 매체
FR2978855A1 (fr) Procede et dispositif de calcul d'une carte de profondeur a partir d'une unique image
JP5765893B2 (ja) 画像処理装置、撮像装置および画像処理プログラム
CN107220945B (zh) 多重退化的极模糊图像的复原方法
JP6344934B2 (ja) 画像処理方法、画像処理装置、撮像装置、画像処理プログラムおよび記録媒体
JP6541454B2 (ja) 画像処理装置、撮像装置、画像処理方法、画像処理プログラム、および、記憶媒体
US20210279851A1 (en) Manufacturing method of learning data, learning method, learning data manufacturing apparatus, learning apparatus, and memory medium
JP2017010093A (ja) 画像処理装置、撮像装置、画像処理方法、画像処理プログラム、および、記憶媒体
JP2012003454A (ja) 画像処理装置、撮像装置および画像処理プログラム
JP2017208642A (ja) 圧縮センシングを用いた撮像装置、撮像方法および撮像プログラム
JP6661491B2 (ja) 画像処理装置および画像処理方法
JP2017130167A (ja) 画像処理装置、撮像装置および画像処理プログラム
JP6611509B2 (ja) 画像処理装置、撮像装置および画像処理プログラム
JP6818461B2 (ja) 撮像装置、画像処理装置、画像処理方法および画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200421

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210819

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210907

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211006

R151 Written notification of patent or utility model registration

Ref document number: 6957197

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151