JP2020057373A - 画像処理方法、画像処理装置、撮像装置、プログラム、記憶媒体、画像処理システム、および、学習済みモデルの製造方法 - Google Patents

画像処理方法、画像処理装置、撮像装置、プログラム、記憶媒体、画像処理システム、および、学習済みモデルの製造方法 Download PDF

Info

Publication number
JP2020057373A
JP2020057373A JP2019152000A JP2019152000A JP2020057373A JP 2020057373 A JP2020057373 A JP 2020057373A JP 2019152000 A JP2019152000 A JP 2019152000A JP 2019152000 A JP2019152000 A JP 2019152000A JP 2020057373 A JP2020057373 A JP 2020057373A
Authority
JP
Japan
Prior art keywords
image
learning
image processing
input
imaging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019152000A
Other languages
English (en)
Other versions
JP7309520B2 (ja
JP2020057373A5 (ja
Inventor
智暁 井上
Tomoaki Inoue
智暁 井上
良範 木村
Yoshinori Kimura
良範 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to US16/576,937 priority Critical patent/US11080832B2/en
Priority to CN201910898810.6A priority patent/CN110958382A/zh
Priority to EP19199118.1A priority patent/EP3629284A1/en
Publication of JP2020057373A publication Critical patent/JP2020057373A/ja
Publication of JP2020057373A5 publication Critical patent/JP2020057373A5/ja
Application granted granted Critical
Publication of JP7309520B2 publication Critical patent/JP7309520B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)
  • Studio Devices (AREA)

Abstract

【課題】撮影画像の高周波成分を復元しつつノイズ量を低減することが可能な画像処理方法を提供する。【解決手段】画像処理方法は、第一の入力画像の第一の領域を取得する工程と、第二の入力画像の第二の領域を取得する工程と、多層のニューラルネットワークを用いて、第一の領域および第二の領域に基づいて、高周波成分が復元されノイズ量が低減された出力画像を算出する工程とを有する。【選択図】図4

Description

本発明は、複数の入力画像を畳み込みニューラルネットワークを用いて複数の入力画像を処理する画像処理方法に関する。
近年、画像の画質を向上させるため、畳み込みニューラルネットワーク(CNN)を用いた画像処理技術が利用され始めている。CNNとは、学習により生成したフィルタを、入力画像に対して畳み込こみ、学習により生成したバイアスを加算したのち、非線形演算することを繰り返し、所望の出力画像へ変換する学習型の画像処理技術である。この学習は、入力学習画像と出力学習画像との組からなる学習画像を用いて行われる。簡単には、学習とは、入力画像に対応する入力学習画像と、出力画像に対応する出力学習画像とを大量(例えば数万枚程度)に用意し、これらの学習画像から入出力画像間の関係を学ぶことである。
例えば、非特許文献1には、入力学習画像をスマートフォンカメラで、出力学習画像をデジタル一眼カメラで取得し、入力画像であるスマートフォンカメラ画像を、デジタル一眼カメラ画質へ変換するCNNが開示されている。これにより、小型のスマートフォンカメラによって、大型の撮像装置であるデジタル一眼カメラの画質に近い画像を取得することが可能となる。
Andrey Ignaov、Nikolay Kobyshev、Radu Timofte、Kenneth Vanhoey、Luc Van Gool、「DSLR−Quality Photos on Mobile Devices with Deep Convolutional Networks」、 arXiv:1704.02470v2、アメリカ合衆国、2017
しかしながら、非特許文献1に開示されているCNNを用いた手法では、入力画像として1つの撮像部で取得された画像のみを用いるため、高周波成分の復元とノイズの低減効果が不十分である。一般的に、撮影画像のノイズ量は撮像素子の画素サイズに依存する。このため、画素サイズが大きいほど、ノイズ量が低い画像を取得することが可能である。一方、画素サイズが小さいほど、被写体の高周波成分の再現性を高めることができる。すなわち、高周波成分の再現性とノイズ量の低減とはトレードオフの関係にあり、1つの撮像部で取得された画像のみを用いて両方を高性能化することは困難である。
そこで本発明は、撮影画像の高周波成分を復元しつつノイズ量を低減することが可能な画像処理方法、画像処理装置、撮像装置、プログラム、記憶媒体、画像処理システム、および、学習済みモデルの製造方法を提供することを目的とする。
本発明の一側面としての画像処理方法は、第一の画像を取得する工程と、前記第一の画像よりノイズ量が多く、被写体の高周波成分を多く含む第二の画像を取得する工程と、前記第一の画像および前記第二の画像をニューラルネットワークに入力して、前記第一の画像より前記被写体の高周波成分を多く含み前記第二の画像よりノイズ量が少ない第三の画像を生成する工程とを有する。
本発明の他の側面としての画像処理装置は、第一の画像と、前記第一の画像よりノイズ量が多く、被写体の高周波成分を多く含む第二の画像を取得する取得部と、前記第一の画像および前記第二の画像をニューラルネットワークに入力して、前記第一の画像より前記被写体の高周波成分を多く含み前記第二の画像よりノイズ量が少ない第三の画像を生成する算出部とを有する。
本発明の他の側面としての撮像装置は、第一の入力画像を撮像する第一の撮像部と、第二の入力画像を撮像する第二の撮像部と、前記の画像処理装置とを有する。
本発明の他の側面としてのプログラムは、前記画像処理方法をコンピュータに実行させる。
本発明の他の側面としての記憶媒体は、前記プログラムを記憶している。
本発明の他の側面としての画像処理システムは、第一の装置と第二の装置を有する画像処理システムであって、前記第一の装置は、第一の画像と、前記第一の画像よりノイズ量が多く、被写体の高周波成分を多く含む第二の画像を用いた画像処理を前記第二の装置に実行させるための要求を送信する送信手段を有し、前記第二の装置は、前記送信手段によって送信された前記要求を受信する受信手段と、前記第一の画像と前記第二の画像を取得する取得手段と、前記第一の画像および前記第二の画像をニューラルネットワークに入力して、前記第一の画像より前記被写体の高周波成分を多く含み前記第二の画像よりノイズ量が少ない第三の画像を生成する算出部とを有する。
本発明の他の側面としての学習済みモデルの製造方法は、第一の画像を取得する工程と、前記第一の画像よりノイズ量が多く、被写体の高周波成分を多く含む第二の画像を取得する工程と、前記第一の画像より前記被写体の高周波成分を多く含み、前記第二の画像よりノイズ量が少ない第三の画像を取得する工程と、前記第一の画像と前記第二の画像と前記第三の画像を用いた学習によりニューラルネットワークのパラメータを更新する工程とを有する。
本発明の他の目的及び特徴は、以下の実施例において説明される。
本発明によれば、撮影画像の高周波成分を復元しつつノイズ量を低減することが可能な画像処理方法、画像処理装置、撮像装置、プログラム、記憶媒体、画像処理システム、および、学習済みモデルの製造方法を提供することができる。
実施例1における撮像装置の外観図である。 実施例1における撮像装置のブロック図である。 実施例1および実施例2における画像を補正するネットワーク構造の説明図である。 実施例1および実施例2における画像の補正処理を示すフローチャートである。 実施例1および実施例2における学習情報の学習を示すフローチャートである。 実施例1における画像処理結果である。 実施例1における画像処理の数値計算結果である。 実施例2における画像処理システムのブロック図である。 実施例2における画像処理システムの外観図である。
以下、本発明の実施例について、図面を参照しながら詳細に説明する。各図において、同一の部材については同一の参照符号を付し、重複する説明は省略する。
実施例の具体的な説明へ入る前に、本発明の要旨を述べる。本発明では、ディープラーニング(深層学習)の1つである畳み込みニューラルネットワーク(CNN)を用いて、複数の異なる撮像部で取得された撮影画像に対して高周波成分を復元しつつノイズ量を低減する。以下に述べる各実施例は、特に、低解像度かつノイズ量が少ない画像(第一の画像)と高解像度かつノイズ量が多い画像(第二の画像)とに基づいて、高解像度かつノイズ量が少ない高画質な画像(第三の画像)を生成するものである。
まず、図1および図2を参照して、本発明の実施例1における撮像装置について説明する。図1は撮像装置1の外観図であり、図1(a)は俯瞰図、図1(b)は正面図をそれぞれ示している。図2は、撮像装置1のブロック図である。本実施例において、撮像装置1は、画像処理方法を実行し、撮影画像に対して高周波成分を復元しつつノイズ量を低減する。
撮像装置1は、広画角な被写体の撮像に用いられる主撮像部100、および、狭画角な被写体の撮像に用いられる副撮像部110を有する。主撮像部100は、撮像光学系101および撮像素子(第一の撮像素子)102を備えて構成される。撮像光学系101は、1つ以上のレンズ、絞り101Aおよびフォーカスレンズ101F(フォーカシング機構)を備えて構成され、不図示の被写体からの光を撮像素子102上に結像させる。また、撮像光学系101は、その内部に設けられた1つ以上のレンズが駆動することで焦点距離が変化する変倍光学系であってもよい。なお図1において、撮像光学系101は撮像装置1の一部として(撮像装置1と一体的に)構成されているが、一眼レフカメラのように交換式の(撮像装置本体に対して着脱可能な)撮像光学系であってもよい。
撮像素子102は、CMOSセンサやCCDセンサ等の固体撮像素子であり、撮像光学系101を介して形成された光学像(被写体像)を光電変換してアナログ電気信号(画像信号)を出力する。撮像光学系101における絞り101Aおよびフォーカスレンズ101Fの機械的な駆動は、システムコントローラ30からの制御指示に応じて、撮像制御部40(フォーカス制御部41)により行われる。撮像制御部40は、設定された絞り値(F値、Fナンバー)に応じて、絞り101Aの開口径を制御する。フォーカス制御部41は、被写体距離に応じてフォーカスレンズ101Fの位置を制御することで、フォーカス調整を行う。
A/Dコンバータ10は、撮像素子102の光電変換により生成されたアナログ電気信号をデジタル信号に変換し、画像処理部20に出力する。画像処理部20は、A/Dコンバータ10から出力されたデジタル信号に対して、画素補間処理、輝度信号処理、および、色信号処理等、いわゆる現像処理を行い、画像を生成する。画像処理部20により生成された画像は、半導体メモリや光ディスク等の画像記録媒体60に記録される。また、画像処理部20により生成された画像は、表示部70に表示されてもよい。情報入力部50は、ユーザの操作に従って様々な情報を入力する。様々な情報の一例としては、画像取得時の撮像条件であり、具体的には、主撮像部100のF値やISO感度等である。
副撮像部110は、撮像光学系111および撮像素子(第二の撮像素子)112を有する。撮像光学系111は、不図示の被写体からの光を撮像素子112上に結像させる単焦点撮像光学系である。撮像光学系111は、撮像光学系101よりも狭い画角(望遠)の光学系である。また撮像光学系111は、フォーカスレンズ111Fを有する。撮像素子112の光電変換により生成されたアナログ電気信号(画像信号)は、撮像素子102により生成されたアナログ電気信号(画像信号)と同様に扱われ、画像処理部20は撮像素子112から出力された画像信号に基づいて画像を生成する。画像処理部20で生成された画像は、主撮像部100と同様に表示部70に表示することができる。ここで、副撮像部110は撮像装置1から着脱可能であってもよく、複数の副撮像部110の中から主撮像部100に適した副撮像部が選択されて撮像装置1に装着されてもよい。
副撮像部110は、主撮像部100に対して相対的に狭い画角を撮影する望遠撮像部である。また、副撮像部110に設けられた撮像素子112は、主撮像部100に設けられた撮像素子102と比較して、撮像素子を構成する画素が配置された撮像領域のサイズが小さく、画素サイズ(画素ピッチ)も小さい。すなわち、主撮像部100で取得される画像(第一の入力画像)は広角画像でノイズ量が少ない画像であり、副撮像部110で取得される画像(第二の入力画像)は相対的に望遠画像でノイズ量が多い画像である。
ここで、本実施例におけるノイズ量について説明する。画像に含まれるノイズ量σ0は、該画像から測定または推定することにより求められる。ノイズが実空間および周波数空間において一様なホワイトガウシアンノイズであるとき、入力画像に含まれるノイズを、以下の式(1)に示すようなMAD(Median Absolute Deviation)から推定することができる。
MAD=median(|wHH1−median(wHH1)|) ・・・(1)
MADは、入力画像をウェーブレット変換して得られたHH1のサブバンド画像におけるウェーブレット係数wHH1のメディアン(中央値)を用いて求められる。このとき、標準偏差(ノイズ量σ0)とMADが以下の式(2)の関係であることから、ノイズ成分の標準偏差を推定することができる。
σ0=MAD/0.6745 ・・・(2)
なお、画像のウェーブレット変換では、画像の水平方向に対してウェーブレット変換を行って低周波成分と高周波成分に分解し、さらに分解して得られた低周波成分と高周波成分の垂直方向に対してウェーブレット変換を行う。ウェーブレット変換により、画像は4分割され、周波数帯域が互いに異なる4つのサブバンド画像に周波数分解される。このとき、左上の低周波帯域成分(スケーリング係数)のサブバンド画像をLL1とし、右下の高周波帯域成分(ウェーブレット係数)のサブバンド画像をHH1という。また、右上(HL1)と左下(LH1)のサブバンド画像はそれぞれ、水平方向に高周波帯域成分をとって垂直方向に低周波帯域成分を取り出したもの、および水平方向に低周波帯域成分をとって垂直方向に高周波帯域成分を取り出したものである。
また、副撮像部110に設けられた撮像素子112と主撮像部100に設けられた撮像素子102の画素数は同じである。すなわち、同じ被写体領域(画角内)では、主撮像部100よりも副撮像部110で取得される画像は相対的に解像度が高い(高周波成分の再現性が高い)画像である。副撮像部110で取得される画像は、主撮像部100で取得される画像よりも被写体の高周波成分を多く含んでいる画像である、とも言える。
画像処理部20は、入力された画像を用いて、高周波成分の復元処理およびノイズ低減処理(合わせて補正処理ともいう)を行う。画像処理部20は、学習部21および補正部22を有する。補正部22は、取得部22aおよび算出部22bを有する。また画像処理部20は、補正処理を実行する際に、メモリ(記憶部)80に記憶された学習情報を呼び出して使用する。なお、補正処理に関する詳細は後述する。
補正された画像等の出力画像は、液晶ディスプレイ等の表示部70に表示され、または画像記録媒体60に保存される。ただし、撮影画像を画像記録媒体60に保存し、任意のタイミングで補正を行ってもよい。また、撮影画像は動画でもよく、この場合、各フレームに対して補正を行う。以上の一連の制御は、システムコントローラ30によって行われる。
次に、図4を参照して、画像処理部20で行われる高周波成分の復元処理およびノイズ低減処理(画像の補正処理)について説明する。図4は、高周波成分の復元処理およびノイズ低減処理を示すフローチャートである。図4の各ステップは、主に、システムコントローラ30の指令に基づいて画像処理部20(補正部22)により実行される。なお、高周波成分の復元処理およびノイズ低減処理の際には事前に学習された学習情報を用いるが、学習に関する詳細は後述する。
まずステップS101において、画像処理部20(補正部22)は、低解像度かつノイズ量の少ない第一の入力画像と高解像度かつノイズ量の多い第二の入力画像(2つの入力画像)、および、学習情報を取得する。学習情報とは、2つの撮影画像と高周波成分が復元されてノイズ量が低減された画像とを結び付けるために予め学習部21により学習された情報である。
続いてステップS102において、補正部22(取得部22a)は、2つの入力画像から部分画像を取得する。すなわち補正部22(取得部22a)は、第一の入力画像から、第一の入力画像の一部である第一の部分領域に基づく第一の画像、および、第二の入力画像から、第二の入力画像の一部である第二の部分領域に基づく第二の画像を取得する。高周波成分の復元処理およびノイズ量の低減処理は、部分領域(第一の部分領域、第二の部分領域)を単位として(部分領域ごとに)行われる。本実施例において、第一の部分領域および第二の部分領域は、第一の入力画像および第二の入力画像のそれぞれ対応する領域、すなわち同一被写体領域に対応する領域である。なお第一の部分領域および第二の部分領域はそれぞれ、第一の入力画像および第二の入力画像の全てであってもよい。
続いてステップS103において、補正部22は、学習情報、第一の部分領域、第二の部分領域を用いて、高周波成分の復元およびノイズ量の低減(補正処理)が行われた部分領域である補正部分領域を生成する。ここで、図3を参照して、補正処理の詳細に関して説明する。図3は、ディープラーニングの1つであるCNN(Convolutional Neural Network)のネットワーク構造を示している。
CNNは、複数の層構造になっており、各層で学習情報を用いた線型変換と非線型変換とが実行される。nを1からNまでの整数とするとき、n番目の層を第n層、第n層における線型変換と非線型変換とをそれぞれ、第n線型変換と第n非線型変換と呼称する。ただし、Nは2以上の整数である。部分領域201に関しては、第1層において、複数のフィルタ202のそれぞれとのコンボリューション(複数の線型関数による第1線型変換)が実行される。その後、活性化関数(Activation Function)と呼ばれる非線型関数を用いて変換(第1非線型変換)が実行される。図3において、活性化関数をAFとして示している。また、部分領域201が複数枚描画されているのは、入力画像(撮影画像)が複数のチャンネルを有するためである。本実施例において、各部分領域はRGB(Red、Green、Blue)の3チャンネルを有する。ただし、チャンネルの数はこれに限定されるものではない。また、部分領域が複数のチャンネルを有していても、1チャンネルずつ個別にCNNへ入力しても構わない。
フィルタ202は複数存在する。補正部22は、複数のフィルタ202のそれぞれと部分領域201とのコンボリューションを個別に算出する。フィルタ202の係数は、学習情報に基づいて決定される。学習情報は、フィルタ202の係数(フィルタ係数)そのもの、または、フィルタ202を所定の関数でフィッティングした際の係数でもよい。フィルタ202のそれぞれのチャンネル数は、部分領域201の数と一致する。部分領域201のチャンネル数が2以上の場合、3次元フィルタとなる(3次元目がチャンネル数を表す)。また、コンボリューションの結果に対して、学習情報から決定される定数(負もとり得る)を加算してもよい。
活性化関数f(x)の例として、以下の式(1)〜(3)が挙げられる。
式(1)はシグモイド関数、式(2)はハイパボリックタンジェント関数、式(3)はReLU(Rectified Linear Unit)と呼ばれる。式(3)中のmaxは、引数のうち最大値を出力するMAX関数を表す。式(1)〜(3)に示される活性化関数f(x)は、全て単調増加関数である。また、活性化関数としてMaxoutを使用してもよい。Maxoutは、第n線型変換の出力である複数の画像のうち、各画素で最大値である信号値を出力するMAX関数である。
図3において、第1線型変換および第1非線型変換が施された部分領域を、第1変換部分領域203と呼称する。第1変換部分領域203の各チャンネル成分は、部分領域201と複数のフィルタ202のそれぞれとのコンボリューションから生成される。このため、第1変換部分領域203のチャンネル数は、フィルタ202の数と同じになる。
第2層では、第1変換部分領域203に対して、第1層と同様に学習情報から決定される複数のフィルタ204とのコンボリューション(第2線型変換)と、活性化関数による非線型変換(第2非線型変換)とを行う。第2層で用いられるフィルタ204は、一般的に、第1層で用いられるフィルタ202と同一ではない。フィルタ204のサイズや数も、フィルタ204と一致しなくてもよい。ただし、フィルタ204のチャンネル数と第1変換部分領域203のチャンネル数とは互いに一致する。補正部22は、同様の演算を第N層まで繰り返す(第n線型変換および第n非線型変換(n=1〜N)を実行する)ことにより、中間データ210を取得する。
最後に、第N+1層において、中間データ210と複数のフィルタ211のそれぞれとのコンボリューションに定数を加算すること(第N+1線型変換)により、補正された補正部分領域212が取得される。ここで用いられるフィルタ211および定数もそれぞれ、学習情報に基づいて決定される。補正部分領域212のチャンネル数は、部分領域201と同じである。このため、フィルタ211の数も部分領域201のチャンネル数と同じである。補正部分領域212の各チャンネルの成分は、中間データ210とフィルタ211のそれぞれ(フィルタ211が一つの場合もある)とのコンボリューションを含む演算から求められる。なお、部分領域201と補正部分領域212とのサイズは互いに一致しなくてもよい。コンボリューションの際に、部分領域201の外側にはデータが存在しないため、データの存在する領域のみで演算すると、コンボリューション結果はサイズが小さくなる。ただし、周期境界条件などを設定することにより、サイズを保つこともできる。
ディープラーニングが高い性能を発揮できる理由は、非線型変換を多層構造によって何度も実行することにより、高い非線型性が得られるためである。仮に、非線型変換を担う活性化関数が存在せず、線型変換のみでネットワークが構成されていた場合、いくら多層にしてもそれと等価な単層の線型変換が存在するため、多層構造にする意味がない。ディープラーニングは、より多層にする方が強い非線型を得られるため、高い性能が出やすいと言われている。一般に、少なくとも3層以上を有する場合がディープラーニングと呼ばれる。
続いて、図4のステップS104において、補正部22は、第一の入力画像および第二の入力画像のうち所定の領域の全てに対して、高周波成分の復元処理およびノイズ量の低減処理(補正処理、すなわち補正部分領域の生成)が完了したか否かを判定する。所定の領域の全てに対する補正処理が完了していない場合、ステップS102へ戻り、補正部22は、まだ補正されていない部分領域を撮影画像から取得する。一方、所定の領域の全てに対して補正処理が完了した場合(所定の領域の全てに関して、補正された補正部分領域が生成されている場合)、ステップS105へ進む。
ステップS105において、補正部22(算出部22b)は、高周波成分の復元処理およびノイズ量の低減処理がなされた画像(補正画像)を出力する。補正画像は、生成された補正部分領域を合成することで生成される。ただし、部分領域が撮影画像(入力画像)の全体である場合、補正部分領域をそのまま高周波成分の復元処理およびノイズ量の低減処理がなされた画像とする。
以上の処理により、撮影画像の高周波成分を復元するとともにノイズ量を低減した画像を得ることができる。本実施例では、第一の入力画像および第二の入力画像の同一被写体領域のみが補正される。すなわち、第二の入力画像と同じまたはそれ以下の画角の画像が出力画像として生成される。換言すると、撮像部サイズの大きい主撮像部100と撮像部サイズが小さい副撮像部110の2つの撮像部からの撮影画像を用いて、副撮像部110と同等の画角の高画質な望遠撮影画像を出力することが可能である。通常撮影により高画質な望遠撮影画像を得るには、主撮像部100の撮像光学系101を副撮像部110の撮像光学系111と同等画角の望遠レンズとする必要があるが、一般的に撮像領域の大きい撮像素子に対応する望遠レンズはサイズが大型となる。本実施例によれば、ノイズ量の少ない撮像が可能な主撮像部100と望遠撮像が可能な小型の副撮像部110とを備え、前述の画像処理方法を実行することで、装置サイズを小さく保ったまま高画質な望遠撮影画像を出力することができる。
次に、図5を参照して、本実施例における学習情報の学習(学習済みモデルの製造方法)について説明する。図5は、学習情報の学習を示すフローチャートである。図5の各ステップは、主に、撮像装置1(画像処理部20)の学習部21により行われる。ただし本実施例はこれに限定されるものではなく、学習情報の学習は、高周波成分の復元およびノイズ量の低減を実行する前であれば、撮像装置1とは別の装置(演算装置)に設けられた学習部で行ってもよい。本実施例では、撮像装置1の学習部21が学習情報を学習する場合について説明する。
まずステップS201において、学習部21は、少なくとも一組の学習画像を取得する。一組の学習画像は、同一の被写体が存在する複数の画像であって、広角画像でノイズ量が少ない第一の入力学習画像、望遠画像でノイズ量が多い第二の入力学習画像、および、望遠画像でノイズ量が少ない出力学習画像を含む。第一の入力学習画像および第二の入力学習画像は、出力学習画像と一対一に対応していてもよいし、一枚の出力学習画像に対して複数枚存在していてもよい。後者の場合、第一の入力学習画像および第二の入力学習画像は、ノイズ量等が異なる複数の画像である。
学習画像を用意する方法として、シミュレーションや実写画像を用いることができる。シミュレーションを行う場合、出力学習画像に対して、撮像部の画質劣化要因を考慮した撮像シミュレーションを行うことで入力学習画像を生成すればよい。実写画像を用いる場合、同一の被写体を撮像装置1の主撮像部100と副撮像部110において同じ条件で撮影した画像を使用すればよい。なお、学習画像には様々な特徴を有する被写体が含まれていることが好ましい。学習画像に含まれない特徴を有する画像は、高精度に補正することができないためである。
続いてステップS202において、学習部21は、ステップS201にて取得した学習画像から、複数の学習ペアを取得する。学習ペアは、学習部分領域(学習領域)と学習補正部分領域とからなる。学習補正部分領域は、第一の入力学習画像および第二の入力学習画像から取得され、そのサイズはステップS102にて取得した撮影画像の部分領域と同じである。学習部分領域は、出力学習画像から取得され、学習部分領域の中心は画像において学習補正部分領域の中心と同じ位置である。そのサイズは、ステップS103にて生成された補正部分領域と同じである。前述と同様に、学習部分領域と学習補正部分領域のペア(学習ペア)は、一対一に対応している必要はない。一つの学習補正部分領域と、複数の学習部分領域とがペア(グループ)になっていてもよい。
続いてステップS203において、学習部21は、複数の学習ペア(学習部分領域と学習補正部分領域)から、学習情報を学習によって取得(生成)する。学習では、高周波成分の復元とノイズ量の低減を実行するネットワーク構造と同じネットワーク構造を使用する。本実施例では、図3に示されるネットワーク構造に対して学習補正部分領域を入力し、その出力結果と学習部分領域との誤差を算出する。この誤差が最小となるように、例えば誤差逆伝播法(Backpropagation)等を用いて、第1乃至N+1層で用いる複数のフィルタのそれぞれの係数や加算する定数などのパラメータ(学習情報)を更新して最適化する。各フィルタの係数および定数の初期値は任意に設定することができ、例えば乱数から決定される。または、各層ごとに初期値を事前学習するAuto Encoder等のプレトレーニングを行ってもよい。
学習ペアの全てをネットワーク構造へ入力し、それら全ての情報を使って学習情報を更新する手法をバッチ学習と呼ぶ。ただし、この学習方法は、学習ペアの数が増えるにつれて計算負荷が膨大になる。一方、学習情報の更新に一つの学習ペアのみを使用し、更新ごとに異なる学習ペアを使用する学習手法をオンライン学習と呼ぶ。この手法は、学習ペアが増えても計算量が増大しないが、一つの学習ペアに存在するノイズの影響を大きく受ける。このため、これら2つの手法の中間に位置するミニバッチ法を用いて学習することが好ましい。ミニバッチ法は、全学習ペアの中から少数を抽出し、それらを用いて学習情報の更新を行う。次の更新では、異なる小数の学習ペアを抽出して使用する。これを繰り返すことにより、バッチ学習とオンライン学習の不利な点を小さくすることができ、高い補正効果を得やすくなる。
続いてステップS204において、学習部21は、学習された学習情報を出力する。本実施例において、学習情報はメモリ80に記憶される。以上の処理により、高周波成分の復元とノイズ量の低減を実行するための学習情報を学習することができる。すなわち、高周波成分の復元とノイズ量の低減を実行するための学習済みモデルを製造することができる。
また、以上の処理に加えて、CNNの性能を向上させる工夫を併用してもよい。例えば、ロバスト性の向上のためネットワークの各層において、ドロップアウト(Dropout)やダウンサンプリングであるプーリング(pooling)を行ってもよい。または、学習精度の向上のため、学習画像の画素の平均値を0、分散を1に正規化し、隣接する画素の冗長性をなくすZCAホワイトニング(ZCA whitening)などを併用してもよい。
図6は本実施例における画像処理結果であり、図6(a)は第一の画像、図6(b)は第二の画像、図6(c)は本実施例による画像処理により得られる出力画像、図6(d)は正解画像をそれぞれ示す。また、図6(a)〜(d)の全ての画像は256×256画素のモノクロ画像であり、画素値は[0 1]の範囲になるように規格化されている。なお、全ての画像は実写画像である。
図7は、本実施例における画像処理の数値計算結果であり、第一の画像(メイン画像)、第二の画像(サブ画像)、および、本実施例の画像処理により得られる出力画像のそれぞれ画質を、画質評価指標SSIMで表している。なお、SSIMは0〜1の値をとり、1に近いほど正解画像と類似していることを意味する。図7より、第一の画像および第二の画像のそれぞれよりも、本実施例の画像処理により得られる出力画像の方が画質評価指数SSIMの値が1に近いことが分かる。このため、CNNを用いて、ノイズ量の少ない広角画像とノイズ量の多い望遠画像とに基づいて、高周波成分が復元されノイズ量が低減された望遠画像へ変換できることが定量的に分かる。
本実施例によれば、撮影画像の高周波成分の復元処理およびノイズ量の低減処理を実行することが可能な撮像装置を提供することができる。
次に、図8および図9を参照して、本発明の画像処理方法を画像処理システムに適用した実施例2に関して説明する。本実施例では、撮影画像を補正する画像処理装置、撮影画像を取得する撮像装置、および、学習を行うサーバが個別に存在する。また本実施例では、撮影に使用された撮像装置の種類を判別することにより、使用する学習情報を切り替える。撮影に使用されたそれぞれの撮像装置の組み合わせに対して個別に学習情報を準備しておくことで、より高精度な画像補正が可能となる。
図8は、画像処理システム200のブロック図である。図9は、画像処理システム200の外観図である。図8および図9に示されるように、画像処理システム200は、複数の撮像装置300、画像処理装置301、サーバ305、表示装置308、記録媒体309、および、出力装置310を備えて構成される。
撮像装置300は、複数の撮像装置300a、300b、…、300nを含む。本実施例では、例えば、複数の撮像装置300のうち一般的な一眼レフカメラを実施例1で説明した主撮像部とし、コンパクトカメラを副撮像部とすることができる。また、副撮像部として、スマートフォン等に搭載される小型のカメラとしてもよい。また本実施例において、複数の撮像装置として2つの撮像装置を用いる場合に限定されるものではなく、3つ以上の撮像装置を用いることも可能である。
複数の撮像装置300a〜300nを用いて撮影された撮影画像(入力画像)は、画像処理装置301に設けられた記憶部302に記憶される。画像処理装置301は、ネットワーク304と有線または無線で接続されており、ネットワーク304を介してサーバ305にアクセスすることができる。サーバ305は、撮影画像の高周波成分を復元しつつノイズ量を低減するための学習情報を学習する学習部307と、学習情報を記憶する記憶部306とを有する。画像処理装置301に設けられた補正部303(画像処理部)は、サーバ305の記憶部306からネットワーク304を介して学習情報を取得し、撮影画像の高周波成分を復元しつつノイズ量を低減して出力画像を生成する。生成された出力画像は、表示装置308、記録媒体309、および、出力装置310の少なくとも一つに出力される。表示装置308は、例えば液晶ディスプレイやプロジェクタである。ユーザは、表示装置308を介して、処理途中の画像を確認しながら作業を行うことができる。記録媒体309は、例えば半導体メモリ、ハードディスク、ネットワーク上のサーバである。出力装置310は、例えばプリンタである。画像処理装置301は、必要に応じて現像処理やその他の画像処理を行う機能を有してもよい。なお、高周波成分の復元、ノイズ低減処理、および、学習情報の学習に関しては、実施例1と同様であるため、それらの説明は省略する。
このように各実施例において、画像処理方法は、第一の画像を取得する工程、および、第一の画像よりノイズ量が多く、被写体の高周波成分を多く含む第二の画像を取得する工程(S102)を有する。また画像処理方法は、第一の画像および第二の画像をニューラルネットワークに入力して、第一の画像より被写体の高周波成分を多く含み第二の画像よりノイズ量が少ない第三の画像を生成する工程(S103〜S105)を有する。
好ましくは、第一の画像および第二の画像はそれぞれ、第一の入力画像および第二の入力画像の少なくとも一部である。より好ましくは、第一の入力画像は、第二の入力画像よりも広い画角を有する。より好ましくは、第三の画像の画角は、第二の入力画像の画角以下である。
好ましくは、第二の画像は、第一の画像を取得する際に用いられた撮像素子102よりも画素ピッチが小さい撮像素子112を用いた撮像により得られた画像である。また好ましくは、第二の画像は、第一の画像を取得する際に用いられた撮像素子102よりも撮像領域が小さい撮像素子112を用いた撮像により得られた画像である。また好ましくは、ニューラルネットワークは、少なくとも一層の畳み込み層を有する。
好ましくは、画像処理方法は、予め学習されたニューラルネットワークに関する学習情報を取得する工程を有する。第三の画像を生成する工程は、Nを2以上の整数、nを1からNまでの整数とするとき、以下の第一の工程と第二の工程とを有する。第一の工程は、第一の画像および第二の画像に対して、学習情報に基づく複数の線型関数のそれぞれによる第n線型変換と、非線型関数による第n非線型変換とをnが1からNになるまで順に実行することで中間データを生成する。第二の工程は、中間データに対して、学習情報に基づく少なくとも一つの線型関数による第N+1線型変換を実行する。より好ましくは、学習情報は、同一の被写体が存在する複数の学習画像であって、第一の入力学習画像と、第二の入力学習画像と、出力学習画像とを用いて学習された情報である。ここで第二の入力学習画像は、第一の入力学習画像よりノイズ量が多く、被写体の高周波成分を多く含む画像である。出力学習画像は、第一の入力学習画像より被写体の高周波成分を多く含み第二の画像よりノイズ量が少ない画像である。より好ましくは、第一の入力学習画像および第二の入力学習画像の少なくとも一方は、シミュレーションにより生成された画像である。
(その他の実施例)
本発明は、画像処理に関する要求を行い実体的にシステム全体の制御を支配する第一の装置(撮像装置、スマートフォン、PCなどのユーザ端末)と、該要求に応じて画像処理を行う第二の装置(サーバ等)で構成された画像処理システムとしても実現可能である。例えば、実施例2の画像処理システム200における補正部303を第二の装置としてのサーバ305側に設け、第一の装置としての画像処理装置301がサーバ305に対して第一の画像および第二の画像を用いた画像処理の実行を要求するように構成しても良い。この場合、第一の装置(ユーザ端末)は画像処理に関する要求を第二の装置(サーバ)に送信するための送信手段を有し、第二の装置(サーバ)は第一の装置(ユーザ端末)から送信された要求を受信する受信手段を有する。
なお、この場合、第一の処理装置は画像処理の要求と共に第一の画像および第二の画像を第二の装置に送信しても良い。ただし、第二の装置は第一の装置の要求に応じて第一の装置以外の場所(外部記憶装置)に記憶された第一の画像および第二の画像を取得しても良い。また、第二の装置による第一の画像および第二の画像に対する画像処理が行われた後、第二の装置は出力画像を第一の装置に送信するようにしても良い。このように画像処理システムを構成することにより、比較的処理負荷の重い補正部による処理を第二の装置側で行うことが可能となり、ユーザ端末側の負担を低減することが可能となる。
また本発明は、上述の実施例の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
各実施例によれば、撮影画像の高周波成分を復元しつつノイズ量を低減することが可能な画像処理方法、画像処理装置、撮像装置、プログラム、記憶媒体、画像処理システム、および、学習済みモデルの製造方法を提供することができる。
以上、本発明の好ましい実施形態について説明したが、本発明はこれらの実施形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。
20 画像処理部(画像処理装置)
22a 取得部
22b 算出部

Claims (17)

  1. 第一の画像を取得する工程と、
    前記第一の画像よりノイズ量が多く、被写体の高周波成分を多く含む第二の画像を取得する工程と、
    前記第一の画像および前記第二の画像をニューラルネットワークに入力して、前記第一の画像より前記被写体の高周波成分を多く含み前記第二の画像よりノイズ量が少ない第三の画像を生成する工程と、を有することを特徴とする画像処理方法。
  2. 前記第一の画像および前記第二の画像はそれぞれ、第一の入力画像および第二の入力画像の少なくとも一部であることを特徴とする請求項1に記載の画像処理方法。
  3. 前記第一の入力画像は、前記第二の入力画像よりも広い画角を有することを特徴とする請求項2に記載の画像処理方法。
  4. 前記第三の画像の画角は、前記第二の入力画像の画角以下であることを特徴とする請求項3に記載の画像処理方法。
  5. 前記第二の画像は、前記第一の画像を取得する際に用いられた撮像素子よりも画素ピッチが小さい撮像素子を用いた撮像により得られた画像であることを特徴とする請求項1乃至4のいずれか1項に記載の画像処理方法。
  6. 前記第二の画像は、前記第一の画像を取得する際に用いられた撮像素子よりも撮像領域が小さい撮像素子を用いた撮像により得られた画像であることを特徴とする請求項1乃至5のいずれか一項に記載の画像処理方法。
  7. 前記ニューラルネットワークは、少なくとも一層の畳み込み層を有することを特徴とする請求項1乃至6のいずれか一項に記載の画像処理方法。
  8. 予め学習された前記ニューラルネットワークに関する学習情報を取得する工程を更に有し、
    前記第三の画像を生成する工程は、Nを2以上の整数、nを1からNまでの整数とするとき、
    前記第一の画像および前記第二の画像に対して、前記学習情報に基づく複数の線型関数のそれぞれによる第n線型変換と、非線型関数による第n非線型変換とをnが1からNになるまで順に実行することで中間データを生成する工程と、
    前記中間データに対して、前記学習情報に基づく少なくとも1つの線型関数による第N+1線型変換を実行する工程と、を含むことを特徴とする請求項1乃至7のいずれか一項に記載の画像処理方法。
  9. 前記学習情報は、同一の被写体が存在する複数の学習画像であって、第一の入力学習画像と、前記第一の入力学習画像よりノイズ量が多く、被写体の高周波成分を多く含む第二の入力学習画像と、前記第一の入力学習画像より前記被写体の高周波成分を多く含み前記第二の画像よりノイズ量が少ない出力学習画像と、を用いて学習された情報であることを特徴とする請求項8に記載の画像処理方法。
  10. 前記第一の入力学習画像および前記第二の入力学習画像の少なくとも一方は、シミュレーションにより生成された画像であることを特徴とする請求項9に記載の画像処理方法。
  11. 第一の画像と、前記第一の画像よりノイズ量が多く、被写体の高周波成分を多く含む第二の画像を取得する取得部と、
    前記第一の画像および前記第二の画像をニューラルネットワークに入力して、前記第一の画像より前記被写体の高周波成分を多く含み前記第二の画像よりノイズ量が少ない第三の画像を生成する算出部と、を有することを特徴とする画像処理装置。
  12. 予め学習された前記ニューラルネットワークに関する学習情報を記憶する記憶部を更に有することを特徴とする請求項11に記載の画像処理装置。
  13. 第一の入力画像を撮像する第一の撮像部と、
    第二の入力画像を撮像する第二の撮像部と、
    請求項11または12に記載の画像処理装置と、を有することを特徴とする撮像装置。
  14. 請求項1乃至10のいずれか一項に記載の画像処理方法をコンピュータに実行させることを特徴とするプログラム。
  15. 請求項14に記載のプログラムを記憶していることを特徴とする記憶媒体。
  16. 第一の装置と第二の装置を有する画像処理システムであって、
    前記第一の装置は、
    第一の画像と、前記第一の画像よりノイズ量が多く、被写体の高周波成分を多く含む第二の画像を用いた画像処理を前記第二の装置に実行させるための要求を送信する送信手段を有し、
    前記第二の装置は、
    前記送信手段によって送信された前記要求を受信する受信手段と、
    前記第一の画像と前記第二の画像を取得する取得手段と、
    前記第一の画像および前記第二の画像をニューラルネットワークに入力して、前記第一の画像より前記被写体の高周波成分を多く含み前記第二の画像よりノイズ量が少ない第三の画像を生成する算出部と、を有することを特徴とする画像処理システム。
  17. 第一の画像を取得する工程と、
    前記第一の画像よりノイズ量が多く、被写体の高周波成分を多く含む第二の画像を取得する工程と、
    前記第一の画像より前記被写体の高周波成分を多く含み、前記第二の画像よりノイズ量が少ない第三の画像を取得する工程と、
    前記第一の画像と前記第二の画像と前記第三の画像を用いた学習によりニューラルネットワークのパラメータを更新する工程と、を有することを特徴とする学習済みモデルの製造方法。
JP2019152000A 2018-09-26 2019-08-22 画像処理方法、画像処理装置、撮像装置、プログラム、記憶媒体、画像処理システム、および、学習済みモデルの製造方法 Active JP7309520B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US16/576,937 US11080832B2 (en) 2018-09-26 2019-09-20 Image processing method, image processing apparatus, imaging apparatus, and storage medium
CN201910898810.6A CN110958382A (zh) 2018-09-26 2019-09-23 图像处理方法、图像处理装置、成像装置和存储介质
EP19199118.1A EP3629284A1 (en) 2018-09-26 2019-09-24 Image processing method, image processing apparatus, imaging apparatus, program, and storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018180646 2018-09-26
JP2018180646 2018-09-26

Publications (3)

Publication Number Publication Date
JP2020057373A true JP2020057373A (ja) 2020-04-09
JP2020057373A5 JP2020057373A5 (ja) 2022-08-17
JP7309520B2 JP7309520B2 (ja) 2023-07-18

Family

ID=70107429

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019152000A Active JP7309520B2 (ja) 2018-09-26 2019-08-22 画像処理方法、画像処理装置、撮像装置、プログラム、記憶媒体、画像処理システム、および、学習済みモデルの製造方法

Country Status (1)

Country Link
JP (1) JP7309520B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111709891A (zh) * 2020-06-12 2020-09-25 北京小米松果电子有限公司 图像去噪模型的训练方法、图像去噪方法、装置及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07160796A (ja) * 1993-12-03 1995-06-23 Victor Co Of Japan Ltd ニューラルネットによる信号処理装置
WO2006137253A1 (ja) * 2005-06-22 2006-12-28 Matsushita Electric Industrial Co., Ltd. 画像生成装置および画像生成方法
WO2014087652A1 (ja) * 2012-12-06 2014-06-12 日本電気株式会社 画像処理装置及び画像処理方法
JP2016527734A (ja) * 2013-06-13 2016-09-08 コアフォトニクス リミテッド デュアルアパーチャズームデジタルカメラ

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07160796A (ja) * 1993-12-03 1995-06-23 Victor Co Of Japan Ltd ニューラルネットによる信号処理装置
WO2006137253A1 (ja) * 2005-06-22 2006-12-28 Matsushita Electric Industrial Co., Ltd. 画像生成装置および画像生成方法
WO2014087652A1 (ja) * 2012-12-06 2014-06-12 日本電気株式会社 画像処理装置及び画像処理方法
JP2016527734A (ja) * 2013-06-13 2016-09-08 コアフォトニクス リミテッド デュアルアパーチャズームデジタルカメラ

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111709891A (zh) * 2020-06-12 2020-09-25 北京小米松果电子有限公司 图像去噪模型的训练方法、图像去噪方法、装置及介质
CN111709891B (zh) * 2020-06-12 2023-11-24 北京小米松果电子有限公司 图像去噪模型的训练方法、图像去噪方法、装置及介质

Also Published As

Publication number Publication date
JP7309520B2 (ja) 2023-07-18

Similar Documents

Publication Publication Date Title
US10354369B2 (en) Image processing method, image processing apparatus, image pickup apparatus, and storage medium
JP7242185B2 (ja) 画像処理方法、画像処理装置、画像処理プログラム、および、記憶媒体
JP7016835B2 (ja) 画像処理方法、画像処理装置、画像処理システム、学習済みウエイトの製造方法、および、プログラム
JP7258604B2 (ja) 画像処理方法、画像処理装置、プログラム、および学習済みモデルの製造方法
JP2020166628A (ja) 画像処理方法、画像処理装置、プログラム、画像処理システム、および、学習済みモデルの製造方法
JP2020036310A (ja) 画像処理方法、画像処理装置、撮像装置、レンズ装置、プログラム、記憶媒体、および、画像処理システム
JP2014006388A (ja) 撮像装置およびその制御方法ならびにプログラム
JP2024024012A (ja) 学習データの生成方法、学習方法、学習データ製造装置、学習装置、およびプログラム
US11308592B2 (en) Image processing method, image processing apparatus, imaging apparatus, and storage medium, that correct a captured image using a neutral network
JP2021140663A (ja) 画像処理方法、画像処理装置、画像処理プログラム、および記憶媒体
JP7309520B2 (ja) 画像処理方法、画像処理装置、撮像装置、プログラム、記憶媒体、画像処理システム、および、学習済みモデルの製造方法
US11080832B2 (en) Image processing method, image processing apparatus, imaging apparatus, and storage medium
JP2022056769A (ja) 画像処理方法、プログラム、画像処理装置、学習済みモデルの製造方法、学習方法、学習装置、および、画像処理システム
JP5543280B2 (ja) 画像処理装置、画像処理方法
JP7146461B2 (ja) 画像処理方法、画像処理装置、撮像装置、プログラム、および、記憶媒体
JP2020030569A (ja) 画像処理方法、画像処理装置、撮像装置、レンズ装置、プログラム、および、記憶媒体
JP7414745B2 (ja) 学習データの製造方法、学習方法、学習データ製造装置、学習装置、およびプログラム
JP2021189929A (ja) 画像処理方法、プログラム、画像処理装置、および、画像処理システム
JP7009219B2 (ja) 画像処理方法、画像処理装置、撮像装置、画像処理プログラム、および、記憶媒体
JP2021114186A (ja) 画像処理装置、画像処理方法、およびプログラム
JP2020061129A (ja) 画像処理方法、画像処理装置、撮像装置、画像処理システム、プログラム、および、記憶媒体
JP7129229B2 (ja) 画像処理方法、画像処理装置、撮像装置、プログラム、および、記憶媒体
JP2019193152A (ja) 撮像装置、撮像方法およびプログラム
WO2022215375A1 (ja) 画像処理方法、機械学習モデルの製造方法、画像処理装置、画像処理システム、及びプログラム
US20240029321A1 (en) Image processing method, image processing apparatus, storage medium, image processing system, method of generating machine learning model, and learning apparatus

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220805

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220805

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230516

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230705

R151 Written notification of patent or utility model registration

Ref document number: 7309520

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151