JP2019028888A - カラー情報拡大器およびカラー情報推定器、ならびに、それらのプログラム - Google Patents

カラー情報拡大器およびカラー情報推定器、ならびに、それらのプログラム Download PDF

Info

Publication number
JP2019028888A
JP2019028888A JP2017150153A JP2017150153A JP2019028888A JP 2019028888 A JP2019028888 A JP 2019028888A JP 2017150153 A JP2017150153 A JP 2017150153A JP 2017150153 A JP2017150153 A JP 2017150153A JP 2019028888 A JP2019028888 A JP 2019028888A
Authority
JP
Japan
Prior art keywords
resolution
color information
image feature
information
monochrome
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017150153A
Other languages
English (en)
Other versions
JP6902425B2 (ja
Inventor
伶 遠藤
Rei Endo
伶 遠藤
吉彦 河合
Yoshihiko Kawai
吉彦 河合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2017150153A priority Critical patent/JP6902425B2/ja
Publication of JP2019028888A publication Critical patent/JP2019028888A/ja
Application granted granted Critical
Publication of JP6902425B2 publication Critical patent/JP6902425B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】高解像度のモノクロ画像から推定されるカラー情報のぼけを低減すること。【解決手段】カラー情報拡大器10は、低解像度カラー情報105または低解像度カラー情報105から抽出した画像特徴量のいずれかである低解像度の画像特徴量から高解像度の画像特徴量を生成するサイズ拡大手段21と、高解像度モノクロ画像101または高解像度モノクロ画像101から抽出した高解像度の画像特徴量と、サイズ拡大手段21により生成された高解像度の画像特徴量とを合成する合成手段22aと、合成手段22aにより合成された高解像度の画像特徴量から、色空間のチャンネルごとに、推定を行うための学習により予め決定されたパラメータ群を用いて画像特徴量を抽出することにより高解像度カラー情報107を推定する高解像度カラー情報推定手段23と、を備える。【選択図】図2

Description

本発明は、モノクロ画像へ付加するカラー情報を拡大するカラー情報拡大器、および、モノクロ画像へ付加するカラー情報を推定するカラー情報推定器、ならびに、それらのプログラムに関する。
近年、モノクロ画像をデジタルデータ化してカラー化する自動色付け技術が複数開発されている。このデジタルデータには、このモノクロ画像をカラー画像にするための画像特徴量となるカラー情報の手がかりがほとんどない。このため、このデジタルデータのカラー化は、フィルムなどの物理媒体に記録されたいわゆるアナログ画像のカラー化と比べて、難易度が高い。例えば、モノクロデータをカラーデータに変換する方法が知られている(特許文献1参照)。この方法は、モノクロデータに記録された特定の物体を仮定し、この特定の物体から色分布モデルを計算する。そして、計算した色分布モデルからカラー情報を推定する。この方法は、この特定の物体をカラー化する対象としているので、予め仮定した対象と、この特定の物体とが異なる場合には、モノクロ画像を自然なカラー画像にすることが難しいという問題がある。
これに対し、近年、いわゆる機械学習技術を用いることにより、白黒画像の中のカラー化対象の選択をより汎用的にしてカラー化するカラー情報の推定方法が提案されている(非特許文献1、非特許文献2参照)。しかしながら、このような機械学習技術を用いたカラー情報の推定方法は、多様な物体が写った膨大な量のカラー画像を用意することを前提としている。そして、このカラー情報の推定方法は、カラー情報推定器を作成するための学習の際に、例えば、ニューラルネットワーク等で構成された学習器に、膨大なカラー画像を入力する。そして、この学習により作成されたカラー情報推定器によれば、モノクロ画像とこのモノクロ画像に対応するカラー情報との対応関係を機械学習技術により学習させ、学習したカラー情報との対応関係に基づいて、入力として与えられる多様なモノクロ画像に対して、従来よりも精度よくカラー情報を推定し、これにより自然なカラー画像を生成できる。
特開2016−146529号公報
Satoshi Iizuka, Edgar Simo-Serra, and Hiroshi Ishikawa., "Let there be Color!: Joint End-to-end Learning of Global and Local Image Priors for Automatic Image Colorization with Simultaneous Classification," ACM Transaction on Graphics (Proc. Of SIGGRAPH), 35(4):110, 2016. Richard Zhang, Phillip Isola, and Alexei A. Efros. "Colorful Image Colorization." In ECCV 2016.
しかしながら、上述した機械学習技術による既存の自動色付け技術では、解像度が縦横256〜512ピクセル程度の低解像度画像を主な対象としており、4K画像や8K画像のような高解像度なモノクロ画像への自然な色付けを可能にする技術は存在しなかった。
上述したような従来の複数の技術は、高解像のモノクロ画像に対して、カラー画像化の元となるモノクロ画像を低解像度に圧縮してから低解像度なカラー情報を推定し、入力画像のサイズにまで拡大する。また、これらの技術は、その後、この拡大されたカラー情報を元のモノクロ画像と合成し、合成したカラー画像を、入力した高解像度のモノクロ画像に対応させる。しかしながら、この従来の方法は、推定したカラー画像にぼけなどが発生するという問題があった。特に、拡大率が大きくなればカラー情報にも大きなぼけが生じるという問題があった。
本発明は、以上のような問題点に鑑みてなされたものであり、高解像度のモノクロ画像から推定されるカラー情報に生じるぼけを低減できるカラー情報拡大器およびカラー情報推定器、ならびに、それらのプログラムを提供することを目的とする。
前記課題を解決するため、本発明の第1の態様に係るカラー情報拡大器は、第1解像度のモノクロ画像の画像特徴量であるモノクロ情報と、前記第1解像度のモノクロ情報から推定された前記第1解像度よりも低い第2解像度の画像特徴量であるカラー情報と、を入力されて、所定の演算処理により前記カラー情報の画像サイズを拡大して高解像度カラー情報として出力するカラー情報拡大器であって、サイズ拡大手段と、合成手段と、高解像度カラー情報推定手段と、を備えることとした。
かかる構成によれば、カラー情報拡大器は、サイズ拡大手段によって、前記第2解像度のカラー情報または当該第2解像度のカラー情報から抽出した画像特徴量のいずれか一方である低解像度の画像特徴量から高解像度の画像特徴量を生成する。
そして、カラー情報拡大器は、合成手段によって、前記第1解像度のモノクロ情報または当該第1解像度のモノクロ情報から抽出した高解像度の画像特徴量と、前記サイズ拡大手段により生成された高解像度の画像特徴量とを合成する。
そして、カラー情報拡大器は、高解像度カラー情報推定手段によって、前記合成手段により合成された高解像度の画像特徴量から、色空間のチャンネルごとに、推定を行うための学習により予め決定されたパラメータ群を用いて画像特徴量を抽出することにより前記高解像度カラー情報を推定する。
また、本発明の第2の態様に係るカラー情報拡大器は、第1解像度のモノクロ画像の画像特徴量であるモノクロ情報と、前記第1解像度のモノクロ情報から推定された前記第1解像度よりも低い第2解像度の画像特徴量であるカラー情報と、を入力されて、所定の演算処理により前記カラー情報の画像サイズを拡大して高解像度カラー情報として出力するカラー情報拡大器であって、特徴抽出手段と、合成手段と、サイズ拡大手段と、高解像度カラー情報推定手段と、を備えることとした。
かかる構成によれば、カラー情報拡大器は、特徴抽出手段によって、前記第1解像度のモノクロ情報から、推定を行うための学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出する。
そして、カラー情報拡大器は、合成手段によって、前記第2解像度のカラー情報または当該第2解像度のカラー情報から抽出した低解像度の画像特徴量と、前記特徴抽出手段により抽出された低解像度の画像特徴量と、を合成する。
そして、カラー情報拡大器は、サイズ拡大手段によって、前記合成手段により合成された低解像度の画像特徴量から高解像度の画像特徴量を生成する。
そして、カラー情報拡大器は、高解像度カラー情報推定手段によって、前記サイズ拡大手段により生成された高解像度の画像特徴量から、色空間のチャンネルごとに、推定を行うための学習により予め決定されたパラメータ群を用いて画像特徴量を抽出することにより前記高解像度カラー情報を推定する。
また、前記課題を解決するため、本発明の第1の態様に係るカラー情報推定器は、前記カラー情報拡大器と、前記第1解像度のモノクロ情報を縮小する処理を行って前記第2解像度のモノクロ情報を生成する縮小器と、前記縮小器により生成された前記第2解像度のモノクロ情報から、推定を行うための学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出することにより前記第2解像度のカラー情報を推定する低解像度カラー情報推定器と、を備え、前記カラー情報拡大器が、前記低解像度カラー情報推定器で推定された前記第2解像度のカラー情報と、前記縮小器をバイパスして入力される前記第1解像度のモノクロ情報と、を用いて、前記高解像度カラー情報を推定する処理を行うこととした。
かかる構成によれば、本発明の第1の態様に係るカラー情報推定器は、第1解像度のモノクロ画像から縮小器と低解像度カラー情報推定器とを経て推定された第2解像度のカラー情報と、第1解像度のモノクロ画像とを、カラー情報拡大器の入力として与えることができる。
また、前記課題を解決するため、本発明の第2の態様に係るカラー情報推定器は、前記カラー情報拡大器と、前記第1解像度のモノクロ情報から、推定を行うための学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出することにより前記第2解像度のカラー情報を推定する低解像度カラー情報推定器と、を備え、前記カラー情報拡大器が、前記低解像度カラー情報推定器で推定された前記第2解像度のカラー情報と、前記低解像度カラー情報推定器をバイパスして入力される前記第1解像度のモノクロ情報と、を用いて、前記高解像度カラー情報を推定する処理を行うこととした。
かかる構成によれば、本発明の第2の態様に係るカラー情報推定器は、第1解像度のモノクロ画像から低解像度カラー情報推定器によって推定された第2解像度のカラー情報と、第1解像度のモノクロ画像とを、カラー情報拡大器の入力として与えることができる。
また、本発明は、コンピュータを、前記カラー情報拡大器として機能させるためのカラー情報拡大プログラムで実現することもできる。
また、本発明は、コンピュータを、前記カラー情報推定器として機能させるためのカラー情報推定プログラムで実現することもできる。
本発明は、以下に示す優れた効果を奏するものである。
本発明に係るカラー情報拡大器によれば、高解像度のモノクロ画像から推定した低解像度のカラー情報を拡大する推定処理に際して、拡大されるカラー情報のぼけを低減できる。
また、本発明に係るカラー情報推定器によれば、入力される高解像度のモノクロ画像から推定するカラー情報のぼけを低減できる。
本発明の第1実施形態に係るカラー情報推定器を含む自動色付け装置の構成を模式的に示すブロック図である。 本発明の第1実施形態に係るカラー情報拡大器の構成を模式的に示すブロック図である。 従来の低解像度カラー情報推定器の学習の流れを模式的に示すブロック図である。 本発明の第1実施形態に係るカラー情報拡大器の学習の流れを模式的に示すブロック図である。 本発明の第2実施形態に係るカラー情報拡大器の構成を模式的に示すブロック図である。 本発明の第3実施形態に係るカラー情報拡大器の構成を模式的に示すブロック図である。 本発明の第4実施形態に係るカラー情報拡大器の構成を模式的に示すブロック図である。 本発明の第2実施形態に係るカラー情報推定器の構成を模式的に示すブロック図である。 本発明の第3実施形態に係るカラー情報推定器の構成を模式的に示すブロック図である。 実験に用いたカラー情報拡大器を模式的に示す説明図である。
以下、本発明の実施形態に係るカラー情報拡大器およびカラー情報推定器について、図面を参照しながら説明する。
[自動色付け装置]
図1は、本発明の第1実施形態に係るカラー情報推定器を含む自動色付け装置の構成を模式的に示すブロック図である。
自動色付け装置1は、モノクロ画像からカラー情報を推定することにより、モノクロ画像へ自動的に色付けするものであり、図1に示すように、主として、カラー情報推定器3と、情報合成器9と、を備えている。
この自動色付け装置1は、例えば一般的なコンピュータで構成され、GPU(Graphics Processing Units)等の演算装置と、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)や一般的な画像メモリと、入出力インタフェースと、を備えている。
カラー情報推定器3は、入力される高解像度モノクロ画像101から、低解像度モノクロ画像103および低解像度カラー情報105を生成して、これらの情報を用いて高解像度カラー情報107を推定するものである。
高解像度モノクロ画像101は、第1解像度のモノクロ画像である。この高解像度モノクロ画像101は、例えば、過去の白黒フィルムや写真からスキャンによりデジタル化したモノクロ画像である。
低解像度モノクロ画像103は、前記第1解像度よりも低い第2解像度のモノクロ画像である。
低解像度カラー情報105は、前記第2解像度のカラー情報である。
高解像度カラー情報107は、前記第1解像度のカラー情報である。
ここで、モノクロ画像とは、具体的には色空間における輝度チャンネル(HSV色空間におけるVチャンネルや、Lab色空間におけるLチャンネルなど)のみから成る画像である。なお、画素の情報が輝度である場合、画素値(輝度値)は、8ビットの情報で表すとき、0〜255の値を有する。モノクロ画像の画像特徴量であるモノクロ情報は、例えば輝度分布で表される。本明細書では、このモノクロ情報をモノクロ画像と同じ意味で用いている。
また、カラー情報とは、例えば、輝度チャンネル以外の2チャンネルについての画像特徴量とすることができる。ここで、画像特徴量とは、例えば、輝度、色度、彩度等の色空間を表す量である。また、画像特徴量は、例えば、色空間を表す量から抽出された平均値、分散、畳み込み積分値等であってもよい。また、画素ごとの画像特徴量の集合は、例えばモノクロ画像(モノクロ情報)やカラー情報である。また、画像特徴量は、高さ方向および幅方向(縦横)に要素が並べられた行列で取り扱ってもよいし、1次元の多変数ベクトルで取り扱ってもよい。
第1解像度の値(高解像度の値)は、第2解像度の値(低解像度の値)に比較して大きければ特に限定されない。例えば、第2解像度の画像の大きさを256×256ピクセル、第1解像度の画像の大きさを512×512ピクセルとしてもよい。また、例えば、第2解像度の画像の大きさを480×270ピクセル、第1解像度の画像の大きさを4K(3840×2160)としてもよい。さらには、第1解像度の画像の大きさを8K(7680×4320)としても構わない。
(カラー情報推定器の第1実施形態)
第1実施形態のカラー情報推定器3は、図1に示すように、縮小器5と、低解像度カラー情報推定器7と、カラー情報拡大器10と、を備えている。
カラー情報拡大器10は、低解像度カラー情報105または低解像度カラー情報105から抽出した画像特徴量のいずれかである低解像度の画像特徴量から高解像度の画像特徴量を生成し、高解像度モノクロ画像101または高解像度モノクロ画像101から抽出した高解像度の画像特徴量と、サイズ拡大手段2により生成された高解像度の画像特徴量とを合成し、合成された高解像度の画像特徴量から、色空間のチャンネルごとに、推定を行うための学習により予め決定されたパラメータ群を用いて画像特徴量を抽出する。
これにより、高解像度カラー情報107を推定する。
縮小器5は、入力される高解像度モノクロ画像101を縮小する処理を行って低解像度モノクロ画像103を生成するものである。ここで、縮小とは解像度を低減、つまり画素数を減少させることをいう。縮小における縮小率が例えば0.5である場合、縮小画像の水平方向、垂直方向の画素数は、原画像の水平方向、垂直方向の画素数のそれぞれ1/2となる。縮小器5は、生成した低解像度モノクロ画像103を低解像度カラー情報推定器7に出力する。
低解像度カラー情報推定器7は、推定を行うための学習により予め決定されたパラメータ群を用いて、縮小器5により生成された低解像度モノクロ画像103から、低解像度のカラー情報(画像特徴量)を抽出する。これにより、低解像度カラー情報推定器7は、低解像度カラー情報105を推定する。なお、低解像度カラー情報推定器7を作成するための学習の流れは、従来技術と同様であるが、簡単な説明を後記する。また、カラー情報の推定手法には、例えば非特許文献1に記載された従来公知の手法を用いることができる。この低解像度カラー情報推定器7は、従来公知のカラー情報推定器と同様に、輝度チャンネルを入力とし、2チャンネルの推定カラー情報を出力する。そして、低解像度カラー情報推定器7は、推定した低解像度カラー情報105をカラー情報拡大器10に出力する。
カラー情報拡大器10は、低解像度カラー情報推定器7により推定された低解像度カラー情報105と、縮小器5をバイパスして入力される高解像度モノクロ画像101と、を入力として、画像サイズが拡大されたカラー情報(高解像度カラー情報107)を推定する処理を行うものである。カラー情報拡大器10は、低解像度カラー情報105を拡大する際に、高解像度モノクロ画像101(モノクロ情報)を用いて拡大する。そして、カラー情報拡大器10は、推定した高解像度カラー情報107を情報合成器9に出力する。
情報合成器9は、カラー情報推定器3で推定された高解像度カラー情報107と、高解像度モノクロ画像101とを合成し、高解像度カラー画像109を作成する。情報合成器9は、1チャンネル(以下、1chと表記する場合もある)のモノクロ情報と、2チャンネル(2ch)のカラー情報とを単純に合成してカラー画像を生成する。
(カラー情報拡大器の詳細)
図2は、本発明の第1実施形態に係るカラー情報拡大器の構成を模式的に示すブロック図である。カラー情報拡大器10は、図2に示すように、サイズ拡大手段21と、合成手段22aと、高解像度カラー情報推定手段23と、を備えている。なお、図2のカラー情報拡大器10は、特徴抽出手段31,32,33を備える形態で図示したが、例えば、すべての特徴抽出手段を省略した構成とすることもできる。なお、以下では、特徴抽出手段について、便宜的に第1の特徴抽出手段31、第2の特徴抽出手段32、および第3の特徴抽出手段33のように呼称する場合もある。
カラー情報拡大器10は、例えばニューラルネットワークにより構成できる。また、ニューラルネットワークは、例えばCNN(Convolutional Neural Network)であってもよい。CNNでは、隠れ層(hidden layer)に、Convolution層(畳み込み層)や、Deconvolution層(逆畳み込み層、または、Transposed Convolution 層)を用いる。よって、CNNを採用した場合、カラー情報拡大器10は、各構成要素を、Convolution層またはDeconvolution層を用いて実装可能であり、GPUを用いて高速に計算できる。
サイズ拡大手段21は、入力される低解像度の画像特徴量を拡大する処理を行って高解像度の画像特徴量を生成するものである。ここで、低解像度の画像特徴量とは、例えば、低解像度カラー情報105のことをいう。なお、図2に示すように、カラー情報拡大器10が第2の特徴抽出手段32を備える場合には、第2の特徴抽出手段32が低解像度カラー情報105から抽出した画像特徴量が低解像度の画像特徴量となる。サイズ拡大手段21は、生成した高解像度の画像特徴量を合成手段22aに出力する。
サイズ拡大手段21には、例えば、Deconvolution層(ニューラルネットワークを用いた画像拡大層)を用いてもよい。また、一般的な画像拡大アルゴリズムで用いられるパラメータを固定的に用いてもよい。なお、一般的な画像拡大アルゴリズムとしては、例えば、最近傍補間法やBilinear補間法などを用いてもよい。
合成手段22aは、例えば、入力される高解像度モノクロ画像101と、サイズ拡大手段21によって生成された高解像度の画像特徴量とを合成するものである。なお、図2に示すように、カラー情報拡大器10が第1の特徴抽出手段31を備える場合には、合成手段22aは、高解像度モノクロ画像101から抽出された画像特徴量と、サイズ拡大手段21によって生成された高解像度の画像特徴量とを合成する。合成手段22aは、合成した高解像度の画像特徴量を高解像度カラー情報推定手段23に出力する。
合成手段22aは、1chのモノクロ情報と、このモノクロ情報と同じ大きさの2chのカラー情報とを単純に合成し、高解像度の画像特徴量を生成する。合成手段22aには、例えば、ニューラルネットワークのConvolution層を用いてもよい。
高解像度カラー情報推定手段23は、合成手段22aにより合成された高解像度の画像特徴量から、高解像度カラー情報を推定するための学習により、予め決定されたパラメータ群を用いて画像特徴量を抽出し、高解像度カラー情報107を推定するものである。
ここで、学習とは、カラー情報拡大器10を作成するための学習をいう。具体的には、高解像度カラー情報推定手段23を含むカラー情報拡大器10を作成するための学習により高解像度カラー情報推定手段23等の内部パラメータ(パラメータ群)を適切に設定することにより、精度の良い推定器として、高解像度カラー情報推定手段23を作成できる。なお、カラー情報拡大器10を作成するための学習の流れについては後記する。
高解像度カラー情報107は、低解像度カラー情報105が拡大されたカラー情報に相当し、高解像度モノクロ画像101に対応した解像度を有する。この高解像度カラー情報107とは、色空間のチャンネルごとのカラー情報であって、例えば、輝度チャンネル以外の2チャンネルについての画像特徴量をいう。
高解像度カラー情報推定手段23は、その前段からの複数(3以上)の出力(Output)に対応した複数(3以上)のアウトプットチャンネルについての画像特徴量を、色空間における2チャンネルについての画像特徴量に変換し、カラー情報を推定する。
高解像度カラー情報推定手段23には、例えば、ニューラルネットワークのConvolution層を用いてもよい。また、Convolution層(隠れ層)が複数あってもよい。つまり、Convolutionを連続的に繰り返し行ってもよい。
高解像度カラー情報推定手段23の前段からのアウトプットチャンネル数は所望の値に設定できる。例えば合成手段22aからのアウトプットチャンネル数は3chやそれ以上であってもよい。
カラー情報拡大器10は、図2に示すように、第1の特徴抽出手段31、第2の特徴抽出手段32、および第3の特徴抽出手段33のうちの少なくとも1つの特徴抽出手段を備えてもよい。
第1の特徴抽出手段31は、高解像度モノクロ画像101から、学習により予め決定されたパラメータ群を用いて高解像度の画像特徴量を抽出し、抽出した高解像度の画像特徴量を合成手段22aに出力するものである。なお、学習とは、カラー情報拡大器10を作成するための学習をいう。第1の特徴抽出手段31は、第1の特徴抽出手段31に入力される1chのモノクロ情報を、第1の特徴抽出手段31のアウトプットチャンネルごとに高解像度の画像特徴量にそれぞれ変換する。
第2の特徴抽出手段32は、低解像度カラー情報105から、学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出し、抽出した低解像度の画像特徴量をサイズ拡大手段21に出力するものである。第2の特徴抽出手段32は、第2の特徴抽出手段32に入力される2chのカラー情報を、第2の特徴抽出手段32のアウトプットチャンネルごとに低解像度の画像特徴量にそれぞれ変換する。
第3の特徴抽出手段33は、合成手段22aで生成された高解像度の画像特徴量から、学習により予め決定されたパラメータ群を用いて高解像度の画像特徴量を抽出し、抽出した高解像度の画像特徴量を高解像度カラー情報推定手段23に出力するものである。第3の特徴抽出手段33は、合成手段22aからの複数の出力に対応した複数のアウトプットチャンネル(例えば3ch)についての画像特徴量を、第3の特徴抽出手段33のアウトプットチャンネルごとに高解像度の画像特徴量にそれぞれ変換する。なお、第3の特徴抽出手段33のアウトプットチャンネル数は、例えば64ch、128ch、256ch等に設定される。
各特徴抽出手段31〜33には、例えば、ニューラルネットワークのConvolution層を用いてもよい。また、Convolution層(隠れ層)が複数あってもよい。各特徴抽出手段からのアウトプットチャンネル数は所望の値に設定できる。なお、本明細書では、特徴抽出手段等に入力した画像特徴量をアウトプットチャンネルごとにコンボリューションにかけて得られた画像特徴量のことを、入力から得た特徴という。また、本明細書では、特徴抽出手段等への複数チャンネルからなる入力情報をコンボリューションにかけて、入力した画像特徴量を変換することを、特徴を抽出するという。
図2では、高解像度カラー情報推定手段23とは別に第3の特徴抽出手段33を図示したが、高解像度カラー情報推定手段23が内部に第3の特徴抽出手段33を備えることとしてもよい。第3の特徴抽出手段33は、高解像度カラー情報推定手段23が色空間のチャンネルごとの画像特徴量を抽出する前に、色空間の2チャンネルについての画像特徴量を出力するためのパラメータ群とは異なるパラメータ群を用いて、サイズ拡大手段21および合成手段22aの処理により生成された高解像度の画像特徴量から、複数チャンネル(例えば64ch)について高解像度の画像特徴量をそれぞれ生成する。
(低解像度カラー情報推定器の学習の流れ)
次に、低解像度カラー情報推定器7の学習の流れについて図3を参照して説明する。低解像度カラー情報推定器7の学習の流れは、従来のカラー情報推定器の学習の流れと同様なので簡単に説明する。
低解像度カラー情報推定器7は、以下の手順により、予め用意した学習器から生成する。この学習器は、モノクロ画像を入力し、所定の計算処理を行うことによりカラー情報を推定して出力する。この学習器(図3では、学習が終わった状態の低解像度カラー情報推定器7として表記している)は、内部パラメータ(パラメータ群)を備え、このパラメータを変更することにより、学習器からの出力を調整する。そして、大量の学習用のカラー画像を用意し、以下のステップS1〜ステップS4を十分な回数繰り返す。この学習器がこのパラメータを学習し、適切にパラメータを設定することにより精度の良いカラー情報推定器を作成できる。
(ステップS1)
学習用のカラー画像として低解像度カラー画像202を用意し、それを低解像度モノクロ画像203と真のカラー情報204とに分離する。
ここで、低解像度モノクロ画像203は、低解像度の学習用モノクロ画像である。
また、真のカラー情報204は、低解像度の学習用モノクロ画像と同じサイズの正解カラー情報であって、推定されるカラー情報との誤差計算に用いる。
(ステップS2)
次に、学習器(低解像度カラー情報推定器7)は、低解像度モノクロ画像203を入力し、現在のパラメータを用いた推定結果のカラー情報として、低解像度カラー情報205を出力する。
(ステップS3)
次に、誤差計算器40は、低解像度カラー情報205(推定カラー情報)と真のカラー情報204との誤差を計算する。この誤差としては、各画素値の平均二乗誤差などが用いられる。
(ステップS4)
また、誤差計算器40は、計算して得られた誤差から、SGDなどの誤差勾配に基づく最適化手法を用いて、誤差が小さくなるように、学習器(低解像度カラー情報推定器7)のパラメータを調整し、調整されたパラメータを学習器に出力する。なお、SGDについては、次の参考文献に記載されているので説明を省略する。
(参考文献)L. Bottou., ”Stochastic Gradient Descent Tricks.,”Neural Networks: Tricks of the Trade: Springer, 2012.
上記学習により適切に設定されるパラメータとは、図1に示す低解像度カラー情報推定器7が、低解像度モノクロ画像103から画像特徴量を抽出し、低解像度カラー情報105を推定する際に用いるパラメータ群のことをいう。つまり、低解像度カラー情報105を推定する際に用いるパラメータ群は、学習器に入力される低解像度の学習用モノクロ画像から所定演算により推定される低解像度のカラー情報と、学習用モノクロ画像と同じサイズの正解カラー情報と、の対応付けを学習することにより決定する。
(カラー情報拡大器の学習の流れ)
次に、カラー情報拡大器10の学習の流れについて図4を参照して説明する。
カラー情報拡大器10は、以下の手順により、予め用意した学習器から生成する。この学習器は、高解像度モノクロ画像301および低解像度カラー情報305を入力し、所定の計算処理を行うことにより高解像度カラー情報307を推定して出力する。この学習器(図4では、学習が終わった状態のカラー情報拡大器10として表記している)は、内部パラメータ(パラメータ群)を備え、このパラメータを変更することにより、学習器からの出力を調整する。そして、大量の学習用のカラー画像を用意し、以下のステップS10〜ステップS14を十分な回数繰り返す。この学習器がこのパラメータを学習し、適切にパラメータを設定することにより精度の良いカラー情報拡大器を作成できる。
(ステップS10)
学習用のカラー画像として高解像度カラー画像309を用意し、それを縮小器5によって単純に縮小して低解像度カラー情報305とする。
ここで、高解像度カラー画像309としては、古い白黒フィルムをカラー化したものも使用する。この場合、例えば、過去の白黒フィルムや写真からスキャンによりデジタル化したモノクロ画像に対して、人手で色付けしたデジタルデータとする。また、学習用の高解像度カラー画像309を大量に準備するために、古い白黒フィルム以外に、カラー撮影された新しい4K等のカラー画像を用いてもよい。
(ステップS11)
次に、高解像度カラー画像309を、高解像度モノクロ画像301と高解像度カラー情報(真のカラー情報)304とに分離する。
ここで、高解像度モノクロ画像301は、高解像度の学習用モノクロ画像である。
また、高解像度カラー情報304は、高解像度の学習用モノクロ画像と同じサイズの正解カラー情報であって、推定される高解像度カラー情報との誤差計算に用いる。
(ステップS12)
次に、学習器(カラー情報拡大器10)は、高解像度モノクロ画像301を入力し、現在のパラメータを用いた推定結果のカラー情報として、高解像度カラー情報307を出力する。
(ステップS13)
次に、誤差計算器40は、高解像度カラー情報307(推定カラー情報)と高解像度カラー情報(真のカラー情報)304との誤差を計算する。この誤差としては、前記した手法と同様の各画素値の平均二乗誤差や交差エントロピーなどを用いる。
(ステップS14)
また、誤差計算器40は、計算して得られた誤差から、SGDなどの誤差勾配に基づく最適化手法を用いて、誤差が小さくなるように、学習器(カラー情報拡大器10)のパラメータを調整し、調整されたパラメータを学習器に出力する。なお、誤差計算器40は、学習のときに付加されるが、学習後には接続を解除する。
上記学習により適切に設定されるパラメータは、図2に示すカラー情報拡大器10が高解像度カラー情報107を推定する際に用いるパラメータ群のことをいう。例えば、高解像度カラー情報推定手段23が、合成手段22aで生成された高解像度の画像特徴量から、色空間のチャンネルごとの画像特徴量を抽出する際にも用いる。
なお、合成手段22aで生成された高解像度の画像特徴量には、高解像度モノクロ画像101の情報(モノクロ情報)と低解像度カラー情報105とに起因した情報を含む。
つまり、高解像度カラー情報107を推定する際に用いるパラメータ群は、学習器にそれぞれ入力される低解像度の学習用カラー情報および高解像度の学習用モノクロ画像から所定演算により推定される拡大された高解像度のカラー情報と、学習用モノクロ画像と同じサイズの正解カラー情報と、の対応付けを学習することにより決定される。
なお、カラー情報拡大器を学習により作るとき、例えば図2の構成のカラー情報拡大器10を作製したいのならば、図2と同じ構成のカラー情報拡大器10を学習に用いる。また、カラー情報拡大器を学習により作るとき、少なくとも1つの特徴抽出手段を省略したカラー情報拡大器を作製したいのならば、特徴抽出手段を省略したカラー情報拡大器を学習に用いればよい。
本実施形態に係るカラー情報拡大器10によれば、高解像度モノクロ画像101(モノクロ情報)を明示的に用いているので、推定されるカラー情報のぼけを低減し、低解像度カラー情報105を精度よく拡大できる。このカラー情報拡大器10は、例えば4Kまたは8K等の高解像度モノクロ画像101への自動色付けをする際に用いるカラー情報を推定するカラー情報推定器3に組み込むことができる。また、本実施形態に係るカラー情報推定器3は、高解像度モノクロ画像101への自動色付けをする際に用いるカラー情報を推定する精度を向上させることができる。
また、高解像度のモノクロ画像のデジタルデータは、例えば物理的フィルムからスキャンすることにより得られるが、従来の色付け技術では、このような高解像度のモノクロ画像に直接色づけすることはできなかった。これに対して、カラー情報推定器3を備える自動色付け装置1は、4K等の高解像度のモノクロ画像に対する自然な色付けを可能とすることができる。
また、例えば、写真や物理的フィルムからスキャンしたモノクロ画像のデータは存在するが、写真や物理的フィルムが消失してデータしか残っていない状況においても、カラー情報推定器3を備える自動色付け装置1は、当時の色情報を推定して、モノクロ画像に色付けすることができる。
さらに、例えば、低解像度カラー情報105が由来するところのカラー撮影された画像では、モノクロ情報チャンネル(色空間における輝度チャンネル)上で境界がはっきりしている領域は、カラー情報チャンネル(例えば、輝度チャンネル以外の2チャンネル)上でも境界がはっきりしているケースが多い。ここで、境界とは、例えばオブジェクトの輪郭線(オブジェクトとその背景との境目)等の線で表される部分である。
そのため、カラー情報拡大器10のように、高解像度モノクロ画像101を用いて、低解像度カラー情報105を拡大すると、特に、高解像度モノクロ情報チャンネル(高解像度モノクロ画像101)上で境界がはっきりしている領域におけるカラー情報のぼけが低減される効果を奏する。
(カラー情報拡大器の第2実施形態)
次に、カラー情報拡大器の第2実施形態について図5を参照(適宜図2参照)して説明する。図5に示すカラー情報拡大器10Aは、サイズ拡大手段21の前段に合成手段22bを備えている点が、図2に示すカラー情報拡大器10と相違している。なお、カラー情報拡大器10Aにおいて、図2に示すカラー情報拡大器10と同じ構成には同じ符号を付して説明を省略する。
カラー情報拡大器10Aは、特徴抽出手段34と、合成手段22bと、サイズ拡大手段21と、高解像度カラー情報推定手段23と、を備えている。なお、図5のカラー情報拡大器10Aは、特徴抽出手段35,36を備える形態で図示したが、例えば、特徴抽出手段35,36を省略した構成とすることもできる。以下では、便宜的に、特徴抽出手段について、第2の特徴抽出手段35および第3の特徴抽出手段36のように呼称する場合もある。このカラー情報拡大器10Aは、例えばニューラルネットワークで構成できる。
特徴抽出手段34は、推定を行うための学習により予め決定されたパラメータ群を用いて、高解像度モノクロ画像101から低解像度の画像特徴量を抽出し、抽出した低解像度の画像特徴量を合成手段22bに出力するものである。
合成手段22bは、例えば、低解像度カラー情報105と、特徴抽出手段34により抽出された低解像度の画像特徴量と、を合成し、低解像度の画像特徴量を生成するものである。なお、図5に示すように、カラー情報拡大器10Aが第2の特徴抽出手段35を備える場合には、合成手段22bは、低解像度カラー情報105から抽出された低解像度の画像特徴量と、特徴抽出手段34により抽出された低解像度の画像特徴量とを合成する。合成手段22bは、合成した低解像度の画像特徴量をサイズ拡大手段21に出力する。
合成手段22bは、2chの低解像度のカラー情報と、この低解像度のカラー情報と同じ大きさの1chのモノクロ情報と、を単純に合成し、低解像度の画像特徴量を生成する。合成手段22bには、例えば、ニューラルネットワークのConvolution層を用いてもよい。
本実施形態では、サイズ拡大手段21は、当該サイズ拡大手段21により生成した高解像度の画像特徴量を、例えば高解像度カラー情報推定手段23に出力する。
本実施形態では、高解像度カラー情報推定手段23は、サイズ拡大手段21で生成された高解像度の画像特徴量から高解像度カラー情報107を推定する。
カラー情報拡大器10Aは、図5に示すように、特徴抽出手段34以外に、第2の特徴抽出手段35と、第3の特徴抽出手段36と、のうちの少なくとも1つの特徴抽出手段をさらに備えてもよい。
第2の特徴抽出手段35は、低解像度カラー情報105から、学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出し、抽出した低解像度の画像特徴量を合成手段22bに出力するものである。なお、この第2の特徴抽出手段35は、抽出された低解像度の画像特徴量の出力先以外は、図2に示す第2の特徴抽出手段32と同じである。
第3の特徴抽出手段36は、サイズ拡大手段21により生成された高解像度の画像特徴量から、学習により予め決定されたパラメータ群を用いて高解像度の画像特徴量を抽出し、抽出した高解像度の画像特徴量を高解像度カラー情報推定手段23に出力するものである。なお、この第3の特徴抽出手段36は、高解像度の画像特徴量を受け取るための入力先以外は、図2に示す第3の特徴抽出手段33と同じである。
図5では、高解像度カラー情報推定手段23とは別に第3の特徴抽出手段36を図示したが、高解像度カラー情報推定手段23が内部に第3の特徴抽出手段36を備えることとしてもよい。例えば、各特徴抽出手段34〜36には、ニューラルネットワークのConvolution層を用いるようにしてもよい。
カラー情報拡大器10Aの学習の流れは、カラー情報拡大器10の学習の流れと同様なので説明を省略する。なお、カラー情報拡大器を学習により作るとき、図5の構成のカラー情報拡大器10Aを作製したいのならば、図5の構成のカラー情報拡大器10Aを学習に用いればよい。また、カラー情報拡大器を学習により作るとき、少なくとも1つの特徴抽出手段を省略したカラー情報拡大器を作製したいのならば、特徴抽出手段を省略したカラー情報拡大器を学習に用いればよい。
第2実施形態に係るカラー情報拡大器10Aによれば、第1実施形態に係るカラー情報拡大器10と同様に、高解像度モノクロ画像101(モノクロ情報)を明示的に用いているので、推定されるカラー情報のぼけを低減し、低解像度カラー情報105を精度よく拡大できる。
(カラー情報拡大器の第3実施形態)
次に、カラー情報拡大器の第3実施形態について図6を参照(適宜図2および図5参照)して説明する。なお、カラー情報拡大器10Bにおいて、カラー情報拡大器10,10Aと同じ構成には同じ符号を付して説明を省略する。
カラー情報拡大器10Bは、特徴抽出手段34と、合成手段22bと、サイズ拡大手段21と、合成手段22aと、高解像度カラー情報推定手段23と、を備えている。なお、図6のカラー情報拡大器10Bは、第1の特徴抽出手段31と、第2の特徴抽出手段35と、第3の特徴抽出手段33と、を備える形態で図示したが、例えば、特徴抽出手段31,35,33を省略した構成とすることもできる。このカラー情報拡大器10Bは、例えばニューラルネットワークで構成できる。
図6に示すカラー情報拡大器10Bは、カラー情報拡大器10,10Aを混合して、サイズ拡大手段21の前後に合成手段22b,22aを備えるようにしたものなので、これ以上の説明については省略する。なお、カラー情報拡大器10Bの学習の流れも、カラー情報拡大器10の学習の流れと同様なので説明を省略する。
第3実施形態に係るカラー情報拡大器10Bによれば、第1実施形態に係るカラー情報拡大器10と同様に、高解像度モノクロ画像101(モノクロ情報)を明示的に用いているので、推定されるカラー情報のぼけを低減し、低解像度カラー情報105を精度よく拡大できる。
(カラー情報拡大器の第4実施形態)
次に、カラー情報拡大器の第4実施形態について図7を参照(適宜図1および図2参照)して説明する。なお、カラー情報拡大器10Cにおいて、カラー情報拡大器10と同じ構成には同じ符号を付して説明を省略する。
ここでは、第1解像度の画像の大きさをN(=3840×2160ピクセル)とすると共に、第2解像度の画像の大きさをN/8(=480×270ピクセル)として説明する。つまり、カラー情報拡大器10Cに入力する高解像度モノクロ画像101は、解像度=Nのモノクロ画像であるものとする。また、カラー情報拡大器10Cに入力する低解像度カラー情報105は、解像度=N/8のカラー情報であるものとする。
カラー情報拡大器10Cは、カラー情報拡大器10を再帰的に連結する構造を用いた再帰的カラー情報拡大器である。ここでは、カラー情報拡大器10は、拡大率が2であるものとし、3つのカラー情報拡大器10を再帰的に連結する。
カラー情報拡大器10Cは、サイズ縮小手段50を備えている。
サイズ縮小手段50は、高解像度モノクロ画像101を、所定の縮小率で縮小する処理を再帰的に行うことにより第1解像度よりも小さく第2解像度よりも大きな解像度を持った複数レベルの解像度のモノクロ画像を生成する。
サイズ縮小手段50は、高解像度モノクロ画像101(解像度=Nのモノクロ画像)を縮小してモノクロ画像111を生成する。このモノクロ画像111は、解像度=N/2のモノクロ画像である。
さらに、サイズ縮小手段50は、モノクロ画像111(解像度=N/2のモノクロ画像)を縮小してモノクロ画像121を生成する。このモノクロ画像121は、解像度=N/4のモノクロ画像である。また、モノクロ画像121は、この場合にサイズ縮小手段50で生成される最小レベルの解像度のモノクロ画像である。
カラー情報拡大器10Cに入力される低解像度カラー情報105と、サイズ縮小手段50で生成される最小レベルの解像度のモノクロ画像121と、を入力とするカラー情報拡大器10は、最終的に、色空間のチャンネルごとの推定カラー情報として、低解像度カラー情報105が拡大されたカラー情報127を出力する。ここでは、カラー情報拡大器10は拡大率が2であるので、このカラー情報127は、解像度=N/4のカラー情報となる。
このカラー情報127と、サイズ縮小手段50で生成されたモノクロ画像111と、を入力とするカラー情報拡大器10は、最終的に、色空間のチャンネルごとの推定カラー情報として、カラー情報127が拡大されたカラー情報117を出力する。ここでは、カラー情報拡大器10は拡大率が2であるので、このカラー情報117は、解像度=N/2のカラー情報となる。
このカラー情報117と、カラー情報拡大器10Cに入力される高解像度モノクロ画像101と、を入力とするカラー情報拡大器10は、最終的に、色空間のチャンネルごとの推定カラー情報として、カラー情報117が拡大された高解像度カラー情報107を出力する。ここでは、カラー情報拡大器10は拡大率が2であるので、この高解像度カラー情報107は、解像度=Nのカラー情報となる。こうして、カラー情報拡大器10Cに入力される低解像度カラー情報105は、23倍(=8倍)に拡大されて、高解像度カラー情報107として出力されることになる。
前記したように、カラー情報拡大器10Cは、低解像度カラー情報105と、生成される最小レベルの解像度のモノクロ画像121とを初期値として、推定されたカラー情報および当該カラー情報よりも大きな解像度を持ったモノクロ画像から当該モノクロ画像と同じ解像度を持ったカラー情報を推定する処理を再帰的に行うことにより第1解像度を持った高解像度カラー情報107を推定する処理を行う。
カラー情報拡大器10Cは、カラー情報拡大器10を再帰的に連結する構造を用いた再帰的カラー情報拡大器であるので、拡大率がM(例えばM=2)であるカラー情報拡大器10を1つ作るだけで、Mの累乗数倍の拡大器を作成できる。
例えば最終的な拡大率を23倍(=8倍)とするカラー情報拡大器10Cを学習により作るときには、拡大率を2倍とするカラー情報拡大器10を学習に用いればよい。これは、再帰的カラー情報拡大器としないで8倍の拡大を実現しようとするときに決定すべきパラメータ数を約1/3に低減させる効果を奏することができる。
よって、カラー情報拡大器10Cによれば、予め推定した低解像度カラー情報105の解像度がN/8(480×270ピクセル)である場合に、解像度がN(=3840×2160ピクセル)に拡大された高解像度カラー情報107を容易に取得することが可能となる。
なお、カラー情報拡大器10Cは、カラー情報拡大器10の代わりに、カラー情報拡大器10A,10Bを再帰的に連結するようにしてもよい。また、カラー情報拡大器10Cによる最終的な拡大率は、8倍に限らず、4倍や16倍等であってもよい。
また、カラー情報拡大器10Cにおいて、例えば3つのカラー情報拡大器10を連結する代わりに、1つのカラー情報拡大器10を異なるタイミングで作動させることにより、3つのカラー情報拡大器10の働きをさせるようにしてもよい。
同様に、カラー情報拡大器10Cにおいて、例えば2つのサイズ縮小手段50を連結する代わりに、1つのサイズ縮小手段50を異なるタイミングで作動させることにより、2つのサイズ縮小手段50の働きをさせるようにしてもよい。
[カラー情報推定器の第2実施形態]
次に、本発明の第2実施形態に係るカラー情報推定器について図8を参照(適宜図1参照)して説明する。カラー情報推定器3Bは、図8に示すように、低解像度カラー情報推定器7Bと、カラー情報拡大器10Dと、を備えている。
低解像度カラー情報推定器7Bは、図1に示す低解像度カラー情報推定器7と同様に低解像度カラー情報105を推定するものである。低解像度カラー情報推定器7Bは、推定した低解像度カラー情報105をカラー情報拡大器10Dに出力する。この低解像度カラー情報推定器7Bは、高解像度モノクロ画像101を入力として用いる点が図1に示す低解像度カラー情報推定器7と異なっているが、従来公知のカラー情報推定器であるので、これ以上の説明を省略する。
カラー情報拡大器10Dは、低解像度カラー情報推定器7Bにより推定された低解像度カラー情報105と、低解像度カラー情報推定器7Bをバイパスして入力される高解像度モノクロ画像101と、を用いて、高解像度カラー情報107を推定する処理を行うものである。カラー情報拡大器10Dは、図8に示すように、サイズ拡大手段21と、合成手段22aと、第3の特徴抽出手段33と、高解像度カラー情報推定手段23と、を備えている。なお、カラー情報拡大器10Dにおいて、図2に示すカラー情報拡大器10と同じ構成には同じ符号を付して説明を省略する。
合成手段22aは、低解像度カラー情報推定器7Bに入力される高解像度モノクロ画像101と同じモノクロ画像と、サイズ拡大手段21により生成された高解像度の画像特徴量とを合成する。ここで、低解像度カラー情報推定器7Bに入力される高解像度モノクロ画像101と同じモノクロ画像は、バイパス経路401を介して、カラー情報拡大器10Dの合成手段22aに入力される。これにより、カラー情報拡大器10Dは、低解像度カラー情報105から高解像度カラー情報107を作成する際に、高解像度モノクロ画像101(モノクロ情報)を直接使用できる。
なお、仮にバイパス経路401からの高解像度モノクロ画像101の入力がない比較例のカラー情報推定器を想定した場合、このような比較例であっても、カラー情報の拡大機能を持たせることは可能と考えられる。その理由は、高解像度モノクロ画像101の持つ情報は、低解像度カラー情報推定器7Bを通過する過程で変形しているが、理論的には、バイパスがなくてもカラー情報拡大器10Dに伝わっているからである。
これに対して、第2実施形態に係るカラー情報推定器3Bは、バイパス経路401からの高解像度モノクロ画像101の入力が存在することにより、カラー情報拡大器10Dに相当する箇所の学習をする際に、高解像モノクロ情報が、このような比較例よりも強い影響を持つ。そのため、カラー情報推定器3Bは、高解像モノクロ情報チャンネル(色空間における輝度チャンネルの高解像の情報)上で境界がはっきりしている領域では、ぼけがないようなカラー情報の拡大をする学習が、上述した比較例よりも促進されることが実験的にも分かっている。
[カラー情報推定器の第3実施形態]
次に、本発明の第3実施形態に係るカラー情報推定器について図9を参照(適宜図7および図8参照)して説明する。カラー情報推定器3Cは、図9に示すように、低解像度カラー情報推定器7Bと、カラー情報拡大器10Eと、サイズ縮小手段50と、を備えている。ここでは、カラー情報推定器3Cに入力する高解像度モノクロ画像101は、解像度=N(=3840×2160ピクセル)のモノクロ画像であるものとする。また、低解像度カラー情報推定器7Bが出力するカラー情報は、解像度=N/8のカラー情報であるものとする。
カラー情報推定器3Cにおいて、図7のカラー情報拡大器10Cと同じ構成には同じ符号を付して説明を省略する。サイズ縮小手段50は、図7のカラー情報拡大器10Cにおけるサイズ縮小手段50と同様に、モノクロ画像111と、このモノクロ画像121とを生成する。
カラー情報拡大器10Eは、図9に示すように、サイズ拡大手段21,21b,21cと、合成手段22a,22b,22cと、第3の特徴抽出手段33と、高解像度カラー情報推定手段23と、を備えている。なお、カラー情報拡大器10Eにおいて、図8に示すカラー情報拡大器10Dと同じ構成には同じ符号を付して説明を省略する。
各サイズ拡大手段21,21b,21cは、同じ機能を有し、ここでは、入力される低解像度の画像特徴量を、一般的な画像拡大アルゴリズムで例えば2倍に拡大する処理を行うことにより高解像度の画像特徴量を生成する。
各合成手段22a,22b,22cは、同じ機能を有し、ここでは、別々の経路から入力される各画像特徴量を単純に合成し、アウトプットチャンネル数を増加させた画像特徴量を生成する。
このような構成のカラー情報推定器3Cは、サイズ縮小手段50を備えることにより、推定された低解像度のカラー情報を拡大する拡大率を、比較的大きな値にすることができる。
具体的は、カラー情報推定器3Cにおいて、サイズ拡大手段21cは、低解像度カラー情報推定器7Bが出力する2chのカラー情報(解像度=N/8)を拡大することにより、2chのカラー情報(解像度=N/4)を生成する。
そして、合成手段22cは、モノクロ画像121(解像度=N/4)と、サイズ拡大手段21cによって生成されたカラー情報(解像度=N/4)と、を合成することにより、3chの画像特徴量(解像度=N/4)を生成する。ここで、合成手段22cは、モノクロ画像121(解像度=N/4)を、バイパス経路403を介して、合成手段22cに入力する。
そして、サイズ拡大手段21bは、合成手段22cが生成した3chの画像特徴量(解像度=N/4)を拡大し、3chの画像特徴量(解像度=N/2)を生成する。そして、合成手段22bは、モノクロ画像111(解像度=N/2)と、サイズ拡大手段21bが生成した3chの画像特徴量(解像度=N/2)とを合成することにより、4chの画像特徴量(解像度=N/2)を生成する。ここで、サイズ拡大手段21bは、モノクロ画像111(解像度=N/2)を、バイパス経路402を介して、合成手段22bに入力する。
そして、サイズ拡大手段21は、合成手段22bが生成した4chの画像特徴量(解像度=N/2)を拡大し、4chの画像特徴量(解像度=N)を生成する。
そして、合成手段22aは、高解像度モノクロ画像101(解像度=N)と、サイズ拡大手段21が生成した4chの画像特徴量(解像度=N)とを合成し、5chの画像特徴量(解像度=N)を生成する。ここで、サイズ拡大手段21は、高解像度モノクロ画像101(解像度=N)を、バイパス経路401を介して、合成手段22aに入力する。
そして、第3の特徴抽出手段33は、合成手段22aが生成した5chの画像特徴量(解像度=N)を、例えば64chの画像特徴量(解像度=N)に変換する。
最後に、高解像度カラー情報推定手段23は、例えば64chの画像特徴量(解像度=N)を、色空間における2チャンネルのカラー情報(解像度=N)に変換する。これにより、高解像度カラー情報107が生成される。
以上、本発明の各実施形態について説明したが、本発明はこれらに限定されず、その趣旨を変えない範囲で実施することができる。例えば、本発明におけるカラー情報は、色空間における輝度チャンネル以外の2チャンネルとしたが、それ以外であっても取り扱うことが可能である。一例としては、RGB色空間における3チャンネルすべてをカラー情報として用いてもよい。
また、カラー情報拡大器やカラー情報推定器に対して入力されるカラー情報の形式と、出力するカラー情報の形式とは一致していなくても構わない。一例としては、カラー情報拡大器10に、高解像度モノクロ画像101としてLab色空間におけるLチャンネルを入力すると共に、低解像度カラー情報105としてLab色空間におけるabチャンネルを入力した場合、高解像度カラー情報107としてRGB色空間におけるRGBチャンネルを出力することもできる。
また、カラー情報拡大器10のすべての構成要素をニューラルネットワークで構成する代わりに、サイズ拡大手段21にBilinear補間法など一般的な画像拡大アルゴリズムで用いられるパラメータを固定的に用いると共に、その他の構成要素をニューラルネットワークで構成するようにしてもよい。この場合、カラー情報拡大器10のすべての構成要素をニューラルネットワークで構成した場合と比べると、良好となることが、実験的に分かっている。
また、カラー情報拡大器10は、ニューラルネットワークによる学習に限らず、他の機械学習技術を用いて構成することもできる。
また、前記各実施形態では、カラー情報拡大器10,10A〜10Dとして説明したが、各装置の構成の処理を可能にするように、汎用または特殊なコンピュータ言語で記述したカラー情報拡大プログラムとみなすことも可能である。
また、前記各実施形態では、カラー情報推定器3,3Bとして説明したが、各装置の構成の処理を可能にするように、汎用または特殊なコンピュータ言語で記述したカラー情報推定プログラムとみなすことも可能である。
実施形態に係るカラー情報拡大器の性能を確かめるために、実験を行った。図10は、実験に用いたカラー情報拡大器を模式的に示す説明図である。図10に示すように、実験に用いたカラー情報拡大器は、図8に示すカラー情報拡大器10Dと同じ構成である。
高解像度モノクロ画像101は、Lab色空間におけるLチャンネルに相当する1chのモノクロ情報(画像特徴量)である。図10では、1枚の画像として模式的に示した。
また、実験では、高解像度モノクロ画像101が960×540ピクセルの画像であるものとした。なお、高解像度モノクロ画像101における画素値をベクトルで表現すると、一般には次の式(1)で示される。式(1)で示すベクトルx1は、高解像度モノクロ画像101の画素数と同様に518400個の成分を持つ。
Figure 2019028888
低解像度カラー情報105は、Lab色空間におけるabチャンネルに相当する2chのカラー情報(画像特徴量)である。図10では、2枚の小さな画像として模式的に示した。
また、実験では、低解像度カラー情報105の解像度が480×270ピクセルであるものとした。そして、実験では、サイズ拡大手段21による拡大率を2(垂直方向2倍×水平方向2倍)とした。図10では、2枚の拡大された画像として模式的に示した。
これら拡大された2chのカラー情報における画素値をそれぞれベクトルで表現すると、一般には次の式(2)および式(3)で示される。それぞれのベクトルx2,x3は、前記した式(1)で示されるベクトルx1と同数個の成分を持っている。
Figure 2019028888
Figure 2019028888
合成手段22aは、各ベクトルx1、x2、x3を入力として、それらのベクトル成分を各画素に対応させて並べて、3chの情報とする。図10では、3枚の画像として模式的に示した。なお、この時点では、例えば3×960×540個の画素ごとの特徴量に対応したメモリが必要である。
第3の特徴抽出手段33は、コンボリューションを行うニューラルネットワークで構成されている。本実験では、20層のConvolution層を構築した。
また、各Convolution層では、出力としてN個の特徴を抽出するものとした。つまり、アウトプットチャンネル数はNである。この実験ではNch=64chとした。
なお、図10では、3層のConvolution層だけを示し、他は省略した。また、64chのうち12のチャンネルだけをNchとして図示し、他は省略した。
Convolution層の1層目(1回目)は、入力チャンネルが3ch(色空間における3チャンネル)であり、この1層目についての64のアウトプットチャンネルごとに、次の式(4)で表されるコンボリューションを行った。
Figure 2019028888
式(4)において、ωiは重みベクトルである。重みベクトルωiは、このカラー情報拡大器における学習の際に誤差を使ってωiを更新する、という誤差計算で決定する学習パラメータである。重みベクトルωiは、1次元の多数変数のベクトルであって、入力される高解像度モノクロ画像101の画素数と同数の成分を持つ。bはバイアスである。なお、i=1,2,3に対応したx1、x2、x3は式(1)〜式(3)で定義されている。
なお、この時点では、例えば64×960×540個の画素ごとの特徴量に対応したメモリが必要である。
Convolution層の2層目(2回目)は、入力チャンネルが64ch(前段の1層目についてのアウトプットにおける64チャンネル)であり、2層目についての64のアウトプットチャンネルごとに、次の式(5)で表されるコンボリューションを行った。
Figure 2019028888
式(5)は式(4)と同様の形式で表されている。なお、i=1〜64に対応したx1〜x64は、前段の1層目についてのアウトプットにおける64チャンネルのそれぞれの情報を示しており、式(1)〜式(3)と同様に定義できるので、その詳細は省略する。
Convolution層の3〜19層目(3〜19回目)は、同様に、入力チャンネルが64ch(前の層についてのアウトプットにおける64チャンネル)であり、それぞれ、64のアウトプットチャンネルごとに、前記した式(5)で表されるコンボリューションを行った。なお、3〜19層目においても、i=1〜64に対応したx1〜x64は、同様に、それらの前の層についてのアウトプットにおける64チャンネルについての画像特徴量を示している。
高解像度カラー情報推定手段23もConvolution層で構成されている。この高解像度カラー情報推定手段23は、出力として、色空間における2つのチャンネルに対応させた特徴をそれぞれ抽出した。つまり、アウトプットチャンネルは2chである。
このConvolution層(高解像度カラー情報推定手段23)は、入力チャンネルが64ch(前の層についてのアウトプットにおける64チャンネル)であり、色空間における2つのチャンネルごとに、前記した式(5)で表されるコンボリューションを行った。
前記した式(4)におけるωiと式(5)におけるωiとはそれぞれ異なっている。また、アウトプットチャンネルごとにωiはそれぞれ異なっている。さらに、前記した20層のConvolution層には、それぞれ異なる重みベクトルωiを用いた。
また、実験では、1282回(=64+64×19+2)のコンボリューションのすべてを、一例として、以下の同じ条件で、重みベクトルωiを変えながら行った。
カーネル(kernel):3
パディング(padding):1
ストライド(stride):1
よって、実験で用いた重みベクトルの各成分の個数を総計した個数は、次の式(6)を演算した結果の個数となる。
3×3×(3×64+64×64×19+64×2) ・・・ 式(6)
また、バイアス項の個数の総計はコンボリューションの個数と同じく、1282個である。これらの合計が全パラメータ数である。
つまり、実験に用いたカラー情報拡大器において、学習によって予め決定されたパラメータ群の個数は、703296+1282=704578個となる。
以上の処理により得られた高解像度カラー情報107を、図1に示すように、元画像である高解像度モノクロ画像101と合成して、高解像度カラー画像109を作成した(以下、実施例1)。
また、従来技術の方法で拡大したカラー情報を、元画像である高解像度モノクロ画像101と合成して、高解像度カラー画像を作成した(以下、比較例1)。
実施例1は、比較例1と比べて色のぼけが低減されたことを目視で確認できた。
また、ランダムに選んだ画像110枚に適用した場合に、PSNR(Peak Signal-to-Noise Ratio)という、元画像に対する劣化具合を表す尺度の平均値において、37.66(比較例)から41.35(実施例)に改善したことを確認できた。
なお、高解像度モノクロ画像101として、より大きな4K画像を用いて同じ実験を行う場合には、特徴量の個数が飛躍的に増大するので、より多くのメモリ領域を持ったハードウェア資源が必要である。
さらに、図10において破線で示す第1の特徴抽出手段31や第2の特徴抽出手段32を追加して図2のカラー情報拡大器10と同様の構成とする場合、さらに多くのパラメータを決定する必要がある。
本実施形態に係るカラー情報拡大器は、4Kモノクロ映像データの自動色付け等に利用することができる。
1 自動色付け装置
3,3B,3C カラー情報推定器
5 縮小器
7,7B 低解像度カラー情報推定器
9 情報合成器
10,10A,10B,10C,10D,10E カラー情報拡大器
21,21b,21c サイズ拡大手段
22a,22b,22c 合成手段
23 高解像度カラー情報推定手段
31〜36 特徴抽出手段
40 誤差計算器
50 サイズ縮小手段

Claims (10)

  1. 第1解像度のモノクロ画像の画像特徴量であるモノクロ情報と、前記第1解像度のモノクロ情報から推定された前記第1解像度よりも低い第2解像度の画像特徴量であるカラー情報と、を入力されて、所定の演算処理により前記カラー情報の画像サイズを拡大して高解像度カラー情報として出力するカラー情報拡大器であって、
    前記第2解像度のカラー情報または当該第2解像度のカラー情報から抽出した画像特徴量のいずれか一方である低解像度の画像特徴量から高解像度の画像特徴量を生成するサイズ拡大手段と、
    前記第1解像度のモノクロ情報または当該第1解像度のモノクロ情報から抽出した高解像度の画像特徴量と、前記サイズ拡大手段により生成された高解像度の画像特徴量とを合成する合成手段と、
    前記合成手段により合成された高解像度の画像特徴量から、色空間のチャンネルごとに、推定を行うための学習により予め決定されたパラメータ群を用いて画像特徴量を抽出することにより前記高解像度カラー情報を推定する高解像度カラー情報推定手段と、を備えるカラー情報拡大器。
  2. 第1解像度のモノクロ画像の画像特徴量であるモノクロ情報と、前記第1解像度のモノクロ情報から推定された前記第1解像度よりも低い第2解像度の画像特徴量であるカラー情報と、を入力されて、所定の演算処理により前記カラー情報の画像サイズを拡大して高解像度カラー情報として出力するカラー情報拡大器であって、
    前記第1解像度のモノクロ情報から、推定を行うための学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出する特徴抽出手段と、
    前記第2解像度のカラー情報または当該第2解像度のカラー情報から抽出した低解像度の画像特徴量と、前記特徴抽出手段により抽出された低解像度の画像特徴量と、を合成する合成手段と、
    前記合成手段により合成された低解像度の画像特徴量から高解像度の画像特徴量を生成するサイズ拡大手段と、
    前記サイズ拡大手段により生成された高解像度の画像特徴量から、色空間のチャンネルごとに、推定を行うための学習により予め決定されたパラメータ群を用いて画像特徴量を抽出することにより前記高解像度カラー情報を推定する高解像度カラー情報推定手段と、を備えるカラー情報拡大器。
  3. 前記高解像度カラー情報推定手段は、
    前記合成手段および前記サイズ拡大手段の処理により生成された高解像度の画像特徴量から色空間のチャンネルごとの画像特徴量を抽出する前に、当該高解像度の画像特徴量から、推定を行うための学習により予め決定されたパラメータ群を用いて、さらに高解像度の画像特徴量を抽出する特徴抽出手段を備え、
    当該特徴抽出手段により抽出された高解像度の画像特徴量から色空間のチャンネルごとに画像特徴量を抽出する請求項1または請求項2に記載のカラー情報拡大器。
  4. 前記第1解像度のモノクロ情報から、推定を行うための学習により予め決定されたパラメータ群を用いて高解像度の画像特徴量を抽出し、抽出した高解像度の画像特徴量を前記合成手段に出力する第1の特徴抽出手段と、
    前記第2解像度のカラー情報から、推定を行うための学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出し、抽出した低解像度の画像特徴量を前記サイズ拡大手段に出力する第2の特徴抽出手段と、
    のうちの少なくとも1つの特徴抽出手段を備える請求項1に記載のカラー情報拡大器。
  5. 前記第2解像度のカラー情報から、推定を行うための学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出し、抽出した低解像度の画像特徴量を前記合成手段に出力する第2の特徴抽出手段を備える請求項2に記載のカラー情報拡大器。
  6. 前記第1解像度のモノクロ情報を、所定の縮小率で縮小する処理を再帰的に行うことにより前記第1解像度よりも小さく前記第2解像度よりも大きな解像度を持った複数レベルの解像度のモノクロ情報を生成するサイズ縮小手段を備え、
    前記第2解像度のカラー情報と、生成される最小レベルの解像度のモノクロ情報とを初期値として、推定されたカラー情報および当該カラー情報よりも大きな解像度を持ったモノクロ情報から当該モノクロ情報と同じ解像度を持ったカラー情報を推定する処理を再帰的に行うことにより前記第1解像度を持った前記高解像度カラー情報を推定する処理を行う請求項1から請求項5のいずれか一項に記載のカラー情報拡大器。
  7. 請求項1から請求項6のいずれか一項に記載のカラー情報拡大器と、
    前記第1解像度のモノクロ情報を縮小する処理を行って前記第2解像度のモノクロ情報を生成する縮小器と、
    前記縮小器により生成された前記第2解像度のモノクロ情報から、推定を行うための学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出することにより前記第2解像度のカラー情報を推定する低解像度カラー情報推定器と、を備え、
    前記カラー情報拡大器は、前記低解像度カラー情報推定器で推定された前記第2解像度のカラー情報と、前記縮小器をバイパスして入力される前記第1解像度のモノクロ情報と、を用いて、前記高解像度カラー情報を推定する処理を行うカラー情報推定器。
  8. 請求項1から請求項6のいずれか一項に記載のカラー情報拡大器と、
    前記第1解像度のモノクロ情報から、推定を行うための学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出することにより前記第2解像度のカラー情報を推定する低解像度カラー情報推定器と、を備え、
    前記カラー情報拡大器は、前記低解像度カラー情報推定器で推定された前記第2解像度のカラー情報と、前記低解像度カラー情報推定器をバイパスして入力される前記第1解像度のモノクロ情報と、を用いて、前記高解像度カラー情報を推定する処理を行うカラー情報推定器。
  9. コンピュータを、請求項1から請求項6のいずれか一項に記載のカラー情報拡大器として機能させるためのカラー情報拡大プログラム。
  10. コンピュータを、請求項7または請求項8に記載のカラー情報推定器として機能させるためのカラー情報推定プログラム。
JP2017150153A 2017-08-02 2017-08-02 カラー情報拡大器およびカラー情報推定器、ならびに、それらのプログラム Active JP6902425B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017150153A JP6902425B2 (ja) 2017-08-02 2017-08-02 カラー情報拡大器およびカラー情報推定器、ならびに、それらのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017150153A JP6902425B2 (ja) 2017-08-02 2017-08-02 カラー情報拡大器およびカラー情報推定器、ならびに、それらのプログラム

Publications (2)

Publication Number Publication Date
JP2019028888A true JP2019028888A (ja) 2019-02-21
JP6902425B2 JP6902425B2 (ja) 2021-07-14

Family

ID=65478615

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017150153A Active JP6902425B2 (ja) 2017-08-02 2017-08-02 カラー情報拡大器およびカラー情報推定器、ならびに、それらのプログラム

Country Status (1)

Country Link
JP (1) JP6902425B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0737093A (ja) * 1993-07-16 1995-02-07 Toshiba Corp パターン識別装置
JP2007226658A (ja) * 2006-02-24 2007-09-06 Nec Access Technica Ltd 情報処理端末装置,情報処理方法及び情報処理用プログラム
JP2011215973A (ja) * 2010-03-31 2011-10-27 Aisin Aw Co Ltd 風景マッチング用参照データ生成システム及び位置測位システム
JP2012520534A (ja) * 2009-03-17 2012-09-06 ハリス コーポレイション 画像をカラー化する地理空間モデリングシステム及び関連する方法
JP2013120498A (ja) * 2011-12-07 2013-06-17 Dunlop Sports Co Ltd シルエット補正方法及びシルエット補正システム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0737093A (ja) * 1993-07-16 1995-02-07 Toshiba Corp パターン識別装置
JP2007226658A (ja) * 2006-02-24 2007-09-06 Nec Access Technica Ltd 情報処理端末装置,情報処理方法及び情報処理用プログラム
JP2012520534A (ja) * 2009-03-17 2012-09-06 ハリス コーポレイション 画像をカラー化する地理空間モデリングシステム及び関連する方法
JP2011215973A (ja) * 2010-03-31 2011-10-27 Aisin Aw Co Ltd 風景マッチング用参照データ生成システム及び位置測位システム
JP2013120498A (ja) * 2011-12-07 2013-06-17 Dunlop Sports Co Ltd シルエット補正方法及びシルエット補正システム

Also Published As

Publication number Publication date
JP6902425B2 (ja) 2021-07-14

Similar Documents

Publication Publication Date Title
US6943807B2 (en) Image processing apparatus and method, recording medium, and program thereof
KR101136506B1 (ko) 화상 생성 방법, 장치 및 그 프로그램 및 프로그램을 기록한 기록매체
EP2202683A1 (en) Image generation method, device, its program and recording medium with program recorded therein
JP2015035198A (ja) 画像処理装置及び画像処理方法
KR100860968B1 (ko) 해상도 향상 장치 및 방법
JP5473173B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
WO2016167014A1 (ja) 画像処理装置及び方法、並びにプログラム及び記録媒体
JP2000244851A (ja) 画像処理装置、方法及びコンピュータ読み取り可能な記憶媒体
JP2016192059A (ja) 画像合成装置、画像合成方法、画像合成プログラム及び記録媒体
JP2011095861A (ja) 画像処理装置、制御方法、及びプログラム
JP4714038B2 (ja) 画像の高解像度化方法及び装置
JP6886887B2 (ja) 誤差計算器およびそのプログラム
US20090185756A1 (en) Image processing device and image processing method
Bätz et al. Multi-image super-resolution using a locally adaptive denoising-based refinement
WO2010051719A1 (zh) 一种视频图像 4/3 倍放大方法
US20130120461A1 (en) Image processor and image processing method
JP2000152250A (ja) 画像処理装置、方法及びコンピュータ読み取り可能な記憶媒体
JP6902425B2 (ja) カラー情報拡大器およびカラー情報推定器、ならびに、それらのプログラム
KR102470242B1 (ko) 영상 처리 장치, 영상 처리 방법, 및 프로그램
KR20230077854A (ko) 단일 이미지를 이용한 특징 강화 가중치 기반의 딥러닝 다중 노출 융합 방법, 장치, 및 프로그램
KR20070119482A (ko) 이미지 리샘플링 방법
JP5181345B2 (ja) 画像処理装置及び画像処理方法
JP2018084997A (ja) 画像処理装置、画像処理方法
JP4265362B2 (ja) 画像処理装置
CN109754370B (zh) 图像去噪方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200702

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210525

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210621

R150 Certificate of patent or registration of utility model

Ref document number: 6902425

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250