JP6902425B2 - Color information magnifiers and color information estimators, and their programs - Google Patents
Color information magnifiers and color information estimators, and their programs Download PDFInfo
- Publication number
- JP6902425B2 JP6902425B2 JP2017150153A JP2017150153A JP6902425B2 JP 6902425 B2 JP6902425 B2 JP 6902425B2 JP 2017150153 A JP2017150153 A JP 2017150153A JP 2017150153 A JP2017150153 A JP 2017150153A JP 6902425 B2 JP6902425 B2 JP 6902425B2
- Authority
- JP
- Japan
- Prior art keywords
- resolution
- color information
- information
- magnifier
- low
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Processing (AREA)
- Image Analysis (AREA)
Description
本発明は、モノクロ画像へ付加するカラー情報を拡大するカラー情報拡大器、および、モノクロ画像へ付加するカラー情報を推定するカラー情報推定器、ならびに、それらのプログラムに関する。 The present invention relates to a color information magnifier that magnifies color information to be added to a monochrome image, a color information estimator that estimates color information to be added to a monochrome image, and a program thereof.
近年、モノクロ画像をデジタルデータ化してカラー化する自動色付け技術が複数開発されている。このデジタルデータには、このモノクロ画像をカラー画像にするための画像特徴量となるカラー情報の手がかりがほとんどない。このため、このデジタルデータのカラー化は、フィルムなどの物理媒体に記録されたいわゆるアナログ画像のカラー化と比べて、難易度が高い。例えば、モノクロデータをカラーデータに変換する方法が知られている(特許文献1参照)。この方法は、モノクロデータに記録された特定の物体を仮定し、この特定の物体から色分布モデルを計算する。そして、計算した色分布モデルからカラー情報を推定する。この方法は、この特定の物体をカラー化する対象としているので、予め仮定した対象と、この特定の物体とが異なる場合には、モノクロ画像を自然なカラー画像にすることが難しいという問題がある。 In recent years, a plurality of automatic coloring technologies for converting monochrome images into digital data and colorizing them have been developed. This digital data has almost no clue of color information which is an image feature amount for converting this monochrome image into a color image. Therefore, the colorization of this digital data is more difficult than the colorization of so-called analog images recorded on a physical medium such as a film. For example, a method of converting monochrome data into color data is known (see Patent Document 1). This method assumes a specific object recorded in monochrome data and calculates a color distribution model from this specific object. Then, the color information is estimated from the calculated color distribution model. Since this method targets this specific object to be colored, there is a problem that it is difficult to make a monochrome image into a natural color image when the object assumed in advance and this specific object are different. ..
これに対し、近年、いわゆる機械学習技術を用いることにより、白黒画像の中のカラー化対象の選択をより汎用的にしてカラー化するカラー情報の推定方法が提案されている(非特許文献1、非特許文献2参照)。しかしながら、このような機械学習技術を用いたカラー情報の推定方法は、多様な物体が写った膨大な量のカラー画像を用意することを前提としている。そして、このカラー情報の推定方法は、カラー情報推定器を作成するための学習の際に、例えば、ニューラルネットワーク等で構成された学習器に、膨大なカラー画像を入力する。そして、この学習により作成されたカラー情報推定器によれば、モノクロ画像とこのモノクロ画像に対応するカラー情報との対応関係を機械学習技術により学習させ、学習したカラー情報との対応関係に基づいて、入力として与えられる多様なモノクロ画像に対して、従来よりも精度よくカラー情報を推定し、これにより自然なカラー画像を生成できる。 On the other hand, in recent years, a method of estimating color information for making the selection of a colorization target in a black-and-white image more general and colorizing by using a so-called machine learning technique has been proposed (Non-Patent Document 1, Non-Patent Document 1, See Non-Patent Document 2). However, the method of estimating color information using such machine learning technology is premised on preparing a huge amount of color images in which various objects are captured. Then, in this color information estimation method, a huge amount of color images are input to a learning device composed of, for example, a neural network, when learning to create a color information estimator. Then, according to the color information estimator created by this learning, the correspondence relationship between the monochrome image and the color information corresponding to the monochrome image is learned by the machine learning technique, and based on the correspondence relationship with the learned color information. , Color information can be estimated more accurately than before for various monochrome images given as inputs, and a natural color image can be generated by this.
しかしながら、上述した機械学習技術による既存の自動色付け技術では、解像度が縦横256〜512ピクセル程度の低解像度画像を主な対象としており、4K画像や8K画像のような高解像度なモノクロ画像への自然な色付けを可能にする技術は存在しなかった。 However, the existing automatic coloring technology based on the machine learning technology described above mainly targets low-resolution images having a resolution of about 256 to 512 pixels in length and width, and naturally creates high-resolution monochrome images such as 4K images and 8K images. There was no technology that made it possible to color the image.
上述したような従来の複数の技術は、高解像のモノクロ画像に対して、カラー画像化の元となるモノクロ画像を低解像度に圧縮してから低解像度なカラー情報を推定し、入力画像のサイズにまで拡大する。また、これらの技術は、その後、この拡大されたカラー情報を元のモノクロ画像と合成し、合成したカラー画像を、入力した高解像度のモノクロ画像に対応させる。しかしながら、この従来の方法は、推定したカラー画像にぼけなどが発生するという問題があった。特に、拡大率が大きくなればカラー情報にも大きなぼけが生じるという問題があった。 In the conventional plurality of techniques as described above, for a high-resolution monochrome image, the monochrome image that is the source of color imaging is compressed to a low resolution, and then low-resolution color information is estimated, and the input image is input. Expand to size. Further, these techniques then synthesize the enlarged color information with the original monochrome image, and make the combined color image correspond to the input high-resolution monochrome image. However, this conventional method has a problem that the estimated color image is blurred. In particular, there is a problem that when the enlargement ratio is increased, the color information is also greatly blurred.
本発明は、以上のような問題点に鑑みてなされたものであり、高解像度のモノクロ画像から推定されるカラー情報に生じるぼけを低減できるカラー情報拡大器およびカラー情報推定器、ならびに、それらのプログラムを提供することを目的とする。 The present invention has been made in view of the above problems, and is a color information magnifier and a color information estimator capable of reducing blurring in color information estimated from a high-resolution monochrome image, and a color information estimator thereof. The purpose is to provide a program.
前記課題を解決するため、本発明の第1の態様に係るカラー情報拡大器は、第1解像度のモノクロ画像の画像特徴量であるモノクロ情報と、前記第1解像度のモノクロ情報から推定された前記第1解像度よりも低い第2解像度の画像特徴量であるカラー情報と、を入力されて、所定の演算処理により前記カラー情報の画像サイズを拡大して高解像度カラー情報として出力するカラー情報拡大器であって、サイズ拡大手段と、合成手段と、高解像度カラー情報推定手段と、を備えることとした。 In order to solve the above problems, the color information magnifier according to the first aspect of the present invention is the color information magnifier estimated from the monochrome information which is the image feature amount of the monochrome image of the first resolution and the monochrome information of the first resolution. A color information expander that inputs color information, which is an image feature amount of a second resolution lower than the first resolution, expands the image size of the color information by a predetermined arithmetic process, and outputs it as high-resolution color information. Therefore, it was decided to provide a size enlargement means, a synthesis means, and a high-resolution color information estimation means.
かかる構成によれば、カラー情報拡大器は、サイズ拡大手段によって、前記第2解像度のカラー情報または当該第2解像度のカラー情報から抽出した画像特徴量のいずれか一方である低解像度の画像特徴量から高解像度の画像特徴量を生成する。
そして、カラー情報拡大器は、合成手段によって、前記第1解像度のモノクロ情報または当該第1解像度のモノクロ情報から抽出した高解像度の画像特徴量と、前記サイズ拡大手段により生成された高解像度の画像特徴量とを合成する。
そして、カラー情報拡大器は、高解像度カラー情報推定手段によって、前記合成手段により合成された高解像度の画像特徴量から、色空間のチャンネルごとに、推定を行うための学習により予め決定されたパラメータ群を用いて画像特徴量を抽出することにより前記高解像度カラー情報を推定する。
According to such a configuration, the color information magnifier is a low-resolution image feature amount that is either one of the second-resolution color information or the image feature amount extracted from the second-resolution color information by the size enlargement means. Generate high-resolution image features from.
Then, the color information magnifier is a high-resolution image feature amount extracted from the first-resolution monochrome information or the first-resolution monochrome information by the compositing means, and a high-resolution image generated by the size-enlarging means. Combine with features.
Then, the color information magnifier is a parameter determined in advance by learning for estimating for each channel of the color space from the high-resolution image feature amount synthesized by the high-resolution color information estimation means by the synthesis means. The high-resolution color information is estimated by extracting the image feature amount using the group.
また、本発明の第2の態様に係るカラー情報拡大器は、第1解像度のモノクロ画像の画像特徴量であるモノクロ情報と、前記第1解像度のモノクロ情報から推定された前記第1解像度よりも低い第2解像度の画像特徴量であるカラー情報と、を入力されて、所定の演算処理により前記カラー情報の画像サイズを拡大して高解像度カラー情報として出力するカラー情報拡大器であって、特徴抽出手段と、合成手段と、サイズ拡大手段と、高解像度カラー情報推定手段と、を備えることとした。 Further, the color information magnifier according to the second aspect of the present invention is more than the monochrome information which is the image feature amount of the monochrome image of the first resolution and the first resolution estimated from the monochrome information of the first resolution. It is a color information magnifier that inputs color information, which is a low second resolution image feature amount, expands the image size of the color information by a predetermined arithmetic process, and outputs it as high resolution color information. It was decided to include an extraction means, a synthesis means, a size enlargement means, and a high-resolution color information estimation means.
かかる構成によれば、カラー情報拡大器は、特徴抽出手段によって、前記第1解像度のモノクロ情報から、推定を行うための学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出する。
そして、カラー情報拡大器は、合成手段によって、前記第2解像度のカラー情報または当該第2解像度のカラー情報から抽出した低解像度の画像特徴量と、前記特徴抽出手段により抽出された低解像度の画像特徴量と、を合成する。
そして、カラー情報拡大器は、サイズ拡大手段によって、前記合成手段により合成された低解像度の画像特徴量から高解像度の画像特徴量を生成する。
そして、カラー情報拡大器は、高解像度カラー情報推定手段によって、前記サイズ拡大手段により生成された高解像度の画像特徴量から、色空間のチャンネルごとに、推定を行うための学習により予め決定されたパラメータ群を用いて画像特徴量を抽出することにより前記高解像度カラー情報を推定する。
According to such a configuration, the color information magnifier extracts a low-resolution image feature amount from the monochrome information of the first resolution by using a feature extraction means using a parameter group predetermined by learning for estimation. To do.
Then, the color information magnifier is a low-resolution image feature amount extracted from the second-resolution color information or the second-resolution color information by the compositing means, and a low-resolution image extracted by the feature extraction means. The feature amount and the feature amount are synthesized.
Then, the color information magnifier generates a high-resolution image feature amount from the low-resolution image feature amount synthesized by the compositing means by the size enlargement means.
Then, the color information magnifier is determined in advance by the high-resolution color information estimation means by learning to perform estimation for each channel in the color space from the high-resolution image feature amount generated by the size enlargement means. The high-resolution color information is estimated by extracting the image feature amount using the parameter group.
また、前記課題を解決するため、本発明の第1の態様に係るカラー情報推定器は、前記カラー情報拡大器と、前記第1解像度のモノクロ情報を縮小する処理を行って前記第2解像度のモノクロ情報を生成する縮小器と、前記縮小器により生成された前記第2解像度のモノクロ情報から、推定を行うための学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出することにより前記第2解像度のカラー情報を推定する低解像度カラー情報推定器と、を備え、前記カラー情報拡大器が、前記低解像度カラー情報推定器で推定された前記第2解像度のカラー情報と、前記縮小器をバイパスして入力される前記第1解像度のモノクロ情報と、を用いて、前記高解像度カラー情報を推定する処理を行うこととした。 Further, in order to solve the above-mentioned problems, the color information estimator according to the first aspect of the present invention performs the color information magnifier and the process of reducing the monochrome information of the first resolution to achieve the second resolution. A low-resolution image feature amount is extracted from the reducer that generates monochrome information and the second-resolution monochrome information generated by the reducer using a parameter group that is predetermined by learning for estimation. The second resolution color information estimator for estimating the color information of the second resolution is provided, and the color information magnifier comprises the second resolution color information estimated by the low resolution color information estimator. It was decided to perform a process of estimating the high-resolution color information by using the monochrome information of the first resolution input by bypassing the reducer.
かかる構成によれば、本発明の第1の態様に係るカラー情報推定器は、第1解像度のモノクロ画像から縮小器と低解像度カラー情報推定器とを経て推定された第2解像度のカラー情報と、第1解像度のモノクロ画像とを、カラー情報拡大器の入力として与えることができる。 According to such a configuration, the color information estimator according to the first aspect of the present invention includes the color information of the second resolution estimated from the monochrome image of the first resolution through the reduction device and the low resolution color information estimator. , A monochrome image of the first resolution can be given as an input of the color information magnifier.
また、前記課題を解決するため、本発明の第2の態様に係るカラー情報推定器は、前記カラー情報拡大器と、前記第1解像度のモノクロ情報から、推定を行うための学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出することにより前記第2解像度のカラー情報を推定する低解像度カラー情報推定器と、を備え、前記カラー情報拡大器が、前記低解像度カラー情報推定器で推定された前記第2解像度のカラー情報と、前記低解像度カラー情報推定器をバイパスして入力される前記第1解像度のモノクロ情報と、を用いて、前記高解像度カラー情報を推定する処理を行うこととした。 Further, in order to solve the above-mentioned problems, the color information estimator according to the second aspect of the present invention is determined in advance by learning to perform estimation from the color information magnifier and the monochrome information of the first resolution. A low-resolution color information estimator that estimates the second-resolution color information by extracting a low-resolution image feature amount using the parameter group is provided, and the color information magnifier provides the low-resolution color information. The high-resolution color information is estimated using the second-resolution color information estimated by the estimator and the first-resolution monochrome information input by bypassing the low-resolution color information estimator. It was decided to perform processing.
かかる構成によれば、本発明の第2の態様に係るカラー情報推定器は、第1解像度のモノクロ画像から低解像度カラー情報推定器によって推定された第2解像度のカラー情報と、第1解像度のモノクロ画像とを、カラー情報拡大器の入力として与えることができる。 According to such a configuration, the color information estimator according to the second aspect of the present invention has the second resolution color information estimated by the low resolution color information estimator from the first resolution monochrome image and the first resolution. A monochrome image can be given as an input to the color information magnifier.
また、本発明は、コンピュータを、前記カラー情報拡大器として機能させるためのカラー情報拡大プログラムで実現することもできる。
また、本発明は、コンピュータを、前記カラー情報推定器として機能させるためのカラー情報推定プログラムで実現することもできる。
The present invention can also be realized by a color information enlargement program for making a computer function as the color information magnifier.
The present invention can also be realized by a color information estimation program for making a computer function as the color information estimator.
本発明は、以下に示す優れた効果を奏するものである。
本発明に係るカラー情報拡大器によれば、高解像度のモノクロ画像から推定した低解像度のカラー情報を拡大する推定処理に際して、拡大されるカラー情報のぼけを低減できる。
また、本発明に係るカラー情報推定器によれば、入力される高解像度のモノクロ画像から推定するカラー情報のぼけを低減できる。
The present invention has the following excellent effects.
According to the color information magnifier according to the present invention, it is possible to reduce the blurring of the enlarged color information in the estimation process for enlarging the low-resolution color information estimated from the high-resolution monochrome image.
Further, according to the color information estimator according to the present invention, it is possible to reduce the blurring of the color information estimated from the input high-resolution monochrome image.
以下、本発明の実施形態に係るカラー情報拡大器およびカラー情報推定器について、図面を参照しながら説明する。 Hereinafter, the color information magnifier and the color information estimator according to the embodiment of the present invention will be described with reference to the drawings.
[自動色付け装置]
図1は、本発明の第1実施形態に係るカラー情報推定器を含む自動色付け装置の構成を模式的に示すブロック図である。
自動色付け装置1は、モノクロ画像からカラー情報を推定することにより、モノクロ画像へ自動的に色付けするものであり、図1に示すように、主として、カラー情報推定器3と、情報合成器9と、を備えている。
この自動色付け装置1は、例えば一般的なコンピュータで構成され、GPU(Graphics Processing Units)等の演算装置と、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)や一般的な画像メモリと、入出力インタフェースと、を備えている。
[Automatic coloring device]
FIG. 1 is a block diagram schematically showing a configuration of an automatic coloring device including a color information estimator according to a first embodiment of the present invention.
The automatic coloring device 1 automatically colors a monochrome image by estimating color information from the monochrome image, and as shown in FIG. 1, mainly includes a color information estimator 3 and an
The automatic coloring device 1 is composed of, for example, a general computer, and includes a computing device such as a GPU (Graphics Processing Units), a ROM (Read Only Memory), a RAM (Random Access Memory), an HDD (Hard Disk Drive), and a general device. It has a typical image memory and an input / output interface.
カラー情報推定器3は、入力される高解像度モノクロ画像101から、低解像度モノクロ画像103および低解像度カラー情報105を生成して、これらの情報を用いて高解像度カラー情報107を推定するものである。
高解像度モノクロ画像101は、第1解像度のモノクロ画像である。この高解像度モノクロ画像101は、例えば、過去の白黒フィルムや写真からスキャンによりデジタル化したモノクロ画像である。
低解像度モノクロ画像103は、前記第1解像度よりも低い第2解像度のモノクロ画像である。
低解像度カラー情報105は、前記第2解像度のカラー情報である。
高解像度カラー情報107は、前記第1解像度のカラー情報である。
The color information estimator 3 generates a low-
The high-
The low-
The low
The high-
ここで、モノクロ画像とは、具体的には色空間における輝度チャンネル(HSV色空間におけるVチャンネルや、Lab色空間におけるLチャンネルなど)のみから成る画像である。なお、画素の情報が輝度である場合、画素値(輝度値)は、8ビットの情報で表すとき、0〜255の値を有する。モノクロ画像の画像特徴量であるモノクロ情報は、例えば輝度分布で表される。本明細書では、このモノクロ情報をモノクロ画像と同じ意味で用いている。
また、カラー情報とは、例えば、輝度チャンネル以外の2チャンネルについての画像特徴量とすることができる。ここで、画像特徴量とは、例えば、輝度、色度、彩度等の色空間を表す量である。また、画像特徴量は、例えば、色空間を表す量から抽出された平均値、分散、畳み込み積分値等であってもよい。また、画素ごとの画像特徴量の集合は、例えばモノクロ画像(モノクロ情報)やカラー情報である。また、画像特徴量は、高さ方向および幅方向(縦横)に要素が並べられた行列で取り扱ってもよいし、1次元の多変数ベクトルで取り扱ってもよい。
Here, the monochrome image is specifically an image composed of only the luminance channels in the color space (V channel in the HSV color space, L channel in the Lab color space, etc.). When the pixel information is luminance, the pixel value (luminance value) has a value of 0 to 255 when represented by 8-bit information. Monochrome information, which is an image feature amount of a monochrome image, is represented by, for example, a luminance distribution. In this specification, this monochrome information is used in the same meaning as a monochrome image.
Further, the color information can be, for example, an image feature amount for two channels other than the luminance channel. Here, the image feature amount is an amount representing a color space such as brightness, chromaticity, and saturation, for example. Further, the image feature amount may be, for example, an average value, a variance, a convolution integral value, or the like extracted from an amount representing a color space. The set of image features for each pixel is, for example, a monochrome image (monochrome information) or color information. Further, the image feature amount may be handled by a matrix in which elements are arranged in the height direction and the width direction (vertical and horizontal), or may be handled by a one-dimensional multivariable vector.
第1解像度の値(高解像度の値)は、第2解像度の値(低解像度の値)に比較して大きければ特に限定されない。例えば、第2解像度の画像の大きさを256×256ピクセル、第1解像度の画像の大きさを512×512ピクセルとしてもよい。また、例えば、第2解像度の画像の大きさを480×270ピクセル、第1解像度の画像の大きさを4K(3840×2160)としてもよい。さらには、第1解像度の画像の大きさを8K(7680×4320)としても構わない。 The value of the first resolution (value of high resolution) is not particularly limited as long as it is larger than the value of the second resolution (value of low resolution). For example, the size of the image of the second resolution may be 256 × 256 pixels, and the size of the image of the first resolution may be 512 × 512 pixels. Further, for example, the size of the image of the second resolution may be 480 × 270 pixels, and the size of the image of the first resolution may be 4K (3840 × 2160). Further, the size of the first resolution image may be 8K (7680 × 4320).
(カラー情報推定器の第1実施形態)
第1実施形態のカラー情報推定器3は、図1に示すように、縮小器5と、低解像度カラー情報推定器7と、カラー情報拡大器10と、を備えている。
カラー情報拡大器10は、低解像度カラー情報105または低解像度カラー情報105から抽出した画像特徴量のいずれかである低解像度の画像特徴量から高解像度の画像特徴量を生成し、高解像度モノクロ画像101または高解像度モノクロ画像101から抽出した高解像度の画像特徴量と、サイズ拡大手段2により生成された高解像度の画像特徴量とを合成し、合成された高解像度の画像特徴量から、色空間のチャンネルごとに、推定を行うための学習により予め決定されたパラメータ群を用いて画像特徴量を抽出する。
これにより、高解像度カラー情報107を推定する。
(First Embodiment of Color Information Estimator)
As shown in FIG. 1, the color information estimator 3 of the first embodiment includes a
The
As a result, the high-
縮小器5は、入力される高解像度モノクロ画像101を縮小する処理を行って低解像度モノクロ画像103を生成するものである。ここで、縮小とは解像度を低減、つまり画素数を減少させることをいう。縮小における縮小率が例えば0.5である場合、縮小画像の水平方向、垂直方向の画素数は、原画像の水平方向、垂直方向の画素数のそれぞれ1/2となる。縮小器5は、生成した低解像度モノクロ画像103を低解像度カラー情報推定器7に出力する。
The
低解像度カラー情報推定器7は、推定を行うための学習により予め決定されたパラメータ群を用いて、縮小器5により生成された低解像度モノクロ画像103から、低解像度のカラー情報(画像特徴量)を抽出する。これにより、低解像度カラー情報推定器7は、低解像度カラー情報105を推定する。なお、低解像度カラー情報推定器7を作成するための学習の流れは、従来技術と同様であるが、簡単な説明を後記する。また、カラー情報の推定手法には、例えば非特許文献1に記載された従来公知の手法を用いることができる。この低解像度カラー情報推定器7は、従来公知のカラー情報推定器と同様に、輝度チャンネルを入力とし、2チャンネルの推定カラー情報を出力する。そして、低解像度カラー情報推定器7は、推定した低解像度カラー情報105をカラー情報拡大器10に出力する。
The low-resolution
カラー情報拡大器10は、低解像度カラー情報推定器7により推定された低解像度カラー情報105と、縮小器5をバイパスして入力される高解像度モノクロ画像101と、を入力として、画像サイズが拡大されたカラー情報(高解像度カラー情報107)を推定する処理を行うものである。カラー情報拡大器10は、低解像度カラー情報105を拡大する際に、高解像度モノクロ画像101(モノクロ情報)を用いて拡大する。そして、カラー情報拡大器10は、推定した高解像度カラー情報107を情報合成器9に出力する。
The
情報合成器9は、カラー情報推定器3で推定された高解像度カラー情報107と、高解像度モノクロ画像101とを合成し、高解像度カラー画像109を作成する。情報合成器9は、1チャンネル(以下、1chと表記する場合もある)のモノクロ情報と、2チャンネル(2ch)のカラー情報とを単純に合成してカラー画像を生成する。
The
(カラー情報拡大器の詳細)
図2は、本発明の第1実施形態に係るカラー情報拡大器の構成を模式的に示すブロック図である。カラー情報拡大器10は、図2に示すように、サイズ拡大手段21と、合成手段22aと、高解像度カラー情報推定手段23と、を備えている。なお、図2のカラー情報拡大器10は、特徴抽出手段31,32,33を備える形態で図示したが、例えば、すべての特徴抽出手段を省略した構成とすることもできる。なお、以下では、特徴抽出手段について、便宜的に第1の特徴抽出手段31、第2の特徴抽出手段32、および第3の特徴抽出手段33のように呼称する場合もある。
(Details of color information magnifier)
FIG. 2 is a block diagram schematically showing the configuration of the color information magnifier according to the first embodiment of the present invention. As shown in FIG. 2, the
カラー情報拡大器10は、例えばニューラルネットワークにより構成できる。また、ニューラルネットワークは、例えばCNN(Convolutional Neural Network)であってもよい。CNNでは、隠れ層(hidden layer)に、Convolution層(畳み込み層)や、Deconvolution層(逆畳み込み層、または、Transposed Convolution 層)を用いる。よって、CNNを採用した場合、カラー情報拡大器10は、各構成要素を、Convolution層またはDeconvolution層を用いて実装可能であり、GPUを用いて高速に計算できる。
The
サイズ拡大手段21は、入力される低解像度の画像特徴量を拡大する処理を行って高解像度の画像特徴量を生成するものである。ここで、低解像度の画像特徴量とは、例えば、低解像度カラー情報105のことをいう。なお、図2に示すように、カラー情報拡大器10が第2の特徴抽出手段32を備える場合には、第2の特徴抽出手段32が低解像度カラー情報105から抽出した画像特徴量が低解像度の画像特徴量となる。サイズ拡大手段21は、生成した高解像度の画像特徴量を合成手段22aに出力する。
The size enlargement means 21 generates a high-resolution image feature amount by performing a process of enlarging the input low-resolution image feature amount. Here, the low-resolution image feature amount means, for example, low-
サイズ拡大手段21には、例えば、Deconvolution層(ニューラルネットワークを用いた画像拡大層)を用いてもよい。また、一般的な画像拡大アルゴリズムで用いられるパラメータを固定的に用いてもよい。なお、一般的な画像拡大アルゴリズムとしては、例えば、最近傍補間法やBilinear補間法などを用いてもよい。 As the size enlargement means 21, for example, a Deconvolution layer (an image enlargement layer using a neural network) may be used. Further, the parameters used in a general image enlargement algorithm may be fixedly used. As a general image enlargement algorithm, for example, the nearest neighbor interpolation method or the Bilinear interpolation method may be used.
合成手段22aは、例えば、入力される高解像度モノクロ画像101と、サイズ拡大手段21によって生成された高解像度の画像特徴量とを合成するものである。なお、図2に示すように、カラー情報拡大器10が第1の特徴抽出手段31を備える場合には、合成手段22aは、高解像度モノクロ画像101から抽出された画像特徴量と、サイズ拡大手段21によって生成された高解像度の画像特徴量とを合成する。合成手段22aは、合成した高解像度の画像特徴量を高解像度カラー情報推定手段23に出力する。
合成手段22aは、1chのモノクロ情報と、このモノクロ情報と同じ大きさの2chのカラー情報とを単純に合成し、高解像度の画像特徴量を生成する。合成手段22aには、例えば、ニューラルネットワークのConvolution層を用いてもよい。
The synthesizing means 22a synthesizes, for example, the input high-
The synthesizing means 22a simply synthesizes 1ch monochrome information and 2ch color information having the same size as the monochrome information to generate a high-resolution image feature amount. For the synthesis means 22a, for example, the Convolution layer of the neural network may be used.
高解像度カラー情報推定手段23は、合成手段22aにより合成された高解像度の画像特徴量から、高解像度カラー情報を推定するための学習により、予め決定されたパラメータ群を用いて画像特徴量を抽出し、高解像度カラー情報107を推定するものである。
ここで、学習とは、カラー情報拡大器10を作成するための学習をいう。具体的には、高解像度カラー情報推定手段23を含むカラー情報拡大器10を作成するための学習により高解像度カラー情報推定手段23等の内部パラメータ(パラメータ群)を適切に設定することにより、精度の良い推定器として、高解像度カラー情報推定手段23を作成できる。なお、カラー情報拡大器10を作成するための学習の流れについては後記する。
The high-resolution color information estimation means 23 extracts an image feature amount from a high-resolution image feature amount synthesized by the synthesis means 22a using a predetermined parameter group by learning for estimating high-resolution color information. However, the high-
Here, the learning means learning for creating the
高解像度カラー情報107は、低解像度カラー情報105が拡大されたカラー情報に相当し、高解像度モノクロ画像101に対応した解像度を有する。この高解像度カラー情報107とは、色空間のチャンネルごとのカラー情報であって、例えば、輝度チャンネル以外の2チャンネルについての画像特徴量をいう。
The high-
高解像度カラー情報推定手段23は、その前段からの複数(3以上)の出力(Output)に対応した複数(3以上)のアウトプットチャンネルについての画像特徴量を、色空間における2チャンネルについての画像特徴量に変換し、カラー情報を推定する。
高解像度カラー情報推定手段23には、例えば、ニューラルネットワークのConvolution層を用いてもよい。また、Convolution層(隠れ層)が複数あってもよい。つまり、Convolutionを連続的に繰り返し行ってもよい。
高解像度カラー情報推定手段23の前段からのアウトプットチャンネル数は所望の値に設定できる。例えば合成手段22aからのアウトプットチャンネル数は3chやそれ以上であってもよい。
The high-resolution color information estimation means 23 uses image features for a plurality of (3 or more) output channels corresponding to a plurality of (3 or more) outputs from the previous stage, and an image for two channels in the color space. Convert to feature quantity and estimate color information.
For the high-resolution color information estimation means 23, for example, the Convolution layer of the neural network may be used. In addition, there may be a plurality of Convolution layers (hidden layers). That is, the Convolution may be repeated continuously.
The number of output channels from the previous stage of the high-resolution color information estimation means 23 can be set to a desired value. For example, the number of output channels from the synthesis means 22a may be 3 channels or more.
カラー情報拡大器10は、図2に示すように、第1の特徴抽出手段31、第2の特徴抽出手段32、および第3の特徴抽出手段33のうちの少なくとも1つの特徴抽出手段を備えてもよい。
As shown in FIG. 2, the
第1の特徴抽出手段31は、高解像度モノクロ画像101から、学習により予め決定されたパラメータ群を用いて高解像度の画像特徴量を抽出し、抽出した高解像度の画像特徴量を合成手段22aに出力するものである。なお、学習とは、カラー情報拡大器10を作成するための学習をいう。第1の特徴抽出手段31は、第1の特徴抽出手段31に入力される1chのモノクロ情報を、第1の特徴抽出手段31のアウトプットチャンネルごとに高解像度の画像特徴量にそれぞれ変換する。
The first feature extraction means 31 extracts a high-resolution image feature amount from the high-
第2の特徴抽出手段32は、低解像度カラー情報105から、学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出し、抽出した低解像度の画像特徴量をサイズ拡大手段21に出力するものである。第2の特徴抽出手段32は、第2の特徴抽出手段32に入力される2chのカラー情報を、第2の特徴抽出手段32のアウトプットチャンネルごとに低解像度の画像特徴量にそれぞれ変換する。
The second feature extraction means 32 extracts a low-resolution image feature amount from the low-
第3の特徴抽出手段33は、合成手段22aで生成された高解像度の画像特徴量から、学習により予め決定されたパラメータ群を用いて高解像度の画像特徴量を抽出し、抽出した高解像度の画像特徴量を高解像度カラー情報推定手段23に出力するものである。第3の特徴抽出手段33は、合成手段22aからの複数の出力に対応した複数のアウトプットチャンネル(例えば3ch)についての画像特徴量を、第3の特徴抽出手段33のアウトプットチャンネルごとに高解像度の画像特徴量にそれぞれ変換する。なお、第3の特徴抽出手段33のアウトプットチャンネル数は、例えば64ch、128ch、256ch等に設定される。 The third feature extraction means 33 extracts a high-resolution image feature amount from the high-resolution image feature amount generated by the synthesis means 22a using a parameter group predetermined by learning, and extracts the high-resolution image feature amount. The image feature amount is output to the high-resolution color information estimation means 23. The third feature extraction means 33 increases the amount of image features for a plurality of output channels (for example, 3 channels) corresponding to the plurality of outputs from the synthesis means 22a for each output channel of the third feature extraction means 33. Convert each to the image feature amount of the resolution. The number of output channels of the third feature extraction means 33 is set to, for example, 64ch, 128ch, 256ch, or the like.
各特徴抽出手段31〜33には、例えば、ニューラルネットワークのConvolution層を用いてもよい。また、Convolution層(隠れ層)が複数あってもよい。各特徴抽出手段からのアウトプットチャンネル数は所望の値に設定できる。なお、本明細書では、特徴抽出手段等に入力した画像特徴量をアウトプットチャンネルごとにコンボリューションにかけて得られた画像特徴量のことを、入力から得た特徴という。また、本明細書では、特徴抽出手段等への複数チャンネルからなる入力情報をコンボリューションにかけて、入力した画像特徴量を変換することを、特徴を抽出するという。 For each feature extraction means 31 to 33, for example, a Convolution layer of a neural network may be used. In addition, there may be a plurality of Convolution layers (hidden layers). The number of output channels from each feature extraction means can be set to a desired value. In this specification, the image feature amount obtained by convolving the image feature amount input to the feature extraction means or the like for each output channel is referred to as a feature obtained from the input. Further, in the present specification, the feature extraction is defined as converting the input image feature amount by applying convolution to the input information consisting of a plurality of channels to the feature extraction means or the like.
図2では、高解像度カラー情報推定手段23とは別に第3の特徴抽出手段33を図示したが、高解像度カラー情報推定手段23が内部に第3の特徴抽出手段33を備えることとしてもよい。第3の特徴抽出手段33は、高解像度カラー情報推定手段23が色空間のチャンネルごとの画像特徴量を抽出する前に、色空間の2チャンネルについての画像特徴量を出力するためのパラメータ群とは異なるパラメータ群を用いて、サイズ拡大手段21および合成手段22aの処理により生成された高解像度の画像特徴量から、複数チャンネル(例えば64ch)について高解像度の画像特徴量をそれぞれ生成する。 In FIG. 2, the third feature extraction means 33 is shown separately from the high-resolution color information estimation means 23, but the high-resolution color information estimation means 23 may include the third feature extraction means 33 inside. The third feature extraction means 33 is a parameter group for outputting the image feature amounts for the two channels of the color space before the high-resolution color information estimation means 23 extracts the image feature amount for each channel in the color space. Uses different parameter groups to generate high-resolution image features for a plurality of channels (for example, 64 channels) from the high-resolution image features generated by the processing of the size enlargement means 21 and the compositing means 22a.
(低解像度カラー情報推定器の学習の流れ)
次に、低解像度カラー情報推定器7の学習の流れについて図3を参照して説明する。低解像度カラー情報推定器7の学習の流れは、従来のカラー情報推定器の学習の流れと同様なので簡単に説明する。
低解像度カラー情報推定器7は、以下の手順により、予め用意した学習器から生成する。この学習器は、モノクロ画像を入力し、所定の計算処理を行うことによりカラー情報を推定して出力する。この学習器(図3では、学習が終わった状態の低解像度カラー情報推定器7として表記している)は、内部パラメータ(パラメータ群)を備え、このパラメータを変更することにより、学習器からの出力を調整する。そして、大量の学習用のカラー画像を用意し、以下のステップS1〜ステップS4を十分な回数繰り返す。この学習器がこのパラメータを学習し、適切にパラメータを設定することにより精度の良いカラー情報推定器を作成できる。
(Learning flow of low resolution color information estimator)
Next, the learning flow of the low-resolution
The low-resolution
(ステップS1)
学習用のカラー画像として低解像度カラー画像202を用意し、それを低解像度モノクロ画像203と真のカラー情報204とに分離する。
ここで、低解像度モノクロ画像203は、低解像度の学習用モノクロ画像である。
また、真のカラー情報204は、低解像度の学習用モノクロ画像と同じサイズの正解カラー情報であって、推定されるカラー情報との誤差計算に用いる。
(Step S1)
A low-
Here, the low-
Further, the
(ステップS2)
次に、学習器(低解像度カラー情報推定器7)は、低解像度モノクロ画像203を入力し、現在のパラメータを用いた推定結果のカラー情報として、低解像度カラー情報205を出力する。
(Step S2)
Next, the learner (low-resolution color information estimator 7) inputs the low-
(ステップS3)
次に、誤差計算器40は、低解像度カラー情報205(推定カラー情報)と真のカラー情報204との誤差を計算する。この誤差としては、各画素値の平均二乗誤差などが用いられる。
(Step S3)
Next, the
(ステップS4)
また、誤差計算器40は、計算して得られた誤差から、SGDなどの誤差勾配に基づく最適化手法を用いて、誤差が小さくなるように、学習器(低解像度カラー情報推定器7)のパラメータを調整し、調整されたパラメータを学習器に出力する。なお、SGDについては、次の参考文献に記載されているので説明を省略する。
(参考文献)L. Bottou., ”Stochastic Gradient Descent Tricks.,”Neural Networks: Tricks of the Trade: Springer, 2012.
(Step S4)
Further, the
(Reference) L. Bottou., "Stochastic Gradient Descent Tricks.," Neural Networks: Tricks of the Trade: Springer, 2012.
上記学習により適切に設定されるパラメータとは、図1に示す低解像度カラー情報推定器7が、低解像度モノクロ画像103から画像特徴量を抽出し、低解像度カラー情報105を推定する際に用いるパラメータ群のことをいう。つまり、低解像度カラー情報105を推定する際に用いるパラメータ群は、学習器に入力される低解像度の学習用モノクロ画像から所定演算により推定される低解像度のカラー情報と、学習用モノクロ画像と同じサイズの正解カラー情報と、の対応付けを学習することにより決定する。
The parameters appropriately set by the above learning are the parameters used when the low-resolution
(カラー情報拡大器の学習の流れ)
次に、カラー情報拡大器10の学習の流れについて図4を参照して説明する。
カラー情報拡大器10は、以下の手順により、予め用意した学習器から生成する。この学習器は、高解像度モノクロ画像301および低解像度カラー情報305を入力し、所定の計算処理を行うことにより高解像度カラー情報307を推定して出力する。この学習器(図4では、学習が終わった状態のカラー情報拡大器10として表記している)は、内部パラメータ(パラメータ群)を備え、このパラメータを変更することにより、学習器からの出力を調整する。そして、大量の学習用のカラー画像を用意し、以下のステップS10〜ステップS14を十分な回数繰り返す。この学習器がこのパラメータを学習し、適切にパラメータを設定することにより精度の良いカラー情報拡大器を作成できる。
(Learning flow of color information magnifier)
Next, the learning flow of the
The
(ステップS10)
学習用のカラー画像として高解像度カラー画像309を用意し、それを縮小器5によって単純に縮小して低解像度カラー情報305とする。
ここで、高解像度カラー画像309としては、古い白黒フィルムをカラー化したものも使用する。この場合、例えば、過去の白黒フィルムや写真からスキャンによりデジタル化したモノクロ画像に対して、人手で色付けしたデジタルデータとする。また、学習用の高解像度カラー画像309を大量に準備するために、古い白黒フィルム以外に、カラー撮影された新しい4K等のカラー画像を用いてもよい。
(Step S10)
A high-
Here, as the high-
(ステップS11)
次に、高解像度カラー画像309を、高解像度モノクロ画像301と高解像度カラー情報(真のカラー情報)304とに分離する。
ここで、高解像度モノクロ画像301は、高解像度の学習用モノクロ画像である。
また、高解像度カラー情報304は、高解像度の学習用モノクロ画像と同じサイズの正解カラー情報であって、推定される高解像度カラー情報との誤差計算に用いる。
(Step S11)
Next, the high-
Here, the high-
Further, the high-
(ステップS12)
次に、学習器(カラー情報拡大器10)は、高解像度モノクロ画像301を入力し、現在のパラメータを用いた推定結果のカラー情報として、高解像度カラー情報307を出力する。
(Step S12)
Next, the learning device (color information magnifier 10) inputs the high-
(ステップS13)
次に、誤差計算器40は、高解像度カラー情報307(推定カラー情報)と高解像度カラー情報(真のカラー情報)304との誤差を計算する。この誤差としては、前記した手法と同様の各画素値の平均二乗誤差や交差エントロピーなどを用いる。
(Step S13)
Next, the
(ステップS14)
また、誤差計算器40は、計算して得られた誤差から、SGDなどの誤差勾配に基づく最適化手法を用いて、誤差が小さくなるように、学習器(カラー情報拡大器10)のパラメータを調整し、調整されたパラメータを学習器に出力する。なお、誤差計算器40は、学習のときに付加されるが、学習後には接続を解除する。
(Step S14)
Further, the
上記学習により適切に設定されるパラメータは、図2に示すカラー情報拡大器10が高解像度カラー情報107を推定する際に用いるパラメータ群のことをいう。例えば、高解像度カラー情報推定手段23が、合成手段22aで生成された高解像度の画像特徴量から、色空間のチャンネルごとの画像特徴量を抽出する際にも用いる。
なお、合成手段22aで生成された高解像度の画像特徴量には、高解像度モノクロ画像101の情報(モノクロ情報)と低解像度カラー情報105とに起因した情報を含む。
つまり、高解像度カラー情報107を推定する際に用いるパラメータ群は、学習器にそれぞれ入力される低解像度の学習用カラー情報および高解像度の学習用モノクロ画像から所定演算により推定される拡大された高解像度のカラー情報と、学習用モノクロ画像と同じサイズの正解カラー情報と、の対応付けを学習することにより決定される。
The parameters appropriately set by the above learning refer to a group of parameters used by the
The high-resolution image feature amount generated by the compositing means 22a includes information derived from the information (monochrome information) of the high-
That is, the parameter group used when estimating the high-
なお、カラー情報拡大器を学習により作るとき、例えば図2の構成のカラー情報拡大器10を作製したいのならば、図2と同じ構成のカラー情報拡大器10を学習に用いる。また、カラー情報拡大器を学習により作るとき、少なくとも1つの特徴抽出手段を省略したカラー情報拡大器を作製したいのならば、特徴抽出手段を省略したカラー情報拡大器を学習に用いればよい。
When the
本実施形態に係るカラー情報拡大器10によれば、高解像度モノクロ画像101(モノクロ情報)を明示的に用いているので、推定されるカラー情報のぼけを低減し、低解像度カラー情報105を精度よく拡大できる。このカラー情報拡大器10は、例えば4Kまたは8K等の高解像度モノクロ画像101への自動色付けをする際に用いるカラー情報を推定するカラー情報推定器3に組み込むことができる。また、本実施形態に係るカラー情報推定器3は、高解像度モノクロ画像101への自動色付けをする際に用いるカラー情報を推定する精度を向上させることができる。
According to the
また、高解像度のモノクロ画像のデジタルデータは、例えば物理的フィルムからスキャンすることにより得られるが、従来の色付け技術では、このような高解像度のモノクロ画像に直接色づけすることはできなかった。これに対して、カラー情報推定器3を備える自動色付け装置1は、4K等の高解像度のモノクロ画像に対する自然な色付けを可能とすることができる。 Further, digital data of a high-resolution monochrome image can be obtained by scanning, for example, from a physical film, but conventional coloring techniques cannot directly color such a high-resolution monochrome image. On the other hand, the automatic coloring device 1 provided with the color information estimator 3 can enable natural coloring of a high-resolution monochrome image such as 4K.
また、例えば、写真や物理的フィルムからスキャンしたモノクロ画像のデータは存在するが、写真や物理的フィルムが消失してデータしか残っていない状況においても、カラー情報推定器3を備える自動色付け装置1は、当時の色情報を推定して、モノクロ画像に色付けすることができる。 Further, for example, even in a situation where there is data of a monochrome image scanned from a photograph or a physical film, but the photograph or the physical film disappears and only the data remains, the automatic coloring device 1 provided with the color information estimator 3 Can estimate the color information at that time and color the monochrome image.
さらに、例えば、低解像度カラー情報105が由来するところのカラー撮影された画像では、モノクロ情報チャンネル(色空間における輝度チャンネル)上で境界がはっきりしている領域は、カラー情報チャンネル(例えば、輝度チャンネル以外の2チャンネル)上でも境界がはっきりしているケースが多い。ここで、境界とは、例えばオブジェクトの輪郭線(オブジェクトとその背景との境目)等の線で表される部分である。
そのため、カラー情報拡大器10のように、高解像度モノクロ画像101を用いて、低解像度カラー情報105を拡大すると、特に、高解像度モノクロ情報チャンネル(高解像度モノクロ画像101)上で境界がはっきりしている領域におけるカラー情報のぼけが低減される効果を奏する。
Further, for example, in a color-photographed image from which the low-
Therefore, when the low-
(カラー情報拡大器の第2実施形態)
次に、カラー情報拡大器の第2実施形態について図5を参照(適宜図2参照)して説明する。図5に示すカラー情報拡大器10Aは、サイズ拡大手段21の前段に合成手段22bを備えている点が、図2に示すカラー情報拡大器10と相違している。なお、カラー情報拡大器10Aにおいて、図2に示すカラー情報拡大器10と同じ構成には同じ符号を付して説明を省略する。
(Second Embodiment of Color Information Enlarger)
Next, a second embodiment of the color information magnifier will be described with reference to FIG. 5 (see FIG. 2 as appropriate). The color information magnifier 10A shown in FIG. 5 is different from the
カラー情報拡大器10Aは、特徴抽出手段34と、合成手段22bと、サイズ拡大手段21と、高解像度カラー情報推定手段23と、を備えている。なお、図5のカラー情報拡大器10Aは、特徴抽出手段35,36を備える形態で図示したが、例えば、特徴抽出手段35,36を省略した構成とすることもできる。以下では、便宜的に、特徴抽出手段について、第2の特徴抽出手段35および第3の特徴抽出手段36のように呼称する場合もある。このカラー情報拡大器10Aは、例えばニューラルネットワークで構成できる。 The color information expander 10A includes a feature extraction means 34, a synthesis means 22b, a size enlargement means 21, and a high-resolution color information estimation means 23. Although the color information magnifier 10A of FIG. 5 is shown in a form including the feature extraction means 35 and 36, for example, the feature extraction means 35 and 36 may be omitted. In the following, for convenience, the feature extraction means may be referred to as the second feature extraction means 35 and the third feature extraction means 36. The color information magnifier 10A can be configured by, for example, a neural network.
特徴抽出手段34は、推定を行うための学習により予め決定されたパラメータ群を用いて、高解像度モノクロ画像101から低解像度の画像特徴量を抽出し、抽出した低解像度の画像特徴量を合成手段22bに出力するものである。
The feature extraction means 34 extracts a low-resolution image feature amount from the high-
合成手段22bは、例えば、低解像度カラー情報105と、特徴抽出手段34により抽出された低解像度の画像特徴量と、を合成し、低解像度の画像特徴量を生成するものである。なお、図5に示すように、カラー情報拡大器10Aが第2の特徴抽出手段35を備える場合には、合成手段22bは、低解像度カラー情報105から抽出された低解像度の画像特徴量と、特徴抽出手段34により抽出された低解像度の画像特徴量とを合成する。合成手段22bは、合成した低解像度の画像特徴量をサイズ拡大手段21に出力する。
合成手段22bは、2chの低解像度のカラー情報と、この低解像度のカラー情報と同じ大きさの1chのモノクロ情報と、を単純に合成し、低解像度の画像特徴量を生成する。合成手段22bには、例えば、ニューラルネットワークのConvolution層を用いてもよい。
The synthesizing means 22b, for example, synthesizes the low-
The compositing means 22b simply synthesizes 2ch low-resolution color information and 1ch monochrome information having the same size as the low-resolution color information to generate a low-resolution image feature amount. For the synthesis means 22b, for example, the Convolution layer of the neural network may be used.
本実施形態では、サイズ拡大手段21は、当該サイズ拡大手段21により生成した高解像度の画像特徴量を、例えば高解像度カラー情報推定手段23に出力する。
本実施形態では、高解像度カラー情報推定手段23は、サイズ拡大手段21で生成された高解像度の画像特徴量から高解像度カラー情報107を推定する。
In the present embodiment, the size enlargement means 21 outputs the high resolution image feature amount generated by the size enlargement means 21 to, for example, the high resolution color information estimation means 23.
In the present embodiment, the high-resolution color information estimation means 23 estimates the high-
カラー情報拡大器10Aは、図5に示すように、特徴抽出手段34以外に、第2の特徴抽出手段35と、第3の特徴抽出手段36と、のうちの少なくとも1つの特徴抽出手段をさらに備えてもよい。 As shown in FIG. 5, the color information magnifier 10A further includes at least one feature extraction means of the second feature extraction means 35 and the third feature extraction means 36, in addition to the feature extraction means 34. You may prepare.
第2の特徴抽出手段35は、低解像度カラー情報105から、学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出し、抽出した低解像度の画像特徴量を合成手段22bに出力するものである。なお、この第2の特徴抽出手段35は、抽出された低解像度の画像特徴量の出力先以外は、図2に示す第2の特徴抽出手段32と同じである。
The second feature extraction means 35 extracts a low-resolution image feature amount from the low-
第3の特徴抽出手段36は、サイズ拡大手段21により生成された高解像度の画像特徴量から、学習により予め決定されたパラメータ群を用いて高解像度の画像特徴量を抽出し、抽出した高解像度の画像特徴量を高解像度カラー情報推定手段23に出力するものである。なお、この第3の特徴抽出手段36は、高解像度の画像特徴量を受け取るための入力先以外は、図2に示す第3の特徴抽出手段33と同じである。 The third feature extraction means 36 extracts a high-resolution image feature amount from the high-resolution image feature amount generated by the size enlargement means 21 using a parameter group predetermined by learning, and extracts the high-resolution image feature amount. The image feature amount of the above is output to the high resolution color information estimation means 23. The third feature extraction means 36 is the same as the third feature extraction means 33 shown in FIG. 2, except for an input destination for receiving a high-resolution image feature amount.
図5では、高解像度カラー情報推定手段23とは別に第3の特徴抽出手段36を図示したが、高解像度カラー情報推定手段23が内部に第3の特徴抽出手段36を備えることとしてもよい。例えば、各特徴抽出手段34〜36には、ニューラルネットワークのConvolution層を用いるようにしてもよい。 In FIG. 5, the third feature extraction means 36 is shown separately from the high-resolution color information estimation means 23, but the high-resolution color information estimation means 23 may include the third feature extraction means 36 inside. For example, the Convolution layer of the neural network may be used for each of the feature extraction means 34 to 36.
カラー情報拡大器10Aの学習の流れは、カラー情報拡大器10の学習の流れと同様なので説明を省略する。なお、カラー情報拡大器を学習により作るとき、図5の構成のカラー情報拡大器10Aを作製したいのならば、図5の構成のカラー情報拡大器10Aを学習に用いればよい。また、カラー情報拡大器を学習により作るとき、少なくとも1つの特徴抽出手段を省略したカラー情報拡大器を作製したいのならば、特徴抽出手段を省略したカラー情報拡大器を学習に用いればよい。
Since the learning flow of the color information magnifier 10A is the same as the learning flow of the
第2実施形態に係るカラー情報拡大器10Aによれば、第1実施形態に係るカラー情報拡大器10と同様に、高解像度モノクロ画像101(モノクロ情報)を明示的に用いているので、推定されるカラー情報のぼけを低減し、低解像度カラー情報105を精度よく拡大できる。
According to the color information magnifier 10A according to the second embodiment, it is estimated because the high resolution monochrome image 101 (monochrome information) is explicitly used as in the
(カラー情報拡大器の第3実施形態)
次に、カラー情報拡大器の第3実施形態について図6を参照(適宜図2および図5参照)して説明する。なお、カラー情報拡大器10Bにおいて、カラー情報拡大器10,10Aと同じ構成には同じ符号を付して説明を省略する。
(Third Embodiment of the color information magnifier)
Next, a third embodiment of the color information magnifier will be described with reference to FIG. 6 (see FIGS. 2 and 5 as appropriate). In the color information magnifier 10B, the same components as those of the
カラー情報拡大器10Bは、特徴抽出手段34と、合成手段22bと、サイズ拡大手段21と、合成手段22aと、高解像度カラー情報推定手段23と、を備えている。なお、図6のカラー情報拡大器10Bは、第1の特徴抽出手段31と、第2の特徴抽出手段35と、第3の特徴抽出手段33と、を備える形態で図示したが、例えば、特徴抽出手段31,35,33を省略した構成とすることもできる。このカラー情報拡大器10Bは、例えばニューラルネットワークで構成できる。 The color information expander 10B includes a feature extraction means 34, a synthesis means 22b, a size enlargement means 21, a synthesis means 22a, and a high-resolution color information estimation means 23. The color information magnifier 10B of FIG. 6 is shown in a form including a first feature extraction means 31, a second feature extraction means 35, and a third feature extraction means 33. The extraction means 31, 35, 33 may be omitted. The color information magnifier 10B can be configured by, for example, a neural network.
図6に示すカラー情報拡大器10Bは、カラー情報拡大器10,10Aを混合して、サイズ拡大手段21の前後に合成手段22b,22aを備えるようにしたものなので、これ以上の説明については省略する。なお、カラー情報拡大器10Bの学習の流れも、カラー情報拡大器10の学習の流れと同様なので説明を省略する。
Since the color information magnifier 10B shown in FIG. 6 is a mixture of the
第3実施形態に係るカラー情報拡大器10Bによれば、第1実施形態に係るカラー情報拡大器10と同様に、高解像度モノクロ画像101(モノクロ情報)を明示的に用いているので、推定されるカラー情報のぼけを低減し、低解像度カラー情報105を精度よく拡大できる。
According to the color information magnifier 10B according to the third embodiment, it is estimated because the high resolution monochrome image 101 (monochrome information) is explicitly used as in the
(カラー情報拡大器の第4実施形態)
次に、カラー情報拡大器の第4実施形態について図7を参照(適宜図1および図2参照)して説明する。なお、カラー情報拡大器10Cにおいて、カラー情報拡大器10と同じ構成には同じ符号を付して説明を省略する。
ここでは、第1解像度の画像の大きさをN(=3840×2160ピクセル)とすると共に、第2解像度の画像の大きさをN/8(=480×270ピクセル)として説明する。つまり、カラー情報拡大器10Cに入力する高解像度モノクロ画像101は、解像度=Nのモノクロ画像であるものとする。また、カラー情報拡大器10Cに入力する低解像度カラー情報105は、解像度=N/8のカラー情報であるものとする。
(Fourth Embodiment of Color Information Enlarger)
Next, a fourth embodiment of the color information magnifier will be described with reference to FIG. 7 (see FIGS. 1 and 2 as appropriate). In the color information magnifier 10C, the same reference numerals are given to the same configurations as those of the
Here, the size of the image of the first resolution is N (= 3840 × 2160 pixels), and the size of the image of the second resolution is N / 8 (= 480 × 270 pixels). That is, it is assumed that the high-
カラー情報拡大器10Cは、カラー情報拡大器10を再帰的に連結する構造を用いた再帰的カラー情報拡大器である。ここでは、カラー情報拡大器10は、拡大率が2であるものとし、3つのカラー情報拡大器10を再帰的に連結する。
The color information magnifier 10C is a recursive color information magnifier using a structure in which the color information magnifiers 10 are recursively connected. Here, it is assumed that the
カラー情報拡大器10Cは、サイズ縮小手段50を備えている。
サイズ縮小手段50は、高解像度モノクロ画像101を、所定の縮小率で縮小する処理を再帰的に行うことにより第1解像度よりも小さく第2解像度よりも大きな解像度を持った複数レベルの解像度のモノクロ画像を生成する。
The color information magnifier 10C includes a
The size reduction means 50 recursively reduces the high-
サイズ縮小手段50は、高解像度モノクロ画像101(解像度=Nのモノクロ画像)を縮小してモノクロ画像111を生成する。このモノクロ画像111は、解像度=N/2のモノクロ画像である。
さらに、サイズ縮小手段50は、モノクロ画像111(解像度=N/2のモノクロ画像)を縮小してモノクロ画像121を生成する。このモノクロ画像121は、解像度=N/4のモノクロ画像である。また、モノクロ画像121は、この場合にサイズ縮小手段50で生成される最小レベルの解像度のモノクロ画像である。
The size reduction means 50 reduces the high-resolution monochrome image 101 (monochrome image with resolution = N) to generate the
Further, the
カラー情報拡大器10Cに入力される低解像度カラー情報105と、サイズ縮小手段50で生成される最小レベルの解像度のモノクロ画像121と、を入力とするカラー情報拡大器10は、最終的に、色空間のチャンネルごとの推定カラー情報として、低解像度カラー情報105が拡大されたカラー情報127を出力する。ここでは、カラー情報拡大器10は拡大率が2であるので、このカラー情報127は、解像度=N/4のカラー情報となる。
The
このカラー情報127と、サイズ縮小手段50で生成されたモノクロ画像111と、を入力とするカラー情報拡大器10は、最終的に、色空間のチャンネルごとの推定カラー情報として、カラー情報127が拡大されたカラー情報117を出力する。ここでは、カラー情報拡大器10は拡大率が2であるので、このカラー情報117は、解像度=N/2のカラー情報となる。
The
このカラー情報117と、カラー情報拡大器10Cに入力される高解像度モノクロ画像101と、を入力とするカラー情報拡大器10は、最終的に、色空間のチャンネルごとの推定カラー情報として、カラー情報117が拡大された高解像度カラー情報107を出力する。ここでは、カラー情報拡大器10は拡大率が2であるので、この高解像度カラー情報107は、解像度=Nのカラー情報となる。こうして、カラー情報拡大器10Cに入力される低解像度カラー情報105は、23倍(=8倍)に拡大されて、高解像度カラー情報107として出力されることになる。
The
前記したように、カラー情報拡大器10Cは、低解像度カラー情報105と、生成される最小レベルの解像度のモノクロ画像121とを初期値として、推定されたカラー情報および当該カラー情報よりも大きな解像度を持ったモノクロ画像から当該モノクロ画像と同じ解像度を持ったカラー情報を推定する処理を再帰的に行うことにより第1解像度を持った高解像度カラー情報107を推定する処理を行う。
As described above, the color information magnifier 10C uses the low-
カラー情報拡大器10Cは、カラー情報拡大器10を再帰的に連結する構造を用いた再帰的カラー情報拡大器であるので、拡大率がM(例えばM=2)であるカラー情報拡大器10を1つ作るだけで、Mの累乗数倍の拡大器を作成できる。
例えば最終的な拡大率を23倍(=8倍)とするカラー情報拡大器10Cを学習により作るときには、拡大率を2倍とするカラー情報拡大器10を学習に用いればよい。これは、再帰的カラー情報拡大器としないで8倍の拡大を実現しようとするときに決定すべきパラメータ数を約1/3に低減させる効果を奏することができる。
よって、カラー情報拡大器10Cによれば、予め推定した低解像度カラー情報105の解像度がN/8(480×270ピクセル)である場合に、解像度がN(=3840×2160ピクセル)に拡大された高解像度カラー情報107を容易に取得することが可能となる。
Since the color information magnifier 10C is a recursive color information magnifier using a structure in which the color information magnifiers 10 are recursively connected, the
For example the final magnification when making the learning color information expander 10C for two 3-fold (= 8 times) may be used
Therefore, according to the color information magnifier 10C, when the resolution of the low-
なお、カラー情報拡大器10Cは、カラー情報拡大器10の代わりに、カラー情報拡大器10A,10Bを再帰的に連結するようにしてもよい。また、カラー情報拡大器10Cによる最終的な拡大率は、8倍に限らず、4倍や16倍等であってもよい。
The color information magnifier 10C may recursively connect the color information magnifiers 10A and 10B instead of the
また、カラー情報拡大器10Cにおいて、例えば3つのカラー情報拡大器10を連結する代わりに、1つのカラー情報拡大器10を異なるタイミングで作動させることにより、3つのカラー情報拡大器10の働きをさせるようにしてもよい。
同様に、カラー情報拡大器10Cにおいて、例えば2つのサイズ縮小手段50を連結する代わりに、1つのサイズ縮小手段50を異なるタイミングで作動させることにより、2つのサイズ縮小手段50の働きをさせるようにしてもよい。
Further, in the color information magnifier 10C, for example, instead of connecting the three color information magnifiers 10, one
Similarly, in the color information magnifier 10C, for example, instead of connecting the two size reduction means 50, one size reduction means 50 is operated at different timings so that the two size reduction means 50 work. You may.
[カラー情報推定器の第2実施形態]
次に、本発明の第2実施形態に係るカラー情報推定器について図8を参照(適宜図1参照)して説明する。カラー情報推定器3Bは、図8に示すように、低解像度カラー情報推定器7Bと、カラー情報拡大器10Dと、を備えている。
[Second Embodiment of Color Information Estimator]
Next, the color information estimator according to the second embodiment of the present invention will be described with reference to FIG. 8 (see FIG. 1 as appropriate). As shown in FIG. 8, the color information estimator 3B includes a low-resolution
低解像度カラー情報推定器7Bは、図1に示す低解像度カラー情報推定器7と同様に低解像度カラー情報105を推定するものである。低解像度カラー情報推定器7Bは、推定した低解像度カラー情報105をカラー情報拡大器10Dに出力する。この低解像度カラー情報推定器7Bは、高解像度モノクロ画像101を入力として用いる点が図1に示す低解像度カラー情報推定器7と異なっているが、従来公知のカラー情報推定器であるので、これ以上の説明を省略する。
The low-resolution
カラー情報拡大器10Dは、低解像度カラー情報推定器7Bにより推定された低解像度カラー情報105と、低解像度カラー情報推定器7Bをバイパスして入力される高解像度モノクロ画像101と、を用いて、高解像度カラー情報107を推定する処理を行うものである。カラー情報拡大器10Dは、図8に示すように、サイズ拡大手段21と、合成手段22aと、第3の特徴抽出手段33と、高解像度カラー情報推定手段23と、を備えている。なお、カラー情報拡大器10Dにおいて、図2に示すカラー情報拡大器10と同じ構成には同じ符号を付して説明を省略する。
The color information magnifier 10D uses the low-
合成手段22aは、低解像度カラー情報推定器7Bに入力される高解像度モノクロ画像101と同じモノクロ画像と、サイズ拡大手段21により生成された高解像度の画像特徴量とを合成する。ここで、低解像度カラー情報推定器7Bに入力される高解像度モノクロ画像101と同じモノクロ画像は、バイパス経路401を介して、カラー情報拡大器10Dの合成手段22aに入力される。これにより、カラー情報拡大器10Dは、低解像度カラー情報105から高解像度カラー情報107を作成する際に、高解像度モノクロ画像101(モノクロ情報)を直接使用できる。
The synthesizing means 22a synthesizes the same monochrome image as the high-
なお、仮にバイパス経路401からの高解像度モノクロ画像101の入力がない比較例のカラー情報推定器を想定した場合、このような比較例であっても、カラー情報の拡大機能を持たせることは可能と考えられる。その理由は、高解像度モノクロ画像101の持つ情報は、低解像度カラー情報推定器7Bを通過する過程で変形しているが、理論的には、バイパスがなくてもカラー情報拡大器10Dに伝わっているからである。
これに対して、第2実施形態に係るカラー情報推定器3Bは、バイパス経路401からの高解像度モノクロ画像101の入力が存在することにより、カラー情報拡大器10Dに相当する箇所の学習をする際に、高解像モノクロ情報が、このような比較例よりも強い影響を持つ。そのため、カラー情報推定器3Bは、高解像モノクロ情報チャンネル(色空間における輝度チャンネルの高解像の情報)上で境界がはっきりしている領域では、ぼけがないようなカラー情報の拡大をする学習が、上述した比較例よりも促進されることが実験的にも分かっている。
Assuming that the color information estimator of the comparative example in which the high-
On the other hand, the color information estimator 3B according to the second embodiment learns a portion corresponding to the color information magnifier 10D due to the presence of the input of the high-
[カラー情報推定器の第3実施形態]
次に、本発明の第3実施形態に係るカラー情報推定器について図9を参照(適宜図7および図8参照)して説明する。カラー情報推定器3Cは、図9に示すように、低解像度カラー情報推定器7Bと、カラー情報拡大器10Eと、サイズ縮小手段50と、を備えている。ここでは、カラー情報推定器3Cに入力する高解像度モノクロ画像101は、解像度=N(=3840×2160ピクセル)のモノクロ画像であるものとする。また、低解像度カラー情報推定器7Bが出力するカラー情報は、解像度=N/8のカラー情報であるものとする。
[Third Embodiment of the color information estimator]
Next, the color information estimator according to the third embodiment of the present invention will be described with reference to FIG. 9 (see FIGS. 7 and 8 as appropriate). As shown in FIG. 9, the color information estimator 3C includes a low-resolution
カラー情報推定器3Cにおいて、図7のカラー情報拡大器10Cと同じ構成には同じ符号を付して説明を省略する。サイズ縮小手段50は、図7のカラー情報拡大器10Cにおけるサイズ縮小手段50と同様に、モノクロ画像111と、このモノクロ画像121とを生成する。
In the color information estimator 3C, the same components as those of the color information magnifier 10C of FIG. 7 are designated by the same reference numerals, and the description thereof will be omitted. The size reduction means 50 generates a
カラー情報拡大器10Eは、図9に示すように、サイズ拡大手段21,21b,21cと、合成手段22a,22b,22cと、第3の特徴抽出手段33と、高解像度カラー情報推定手段23と、を備えている。なお、カラー情報拡大器10Eにおいて、図8に示すカラー情報拡大器10Dと同じ構成には同じ符号を付して説明を省略する。 As shown in FIG. 9, the color information expander 10E includes size enlargement means 21,21b, 21c, synthesis means 22a, 22b, 22c, a third feature extraction means 33, and high-resolution color information estimation means 23. , Is equipped. In the color information magnifier 10E, the same reference numerals are given to the same configurations as the color information magnifier 10D shown in FIG. 8, and the description thereof will be omitted.
各サイズ拡大手段21,21b,21cは、同じ機能を有し、ここでは、入力される低解像度の画像特徴量を、一般的な画像拡大アルゴリズムで例えば2倍に拡大する処理を行うことにより高解像度の画像特徴量を生成する。
各合成手段22a,22b,22cは、同じ機能を有し、ここでは、別々の経路から入力される各画像特徴量を単純に合成し、アウトプットチャンネル数を増加させた画像特徴量を生成する。
The size enlargement means 21, 21b, and 21c have the same function, and here, the input low-resolution image feature amount is increased by performing a process of magnifying the input low-resolution image feature amount by, for example, twice by a general image enlargement algorithm. Generate image features with resolution.
Each of the compositing means 22a, 22b, and 22c has the same function, and here, each image feature amount input from a different route is simply combined to generate an image feature amount in which the number of output channels is increased. ..
このような構成のカラー情報推定器3Cは、サイズ縮小手段50を備えることにより、推定された低解像度のカラー情報を拡大する拡大率を、比較的大きな値にすることができる。
具体的は、カラー情報推定器3Cにおいて、サイズ拡大手段21cは、低解像度カラー情報推定器7Bが出力する2chのカラー情報(解像度=N/8)を拡大することにより、2chのカラー情報(解像度=N/4)を生成する。
そして、合成手段22cは、モノクロ画像121(解像度=N/4)と、サイズ拡大手段21cによって生成されたカラー情報(解像度=N/4)と、を合成することにより、3chの画像特徴量(解像度=N/4)を生成する。ここで、合成手段22cは、モノクロ画像121(解像度=N/4)を、バイパス経路403を介して、合成手段22cに入力する。
The color information estimator 3C having such a configuration is provided with the size reduction means 50, so that the enlargement ratio for enlarging the estimated low-resolution color information can be set to a relatively large value.
Specifically, in the color information estimator 3C, the
Then, the synthesizing means 22c synthesizes the monochrome image 121 (resolution = N / 4) and the color information (resolution = N / 4) generated by the
そして、サイズ拡大手段21bは、合成手段22cが生成した3chの画像特徴量(解像度=N/4)を拡大し、3chの画像特徴量(解像度=N/2)を生成する。そして、合成手段22bは、モノクロ画像111(解像度=N/2)と、サイズ拡大手段21bが生成した3chの画像特徴量(解像度=N/2)とを合成することにより、4chの画像特徴量(解像度=N/2)を生成する。ここで、サイズ拡大手段21bは、モノクロ画像111(解像度=N/2)を、バイパス経路402を介して、合成手段22bに入力する。
Then, the
そして、サイズ拡大手段21は、合成手段22bが生成した4chの画像特徴量(解像度=N/2)を拡大し、4chの画像特徴量(解像度=N)を生成する。
そして、合成手段22aは、高解像度モノクロ画像101(解像度=N)と、サイズ拡大手段21が生成した4chの画像特徴量(解像度=N)とを合成し、5chの画像特徴量(解像度=N)を生成する。ここで、サイズ拡大手段21は、高解像度モノクロ画像101(解像度=N)を、バイパス経路401を介して、合成手段22aに入力する。
Then, the size expanding means 21 enlarges the 4ch image feature amount (resolution = N / 2) generated by the compositing means 22b to generate the 4ch image feature amount (resolution = N).
Then, the synthesizing means 22a synthesizes the high-resolution monochrome image 101 (resolution = N) and the 4ch image feature amount (resolution = N) generated by the size expanding means 21, and the 5ch image feature amount (resolution = N). ) Is generated. Here, the size enlargement means 21 inputs the high-resolution monochrome image 101 (resolution = N) to the synthesis means 22a via the
そして、第3の特徴抽出手段33は、合成手段22aが生成した5chの画像特徴量(解像度=N)を、例えば64chの画像特徴量(解像度=N)に変換する。
最後に、高解像度カラー情報推定手段23は、例えば64chの画像特徴量(解像度=N)を、色空間における2チャンネルのカラー情報(解像度=N)に変換する。これにより、高解像度カラー情報107が生成される。
Then, the third feature extraction means 33 converts the 5ch image feature amount (resolution = N) generated by the synthesis means 22a into, for example, 64ch image feature amount (resolution = N).
Finally, the high-resolution color information estimation means 23 converts, for example, an image feature amount (resolution = N) of 64 channels into color information (resolution = N) of two channels in the color space. As a result, high-
以上、本発明の各実施形態について説明したが、本発明はこれらに限定されず、その趣旨を変えない範囲で実施することができる。例えば、本発明におけるカラー情報は、色空間における輝度チャンネル以外の2チャンネルとしたが、それ以外であっても取り扱うことが可能である。一例としては、RGB色空間における3チャンネルすべてをカラー情報として用いてもよい。 Although each embodiment of the present invention has been described above, the present invention is not limited to these and can be carried out without changing the gist thereof. For example, the color information in the present invention is set to two channels other than the luminance channel in the color space, but other channels can be handled. As an example, all three channels in the RGB color space may be used as color information.
また、カラー情報拡大器やカラー情報推定器に対して入力されるカラー情報の形式と、出力するカラー情報の形式とは一致していなくても構わない。一例としては、カラー情報拡大器10に、高解像度モノクロ画像101としてLab色空間におけるLチャンネルを入力すると共に、低解像度カラー情報105としてLab色空間におけるabチャンネルを入力した場合、高解像度カラー情報107としてRGB色空間におけるRGBチャンネルを出力することもできる。
Further, the format of the color information input to the color information magnifier and the color information estimator and the format of the output color information do not have to match. As an example, when the L channel in the Lab color space is input to the
また、カラー情報拡大器10のすべての構成要素をニューラルネットワークで構成する代わりに、サイズ拡大手段21にBilinear補間法など一般的な画像拡大アルゴリズムで用いられるパラメータを固定的に用いると共に、その他の構成要素をニューラルネットワークで構成するようにしてもよい。この場合、カラー情報拡大器10のすべての構成要素をニューラルネットワークで構成した場合と比べると、良好となることが、実験的に分かっている。
また、カラー情報拡大器10は、ニューラルネットワークによる学習に限らず、他の機械学習技術を用いて構成することもできる。
Further, instead of configuring all the components of the
Further, the
また、前記各実施形態では、カラー情報拡大器10,10A〜10Dとして説明したが、各装置の構成の処理を可能にするように、汎用または特殊なコンピュータ言語で記述したカラー情報拡大プログラムとみなすことも可能である。
また、前記各実施形態では、カラー情報推定器3,3Bとして説明したが、各装置の構成の処理を可能にするように、汎用または特殊なコンピュータ言語で記述したカラー情報推定プログラムとみなすことも可能である。
Further, in each of the above-described embodiments, the color information magnifiers 10, 10A to 10D have been described, but they are regarded as a color information magnifying program described in a general-purpose or special computer language so as to enable processing of the configuration of each device. It is also possible.
Further, in each of the above-described embodiments, the color information estimators 3 and 3B have been described, but they can also be regarded as a color information estimation program written in a general-purpose or special computer language so as to enable processing of the configuration of each device. It is possible.
実施形態に係るカラー情報拡大器の性能を確かめるために、実験を行った。図10は、実験に用いたカラー情報拡大器を模式的に示す説明図である。図10に示すように、実験に用いたカラー情報拡大器は、図8に示すカラー情報拡大器10Dと同じ構成である。 An experiment was conducted to confirm the performance of the color information magnifier according to the embodiment. FIG. 10 is an explanatory diagram schematically showing the color information magnifier used in the experiment. As shown in FIG. 10, the color information magnifier used in the experiment has the same configuration as the color information magnifier 10D shown in FIG.
高解像度モノクロ画像101は、Lab色空間におけるLチャンネルに相当する1chのモノクロ情報(画像特徴量)である。図10では、1枚の画像として模式的に示した。
また、実験では、高解像度モノクロ画像101が960×540ピクセルの画像であるものとした。なお、高解像度モノクロ画像101における画素値をベクトルで表現すると、一般には次の式(1)で示される。式(1)で示すベクトルx1は、高解像度モノクロ画像101の画素数と同様に518400個の成分を持つ。
The high-
Further, in the experiment, it was assumed that the high-
低解像度カラー情報105は、Lab色空間におけるabチャンネルに相当する2chのカラー情報(画像特徴量)である。図10では、2枚の小さな画像として模式的に示した。
また、実験では、低解像度カラー情報105の解像度が480×270ピクセルであるものとした。そして、実験では、サイズ拡大手段21による拡大率を2(垂直方向2倍×水平方向2倍)とした。図10では、2枚の拡大された画像として模式的に示した。
The low-
Further, in the experiment, it was assumed that the resolution of the low
これら拡大された2chのカラー情報における画素値をそれぞれベクトルで表現すると、一般には次の式(2)および式(3)で示される。それぞれのベクトルx2,x3は、前記した式(1)で示されるベクトルx1と同数個の成分を持っている。 When the pixel values in the enlarged 2ch color information are expressed by vectors, they are generally expressed by the following equations (2) and (3). Each of the vectors x 2 and x 3 has the same number of components as the vector x 1 represented by the above equation (1).
合成手段22aは、各ベクトルx1、x2、x3を入力として、それらのベクトル成分を各画素に対応させて並べて、3chの情報とする。図10では、3枚の画像として模式的に示した。なお、この時点では、例えば3×960×540個の画素ごとの特徴量に対応したメモリが必要である。 The synthesizing means 22a takes each vector x 1 , x 2 , and x 3 as inputs, and arranges the vector components corresponding to each pixel to obtain 3ch information. In FIG. 10, it is schematically shown as three images. At this point, for example, a memory corresponding to the feature amount for each of 3 × 960 × 540 pixels is required.
第3の特徴抽出手段33は、コンボリューションを行うニューラルネットワークで構成されている。本実験では、20層のConvolution層を構築した。
また、各Convolution層では、出力としてN個の特徴を抽出するものとした。つまり、アウトプットチャンネル数はNである。この実験ではNch=64chとした。
なお、図10では、3層のConvolution層だけを示し、他は省略した。また、64chのうち12のチャンネルだけをNchとして図示し、他は省略した。
The third feature extraction means 33 is composed of a neural network that performs convolution. In this experiment, 20 Convolution layers were constructed.
Further, in each Convolution layer, N features are extracted as outputs. That is, the number of output channels is N. In this experiment, Nch = 64ch.
In FIG. 10, only three Convolution layers are shown, and the others are omitted. Further, only 12 channels out of 64 channels are shown as Nch, and the others are omitted.
Convolution層の1層目(1回目)は、入力チャンネルが3ch(色空間における3チャンネル)であり、この1層目についての64のアウトプットチャンネルごとに、次の式(4)で表されるコンボリューションを行った。 The first layer (first time) of the Convolution layer has 3 channels (3 channels in the color space), and each of the 64 output channels for the first layer is represented by the following equation (4). Convolution was done.
式(4)において、ωiは重みベクトルである。重みベクトルωiは、このカラー情報拡大器における学習の際に誤差を使ってωiを更新する、という誤差計算で決定する学習パラメータである。重みベクトルωiは、1次元の多数変数のベクトルであって、入力される高解像度モノクロ画像101の画素数と同数の成分を持つ。bはバイアスである。なお、i=1,2,3に対応したx1、x2、x3は式(1)〜式(3)で定義されている。
なお、この時点では、例えば64×960×540個の画素ごとの特徴量に対応したメモリが必要である。
In equation (4), ω i is a weight vector. The weight vector ω i is a learning parameter determined by error calculation in which ω i is updated by using an error during learning in this color information expander. The weight vector ω i is a one-dimensional multivariable vector and has the same number of components as the number of pixels of the input high-
At this point, for example, a memory corresponding to the feature amount for each of 64 × 960 × 540 pixels is required.
Convolution層の2層目(2回目)は、入力チャンネルが64ch(前段の1層目についてのアウトプットにおける64チャンネル)であり、2層目についての64のアウトプットチャンネルごとに、次の式(5)で表されるコンボリューションを行った。 The second layer (second time) of the Convolution layer has 64 channels of input channels (64 channels in the output for the first layer in the previous stage), and for each of the 64 output channels for the second layer, the following equation ( The convolution represented by 5) was performed.
式(5)は式(4)と同様の形式で表されている。なお、i=1〜64に対応したx1〜x64は、前段の1層目についてのアウトプットにおける64チャンネルのそれぞれの情報を示しており、式(1)〜式(3)と同様に定義できるので、その詳細は省略する。 Equation (5) is expressed in the same format as Equation (4). Incidentally, x 1 ~x 64 corresponding to the i = 1 to 64 indicates the respective information 64 channels at the output of the first layer of the preceding stage, as in equation (1) to (3) Since it can be defined, the details are omitted.
Convolution層の3〜19層目(3〜19回目)は、同様に、入力チャンネルが64ch(前の層についてのアウトプットにおける64チャンネル)であり、それぞれ、64のアウトプットチャンネルごとに、前記した式(5)で表されるコンボリューションを行った。なお、3〜19層目においても、i=1〜64に対応したx1〜x64は、同様に、それらの前の層についてのアウトプットにおける64チャンネルについての画像特徴量を示している。 Similarly, in the 3rd to 19th layers (3rd to 19th times) of the Convolution layer, the input channels are 64 channels (64 channels in the output for the previous layer), and each of the 64 output channels is described above. The convolution represented by the equation (5) was performed. Also in 3 to 19-layer, x 1 ~x 64 corresponding to the i = 1 to 64 are likewise shows an image feature amount for 64 channels at the output of their previous layer.
高解像度カラー情報推定手段23もConvolution層で構成されている。この高解像度カラー情報推定手段23は、出力として、色空間における2つのチャンネルに対応させた特徴をそれぞれ抽出した。つまり、アウトプットチャンネルは2chである。
このConvolution層(高解像度カラー情報推定手段23)は、入力チャンネルが64ch(前の層についてのアウトプットにおける64チャンネル)であり、色空間における2つのチャンネルごとに、前記した式(5)で表されるコンボリューションを行った。
The high-resolution color information estimation means 23 is also composed of a Convolution layer. The high-resolution color information estimation means 23 extracts features corresponding to two channels in the color space as outputs. That is, the output channel is 2ch.
This Convolution layer (high-resolution color information estimation means 23) has 64 channels of input channels (64 channels in the output of the previous layer), and each of the two channels in the color space is represented by the above equation (5). The convolution to be done was done.
前記した式(4)におけるωiと式(5)におけるωiとはそれぞれ異なっている。また、アウトプットチャンネルごとにωiはそれぞれ異なっている。さらに、前記した20層のConvolution層には、それぞれ異なる重みベクトルωiを用いた。 They are different from each from the omega i in omega i the formula in equation (4) described above (5). Also, ω i is different for each output channel. Further, different weight vectors ω i were used for the 20 Convolution layers described above.
また、実験では、1282回(=64+64×19+2)のコンボリューションのすべてを、一例として、以下の同じ条件で、重みベクトルωiを変えながら行った。
カーネル(kernel):3
パディング(padding):1
ストライド(stride):1
In the experiment, all 1282 convolutions (= 64 + 64 × 19 + 2) were performed as an example under the same conditions as below, while changing the weight vector ω i.
Kernel: 3
Padding: 1
Stride: 1
よって、実験で用いた重みベクトルの各成分の個数を総計した個数は、次の式(6)を演算した結果の個数となる。
3×3×(3×64+64×64×19+64×2) ・・・ 式(6)
また、バイアス項の個数の総計はコンボリューションの個数と同じく、1282個である。これらの合計が全パラメータ数である。
つまり、実験に用いたカラー情報拡大器において、学習によって予め決定されたパラメータ群の個数は、703296+1282=704578個となる。
Therefore, the total number of each component of the weight vector used in the experiment is the number of results obtained by calculating the following equation (6).
3 × 3 × (3 × 64 + 64 × 64 × 19 + 64 × 2) ・ ・ ・ Equation (6)
The total number of bias terms is 1282, which is the same as the number of convolutions. The sum of these is the total number of parameters.
That is, in the color information magnifier used in the experiment, the number of parameter groups determined in advance by learning is 703296 + 1282 = 704578.
以上の処理により得られた高解像度カラー情報107を、図1に示すように、元画像である高解像度モノクロ画像101と合成して、高解像度カラー画像109を作成した(以下、実施例1)。
また、従来技術の方法で拡大したカラー情報を、元画像である高解像度モノクロ画像101と合成して、高解像度カラー画像を作成した(以下、比較例1)。
実施例1は、比較例1と比べて色のぼけが低減されたことを目視で確認できた。
また、ランダムに選んだ画像110枚に適用した場合に、PSNR(Peak Signal-to-Noise Ratio)という、元画像に対する劣化具合を表す尺度の平均値において、37.66(比較例)から41.35(実施例)に改善したことを確認できた。
As shown in FIG. 1, the high-
Further, the color information enlarged by the method of the prior art was combined with the high-
In Example 1, it was confirmed visually that the color blur was reduced as compared with Comparative Example 1.
Further, when applied to 110 randomly selected images, PSNR (Peak Signal-to-Noise Ratio), which is an average value of a scale indicating the degree of deterioration with respect to the original image, ranges from 37.66 (comparative example) to 41. It was confirmed that the improvement was made to 35 (Example).
なお、高解像度モノクロ画像101として、より大きな4K画像を用いて同じ実験を行う場合には、特徴量の個数が飛躍的に増大するので、より多くのメモリ領域を持ったハードウェア資源が必要である。
さらに、図10において破線で示す第1の特徴抽出手段31や第2の特徴抽出手段32を追加して図2のカラー情報拡大器10と同様の構成とする場合、さらに多くのパラメータを決定する必要がある。
When the same experiment is performed using a larger 4K image as the high-
Further, when the first feature extraction means 31 and the second feature extraction means 32 shown by the broken lines in FIG. 10 are added to have the same configuration as the
本実施形態に係るカラー情報拡大器は、4Kモノクロ映像データの自動色付け等に利用することができる。 The color information magnifier according to this embodiment can be used for automatic coloring of 4K monochrome video data and the like.
1 自動色付け装置
3,3B,3C カラー情報推定器
5 縮小器
7,7B 低解像度カラー情報推定器
9 情報合成器
10,10A,10B,10C,10D,10E カラー情報拡大器
21,21b,21c サイズ拡大手段
22a,22b,22c 合成手段
23 高解像度カラー情報推定手段
31〜36 特徴抽出手段
40 誤差計算器
50 サイズ縮小手段
1 Automatic coloring device 3,3B, 3C
Claims (10)
前記第2解像度のカラー情報または当該第2解像度のカラー情報から抽出した画像特徴量のいずれか一方である低解像度の画像特徴量から高解像度の画像特徴量を生成するサイズ拡大手段と、
前記第1解像度のモノクロ情報または当該第1解像度のモノクロ情報から抽出した高解像度の画像特徴量と、前記サイズ拡大手段により生成された高解像度の画像特徴量とを合成する合成手段と、
前記合成手段により合成された高解像度の画像特徴量から、色空間のチャンネルごとに、推定を行うための学習により予め決定されたパラメータ群を用いて画像特徴量を抽出することにより前記高解像度カラー情報を推定する高解像度カラー情報推定手段と、を備えるカラー情報拡大器。 Monochrome information, which is an image feature amount of a monochrome image of the first resolution, and color information, which is an image feature amount of a second resolution lower than the first resolution estimated from the monochrome information of the first resolution, are input. This is a color information magnifier that enlarges the image size of the color information by a predetermined arithmetic process and outputs it as high-resolution color information.
A size enlargement means for generating a high-resolution image feature from a low-resolution image feature that is either one of the second-resolution color information or the image feature extracted from the second-resolution color information.
A compositing means for synthesizing a high-resolution image feature amount extracted from the first-resolution monochrome information or the first-resolution monochrome information and a high-resolution image feature amount generated by the size enlargement means.
The high-resolution color is extracted from the high-resolution image feature amount synthesized by the compositing means using a parameter group predetermined by learning for estimation for each channel in the color space. A color information magnifier including a high-resolution color information estimation means for estimating information.
前記第1解像度のモノクロ情報から、推定を行うための学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出する特徴抽出手段と、
前記第2解像度のカラー情報または当該第2解像度のカラー情報から抽出した低解像度の画像特徴量と、前記特徴抽出手段により抽出された低解像度の画像特徴量と、を合成する合成手段と、
前記合成手段により合成された低解像度の画像特徴量から高解像度の画像特徴量を生成するサイズ拡大手段と、
前記サイズ拡大手段により生成された高解像度の画像特徴量から、色空間のチャンネルごとに、推定を行うための学習により予め決定されたパラメータ群を用いて画像特徴量を抽出することにより前記高解像度カラー情報を推定する高解像度カラー情報推定手段と、を備えるカラー情報拡大器。 Monochrome information, which is an image feature amount of a monochrome image of the first resolution, and color information, which is an image feature amount of a second resolution lower than the first resolution estimated from the monochrome information of the first resolution, are input. This is a color information magnifier that enlarges the image size of the color information by a predetermined arithmetic process and outputs it as high-resolution color information.
A feature extraction means for extracting a low-resolution image feature amount from the first-resolution monochrome information using a parameter group predetermined by learning for estimation.
A compositing means for synthesizing a low-resolution image feature amount extracted from the second-resolution color information or the second-resolution color information and a low-resolution image feature amount extracted by the feature extraction means.
A size enlargement means for generating a high-resolution image feature amount from a low-resolution image feature amount synthesized by the compositing means, and a size enlargement means.
The high-resolution image feature amount is extracted from the high-resolution image feature amount generated by the size enlargement means using a parameter group predetermined by learning for estimation for each channel in the color space. A color information magnifier including a high-resolution color information estimation means for estimating color information.
前記合成手段および前記サイズ拡大手段の処理により生成された高解像度の画像特徴量から色空間のチャンネルごとの画像特徴量を抽出する前に、当該高解像度の画像特徴量から、推定を行うための学習により予め決定されたパラメータ群を用いて、さらに高解像度の画像特徴量を抽出する特徴抽出手段を備え、
当該特徴抽出手段により抽出された高解像度の画像特徴量から色空間のチャンネルごとに画像特徴量を抽出する請求項1または請求項2に記載のカラー情報拡大器。 The high-resolution color information estimation means
To estimate from the high-resolution image features before extracting the image features for each channel in the color space from the high-resolution image features generated by the processing of the compositing means and the size enlargement means. It is provided with a feature extraction means for extracting a higher resolution image feature amount using a parameter group determined in advance by learning.
The color information magnifier according to claim 1 or 2, wherein the image feature amount is extracted for each channel of the color space from the high-resolution image feature amount extracted by the feature extraction means.
前記第2解像度のカラー情報から、推定を行うための学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出し、抽出した低解像度の画像特徴量を前記サイズ拡大手段に出力する第2の特徴抽出手段と、
のうちの少なくとも1つの特徴抽出手段を備える請求項1に記載のカラー情報拡大器。 A high-resolution image feature amount is extracted from the first-resolution monochrome information using a parameter group predetermined by learning for estimation, and the extracted high-resolution image feature amount is output to the synthesis means. The first feature extraction means and
A low-resolution image feature is extracted from the second-resolution color information using a parameter group predetermined by learning for estimation, and the extracted low-resolution image feature is output to the size enlargement means. Second feature extraction means to be
The color information magnifier according to claim 1, further comprising at least one feature extraction means.
前記第2解像度のカラー情報と、生成される最小レベルの解像度のモノクロ情報とを初期値として、推定されたカラー情報および当該カラー情報よりも大きな解像度を持ったモノクロ情報から当該モノクロ情報と同じ解像度を持ったカラー情報を推定する処理を再帰的に行うことにより前記第1解像度を持った前記高解像度カラー情報を推定する処理を行う請求項1から請求項5のいずれか一項に記載のカラー情報拡大器。 By recursively performing a process of reducing the monochrome information of the first resolution at a predetermined reduction ratio, monochrome information of a plurality of levels having a resolution smaller than the first resolution and larger than the second resolution can be obtained. Equipped with a size reduction means to generate
With the color information of the second resolution and the monochrome information of the minimum level resolution generated as initial values, the same resolution as the monochrome information is obtained from the estimated color information and the monochrome information having a resolution larger than the color information. The color according to any one of claims 1 to 5, wherein the process of estimating the high-resolution color information having the first resolution is performed by recursively performing the process of estimating the color information having the first resolution. Information expander.
前記第1解像度のモノクロ情報を縮小する処理を行って前記第2解像度のモノクロ情報を生成する縮小器と、
前記縮小器により生成された前記第2解像度のモノクロ情報から、推定を行うための学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出することにより前記第2解像度のカラー情報を推定する低解像度カラー情報推定器と、を備え、
前記カラー情報拡大器は、前記低解像度カラー情報推定器で推定された前記第2解像度のカラー情報と、前記縮小器をバイパスして入力される前記第1解像度のモノクロ情報と、を用いて、前記高解像度カラー情報を推定する処理を行うカラー情報推定器。 The color information magnifier according to any one of claims 1 to 6.
A reduction device that generates the monochrome information of the second resolution by performing a process of reducing the monochrome information of the first resolution.
The color information of the second resolution is obtained by extracting a low-resolution image feature amount from the monochrome information of the second resolution generated by the reducer using a parameter group predetermined by learning for estimation. Equipped with a low resolution color information estimator to estimate
The color information magnifier uses the second resolution color information estimated by the low resolution color information estimator and the first resolution monochrome information input by bypassing the reducer. A color information estimator that performs processing for estimating the high-resolution color information.
前記第1解像度のモノクロ情報から、推定を行うための学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出することにより前記第2解像度のカラー情報を推定する低解像度カラー情報推定器と、を備え、
前記カラー情報拡大器は、前記低解像度カラー情報推定器で推定された前記第2解像度のカラー情報と、前記低解像度カラー情報推定器をバイパスして入力される前記第1解像度のモノクロ情報と、を用いて、前記高解像度カラー情報を推定する処理を行うカラー情報推定器。 The color information magnifier according to any one of claims 1 to 6.
Low-resolution color information that estimates the second-resolution color information by extracting low-resolution image features from the first-resolution monochrome information using a parameter group predetermined by learning for estimation. Equipped with an estimator,
The color information magnifier includes the second resolution color information estimated by the low resolution color information estimator, the first resolution monochrome information input by bypassing the low resolution color information estimator, and the like. A color information estimator that performs processing for estimating the high-resolution color information using the above.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017150153A JP6902425B2 (en) | 2017-08-02 | 2017-08-02 | Color information magnifiers and color information estimators, and their programs |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017150153A JP6902425B2 (en) | 2017-08-02 | 2017-08-02 | Color information magnifiers and color information estimators, and their programs |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2019028888A JP2019028888A (en) | 2019-02-21 |
| JP6902425B2 true JP6902425B2 (en) | 2021-07-14 |
Family
ID=65478615
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017150153A Active JP6902425B2 (en) | 2017-08-02 | 2017-08-02 | Color information magnifiers and color information estimators, and their programs |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6902425B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119854510A (en) * | 2023-10-18 | 2025-04-18 | 华为技术有限公司 | Image encoding method, decoding method and related equipment |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0737093A (en) * | 1993-07-16 | 1995-02-07 | Toshiba Corp | Pattern identification device |
| JP2007226658A (en) * | 2006-02-24 | 2007-09-06 | Nec Access Technica Ltd | Information processing terminal device, information processing method, and program for information processing |
| US20100238165A1 (en) * | 2009-03-17 | 2010-09-23 | Harris Corporation | Geospatial modeling system for colorizing images and related methods |
| JP5057183B2 (en) * | 2010-03-31 | 2012-10-24 | アイシン・エィ・ダブリュ株式会社 | Reference data generation system and position positioning system for landscape matching |
| JP5816069B2 (en) * | 2011-12-07 | 2015-11-17 | ダンロップスポーツ株式会社 | Silhouette correction method and silhouette correction system |
-
2017
- 2017-08-02 JP JP2017150153A patent/JP6902425B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2019028888A (en) | 2019-02-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6886887B2 (en) | Error calculator and its program | |
| JP6377258B2 (en) | Image processing apparatus and method, program, and recording medium | |
| JP6453694B2 (en) | Image composition apparatus, image composition method, image composition program, and recording medium | |
| US7965339B2 (en) | Resolution enhancing method and apparatus of video | |
| EP2202683A1 (en) | Image generation method, device, its program and recording medium with program recorded therein | |
| JP2007000205A (en) | Image processing apparatus, image processing method, and image processing program | |
| CN111062867A (en) | Video super-resolution reconstruction method | |
| KR20100053680A (en) | Image generation method, device, its program and recording medium stored with program | |
| WO2011111819A1 (en) | Image processing device, image processing program, and method for generating images | |
| KR100860968B1 (en) | Image-resolution-improvement apparatus and method | |
| CN103238168A (en) | Image processing apparatus, image processing method, and image processing program | |
| JP2011095861A (en) | Image processing apparatus, control method and program | |
| WO2008102898A1 (en) | Image quality improvement processig device, image quality improvement processig method and image quality improvement processig program | |
| JP4839448B2 (en) | Image quality improvement processing method and image quality improvement processing program for multiple areas | |
| KR101819984B1 (en) | Image synthesis method in real time | |
| JP6902425B2 (en) | Color information magnifiers and color information estimators, and their programs | |
| WO2010051719A1 (en) | Method for magnifying video image 4/3 times | |
| KR20070119482A (en) | Image resampling method | |
| JP4714038B2 (en) | Method and apparatus for increasing image resolution | |
| JP2000354244A (en) | Image processing apparatus, method, and computer-readable storage medium | |
| KR102470242B1 (en) | Image processing device, image processing method and program | |
| JP6854629B2 (en) | Image processing device, image processing method | |
| JP4265363B2 (en) | Image processing device | |
| JP2024545623A (en) | Iterative graph-based image enhancement with object separation | |
| JP5181345B2 (en) | Image processing apparatus and image processing method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200702 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210525 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210621 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6902425 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
