JP4956464B2 - Image high resolution device, learning device and method - Google Patents
Image high resolution device, learning device and method Download PDFInfo
- Publication number
- JP4956464B2 JP4956464B2 JP2008048690A JP2008048690A JP4956464B2 JP 4956464 B2 JP4956464 B2 JP 4956464B2 JP 2008048690 A JP2008048690 A JP 2008048690A JP 2008048690 A JP2008048690 A JP 2008048690A JP 4956464 B2 JP4956464 B2 JP 4956464B2
- Authority
- JP
- Japan
- Prior art keywords
- block
- size
- learning
- pixels
- low
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 90
- 239000013598 vector Substances 0.000 claims description 66
- 239000011159 matrix material Substances 0.000 claims description 65
- 238000012545 processing Methods 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 19
- 230000009467 reduction Effects 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 10
- 230000000717 retained effect Effects 0.000 claims 1
- 238000012986 modification Methods 0.000 description 81
- 230000004048 modification Effects 0.000 description 81
- 238000002372 labelling Methods 0.000 description 44
- 230000008569 process Effects 0.000 description 32
- 230000008859 change Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 12
- 101710163391 ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase Proteins 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012615 high-resolution technique Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Landscapes
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
Description
本発明は、カメラで撮影された画像データやテレビが受信した画像データをより高い解像度の画像データに変換する画像高解像度化装置、学習装置および方法に関する。 The present invention relates to an image resolution increasing apparatus, a learning apparatus, and a method for converting image data captured by a camera and image data received by a television into image data with higher resolution.
近年、画素数が多いテレビやディスプレイなどの表示装置が普及してきている。表示装置の画素数が多ければ、画像の細かい部分まで表示できる。すなわち、高解像度な画像を表示できる。表示する画像データの画素数が表示装置よりも少ない場合、画素数を増やすことにより高解像度化してから表示する必要がある。 In recent years, display devices such as televisions and displays with a large number of pixels have become widespread. If the number of pixels of the display device is large, it is possible to display up to a fine part of the image. That is, a high-resolution image can be displayed. When the number of pixels of the image data to be displayed is smaller than that of the display device, it is necessary to display after increasing the resolution by increasing the number of pixels.
高解像度化の手法として、作成する高解像度画像の画素を、低解像度画像中で時間方向または空間方向で近傍に位置する画素の値の一次結合により作成するものがある(例えば、特許文献1、特許文献2参照)。その一次結合の際の係数を、予め準備した学習画像を利用して学習する。その係数は、学習画像に対する誤差を最小化するように学習されるため、その係数を利用して入力の低解像度画像を高解像度化した出力の高解像度画像は、未知の真の高解像度画像に対する誤差が小さくなると期待できる。
しかし、上記の高解像度化の手法を使用してもまだ画質が低いという問題がある。 However, there is a problem that the image quality is still low even when the above-described high resolution technique is used.
本発明の目的は、高画質な高解像度画像を作成する画像高解像度化装置、学習装置および方法を提供することである。 An object of the present invention is to provide an image high-resolution device, a learning device, and a method for creating a high-quality high-resolution image.
上述の課題を解決するため、本発明の画像高解像度化装置は、縦および横の画素数を示すサイズが第1サイズである低解像度画像を入力する入力手段と、前記第1サイズの縦の画素数と、サイズが前記第1サイズよりも大きい第2サイズの縦の画素数とを互いに素にしたものと、前記第1サイズの横の画素数と前記第2サイズの横の画素数とを互いに素にしたものとを使用し、前記低解像度画像に対応する第1ブロックサイズと、前記第2サイズの高解像度画像に対応する第2ブロックサイズとを高解像度化のための処理単位であるブロックのサイズとして決定する決定手段と、前記第1ブロックサイズの第1学習用ブロックと前記第2ブロックサイズの第2学習用ブロックとの組の1つ以上の組から、該第1学習用ブロックに第1係数をかけて算出したブロックと該第2学習用ブロックとの誤差を小さくするように学習された1以上の第1係数を保持し、1以上の第1係数から前記第1ブロックサイズと前記第2ブロックサイズに対応する係数を第2係数として読み出す第1読出手段と、前記第1ブロックサイズのブロックの前記低解像度画像中の第1位置と、前記第2ブロックサイズのブロックの前記第1位置に対応する前記高解像度画像中の第2位置とを順次設定する設定手段と、前記第2係数を前記第1位置の第1ブロックにかけて前記第2位置の第2ブロックを作成して前記高解像度画像を作成する作成手段と、を具備することを特徴とする。 In order to solve the above-described problem, an image resolution increasing apparatus according to the present invention includes an input unit that inputs a low-resolution image having a first size indicating the number of vertical and horizontal pixels, and a vertical size of the first size. The number of pixels and the number of vertical pixels of a second size larger than the first size, and the number of horizontal pixels of the first size and the number of horizontal pixels of the second size, And a first block size corresponding to the low-resolution image and a second block size corresponding to the high-resolution image of the second size in a processing unit for increasing the resolution. From the one or more sets of a determination means for determining the size of a certain block and a first learning block having the first block size and a second learning block having the second block size, the first learning block Apply the first coefficient to the block One or more first coefficients learned so as to reduce an error between the block calculated in this way and the second learning block are held, and the first block size and the second block size are determined from the one or more first coefficients. Corresponding to the first position of the block of the first block size in the low-resolution image and the first position of the block of the second block size. A setting means for sequentially setting a second position in the high-resolution image, and a second block at the second position is created by applying the second coefficient to the first block at the first position to create the high-resolution image. And creating means.
本発明の学習装置は、縦および横の画素数を示すサイズが高サイズである学習用高解像度画像を入力する入力手段と、サイズが前記高サイズよりも小さい低サイズである学習用低解像度画像を前記学習用高解像度画像から作成する作成手段と、前記学習用低解像度画像と前記学習用高解像度画像とから、低ブロックサイズの第1学習用ブロックと高ブロックサイズの第2学習用ブロックとの組を抽出する抽出手段と、前記第1学習用ブロックに第1係数をかけて算出したブロックと前記第2学習用ブロックとの誤差の、前記低ブロックサイズの第1学習用ブロックと前記高ブロックサイズの第2学習用ブロックとの組についての和が最も小さくなる該第1係数を算出する第1算出手段と、前記低ブロックサイズ及び前記高ブロックサイズと、前記第1係数とを関連付けて保持する保持手段と、を具備し、前記高ブロックサイズと前記低ブロックサイズは、前記高サイズの縦の画素数と前記低サイズの縦の画素数とを互いに素にしたものと、該高サイズの横の画素数と該低サイズの横の画素数とを互いに素にしたものとから決定される、あるいは、決定されたものが入力されることを特徴とする。 The learning device of the present invention includes an input unit that inputs a high-resolution image for learning whose size indicating the number of vertical and horizontal pixels is a high size, and a low-resolution image for learning whose size is a low size smaller than the high size. From the learning high-resolution image, and from the learning low-resolution image and the learning high-resolution image, a first learning block having a low block size and a second learning block having a high block size, Extraction means for extracting a set of the first learning block, the first learning block of the low block size, and the high of the error between the block calculated by multiplying the first learning block by a first coefficient and the second learning block First calculation means for calculating the first coefficient that minimizes the sum of the block size and the second learning block, the low block size and the high block size; Holding means for associating and holding the first coefficient, wherein the high block size and the low block size are such that the number of vertical pixels of the high size and the number of vertical pixels of the low size are mutually prime. And the determined number of pixels having the same size as the number of horizontal pixels of the high size and the number of horizontal pixels of the low size. .
また、本発明の学習装置は、縦および横の画素数を示すサイズが高サイズである学習用高解像度画像を入力する入力手段と、サイズが前記高サイズよりも小さい低サイズである学習用低解像度画像を前記学習用高解像度画像から作成する作成手段と、前記学習用低解像度画像と前記学習用高解像度画像とから、低ブロックサイズの第1学習用ブロックと高ブロックサイズの第2学習用ブロックとの組を抽出する抽出手段と、前記第1学習用ブロックを示す第1ベクトルを、低解像度化によって前記第1学習用ブロックになる前記高ブロックサイズのブロックを示すベクトルの集合に属するベクトルに変換する係数行列の中から、該係数行列に右から前記第1ベクトルをかけて算出したベクトルと前記第2学習用ブロックを示すベクトルとの誤差の、前記低ブロックサイズの第1学習用ブロックと前記高ブロックサイズの第2学習用ブロックとの組についての和が最も小さくなる該係数行列を算出する第1算出手段と、前記低ブロックサイズ及び前記高ブロックサイズと、前記係数行列とを関連付けて保持する保持手段と、を具備し、前記高ブロックサイズと前記低ブロックサイズは、前記高サイズの縦の画素数と前記低サイズの縦の画素数とを互いに素にしたものと、該高サイズの横の画素数と該低サイズの横の画素数とを互いに素にしたものとから決定される、あるいは、決定されたものが入力されることを特徴とする。 In addition, the learning device of the present invention includes an input unit that inputs a high-resolution image for learning having a high size indicating the number of vertical and horizontal pixels, and a learning low-size that is a low size smaller than the high size. A creation means for creating a resolution image from the learning high-resolution image, and a first learning block having a low block size and a second learning block having a high block size from the learning low-resolution image and the learning high-resolution image. A vector belonging to a set of vectors indicating the high-block size blocks that become the first learning block by reducing the resolution of the first vector indicating the first learning block by extracting means for extracting a pair with the block Of the coefficient matrix to be converted into the vector obtained by multiplying the coefficient matrix by the first vector from the right and the vector indicating the second learning block. First calculation means for calculating the coefficient matrix having the smallest sum for the set of the first learning block having the low block size and the second learning block having the high block size, and the low block size and Holding means for associating and holding the high block size and the coefficient matrix, wherein the high block size and the low block size are the number of vertical pixels of the high size and the vertical pixels of the low size. The number is determined based on a relatively prime number, and the number of horizontal pixels of the high size and the number of horizontal pixels of the low size are relatively prime, or the determined number is input. It is characterized by that.
本発明の画像高解像度化装置、学習装置および方法によれば、高画質な高解像度画像を作成することができる。 According to the image resolution increasing device, the learning device, and the method of the present invention, a high-quality high-resolution image can be created.
以下、図面を参照しながら本発明の実施形態に係る画像高解像度化装置、学習装置および方法について詳細に説明する。なお、以下では、同一の番号を付した部分については同様の動作を行うものとして、重ねての説明を省略する。また、実施形態は、後述の実施形態に限定されるものではなく、変更しても構わない。例えば後述の変更例により変更したり、それら変更例を組み合わせることにより変更したりしても構わない。 Hereinafter, an image resolution increasing apparatus, a learning apparatus, and a method according to an embodiment of the present invention will be described in detail with reference to the drawings. In the following description, the same numbered parts are assumed to perform the same operation, and repeated description is omitted. Further, the embodiment is not limited to the embodiment described later, and may be changed. For example, you may change by the example of a below-mentioned change, and may change by combining those examples of change.
最初に簡単に用語について説明する。
デジタル画像は各位置に色や輝度の情報を持った値からなる。この値を持つ単位を画素と呼び、その値を画素値と呼ぶ。以下では説明を簡単にするため、画素値として輝度を表す値のみを持つ場合を説明する。この場合、1画素あたりに画素値が1つである。色の情報を持った値を画素値として持たせる場合としては、例えば赤と緑と青に関する色の情報を3次元の空間で表現したRGB色空間での値を画素値として持たせるとよい。この場合、1画素あたりに赤と緑と青に関する3つの値が画素値になる。RGB色空間の代わりにYUV空間での値を画素値として持たせても良い。
First, terms are briefly explained.
A digital image consists of values having color and brightness information at each position. A unit having this value is called a pixel, and the value is called a pixel value. Hereinafter, in order to simplify the description, a case will be described in which only the pixel value has a value representing luminance. In this case, there is one pixel value per pixel. As a case where a value having color information is given as a pixel value, for example, a value in an RGB color space in which color information about red, green and blue is expressed in a three-dimensional space may be given as a pixel value. In this case, three values for red, green, and blue are pixel values per pixel. Instead of the RGB color space, a value in the YUV space may be given as the pixel value.
デジタル画像を高解像度化するためには画素数を増やす必要がある。画素数を増やすことを画像の高解像度化という場合がある。また、画像の拡大と高解像度化を同じ意味で利用したり画像の縮小と低解像度化を同じ意味で使用したりする場合がある。 In order to increase the resolution of a digital image, it is necessary to increase the number of pixels. Increasing the number of pixels is sometimes called increasing the resolution of an image. In some cases, enlargement of an image and higher resolution are used in the same meaning, and reduction of an image and lower resolution are used in the same meaning.
画像中の矩形の部分画像はブロックと呼ばれる。以下では、ブロックの画素の値を並べた縦ベクトルによりブロックを表現する。ブロックの表現は、縦ベクトルではなく横ベクトルでも構わないが、ここでは縦ベクトルとする。説明の簡略化のために、そのブロックとベクトルを区別せずベクトルをブロックと呼んだりブロックをベクトルと呼んだりする場合がある。 A rectangular partial image in the image is called a block. In the following, a block is represented by a vertical vector in which pixel values of the block are arranged. The representation of the block may be a horizontal vector instead of a vertical vector, but here it is a vertical vector. For simplification of explanation, a vector may be called a block or a block may be called a vector without distinguishing the block and the vector.
ブロックを拡張し時間方向にも画素を持たせたものを時空間ブロックと呼ぶ。時空間ブロックと区別するために、時間方向に画素を持たないブロックを、空間ブロックと呼ぶ場合がある。また、空間ブロックと時空間ブロックを区別せずに単にブロックと呼ぶ場合もある。 A block that is expanded and has pixels in the temporal direction is called a spatiotemporal block. In order to distinguish from a spatiotemporal block, a block having no pixels in the temporal direction may be referred to as a spatial block. In some cases, the spatial block and the spatio-temporal block are simply referred to as a block without being distinguished.
本実施形態の画像高解像度化装置について図1を参照して説明する。
画像高解像度化装置100は、ブロックサイズ決定部101と、係数データ保持部102と、ブロック位置制御部103と、作成部104を有する。
画像高解像度化装置100への入力は、低解像度画像105とサイズデータ106である。サイズデータ106は、低解像度画像105の縦と横の画素数であるサイズのデータと、作成する高解像度画像110のサイズのデータである。以下では、画像の縦の画素数を高さ、横の画素数を幅と呼ぶ。低解像度画像105の幅と高さをそれぞれ、wlとhlで表す。高解像度画像110の幅と高さをそれぞれ、whとhhで表す。低解像度画像105は作成部104に送られる。サイズデータ106(wlとhlとwhとhh)は、ブロックサイズ決定部101とブロック位置制御部103に送られる。画像高解像度化装置100からの出力は高解像度画像110である。高解像度画像110は作成部104から出力される。低解像度画像105と高解像度画像110の一例をそれぞれ図2(a)、図2(b)に示す。この例では、wl = 9,hl = 12,wh = 24,hh = 27である。
The image resolution increasing apparatus of this embodiment will be described with reference to FIG.
The image
The input to the image
ブロックサイズ決定部101は、入力したサイズデータ106(wlとhlとwhとhh)からブロックサイズデータ107を決定して出力し、係数データ保持部102とブロック位置制御部103に送る。ブロックサイズデータ107は、高解像度化の処理の単位であるブロックのサイズを示すデータであり、低解像度画像105に対応するブロックのサイズを示すデータと、高解像度画像110に対応するブロックのサイズを示すデータとからなる。以下では、低解像度画像105中のブロックを低解像度ブロックと呼び、高解像度画像110中のブロックを高解像度ブロックと呼ぶ。高解像度ブロックを作成するために必要な低解像度ブロックの幅と高さをそれぞれ、cl + iとrl + iで表す。clとrlとiについては後のブロック位置制御部103、(1−1)で説明する。高解像度ブロックの幅と高さをそれぞれchとrhで表す。すなわち、ブロックサイズデータ107はclとrlとiとchとrhを含む。ブロックサイズデータ107(clとrlとiとchとrh)の決定方法は後の(1−1)で説明する。
Block
係数データ保持部102は、入力したブロックサイズデータ107(clとrlとiとchとrh)から対応する係数データ108を読み出し、作成部104に送る。係数データ108は、低解像度ブロックから高解像度ブロックを作成するための係数であり、Fで表す。低解像度ブロックの各画素の値を並べた(cl + i)(rl + i)次元の縦ベクトルをzで表す。高解像度ブロックの各画素の推定値を並べたchrh次元の縦ベクトルをxで表す。係数データ108(F)は、zからxを式x = Fzで計算するための係数行列である。Fのサイズはchrh行(cl + i)(rl + i)列である。Fは予め学習され、係数データ保持部102に複数保持されている。Fの学習方法については後に(1−1)で説明する。
The coefficient
ブロック位置制御部103は、入力したサイズデータ106(wlとhlとwhとhh)と入力したブロックサイズデータ107(clとrlとiとchとrh)とから、位置データ109を順次設定するように制御して出力し作成部104に送る。位置データ109は、低解像度画像105中の低解像度ブロック(zや後述のy)の位置と、作成する高解像度画像110中の高解像度ブロック(x)の位置を示すデータである。ブロック位置制御部103は例えば高解像度画像110を高解像度ブロックで埋め尽くすように位置データ109を制御する。ブロック位置制御部103は例えば図3に示した順に高解像度ブロックの位置を制御する。低解像度ブロックの位置は高解像度ブロックの位置に同期させる。そのためには、ブロック位置制御部103は、高解像度ブロックを横方向にchずつ移動し、縦方向にrhずつ移動することにより制御し、その高解像度ブロックを作成するために必要な低解像度ブロックを横方向にclずつ移動し、縦方向にrlずつ移動することにより制御すればよい。以下ではこの制御の場合の例を説明する。ただし、本実施形態のブロック位置制御部103がこの場合に限定されるわけではない。高解像度画像110中の一部の高解像度ブロックだけを、本実施形態によって作成するように位置データ109を制御してもよい。例えば高解像度画像110中の中央付近に位置する高解像度ブロックだけを本実施形態で作成し、それ以外の部分を別の手法で作成してもよい。また、高解像度画像110を、平坦な部分とエッジが多い部分とテクスチャがある部分とに分離し、テクスチャがある高解像度ブロックを本実施形態で作成するように、位置データ109を制御するようにしてもよい。そのためには、ブロック位置制御部103に、分離結果を入力したり低解像度画像105を入力することにより分離できるようにしたりする必要がある。
Block
作成部104は、低解像度画像105と係数データ108(F)と位置データ109から、次の式により、高解像度画像110を作成して出力する。
The
x = Fz
ある位置データ109が与えられたとき、その位置データ109が示すzにFを左からかけることにより、位置データ109が示すxを作成する。ブロック位置制御部103により制御されている位置データ109が変化するたびに、作成部104が、高解像度画像110中の高解像度ブロックを順次作成し、高解像度画像110中の全ての高解像度ブロックを作成し、高解像度画像110を作成する。
x = Fz
When
次に、図1の画像高解像度化装置の動作の一例について図4を参照して説明する。
S401では、ブロックサイズ決定部101がサイズデータ106(wlとhlとwhとhh)からブロックサイズデータ107(clとrlとiとchとrh)を決定し、S402に進む。
Next, an example of the operation of the image resolution increasing apparatus in FIG. 1 will be described with reference to FIG.
At S401, the block
S402では、係数データ保持部102がブロックサイズデータ107(clとrlとiとchとrh)から対応する係数データ108(F)を読み出し、S403に進む。
In S402, reads out the
S403では、ブロック位置制御部103が、サイズデータ106とブロックサイズデータ107から、作成する高解像度画像110中の高解像度ブロックの位置と、その高解像度ブロックを作成するために必要な低解像度画像105中の低解像度ブロックの位置を示す位置データ109を決定し、S404に進む。
In step S403, the block
S404では、作成部104が、位置データ109が示す低解像度画像105中の低解像度ブロック(z)と係数データ108(F)から、作成する高解像度画像110中の位置データ109が示す高解像度ブロック(x)を、式(x = Fz)により作成し、S405に進む。
In S404, the
S405では、作成部104は、位置データ109の示す高解像度ブロック(x)が、高解像度画像110を埋め尽くすように制御されたかどうかを判定し、埋め尽くした場合は処理を終了し、埋め尽くしていない場合はS403に戻る。ここでは、処理の終了条件を、位置データ109の示す高解像度ブロック(x)が、高解像度画像110を埋め尽くすように制御されたかどうかとしたが、他の基準で判定してもよい。
In S405, the
(1−1)ブロックサイズデータ107(clとrlとiとchとrh)の決定方法
次に、ブロックサイズ決定部101が決定するブロックサイズデータ107(clとrlとiとchとrh)の決定方法について説明する。
chとclはwhとwlを互いに素にした値とする。例えば横方向の高解像度化率を示すwh/wlという分数を約分し、既約分数にする。約分にはユークリッドの互除法を利用できる。その既約分数の分子をchとし分母をclとする。rhとrlはhhとhlを互いに素にした値とする。例えば縦方向の高解像度化率を示すhh/hlという分数を約分し、既約分数にする。その既約分数の分子をrhとし分母をrlとする。
(1-1) Method for Determining Block Size Data 107 (c l , r l , i, c h , r h ) Next, block size data 107 (c l , r l , i determined by the block size determining unit 101) And the determination method of c h and r h ) will be described.
Let c h and c l be values in which w h and w l are prime. For example lowest terms fractional that w h / w l showing a high resolution rate of lateral to irreducible fraction. Euclidean mutual division can be used for reduction. The denominator is the molecule of the irreducible fraction number and c h a c l. Let r h and r l be values in which h h and h l are relatively prime. For example, a fraction of h h / h l indicating the high resolution ratio in the vertical direction is reduced to an irreducible fraction. Let the numerator of the irreducible fraction be r h and the denominator be r l .
次に、図2の低解像度画像(a)と高解像度画像(b)における、i = 0の場合のある低解像度ブロックと高解像度ブロックについてそれぞれ図5(a)、図5(b)を参照して説明する。i = 0の場合、低解像度ブロックと高解像度ブロックは、被写体の同じ部分を示すブロックとなる。互いに素にした値を計算したのは、低解像度ブロックと高解像度ブロックが被写体の同じ部分を示すブロックとなるサイズ(clとrlとchとrh)を計算するためである。この場合の低解像度ブロックと高解像度ブロックは、それぞれ低解像度画像105と高解像度画像110に重なりなく敷き詰められる。被写体の同じ部分を示す低解像度ブロックと高解像度ブロックのサイズ(clとrlとchとrh)を求めるのは、作成した高解像度ブロックを低解像度化したものが、入力の低解像度ブロックに近付くようにするためである。作成した高解像度ブロックを低解像度化したものが入力の低解像度ブロックに一致しない場合、一致しない分の誤差が作成した高解像度ブロックに存在する。その誤差を発生させないために、被写体の同じ部分を示す低解像度ブロックと高解像度ブロックのサイズ(clとrlとchとrh)を求める。
Next, referring to FIG. 5A and FIG. 5B for the low resolution block and the high resolution block in the case of i = 0 in the low resolution image (a) and the high resolution image (b) of FIG. 2, respectively. To explain. When i = 0, the low resolution block and the high resolution block are blocks showing the same part of the subject. Was calculated disjoint in value is to calculate the size of the low-resolution block and the high-resolution block is block diagram showing the same portion of the object (c l and r l and c h a r h). In this case, the low resolution block and the high resolution block are spread on the
次に、図2の低解像度画像(a)と高解像度画像(b)における、i = 2の場合のある低解像度ブロックと高解像度ブロックについてそれぞれ図6(a)、図6(b)を参照して説明する。iが正の場合、低解像度ブロックの方が高解像度ブロックよりも広い範囲を示す。ある高解像度ブロックを作成するために、それよりも広い範囲を示す低解像度ブロックを利用するため、高い画質を得られる。 Next, for the low resolution block and the high resolution block in the case of i = 2 in the low resolution image (a) and the high resolution image (b) of FIG. 2, respectively refer to FIG. 6 (a) and FIG. 6 (b). To explain. When i is positive, the low resolution block indicates a wider range than the high resolution block. In order to create a certain high resolution block, a low resolution block showing a wider range than that is used, so that high image quality can be obtained.
次に、図2の低解像度画像(a)と高解像度画像(b)における、i = −2の場合のある低解像度ブロックと高解像度ブロックについてそれぞれ図7(a)、図7(b)を参照して説明する。iが負の場合、低解像度ブロックの方が高解像度ブロックよりも狭い範囲を示す。ある高解像度ブロックを作成するために、それよりも狭い範囲を示す低解像度ブロックしか利用しないため、高い画質を得られない。
したがって、高い画質を得るためには、ブロックサイズ決定部101はiを0以上とすることによりブロックサイズデータ107を決定するとよい。
Next, FIG. 7A and FIG. 7B are respectively shown for the low resolution block and the high resolution block in the case of i = −2 in the low resolution image (a) and the high resolution image (b) of FIG. The description will be given with reference. When i is negative, the low resolution block shows a narrower range than the high resolution block. In order to create a certain high-resolution block, only a low-resolution block showing a narrower range is used, so that high image quality cannot be obtained.
Therefore, in order to obtain high image quality, the block
i = 0の場合の低解像度ブロックの画素の値を並べたベクトルをyで表す。yはclrl次元のベクトルである。高解像度ブロックxは低解像度化により低解像度ブロックyに類似したものになることが望ましい。一致しない場合、一致しないのは一致しない分の誤差がxに含まれるためである。したがって、高い画質を得るためには作成したxを低解像度化したものがyに近付くようにすればよい。 A vector in which the pixel values of the low resolution block in the case of i = 0 is arranged is represented by y. y is a c l r l- dimensional vector. It is desirable that the high resolution block x be similar to the low resolution block y due to the reduction in resolution. When they do not match, the reason why they do not match is that x includes an error corresponding to the mismatch. Therefore, in order to obtain a high image quality, it is only necessary that the generated x with a reduced resolution approaches y.
以下では、高解像度ブロックと低解像度ブロックを重ね合わせたときの面積比に応じた低解像度化を仮定する。ここでは、面積比に応じた低解像度化を仮定するが、他の低解像度化の過程を仮定しても構わない。例えば高解像度ブロックをぼかして、サブサンプリングすると低解像度ブロックになるという低解像度化の過程を仮定しても構わない。ベクトルや行列のサイズが変化する場合があることに注意すれば容易に変更できる。 In the following, it is assumed that the resolution is reduced according to the area ratio when the high resolution block and the low resolution block are overlapped. Here, the resolution reduction according to the area ratio is assumed, but other resolution reduction processes may be assumed. For example, it is possible to assume a process of lowering the resolution by blurring a high resolution block and subsampling to become a low resolution block. You can easily change the size of the vector or matrix if you note that it can change.
高解像度ブロックと低解像度ブロックを重ね合わせたときの面積比に応じた、高解像度ブロックxの低解像度化をWxで表す。Wが面積比に応じた低解像度化の過程を示す行列である。xはchrh次元の縦ベクトルであり、Wはclrl行chrh列の行列である。図8は、ch = rh = 4、cl = rl = 1の場合の低解像度化の例である。この場合、xは16次元のベクトルで、Wは1行16列の行列である。Wの要素は、面積比に応じて決まるため、全て1/16になる。clとrlとchとrhが他の値の場合は、その値に応じて、Wの行列サイズと要素の値が変わる。 The reduction in the resolution of the high resolution block x according to the area ratio when the high resolution block and the low resolution block are overlaid is represented by Wx. W is a matrix indicating the process of resolution reduction according to the area ratio. x is a vertical vector of c h r h dimension, and W is a matrix of c l r l rows c h r h columns. FIG. 8 is an example of resolution reduction in the case of c h = r h = 4 and c l = r l = 1. In this case, x is a 16-dimensional vector, and W is a 1 × 16 matrix. Since the elements of W are determined according to the area ratio, they are all 1/16. If c l and r l and c h a r h is the other value, depending on its value, the values of the matrix size and the elements of W changes.
高解像度ブロックxが、低解像度化により、低解像度ブロックyに一致する場合、次の式が成り立つ。 When the high resolution block x coincides with the low resolution block y due to the reduction in resolution, the following equation is established.
y = Wx
この式を満足するxの一般形は、次の式で表される。
y = Wx
The general form of x that satisfies this equation is expressed by the following equation.
x = W+y + (I − W+W)v
ここで、+は、行列の一般逆行列を表す。W+の行列のサイズはchrh行clrl列である。Iはchrh行chrh列の単位行列を表す。vはxと同じ次元の任意のベクトルである。この一般形に、任意のベクトルvが含まれることから、式(y = Wx)を満足するxが一意に定まらないことがわかる。図9は、高解像度ブロックx1とx2が、低解像度化により、共に同一の低解像度ブロックyになる様子を示した例である。この例からも、式(y = Wx)を満足するxがyから一意に求められないことがわかる。
x = W + y + (I-W + W) v
Here, + represents a general inverse matrix. The size of the matrix of W + is c h r h rows c l r l columns. I represents a unit matrix of c h r h rows and c h r h columns. v is an arbitrary vector of the same dimension as x. Since an arbitrary vector v is included in this general form, it can be seen that x that satisfies the expression (y = Wx) is not uniquely determined. Figure 9 is a high-resolution block x 1 and x 2 are the low resolution, which is an example showing how the both of the same low-resolution block y. Also from this example, it can be seen that x satisfying the equation (y = Wx) cannot be uniquely obtained from y.
式(x = W+y + (I − W+W)v)の右辺の第一項には、yが含まれる。よって、式(y = Wx)を満足するxを求めるためには、yが必要である。yは、iが0の場合の低解像度ブロックの画素の値を並べたベクトルであった。したがって、高い画質の高解像度画像110を得るために、ブロックサイズ決定部101は、iを0以上とすることにより、ブロックサイズデータ107を決定するとよい。
The first term on the right side of the formula (x = W + y + (I−W + W) v) includes y. Therefore, in order to obtain x that satisfies the equation (y = Wx), y is required. y is a vector in which the values of the pixels of the low resolution block when i is 0 are arranged. Therefore, in order to obtain a high-
従来手法では係数を学習しその係数を利用して高解像度化していた。しかし、高解像度画像中のある画素を作成するために、低解像度画像中のどの領域を利用すればよいのかという指標が与えられていなかった。例えば高解像度画像中のある画素を作成するために、低解像度画像中の近傍16画素(縦横それぞれ4画素)を利用することにした場合を考える。それにより高解像度画像中のその画素を計算できる。その他の画素についても同様に計算できる。しかし、作成した高解像度画像を低解像度化したときに、入力の低解像度画像に一致する保証がない。一致しなかった場合、一致しない分の誤差が作成した高解像度画像に存在し、画質が低い。その誤差が発生しないようにするために、従来は、低解像度画像中で利用する画素を試行錯誤で決定する必要がある。それに対し、本実施形態によれば、高解像度画像中の画素の値を計算するために、低解像度画像中のどの画素を利用すればよいのかが明確になる。 In the conventional method, a coefficient is learned and the resolution is increased by using the coefficient. However, no index has been given as to which area in the low-resolution image should be used to create a certain pixel in the high-resolution image. For example, consider a case where 16 pixels in the vicinity (4 pixels each in the vertical and horizontal directions) in the low resolution image are used in order to create a certain pixel in the high resolution image. Thereby, the pixel in the high resolution image can be calculated. The same calculation can be performed for other pixels. However, when the created high-resolution image is reduced in resolution, there is no guarantee that it matches the input low-resolution image. If they do not match, an error that does not match exists in the created high-resolution image, and the image quality is low. In order to prevent the error from occurring, conventionally, it is necessary to determine pixels to be used in a low-resolution image by trial and error. On the other hand, according to the present embodiment, it is clear which pixel in the low resolution image should be used in order to calculate the value of the pixel in the high resolution image.
(1−2)係数行列Fの第1の学習方法
次に、係数行列Fの第1の学習装置、及び、方法について説明する。
係数行列Fの学習装置1000について図10を参照して説明する。
係数行列Fの学習装置1000は、低解像度画像作成部1001と、ブロック抽出部1002と、係数データ学習部1003と、係数データ保持部102を有する。係数行列Fの学習装置1000への入力は、サイズデータ1004と、学習用高解像度画像1005と、ブロックサイズデータ1006である。学習用高解像度画像1005は係数行列Fを学習するために利用する学習用の高解像度画像である。学習用高解像度画像1005は低解像度画像作成部1001とブロック抽出部1002に送られる。サイズデータ1004は学習用高解像度画像1005のサイズ(幅と高さ)である。サイズデータ1004は低解像度画像作成部1001に送られる。ブロックサイズデータ1006はclとrlとchとrhとiである。ブロックサイズデータ1006は低解像度画像作成部1001とブロック抽出部1002と係数データ学習部1003と係数データ保持部102に送られる。係数行列Fの学習装置1000は、係数データ保持部102に係数データ1009を保持させる。
(1-2) First Learning Method for Coefficient Matrix F Next, a first learning device and method for the coefficient matrix F will be described.
The
The coefficient matrix
低解像度画像作成部1001は、入力したサイズデータ1004と、入力した学習用高解像度画像1005と、入力したブロックサイズデータ1006のうちのclとrlとchとrhから、学習用低解像度画像1007を作成しブロック抽出部1002に送る。学習用低解像度画像1007は学習用高解像度画像1005を低解像度化することにより作成する。学習用低解像度画像1007は式(y = Wx)を満足するように作成するとよい。学習用低解像度画像1007をさらにぼかしても良い。ぼかした低解像度画像を高解像度に変換するように学習された係数を利用して高解像度化すると作成される高解像度画像がより鮮鋭になる。ここでのxは、学習用高解像度画像1005中の幅がchで高さがrhである高解像度ブロックを表す。yは、そのxと位置が対応する学習用低解像度画像1007中の幅がclで高さがrlである低解像度ブロックを表す。低解像度画像作成部1001はiを利用しないためiを低解像度画像作成部1001に送らなくても構わない。
Low-resolution
ブロック抽出部1002は、入力した学習用高解像度画像1005と入力したブロックサイズデータ1006と入力した学習用低解像度画像1007から、学習用ブロック1008を抽出し係数データ学習部1003に送る。学習用ブロック1008は、学習用高解像度画像1005中の幅がchで高さがrhである学習用高解像度ブロックと、その学習用高解像度ブロックに対応する学習用低解像度画像1007中の幅が(cl + i)で高さが(rl + i)である学習用低解像度ブロックとの組からなり、その組は1組以上である。学習用高解像度画像1005の枚数を増やせば、その組の数を増やせる。組の数を増やせば増やすほど、学習の効果が高まる。
The
係数データ学習部1003は、ブロックサイズデータ1006と学習用ブロック1008から、係数データ1009を学習し係数データ保持部102に送る。係数データ1009は以下で説明する係数行列Fである。学習用ブロック1008のうち、学習用高解像度ブロックを示すchrh次元の縦ベクトルをxn(n = 1,2,...,N)で表し、学習用低解像度ブロックを示す(cl + i)(rl + i)次元の縦ベクトルをzn(n = 1,2,...,N)で表す。ここで、Nは学習用の組の数を表す。i = 0とした場合の低解像度ブロックznをynで表す。低解像度ブロックynはiが正である低解像度ブロックznの一部である。低解像度ブロックynと高解像度ブロックxnは、被写体の同じ部分を表す。低解像度ブロックznを係数行列Fで高解像度化したときの2乗誤差enは、次の式で表される。
ここで、Fが未知数である。全ての学習用のブロックの組に対する2乗誤差en(n = 1,2,...,N)の総和Eは、次の式で表される。
このEを最小化するFを、係数データ保持部102に保持しておけば、未知の入力の低解像度ブロックをFにより高解像度化したときの、未知の真の高解像度ブロックに対する2乗誤差が小さくなると期待できる。Eを最小化するFを求めるために、EをFで偏微分すると、次の式が得られる。
ここで、Tは、行列やベクトルの転置を表す。
を0と置くと、次の式
が得られる。
は、Nが大きく、znが互いに類似していなければ、正則行列となり、逆行列を持つ。したがって、Eを最小化するFは、次の式で計算できる。
ここで、−1は、行列の逆行列を表す。iが0以上であれば、こうして求めたFによる高解像度ブロックxは、式(y = Wx)を満足する場合が多い。しかし、満足する保証はない。もし、
が正則でない場合は、Fを次の式で計算するとよい。
ここで、+は、行列の一般逆行列を表す。 Here, + represents a general inverse matrix.
係数データ保持部102は、ブロックサイズデータ1006(clとrlとchとrhとi)と係数データ1009(F)を組にして保持する。これにより、あるブロックサイズデータ1006(clとrlとchとrhとi)に対応する係数データ1009(F)が保持される。
Coefficient
次に、図10の学習装置1000の動作の一例について図11を参照して説明する。
S1101では、ブロックサイズデータ1006(clとrlとchとrhとi)が低解像度画像作成部1001とブロック抽出部1002と係数データ学習部1003と係数データ保持部102に入力される。
Next, an example of the operation of the
In S1101, it is input to the
S1102では、学習用に準備した高解像度画像の中から1枚が学習用高解像度画像1005として低解像度画像作成部1001とブロック抽出部1002に入力され、その学習用高解像度画像1005のサイズがサイズデータ1004として入力される。
In S1102, one of the high-resolution images prepared for learning is input as a learning high-
S1103では、低解像度画像作成部1001が、サイズデータ1004と学習用高解像度画像1005とブロックサイズデータ1006のうちのcl、rl、ch、およびrhとから、学習用低解像度画像1007を作成する。
In step S <b> 1103, the low-resolution
S1104では、ブロック抽出部1002が、学習用高解像度画像1005とブロックサイズデータ1006と学習用低解像度画像1007から、学習用高解像度ブロックとそれに対応する学習用低解像度ブロックの組を抽出する。抽出する組の数が多いほど学習の効果が高まる。ただし、ブロック内で画素値の変動が小さいブロック(平坦なブロック)は抽出しなくても構わない。
In S1104, the
S1105では、学習用に準備した高解像度画像が全て入力されたかどうかを確認し、入力されていればS1106に進み、入力されていなければS1102に戻る。この確認作業は、学習装置1000の外部からのユーザ入力により実行される。あるいは、学習用に準備した高解像度画像の枚数をサイズデータ1004に含ませ、低解像度画像作成部1001で入力された学習用高解像度画像1005の枚数を数える機能を持たせ、この確認作業を低解像度画像作成部1001に実行させても良い。
In S1105, it is confirmed whether or not all the high resolution images prepared for learning have been input. If they have been input, the process proceeds to S1106, and if not, the process returns to S1102. This confirmation work is executed by user input from outside the
S1106では、係数データ学習部1003が、ブロックサイズデータ1006と、抽出した学習用高解像度ブロックとそれに対応する学習用低解像度ブロックの組の全て(学習用ブロック1008)から、係数データ1009(F)を学習し、係数データ保持部102がその係数データ1009(F)をブロックサイズデータ1006(clとrlとchとrhとi)と組にして保持する。
In step S1106, the coefficient
(1−3)係数行列Fの第2の学習方法
係数行列Fの第1の学習方法で学習したFによる高解像度ブロックxは、式(y = Wx)を満足する保証がない。式(y = Wx)を満足させられる係数行列Fの第2の学習装置、及び、方法について説明する。
係数行列Fの第2の学習装置は、第1の学習装置と同じで、図10に示す通りである。ただし、係数データ学習部1003におけるFの計算方法のみが異なる。また、係数行列Fの第2の学習方法の処理の流れは、第1の学習方法と同じで、図11に示す通りである。ただし、S1106におけるFの計算方法のみが異なる。そこで、Fの計算方法のみを説明する。
(1-3) Second Learning Method for Coefficient Matrix F The high-resolution block x by F learned by the first learning method for the coefficient matrix F is not guaranteed to satisfy the equation (y = Wx). A second learning device and method for the coefficient matrix F that can satisfy the equation (y = Wx) will be described.
The second learning device for the coefficient matrix F is the same as the first learning device, as shown in FIG. However, only the calculation method of F in the coefficient
Fの計算方法の説明のために、clrl次元縦ベクトルの分解について説明する。xnなどのchrh次元の縦ベクトルは、chrh次元ユークリッド空間
中の一点である。この空間は、R(WT)とN(W)の直交直和になっている。ここで、R(WT)は、
R(WT) = {x|x = WTy}
により定義されるWTの値域である。N(W)は、
N(W) = {x|Wx = 0}
により定義されるWの零空間であり、0は要素が全て0のclrl次元縦ベクトルを表す。この直交直和の関係から、chrh次元ユークリッド空間
R (W T ) = {x | x = W T y}
A range of defined W T by. N (W) is
N (W) = {x | Wx = 0}
The zero space of W defined by, where 0 represents a c l r l dimensional vertical vector with all elements being 0. From this orthogonal direct sum relationship, the c h r h dimensional Euclidean space
中の任意のchrh次元の縦ベクトルxを、次の式の通り、R(WT)の元とN(W)の元に一意に分解できる。 Arbitrary c h r h dimensional vertical vectors x can be uniquely decomposed into R (W T ) elements and N (W) elements as follows:
x = W+Wx + (I − W+W)x
ここで、W+WはR(WT)への正射影行列であり、I − W+WはN(W)への正射影行列である。
x = W + Wx + (I−W + W) x
Here, W + W is an orthogonal projection matrix to R (W T ), and I − W + W is an orthogonal projection matrix to N (W).
P = I − W+W
と置くと、chrh次元の縦ベクトルxを
x = W+Wx + Px
と一意に分解できる。
P = I-W + W
Then, the vertical vector x of the c h r h dimension is expressed as x = W + Wx + Px
And can be decomposed uniquely.
式(y = Wx)を満足させられる係数行列Fの一般形は、次の式で与えられる。 The general form of the coefficient matrix F that satisfies the equation (y = Wx) is given by the following equation.
F = S + PX
ここでSは、Sz = W+Wx = W+yを満足するchrh行(cl + i)(rl + i)列の行列であり、W+の要素と0を要素に持つ。Xは、chrh行(cl + i)(rl + i)列の任意の行列である。Fは、低解像度ブロックを表す(cl + i)(rl + i)次元の縦ベクトルzを、低解像度化によってyになる高解像度ブロックを示すchrh次元の縦ベクトルの集合である線形多様体に属するベクトルに変換する係数行列の一般形である。Fがこの式(F = S + PX)で表されるという制約の下で、Eを最小化するPXを求めることにより、Fを学習する。Pは正射影行列であるため、PT = PとP2 = Pが成立する。したがって、
Where S is the Sz = W + Wx = W + y satisfies c h r h line (c l + i) (r l + i) column of the matrix, with a W + components and 0 to the element . X is an arbitrary matrix of c h r h rows (c l + i) (r l + i) columns. F is a set of (c l + i) (r l + i) -dimensional vertical vectors z representing low-resolution blocks, and c h r h- dimensional vertical vectors indicating high-resolution blocks that become y by resolution reduction. It is a general form of a coefficient matrix that converts to a vector belonging to a certain linear manifold. F is learned by obtaining PX that minimizes E under the constraint that F is represented by this formula (F = S + PX). Since P is an orthogonal projection matrix, P T = P and P 2 = P are established. Therefore,
となる。Pは定数であるため、EをPXではなく、Xで偏微分すると、次の式
が得られる。
を0と置くと、次の式
が得られる。
は、Nが大きく、znが互いに類似していなければ、逆行列を持つため、Eを最小化するPXは、次の式で計算できる。
これを式(F = S + PX)に代入したものが、求めるFである。このFによる高解像度ブロックxは、式(y = Wx)を満足する。もし、
が逆行列を持たない場合は、PXを次の式で計算するとよい。
こうして求めたFにより低解像度ブロックzを高解像度化したFzに、左からWをかけることにより低解像度化した低解像度ブロックWFzがyに一致することは、WW+が単位行列であることと、W(I − W+W)が零行列であることから明らかである。 The fact that the low resolution block WFz which has been reduced in resolution by applying W from the left to Fz obtained by increasing the resolution of the low resolution block z by F thus obtained matches y is that WW + is a unit matrix, It is clear from W (I−W + W) being a zero matrix.
(1−4)本実施形態の効果
本実施形態により、高解像度画像中の画素の値を計算するために、低解像度画像中のどの画素を利用すればよいのかが明確になる。その画素を利用して高解像度化するための係数を学習し、その係数を利用して作成した高解像度ブロックを低解像度化すると、入力に近付く、あるいは、一致するようになる。これにより、誤差が減少する。すなわち、高画質化の効果がある。
(1-4) Effects of the Present Embodiment According to the present embodiment, which pixel in the low-resolution image should be used to calculate the value of the pixel in the high-resolution image becomes clear. When a coefficient for increasing the resolution is learned using the pixel and the resolution of a high-resolution block created using the coefficient is reduced, the input approaches or coincides with the input. This reduces the error. That is, there is an effect of improving the image quality.
(1−5)第1の変更例:一次結合で表現できないブロックを学習して加算する変更例
本実施形態をさらに高解像度化するための変更例を説明する。本実施形態では、式(x = Fz)により高解像度化した。この高解像度化では、低解像度ブロックと係数の一次結合で表される高解像度ブロックしか作成できない。しかし、真で未知の高解像度ブロックが、その一次結合で表現されるとは限らない。そこで、その一次結合で表現できない成分を学習し、加算するように変更する。
第1の変更例の画像高解像度化装置1200について図12を参照して説明する。図1の構成に対し、加算データ保持部1201と、加算データ保持部1201との結線が追加される。変更点のみを説明する。
(1-5) First modification example: Modification example in which blocks that cannot be expressed by linear combination are learned and added
A modification example for further increasing the resolution of this embodiment will be described. In the present embodiment, the resolution is increased by the equation (x = Fz). With this high resolution, only a high resolution block represented by a linear combination of a low resolution block and a coefficient can be created. However, true and unknown high-resolution blocks are not always represented by their linear combination. Therefore, a component that cannot be expressed by the linear combination is learned and changed to be added.
An image
ブロックサイズ決定部101は、ブロックサイズデータ107(clとrlとiとchとrh)を、加算データ保持部1201にも送る。
Block
加算データ保持部1201は、ブロックサイズデータ107(clとrlとiとchとrh)から、このデータに対応する加算データ1203を読み出し、作成部1202に送る。ここで、加算データ1203は、ブロックサイズデータ107(clとrlとiとchとrh)ごとに学習されて加算データ保持部1201に保持されている。加算データ1203の学習方法についてはすぐ後に説明する。
Addition
作成部1202は、入力した低解像度画像105と入力した係数データ108(F)と入力した位置データ109と入力した加算データ1203から、高解像度画像110を作成して出力する。ブロック位置制御部103により制御されている位置データ109が変化するたびに、高解像度画像110中の高解像度ブロックxが順次作成される。
The
加算データ1203と作成部1202における高解像度ブロックxの作成方法について説明する。第1の変更例では、次の式により、高解像度ブロックxを作成する。
A method of creating the high-resolution block x in the
x = Fz + h
ここで、hはxと同じ次元の縦ベクトルである。Fは上述の方法で学習したものである。このhを、Fを学習してから学習する。予め学習したhを、加算データ1203として、加算データ保持部1201に保持する。
x = Fz + h
Here, h is a vertical vector having the same dimension as x. F is learned by the method described above. This h is learned after learning F. The h learned in advance is held in the addition
加算データ1203(h)の学習方法を説明する。Fとhで低解像度ブロックznを高解像度化したときの2乗誤差enは、次の式で表される。
ここで、Fは定数でありhが未知数である。全ての学習用のブロックの組に対する2乗誤差en(n = 1,2,...,N)の総和Eを最小化するhを学習する。Eをhで偏微分することにより、次の式
が得られる。
を0と置くと、次の式が得られる。
よって、Eを最小化するhは次の式で学習できる。
次に、図12の画像高解像度化装置1200の動作の一例について図13を参照して説明する。図13では、図4の処理の流れに対し、S1301が追加される。変更点のみを説明する。
S402の後は、S403ではなく、S1301に進む。
S1301では、ブロックサイズデータ107(clとrlとiとchとrh)から、対応する加算データ1203(h)を読み出し、S403に進む。
S404では、位置データ109が示す低解像度画像105中の低解像度ブロック(z)と係数データ108(F)と加算データ1203(h)から、作成する高解像度画像110中の位置データ109が示す高解像度ブロック(x)を、式(x = Fz + h)により作成し、S405に進む。
Next, an example of the operation of the image
After S402, the process proceeds to S1301, not S403.
In S1301, the
In S404, the
次に、係数行列Fと加算データ1203の学習装置1400について図14を参照して説明する。学習装置1400は、図10の構成に対し、加算データ学習部1401と加算データ保持部1201とそれらとの結線が追加されている。変更点のみを説明する。
Next, a
ブロックサイズデータ1006(clとrlとchとrhとi)は、加算データ学習部1401と加算データ保持部1201にも送られる。学習用ブロック1008は、加算データ学習部1401にも送られる。係数データ1009(F)は、加算データ学習部1401にも送られる。
加算データ学習部1401は、ブロックサイズデータ1006(clとrlとchとrhとi)と学習用ブロック1008と係数データ1009(F)とから、加算データ1402を学習し、加算データ学習部1401に送る。加算データ1402はhである。学習方法は上述の通りである。
Addition
加算データ保持部1201は、ブロックサイズデータ1006(clとrlとchとrhとi)と加算データ1402(h)を組にして保持する。これにより、あるブロックサイズデータ1006(clとrlとchとrhとi)に対応する加算データ1402(h)が保持される。
Addition
図14の学習装置1400の動作の一例について図15を参照して説明する。図15では、図11の処理の流れに対し、S1501が追加されている。その部分のみを説明する。
S1501では、ブロックサイズデータ1006(clとrlとchとrhとi)と学習用ブロック1008と係数データ1009(F)から、加算データ1402を学習し、ブロックサイズデータ1006(clとrlとchとrhとi)と加算データ1402(h)を組にして保持する。
An example of the operation of the
At S1501, the
第1の変更例によれば、学習した係数データを利用して、さらに加算データを学習するという2段階の学習がなされる。加算データは、係数データを利用した一次結合で表現できない成分であるため、高解像度化の効果がある。 According to the first modification, two-stage learning is performed in which additional data is learned using the learned coefficient data. Since the added data is a component that cannot be expressed by linear combination using coefficient data, there is an effect of increasing the resolution.
(1−6)第2の変更例:一次結合で表現できないブロックを学習して加算する変更例
第1の変形例では、hを学習するために、学習用のデータ(xnとznとyn)が大量に必要である。hの各要素のとりうる範囲が広く、hがchrh次元という高次元のベクトルであるためである。そこで、学習用のデータ(xnとznとyn)の数Nが少なくても高い画質を得られるようにするために変更したのが、本変更例である。
(1-6) Second modification example: Modification example in which blocks that cannot be expressed by linear combination are learned and added
In the first modification, a large amount of learning data (x n , z n, and y n ) is necessary to learn h. This is because each element of h can have a wide range, and h is a high-dimensional vector of c h r h dimensions. So, was changed in order to obtain high image quality even with a small number N of data for learning (x n and z n and y n) is an this modification.
本変更例でも、画像高解像度化装置の構成は図12の通りである。第1の変更例と異なる部分のみを説明する。本変更例では、加算データ1203として、後述の方法で学習したhを、加算データ保持部1201に保持する。作成部104では、加算データ保持部1201(後述の方法で学習したh)を利用して、次の式により、高解像度ブロックxを作成する。
x = Fz + ‖M‖h
ここで、Fは、上述の方法で学習したものである。Mは、xと同じ次元の縦ベクトルである。例えばMは、次の式で定義される。
M = Fz − w
ここで、wは、zを最近傍内挿法により高解像度化した高解像度ブロックを示すxと同じ次元の縦ベクトル、あるいは、
w = W+y
により定義されるベクトルである。hを学習する際には、Mは学習用の低解像度ブロック(znとyn)から計算する。nに依存するため、学習の際のMをMnと表記する。
Also in this modified example, the configuration of the image resolution increasing apparatus is as shown in FIG. Only the differences from the first modification will be described. In the present modification example, h learned by the method described later is held in the added
x = Fz + ‖M‖h
Here, F is learned by the above method. M is a vertical vector having the same dimension as x. For example, M is defined by the following formula.
M = Fz−w
Here, w is a vertical vector of the same dimension as x indicating a high resolution block obtained by increasing the resolution of z by nearest neighbor interpolation, or
w = W + y
Is a vector defined by When learning h, M is calculated from the low-resolution blocks for learning (z n and y n ). Since it depends on n, M at the time of learning is expressed as M n .
Mn = Fzn − wn
ここで、wnは、znを最近傍内挿法により高解像度化した高解像度ブロックを示すxnと同じ次元の縦ベクトル、あるいは、
wn = W+yn
により定義されるベクトルである。Fとhで低解像度ブロックznを高解像度化したときの2乗誤差enは、次の式で表される。
Here, w n is a vertical vector of the same dimension as x n indicating a high resolution block obtained by increasing the resolution of z n by nearest neighbor interpolation, or
w n = W + y n
Is a vector defined by Square error e n when the high resolution low-resolution block z n at F and h is expressed by the following equation.
ここで、FとMnは定数であり、hが未知数である。全ての学習用のブロックの組に対する2乗誤差en(n = 1,2,...,N)の総和Eを最小化するhを学習する。Eをhで偏微分することにより、次の式
が得られる。
を0と置くと、次の式が得られる。
よって、Eを最小化するhは次の式で学習できる。
第2の変更例でも、画像高解像度化方法の処理の流れは図13の通りである。第1の変更例と異なる部分のみを説明する。
S404では、位置データ109が示す低解像度画像105中の低解像度ブロック(z)と係数データ108(F)と加算データ1203(h)から、作成する高解像度画像110中の位置データ109が示す高解像度ブロック(x)を、式(x = Fz + ‖M‖h)により作成し、S405に進む。
Also in the second modified example, the flow of processing of the image high-resolution method is as shown in FIG. Only the differences from the first modification will be described.
In S404, the
また、第2の変更例の加算データ保持部1201の学習装置の構成は、第1の変更例と同じで、図14に示す通りである。ただし、加算データ学習部1401における加算データ1402(h)の学習方法が第1の変形例で説明した方法から、ここで示した方法に変わる。
The configuration of the learning device of the added
さらに、第2の変更例の加算データ保持部1201の学習方法の処理の流れは、第1の変更例と同じで、図15に示す通りである。ただし、S1501における加算データ1402(h)の学習方法が第1の変更例で説明した方法から、ここで示した方法に変わる。
Furthermore, the processing flow of the learning method of the addition
第2の変更例によれば、係数データを利用した一次結合で表現できない成分を効率よく学習できる。したがって、学習用のデータ(xnとznとyn)の数Nが大きくない場合に、高い画質を得られる。 According to the second modification, it is possible to efficiently learn components that cannot be expressed by linear combination using coefficient data. Therefore, high image quality can be obtained when the number N of learning data (x n , z n, and y n ) is not large.
(1−7)第3の変更例:低解像度画像を強調する変更例
鮮鋭な高解像度画像110を作成するために、低解像度画像を強調する変更例を説明する。
(1-7) Third modification example: Modification example for emphasizing a low-resolution image
In order to create a sharp high-
本変更例では、作成部104において、低解像度画像105を強調する。低解像度ブロックは、強調された低解像度画像105中のブロックとなる。強調のためには、アンシャープマスクやラプラシアンフイルタを利用できる。低解像度画像105が鮮鋭に強調されるため、作成される高解像度画像110が鮮鋭になる。
In the present modification example, the
(1−8)第4の変更例:学習用の画像を強調する変更例
鮮鋭な高解像度画像110を作成するために、学習用の画像を強調する変更例を説明する。
(1-8) Fourth modification example: Modification example in which an image for learning is emphasized
In order to create a sharp high-
本変更例では、学習用の高解像度ブロックxnを、鮮鋭に強調してから、係数データや加算データを学習する。強調のためには、アンシャープマスクやラプラシアンフイルタを利用できる。学習用の高解像度ブロックxnを強調してもよいし、xnが含まれる元の画像を強調してもよい。これにより、より鮮鋭な高解像度ブロックを作成できる係数データや加算データが学習されるようになる。したがって、より鮮鋭な高解像度画像110を作成できる。
In the present modification example, the high-resolution block xn for learning is sharply emphasized, and then the coefficient data and the addition data are learned. An unsharp mask or Laplacian filter can be used for emphasis. The high-resolution block xn for learning may be emphasized, or the original image including xn may be emphasized. Thereby, coefficient data and addition data that can create a sharper high-resolution block are learned. Therefore, a sharper high-
(1−9)第5の変更例:ラベリングを利用する変更例
画質をさらに高めるために、ラベリングを利用する変更例を説明する。ラベリングを利用して、ラベルごとに係数データや加算データを学習する。これにより、さらに画質を高められる。ここではラベリングは分類することと同様な意味で使用している。
(1-9) Fifth modification example: Modification example using labeling
In order to further improve the image quality, a modified example using labeling will be described. By using labeling, coefficient data and addition data are learned for each label. Thereby, the image quality can be further improved. Here, labeling is used in the same meaning as classification.
本変形例では、第2の変更例に、さらに、ラベリングを利用した場合を説明する。ただし、ラベリングを利用した変更が、第2の変更例にしか適用できないわけではない。他の変更例を適用していない本実施形態にも適用できる。また、他の変更例を適用したものにも適用できる。 In the present modification, a case where labeling is further used in the second modification will be described. However, the change using labeling is not only applicable to the second modification example. The present embodiment is not applicable to other modified examples. Further, the present invention can be applied to other modified examples.
第5の変更例の画像高解像度化装置1600について図16を参照して説明する。
図12の第1の変更例の構成に、ラベリング部1601と、ラベリング部1601との結線が追加される。第2の変更例との変更点のみを説明する。
An image
The connection between the
低解像度画像105は、ラベリング部1601にも送られる。ブロック位置制御部103は、位置データ109をラベリング部1601にも送る。
ラベリング部1601は、位置データ109が示す低解像度ブロックzまたはyのラベルデータ1604を、所定の規則により決定して出力し、係数データ保持部1602と加算データ保持部1603に送る。ラベルデータ1604を決定するための規則としては、例えばベクトル量子化やADRCや増分符合などを利用する。低解像度ブロックをラベリングできれば良いため、例えば、低解像度ブロックにエッジ検出を施し、その結果に対してベクトル量子化やADRCや増分符号などを利用しても良い。ラベリング部1601は、低解像度ブロックzまたはyを所定の規則により変換し、変換したブロックをブロックに含まれる値にしたがってラベリング(分類)したデータをラベルデータ1604として出力する。変換したものは変換に特有な特徴量を示すので、ラベリング部1601はこの特徴量にしたがって低解像度ブロックzまたはyをラベリングする。ラベリング部1601は、例えば低解像度ブロック(ベクトルで表される)にADRCを施し、さらに2値化して、2値化で取り得るベクトル数だけ対応する低解像度ブロックをラベリングし、ラベリングされた低解像度ブロックzまたはyのラベルデータ1604を出力する。例えば低解像度ブロックがN列の縦ベクトルで表されている場合には、最終的に二値化によって2N個にクラスタリングできる。
The
The
係数データ保持部1602は、ブロックサイズデータ107(clとrlとiとchとrh)とラベルデータ1604から、対応する係数データ108(F)を読み出し、作成部1202に送る。ここで、係数データ108(F)は、ブロックサイズデータ107(clとrlとiとchとrh)とラベルデータ1604ごとに学習されて係数データ保持部1602に保持されている。Fの学習方法は後述する。
Coefficient
加算データ保持部1603は、ブロックサイズデータ107(clとrlとiとchとrh)とラベルデータ1604から、対応する加算データ1203(h)を読み出し、作成部1202に送る。ここで、加算データ1203(h)は、ブロックサイズデータ107(clとrlとiとchとrh)とラベルデータ1604ごとに学習されて加算データ保持部1201に保持されている。hの学習方法は後述する。
The addition
作成部1202は、低解像度画像105と係数データ108(F)と位置データ109と加算データ1203(h)から、高解像度画像110を作成して出力する。ブロック位置制御部103により制御されている位置データ109が変化するたびに、高解像度画像110中の高解像度ブロックxが順次作成される。高解像度ブロックxは、式(x = Fz + ‖M‖h)により作成される。
The
次に、図16の画像高解像度化装置の動作の一例について図17を参照して説明する。
S1701では、ブロックサイズ決定部101がサイズデータ106(wlとhlとwhとhh)からブロックサイズデータ107を決定し、S1702に進む。
Next, an example of the operation of the image resolution increasing apparatus in FIG. 16 will be described with reference to FIG.
In S1701, it determines the
S1702では、ブロック位置制御部103が、作成する高解像度画像110中の高解像度ブロック(x)の位置と、その高解像度ブロック(x)を作成するために必要な低解像度画像105中の低解像度ブロック(zまたはy)の位置を示す位置データ109を決定し、S1703に進む。
In S1702, the block
S1703では、ラベリング部1601が、位置データ109が示す低解像度ブロック(zまたはy)のラベルデータ1604を、所定の規則により決定し、S1704に進む。
In S1703, the
S1704では、係数データ保持部1602がブロックサイズデータ107(clとrlとiとchとrh)とラベルデータ1604から対応する係数データ108(F)を読み出し、S1705に進む。
In S1704, it reads the
S1705では、加算データ保持部1603がブロックサイズデータ107(clとrlとiとchとrh)とラベルデータ1604から対応する加算データ1203(h)を読み出し、S1706に進む。
In S1705, read the added
S1706では、作成部1202が、位置データ109が示す低解像度画像105中の低解像度ブロック(z)と係数データ108(F)と加算データ1203(h)から、作成する高解像度画像110中の位置データ109が示す高解像度ブロック(x)を、式(x = Fz + ‖M‖h)により作成し、S1707に進む。
In S1706, the
S1707では、作成部1202が、位置データ109の示す高解像度ブロック(x)が、高解像度画像110を埋め尽くすように制御されたかどうかを判定し、埋め尽くした場合は処理を終了し、埋め尽くしていない場合はS1702に戻る。ここでは、処理の終了条件を、位置データ109の示す高解像度ブロック(x)が、高解像度画像110を埋め尽くすように制御されたかどうかとしたが、他の基準で判定してもよい。
In S1707, the
次に、Fとhの学習について説明する。
学習用のデータ(xnとznとyn)のラベルを決定し、各ラベルの学習用のデータを利用してFを学習する。具体的には、まず学習用の低解像度ブロックznまたはynのラベルを、ラベリング部1601と同じ規則により決定する。次に、そのラベルを、学習用の高解像度ブロック(xn)のラベル、および、学習用の低解像度ブロック(znとyn)のラベルとする。最後に、各ラベルの学習用の高解像度ブロック(xn)と、学習用の低解像度ブロック(znとyn)とから、(1−2)や(1−3)の方法により、そのラベルのFを学習し、第2の変更例での方法により、そのラベルのhを学習する。これにより、ブロックサイズデータ107(clとrlとiとchとrh)とラベルデータ1604ごとにFとhが学習される。
Fとhの学習方法の処理の流れを示すフローチャートは、図15にラベルを計算するステップを追加したものとなるだけなので、図示は省略する。Fとhの学習装置は、図10にラベルを計算する手段を追加したものとなるだけなの、図示は省略する。
Next, learning of F and h will be described.
Determining the label data for learning (x n and z n and y n), to learn the F using the learning data for each label. Specifically, the first low-resolution label block z n or y n for learning, determined by the same rules as the
The flowchart showing the processing flow of the learning method for F and h is simply the addition of the step of calculating the label in FIG. The learning device for F and h is merely the addition of the means for calculating the label in FIG.
第5の変更例によれば、低解像度ブロック(zまたはy)のラベルを決定し、そのラベルに応じて学習されたFやhにより高解像度化される。したがって、低解像度ブロック(zまたはy)のラベルに応じた適応的な高解像度化がなされる。この適応的な高解像度化により、作成される高解像度ブロック(x)の画質が向上し、高解像度画像110の画質が上がる。
According to the fifth modification, the label of the low resolution block (z or y) is determined, and the resolution is increased by F and h learned according to the label. Therefore, an adaptive increase in resolution according to the label of the low resolution block (z or y) is performed. By this adaptive increase in resolution, the image quality of the created high-resolution block (x) is improved, and the image quality of the high-
(1−10)第6の変更例:ラベリングを利用する他の変更例
本変形例は、ラベリングを利用する第5の変更例とは別の変更例を説明する。
ここでは、第2の変更例にさらにラベリングを利用した場合を説明する。ただし、ラベリングを利用した変更が第2の変更例にしか適用できないわけではない。他の変更例を適用していない本実施形態にも適用できる。また、他の変更例を適用したものにも適用できる。
(1-10) Sixth modification example: Other modification examples using labeling
This modified example describes a modified example different from the fifth modified example using labeling.
Here, a case where labeling is further used in the second modification will be described. However, the change using labeling is not only applicable to the second change example. The present embodiment is not applicable to other modified examples. Further, the present invention can be applied to other modified examples.
本変更例の画像高解像度化装置1800について図18、図19を参照して説明する。
図12の構成に、第1ラベリング部1801と、第2ラベリング部1802と、それらとの結線が追加される。
An image
The
第1ラベリング部1801、第2ラベリング部1802は、第5の変更例で説明したラベリング部1601と処理内容は同様である。第1ラベリング部1801と第2ラベリング部1802とでは、入力する画像が異なる。
The
次に、図18の画像高解像度化装置の動作の一例について図19を参照して説明する。
S1701では、低解像度画像105が、ブロック位置制御部103と係数データ保持部102と加算データ保持部1201と第1ラベリング部1801と第2ラベリング部1802にも送られる。また、サイズデータ106(wlとhlとwhとhh)が、ブロックサイズ決定部101とブロック位置制御部103に送られる。そして、ブロックサイズ決定部101が、サイズデータ106(wlとhlとwhとhh)から、ブロックサイズデータ107(clとrlとiとchとrh)を決定し、ブロック位置制御部103と第1ラベリング部1801と第2ラベリング部1802と係数データ保持部1602と加算データ保持部1603と作成部1202に送り、S1702に進む。
Next, an example of the operation of the image resolution increasing apparatus in FIG. 18 will be described with reference to FIG.
In S <b> 1701, the
S1702では、ブロック位置制御部103が、サイズデータ106(wlとhlとwhとhh)とブロックサイズデータ107(clとrlとiとchとrh)とから、作成する高解像度画像110中の高解像度ブロック(x)の位置と、その高解像度ブロック(x)を作成するために必要な低解像度画像105中の低解像度ブロック(zまたはy)の位置を示す位置データ109を決定し、第1ラベリング部1801と作成部1202に送り、S1901に進む。
At S1702, the block
S1901では、第1ラベリング部1801が、低解像度画像105と位置データ109から、位置データ109が示す低解像度ブロック(zまたはy)の第1ラベルデータ1803を、所定の規則により決定し、係数データ保持部102に送り、S1704に進む。第1ラベルデータ1803を決定するための規則としては、例えばベクトル量子化やADRCや増分符合などを利用できる。低解像度ブロックをラベリングできれば良いため、例えば、低解像度ブロックにエッジ検出を施し、その結果に対してベクトル量子化やADRCや増分符号などを利用しても良い。
In S1901, the
S1704では、係数データ保持部1602が、ブロックサイズデータ107(clとrlとiとchとrh)と第1ラベルデータ1803から、対応する係数データ108(F)を読み出し、作成部1202に送り、S1903に進む。ここで、係数データ108(F)は、ブロックサイズデータ107(clとrlとiとchとrh)と第1ラベルデータ1803ごとに学習されて、係数データ保持部102に保持されている。Fの学習方法は後述する。
In S1704, the coefficient
S1902では、作成部1202が、低解像度画像105と係数データ108(F)と位置データ109から、位置データ109が示すzにFを左からかけることにより、位置データ109に対応する高解像度ブロック(Fz)を計算し、ブロックデータ1804として、第2ラベリング部1802に送り、S1903に進む。
In S1902, the
S1903では、第2ラベリング部1802が、ブロックサイズデータ107(clとrlとiとchとrh)のうちのchとrhとブロックデータ1804(Fz)から、ブロックデータ1804(Fz)の第2ラベルデータ1805を、所定の規則により決定し、加算データ保持部1603に送り、S1705に進む。ブロックサイズ決定部101が、第2ラベリング部1802に、clとrlとiとchとrhを送るようにしたが、第2ラベリング部1802ではchとrhしか利用しないため、それらだけを送るようにしてもよい。
In S1903, the
S1705では、加算データ保持部1603が、ブロックサイズデータ107(clとrlとiとchとrh)と第2ラベルデータ1805から、対応する加算データ1203(h)を読み出し、作成部1202に送り、S1904に進む。ここで、加算データ1203(h)は、ブロックサイズデータ107(clとrlとiとchとrh)と第2ラベルデータ1805ごとに学習されて加算データ保持部1201に保持されている。hの学習方法は後述する。
In S1705, the sum
S1904では、作成部1202が、低解像度画像105と係数データ108(F)と位置データ109と加算データ1203(h)と、S1902で計算したFzとから、位置データ109の示す高解像度ブロック(x)を、式(x = Fz + ‖M‖h)により計算し、S1707に進む。ブロック位置制御部103により制御されている位置データ109が変化するたびに、高解像度画像110中の高解像度ブロックxが順次作成される。
In S1904, the
S1707では、作成部1202が、位置データ109の示す高解像度ブロック(x)が、高解像度画像110を埋め尽くすように制御されたかどうかを判定し、埋め尽くした場合は作成部104が高解像度画像110を出力して処理を終了し、埋め尽くしていない場合はS1702に戻る。ここでは、処理の終了条件を、位置データ109の示す高解像度ブロック(x)が、高解像度画像110を埋め尽くすように制御されたかどうかとしたが、他の基準で判定してもよい。
In step S1707, the
次に、Fの学習方法を説明する。
学習用のデータ(xnとznとyn)の第1ラベルを決定し、各第1ラベルの学習用のデータを利用して、Fを学習する。具体的には、まず学習用の低解像度ブロックznまたはynの第1ラベルを、第1ラベリング部1801と同じ規則により決定する。次に、その第1ラベルを、学習用の高解像度ブロック(xn)の第1ラベル、および、学習用の低解像度ブロック(znとyn)の第1ラベルとする。最後に、各第1ラベルの学習用の高解像度ブロック(xn)と、学習用の低解像度ブロック(znとyn)とから、(1−2)や(1−3)の方法により、その第1ラベルのFを学習する。
Next, a learning method for F will be described.
Determining a first label data for learning (x n and z n and y n), by using the learning data of the first label, to learn F. Specifically, the first low-resolution block first label z n or y n for learning, determined by the same rule as the
次に、hの学習方法を説明する。
学習用のデータ(xnとznとyn)の第2ラベルを決定し、各第2ラベルの学習用のデータを利用して、hを学習する。具体的には、まず学習用の低解像度ブロックznから計算した高解像度ブロックFznの第2ラベルを、第2ラベリング部1802と同じ規則により決定する。ここで、Fは、第1ラベルに応じた係数行列であることに注意が必要である。次に、その第2ラベルを、学習用の高解像度ブロック(xn)の第2ラベル、および、学習用の低解像度ブロック(znとyn)の第2ラベルとする。最後に、各第2ラベルの学習用の高解像度ブロック(xn)とFznから、第2の変更例での方法によりその第2ラベルのhを学習する。
Next, a learning method for h will be described.
Determining a second label data for learning (x n and z n and y n), by using the learning data of the second label, to learn h. Specifically, first, the second label of the high resolution block Fz n calculated from the learning low resolution block z n is determined according to the same rule as the
なお、Fとhの学習方法の処理の流れを示すフローチャートは、図15に、第1ラベルを計算するステップと第2ラベルを計算するステップを追加したものとなるだけので、図示は省略する。Fとhの学習装置は、図10に、第1ラベルを計算する手段と第2ラベルを計算する手段を追加したものとなるだけので、図示は省略する。 Note that the flowchart showing the processing flow of the learning method for F and h is simply the addition of the step for calculating the first label and the step for calculating the second label in FIG. The learning apparatus for F and h is the same as that shown in FIG. 10 except that means for calculating the first label and means for calculating the second label are added.
第6の変更例によれば、低解像度ブロックzまたはyの第1ラベルに応じて学習されたFと、高解像度ブロックFzの第2ラベルに応じて学習されたhにより高解像度化される。したがって、第1ラベルと第2ラベルに応じた適応的な高解像度化がなされる。この適応的な高解像度化により、作成される高解像度ブロック(x)の画質が向上し、高解像度画像110の画質が上がる。
According to the sixth modification, the resolution is increased by F learned according to the first label of the low resolution block z or y and h learned according to the second label of the high resolution block Fz. Therefore, adaptively high resolution is made according to the first label and the second label. By this adaptive increase in resolution, the image quality of the created high-resolution block (x) is improved, and the image quality of the high-
第5の変更例と第6の変更例では、ラベルに応じて学習したFとhによる高解像度化の例を示した。他にも、Fのみをラベルに応じて学習したり、hのみをラベルに応じて学習したりすることなどができる。 In the fifth modification example and the sixth modification example, an example of increasing the resolution by F and h learned according to the label is shown. In addition, it is possible to learn only F according to the label, or to learn only h according to the label.
(1−11)第7の変更例:高倍率用に学習した係数データと加算データから低倍率用の係数データと加算データを作成する変更例
本実施形態やその変更例では、係数データ108(F)や加算データ1203(h)が予め学習されて保持されていた。Fとhは高解像度化率(横方向にch/cl倍と縦方向にrh/rl倍)が同じであれば同じものを利用できる。しかし、別の高解像度化率に対してはそのFとhを利用できない。多くの高解像度化率での高解像度化を実現するために、多くのFとhを学習して保持する場合、学習の手間がかかる上にそれらFとhの保持のためのメモリが多く必要になるという問題がある。そこで、ある高解像度化率用に学習したFとhからそれよりも低い高解像度化率用のFとhを作成する変更例を説明する。
ここでは、第2の変更例をさらに変更する例を説明する。ただし、第7の変更例が第2の変更例にしか適用できないわけではない。他の変更例を適用していない本実施形態にも適用できる。また、他の変更例を適用したものにも適用できる。
(1-11) Seventh modification example: Modification example for creating coefficient data and addition data for low magnification from coefficient data and addition data learned for high magnification
In the present embodiment and its modified examples, the coefficient data 108 (F) and the addition data 1203 (h) are learned and held in advance. If F and h have the same high resolution ratio (c h / c 1 times in the horizontal direction and r h / r 1 times in the vertical direction), the same can be used. However, the F and h cannot be used for other high resolution ratios. In order to realize high resolution at many high resolution ratios, when learning and holding many F and h, it takes time for learning and requires a lot of memory for holding these F and h. There is a problem of becoming. Therefore, a description will be given of a modification example in which F and h for a higher resolution rate lower than the F and h learned for a higher resolution rate are created.
Here, an example in which the second modification example is further modified will be described. However, the seventh modification example cannot be applied only to the second modification example. The present embodiment is not applicable to other modified examples. Further, the present invention can be applied to other modified examples.
第7の変更例の画像高解像度化装置の構成を示す図は、第2の変更例と同様で図12である。ただし、係数データ保持部102と加算データ保持部1201の動作が異なる。その部分のみを説明する。
係数データ保持部102は、ブロックサイズデータ107(clとrlとiとchとrh)から、対応する係数データ108(F)が存在すればそれを読み出し存在しなければ作成して、作成部1202に送る。存在しなかった場合のFの作成方法は後述する。
The diagram showing the configuration of the image resolution increasing apparatus of the seventh modification is the same as that of the second modification, and is FIG. However, the operations of the coefficient
The coefficient
加算データ保持部1201は、ブロックサイズデータ107(clとrlとiとchとrh)から、対応する加算データ1203(h)が存在すればそれを読み出し存在しなければ作成して、作成部104に送る。存在しなかった場合のhの作成方法は後述する。
The addition
第7の変更例の画像高解像度化装置の処理の流れを示す図は、第2の変更例と同様で図13の通りである。ただし、S402とS1301での処理の内容が異なる。その部分のみを説明する。
S402では、係数データ保持部102が、ブロックサイズデータ107(clとrlとiとchとrh)から、対応する係数データ108(F)が存在すればそれを読み出し存在しなければ作成して、S1301に進む。
A diagram showing a flow of processing of the image resolution increasing apparatus of the seventh modified example is the same as that of the second modified example, and is as shown in FIG. However, the contents of the processing in S402 and S1301 are different. Only that part will be described.
In S402, the coefficient
S1301では、作成部1202が、ブロックサイズデータ107(clとrlとiとchとrh)から、対応する加算データ1203(h)が存在すればそれを読み出し存在しなければ作成して、S403に進む。
In S1301,
次に、対応する係数データ108(F)が存在しなかった場合のFの作成方法を説明する。
まず、係数データ保持部102から、高解像度化率(横方向にch/cl倍と縦方向にrh/rl倍)よりも高い高解像度化率に対応する係数データ108の中で、iが等しいものを探索する。この係数データ108をF’で表し、F’に対応するブロックサイズデータ107をcl’とrl’とch’とrh’で表す。
Next, a method for creating F when the corresponding coefficient data 108 (F) does not exist will be described.
First, from the coefficient
次に、clとcl’の最小公倍数cを計算し、rlとrl’の最小公倍数rを計算する。最小公倍数は、ユークリッドの互除法を利用すれば計算できる。次に、横方向にc + i画素で縦方向にr + i画素のブロックaを、横方向にcch’/cl’画素で縦方向にrrh’/rl’画素のブロックbに高解像度化する行列GをF’から作成する。Gはcch’rrh’/(cl’rl’)行(c + i)(r + i)列の行列である。Gは、F’の要素と0を要素に持つ。 Next, 'calculates the least common multiple c of, r l and r l' c l and c l for calculating the least common multiple r of. The least common multiple can be calculated using the Euclidean algorithm. Next, a block a of c + i pixels in the horizontal direction and r + i pixels in the vertical direction is changed to a block b of cc h '/ c l ' pixels in the horizontal direction and rr h '/ r l ' pixels in the vertical direction. A matrix G to be increased in resolution is created from F ′. G is a matrix of cc h 'rr h ' / (c l 'r l ') rows (c + i) (r + i) columns. G has an element of F ′ and 0 as elements.
図20に、i = 4,ch = 4,cl = 3,ch’ = 3,cl’ = 2,rh = 4,rl = 3,rh’ = 3,rl’ = 2の場合のブロックaと、ブロックbと、後述のブロックdの例を示す。この例ではc = r = 6である。次に、ブロックbを横方向にcch/cl画素で縦方向にrrh/rl画素のブロックdに低解像度化する行列Vを作成する。Vはcchrrh/(clrl)行cch’rrh’/(cl’rl’)列の行列である。Vの要素は、ブロックbとブロックdを重ね合わせたときの面積比に応じて決定する。最後に、FをVGから作成する。VGはcchrrh/(clrl)行(c + i)(r + i))列の行列である。図20中の太線に着目すると、横方向にcl + i画素で縦方向にrl + i画素のブロックが、横方向にch画素で縦方向にrh画素のブロックになっている。VGからこの太線に関する要素を抽出することによりFを作成する。なお、図20の例では、太線で示した部分以外にも、横方向にcl + i画素で縦方向にrl + i画素のブロックが、横方向にch画素で縦方向にrh画素のブロックになっている箇所が3つある。それらをそれぞれ図21、図22、図23に示す。これらの図に対応する要素の平均をとってFを作成してもよい。 Figure 20, i = 4, c h = 4, c l = 3, c h '= 3, c l' = 2, r h = 4, r l = 3, r h '= 3, r l' = 2 shows an example of a block a, a block b, and a later-described block d. In this example, c = r = 6. Next, create a matrix V of lower resolution in block d of rr h / r l pixels longitudinally cc h / c l pixel block b in the lateral direction. V is a matrix of cc h rr h / (c l r l) line cc h 'rr h' / ( c l 'r l') column. The element of V is determined according to the area ratio when the block b and the block d are overlapped. Finally, F is created from VG. VG is a cc h rr h / (c l r l) line (c + i) (r + i)) column of the matrix. Focusing on a thick line in FIG. 20, in the longitudinal direction c l + i pixels in the horizontal direction of the r l + i pixel block, which is a block of r h pixels in the horizontal direction longitudinally c h pixels. F is created by extracting elements related to the bold line from VG. In the example of FIG. 20, in addition to the portion indicated by the bold line, a block of c l + i pixels in the horizontal direction and r l + i pixels in the vertical direction, and c h pixels in the horizontal direction and r h in the vertical direction. There are three locations that are pixel blocks. They are shown in FIGS. 21, 22, and 23, respectively. F may be created by taking the average of the elements corresponding to these figures.
次に、対応する加算データ1203(h)が存在しなかった場合のhの作成方法を説明する。
まず、加算データ保持部1201から、高解像度化率(横方向にch/cl倍と縦方向にrh/rl倍)よりも高い高解像度化率に対応する加算データ1203の中で、iが等しいものを探索する。この加算データ1203をh’で表し、h’に対応するブロックサイズデータ107をcl’とrl’とch’とrh’で表す。次に、clとcl’の最小公倍数cを計算し、rlとrl’の最小公倍数rを計算する。最小公倍数は、ユークリッドの互除法を利用すれば計算できる。
Next, a method of creating h when the corresponding addition data 1203 (h) does not exist will be described.
First, the added
次に、h’を横方向にc/cl’個、縦方向にr/rl’個敷き詰めたブロックfを作成する。図24に、ch = 4,cl = 3,ch’ = 3,cl’ = 2,rh = 4,rl = 3,rh’ = 3,rl’ = 2の場合のブロックfと、後述のブロックgの例を示す。この例では、c = r = 6である。図24のブロックf中の太線は敷き詰めたh’を表す。次に、ブロックfを、横方向にcch/cl画素で縦方向にrrh/rl画素のブロックgに低解像度化する。最後に、gから横方向にch画素で縦方向にrh画素のブロックを抽出することによりhを作成する。図24の例では、ブロックg中の太線で示したブロックがhの候補となる。これらの平均をhとしてもよい。 Next, a block f in which c ′ / c 1 ′ h ′ is laid in the horizontal direction and r / r 1 ′ in the vertical direction is created. FIG. 24 shows a case where c h = 4, c l = 3, c h '= 3, c l ' = 2, r h = 4, r l = 3, r h '= 3 and r l ' = 2. An example of a block f and a block g described later is shown. In this example, c = r = 6. The thick line in the block f in FIG. 24 represents h ′ that has been spread. Next, the block f, to a low resolution into blocks g of rr h / r l pixels in the horizontal direction longitudinally cc h / c l pixels. Finally, create a h by extracting a block of r h pixels in the vertical direction c h pixels in the horizontal direction from g. In the example of FIG. 24, a block indicated by a thick line in the block g is a candidate for h. The average of these may be h.
第7の変更例によれば、学習していない高解像度化率のFやhを作成できるため、Fやhの学習のコストと、Fやhの保持のためのメモリを削減できる。 According to the seventh modification example, F and h having a high resolution rate that has not been learned can be created, so that the learning cost of F and h and the memory for holding F and h can be reduced.
(1−12)第8の変更例:高速化に関する変更例
本実施形態では、式(y = Wx)を満足するxを求めることで高い画質を得るために、ブロックサイズデータ107(clとrlとiとchとrh)に応じた係数データ108(F)を利用して高解像度化した。高速化のためには、係数データ108(F)の要素のうち、絶対値が小さなものを無視しても構わない。
(1-12) Eighth Modification Example: Modification Example Regarding Speedup
In this embodiment, equation (y = Wx) in order to obtain a high image quality by obtaining the x that satisfies the
もし、係数データ108(F)の要素に0が含まれる場合、その要素との演算はFzの結果に影響を及ぼさない。したがって、その要素を無視し演算を省くことにより、高速化を実現できる。ただし、Fの各要素が0かどうかを判定するとその判定のための計算時間が必要になる。その判定の計算時間を削減するには、学習したFに対し予めどの要素が0かを判定しておき、そのFに対してFzを計算する回路やプログラムを専用に作成するとよい。これにより、画質を劣化させることなく高速化できる。 If 0 is included in the element of the coefficient data 108 (F), the calculation with the element does not affect the result of Fz. Therefore, it is possible to increase the speed by ignoring the element and omitting the calculation. However, if it is determined whether each element of F is 0, calculation time for the determination is required. Its To reduce the calculation time of the determination, advance to determine in advance which elements to learned F is 0, it is preferable to create a circuit or program that calculates Fz for the F dedicated. Thereby, it is possible to increase the speed without degrading the image quality.
人間が知覚できない程度に画質を劣化させても構わなければ、Fの要素のうち、絶対値が小さいものを無視するとよい。例えばF = (0.004 −0.1 0.9 −0.1 0.004),z = (255 100 50 40 10)Tである場合を考える。この場合、次の式の通り、Fz = 32.06となる。 If the image quality can be degraded to the extent that humans cannot perceive it, it is advisable to ignore the F elements having a small absolute value. For example, consider the case where F = (0.004−0.1 0.9−0.1 0.004) and z = (255 100 50 40 10) T. In this case, Fz = 32.06 as shown in the following equation.
Fz = 0.004×255 − 0.1×100 + 0.9×50 − 0.1×40 + 0.004×10
= 1.02 − 10 + 45 − 4 + 0.04
= 32.06
画素の値を8ビット、すなわち、0から255の整数で表現し、式(x = Fz)により高解像度ブロックxを求める場合、32.06から32になる。この場合、積和演算の回数が少なくなるので高速化できる。0.004×255と0.004×10という演算を無視した場合、Fxは31となり結果はほとんど変わらない。画素の値が1変化した程度では、人間はその差を知覚できない。画素の値が4変化したとしてもその差を知覚できないことが多い。したがって、Fの要素のうち、絶対値が小さいものを無視すれば、ほとんど画質を劣化させることなく、高速化できる。
Fz = 0.004 × 255−0.1 × 100 + 0.9 × 50−0.1 × 40 + 0.004 × 10
= 1.02 -10 + 45 -4 + 0.04
= 32.06
When the pixel value is expressed by 8 bits, that is, an integer from 0 to 255, and the high resolution block x is obtained by the equation (x = Fz), the value is 32.06 to 32. In this case, since the number of product-sum operations is reduced, the speed can be increased. If the calculations of 0.004 × 255 and 0.004 × 10 are ignored, Fx is 31 and the result is almost unchanged. To the extent that the pixel value changes by one, humans cannot perceive the difference. Even if the value of a pixel changes by 4, it is often impossible to perceive the difference. Therefore, if elements having a small absolute value among the elements of F are ignored, the speed can be increased with almost no deterioration in image quality.
式(x = Fz + h)や式(x = Fz + ‖M‖h)により、xを求める場合も、F中の0や絶対値が小さいものを無視することにより高速化できる。また、hについても同様にh中の0や絶対値が小さいものを無視すれば、高速化できる。 Even when x is obtained by the equation (x = Fz + h) or the equation (x = Fz + ‖M‖h), the speed can be increased by ignoring 0 or a small absolute value in F. Similarly, h can be speeded up by ignoring 0 in h and those having a small absolute value.
Fやhは、学習が終了した段階で要素の値がわかっているため、低解像度ブロック中のどの画素に関する演算を無視すれば良いかという情報を、画像を高解像度化する方法や装置やプログラムに反映できる。Fやhの要素の絶対値が閾値よりも小さいかどうかを判定する必要すらない。そのFやh専用の回路として、Fやhの要素の絶対値の小さい要素に対する演算を行わないものを設計すれば、その分、回路規模が小さくなり、計算コストを削減できる。同様に、Fやhの絶対値の小さい要素に対する演算を行わない画像の高解像度方法やプログラムにすれば、その分、計算コストを削減できる。 Since F and h have element values known at the stage of learning, information on which pixel in the low resolution block should be ignored is a method, apparatus, or program for increasing the resolution of an image. Can be reflected. It is not necessary to determine whether the absolute values of the elements F and h are smaller than the threshold value. If a circuit dedicated to F and h that does not perform an operation on an element having a small absolute value of the element F or h is designed, the circuit scale is reduced correspondingly, and the calculation cost can be reduced. Similarly, if an image high-resolution method or program that does not perform operations on elements having small absolute values of F and h is used, the calculation cost can be reduced accordingly.
(1−13)第9の変更例:空間ブロックから時空間ブロックへ拡張する変更例
動画の各フレームを入力とし、本変更例を適用しない本実施形態の装置や方法で高解像度化し、出力される高解像度画像を連結することにより作成した動画を再生すると、時間方向にちらつきが知覚されることがある。そのちらつきを軽減するための変更例を説明する。
(1-13) Ninth modification example: Modification example for extending from a space block to a space-time block
Flickering in the time direction is perceived when playing a movie created by connecting each frame of the movie as input, increasing the resolution with the apparatus or method of this embodiment that does not apply this modification, and connecting the output high-resolution images. May be. A modification example for reducing the flicker will be described.
本実施形態では、ある1枚の画像を入力しそれを高解像度化した1枚の画像を出力する例を示した。それに対し、撮影時刻が時間方向に近いt枚の画像を入力し、そのうちの1枚を高解像度化した1枚を出力するように変更してもよい。この場合、低解像度ブロックzが時空間方向のブロックに変わる。時空間ブロックは、空間方向に加え時間方向にt個の画素を持つ。なお、低解像度ブロックyと高解像度ブロックxは、変わらず時間方向に画素を持たない。時間方向に画素を持たないブロックと持つブロックを区別する場合、持たない方を空間ブロックと表記し持つ方を時空間ブロックと表記する。 In the present embodiment, an example in which a certain image is input and a single image with a high resolution is output is shown. On the other hand, t images whose shooting times are close to the time direction may be input, and one image obtained by increasing the resolution of one image may be output. In this case, the low resolution block z is changed to a space-time block. The spatiotemporal block has t pixels in the time direction in addition to the spatial direction. Note that the low resolution block y and the high resolution block x do not change and have no pixels in the time direction. When distinguishing between a block having no pixels in the temporal direction and a block having pixels, the one having no pixels is referred to as a space block, and the one having a pixel is referred to as a space-time block.
例えば2枚の画像を入力し、2枚目の画像を高解像度化したものを出力する場合を例にとり、他の変更例を適用しない場合の本実施形態からの変更点のみを説明する。この例では、t = 2である。この変更例の画像高解像度化装置の構成は図1のままである。 For example, a case where two images are input and a high resolution image of the second image is output will be taken as an example, and only changes from the present embodiment when no other modification examples are applied will be described. In this example, t = 2. The configuration of the image resolution increasing apparatus of this modification is the same as that shown in FIG.
低解像度画像105は、t枚の画像になる。この例では、2枚の画像になる。
低解像度ブロックzは、時間方向にも画素を持つ。低解像度ブロックzのサイズは、横方向にcl + i、縦方向にrl + i、時間方向にtである。zは縦ベクトルで表現され、次元は、(cl + i)(rl + i)tである。図25は、cl = 3,rl = 4,i = 2,t = 2の低解像度ブロックzの例である。この図25のzは、横方向に5個、縦方向に6個、時間方向に2個((a)と(b))の画素を持ち、合計60個の画素を持つ。
The
The low resolution block z has pixels in the time direction. The size of the low resolution block z is c l + i in the horizontal direction, r l + i in the vertical direction, and t in the time direction. z is expressed by a vertical vector, and the dimension is (c 1 + i) (r 1 + i) t. Figure 25 is an example of a c l = 3, r l = 4, i = 2, t = 2 for the low-resolution block z. 25 in FIG. 25 has 5 pixels in the horizontal direction, 6 in the vertical direction, and 2 ((a) and (b)) in the time direction, and has a total of 60 pixels.
ブロックサイズデータ107は変わらない。低解像度ブロックzのサイズにtが含まれるようになる。tは定数であるため、ブロックサイズデータ107にtを含める必要はなく、tの値を必要とする各手段が保持しておけばよい。したがって、ブロックサイズ決定部101に変更はない。
The
係数データ保持部102は、zを時空間ブロックに変更したことに伴い、サイズが異なる係数データ108(F)を保持している。それ以外は、変わらない。Fはchrh行(cl + i)(rl + i)t列の行列となる。このサイズのFが学習され、保持されている。
The coefficient
Wについて、図25の例で説明する。Wを、高解像度ブロック(空間ブロック)を示すchrh次元の縦ベクトルを、図25の(a)と(b)の低解像度ブロック(空間ブロック)を示すclrlt次元の縦ベクトルに低解像度化するclrlt行chrh列の行列とする。t=1の場合とt=2の場合でWを比較すると、異なるのはWの行数である。t=2の場合のWは、t=1の場合のWの要素を2つずつ持つ。Fの学習方法は、FとWとzのサイズを変化させるだけで、上述の方法を適用できる。
ブロック位置制御部103は変わらない。
作成部104は、入力される低解像度画像105と係数データ108(F)が変化している点が異なる。ある位置データ109が与えられたとき、その位置データ109が示すzにFを左からかけることにより、位置データ109が示すxを作成する。このzが時空間ブロックになり、Fのサイズが変化するが式(x = Fz)は変化しない。ブロック位置制御部103により制御されている位置データ109が変化するたびに、高解像度画像110中の高解像度ブロックが順次作成される。
W will be described with reference to the example of FIG. W, a c h r h dimensional vertical vector indicating a high resolution block (spatial block), and a c l r l t dimensional vertical vector indicating the low resolution block (spatial block) in FIGS. A matrix of c l r l t rows and c h r h columns to reduce the resolution to a vector. When W is compared between t = 1 and t = 2, the difference is the number of rows of W. W in the case of t = 2 has two elements of W in the case of t = 1. As the learning method of F, the above-described method can be applied only by changing the sizes of F, W, and z.
The block
The
本変更例の画像高解像度化の処理の流れは図4のままである。データ中に、時間方向のデータが増えているものがある点を除き変更はない。 The flow of the processing for increasing the resolution of the image in this modified example remains as in FIG. There is no change except that some data has increased data in the time direction.
動画の各フレームを入力とし、本変更例を適用しない本実施形態の装置や方法で高解像度化し、出力される高解像度画像を連結することにより作成した動画を再生すると、時間方向にちらつきが知覚されることがある。それに対し、第9の変更例を適用すると、時間方向の情報を利用するため、時間方向のちらつきが軽減される。 Flickering in the time direction is perceived when playing a movie created by connecting each frame of the movie as input, increasing the resolution with the apparatus or method of this embodiment that does not apply this modification, and connecting the output high-resolution images. May be. On the other hand, when the ninth modification example is applied, time direction flicker is reduced because information in the time direction is used.
ただし、被写体に動きがある場合、tを2以上にすることにより、かえって画質が低下する。この場合、低解像度画像中で時間方向に変化がある画素では、その画素を無視して計算するように変更すれば良い。具体的には、低解像度画像中で動きのある画素を、フレーム間差分法により検出する。そして、低解像度ブロック中で動きのあった画素の値を、求める高解像度ブロックと同じ時刻の低解像度ブロックの画素の値で置き換えてやれば良い。あるいは、動きのあった画素を含むブロックを、t=1として処理すれば良い。あるいは、動きのあった画素を無視すれば良い。無視するためには、動きのあった画素に関するFとWとzの要素を削除すれば良い。削除により、FとWとzのサイズが減少する。これにより、動きのない画素の時間方向のちらつきを抑制しつつ、動きのある画素での画質劣化を防ぐことができる。 However, when the subject is moving, the image quality is lowered by setting t to 2 or more. In this case, in a pixel having a change in the time direction in the low-resolution image, the pixel may be changed to be ignored. Specifically, a moving pixel in the low resolution image is detected by the inter-frame difference method. Then, the pixel value that has moved in the low resolution block may be replaced with the pixel value of the low resolution block at the same time as the high resolution block to be obtained. Alternatively, a block including pixels that have moved may be processed as t = 1. Alternatively, pixels that have moved may be ignored. In order to ignore it, it is only necessary to delete the F, W, and z elements relating to the pixel that has moved. Deletion reduces the size of F, W, and z. As a result, it is possible to prevent image quality deterioration in pixels with movement while suppressing flickering in the time direction of pixels without movement.
ここでは、空間ブロックを時空間ブロックに変更する例を示したが、時空間ブロックではなく、時間方向に画素を持たせれば、同様の効果が得られる。 Here, an example in which a space block is changed to a spatio-temporal block is shown, but the same effect can be obtained if pixels are provided in the time direction instead of the spatio-temporal block.
(1−14)その他
上述の変更例は組み合わせて利用できる。それにより、より高い画質を得られたり、高速に処理できたりする。例えば本実施形態に対し、第1の変更例や第2の変更例のように一次結合で表現できないブロックを学習して加算するように変更し、さらに、第3の変更例や第4の変更例のように画像を強調するように変更し、第5の変更例や第6の変更例のようにラベリングを利用するように変更し、さらに、第7の変更例のように高倍率用に学習した係数データと加算データから低倍率用の係数データと加算データを作成するように変更し、さらに、第8の変更例のように作成する高解像度ブロックの画素の値に対する影響が小さな係数データや加算データを無視するように変更し、第9の変更例のように高解像度ブロックを計算するための低解像度ブロックを空間ブロックから時空間ブロックへ拡張するように変更することができる。
(1-14) Others The above modification examples can be used in combination. As a result, higher image quality can be obtained and processing can be performed at high speed. For example, the present embodiment is modified so that blocks that cannot be expressed by linear combination like the first modification example and the second modification example are learned and added, and further, the third modification example and the fourth modification are added. Change to enhance the image as in the example, change to use labeling as in the fifth and sixth modifications, and further, for high magnification as in the seventh modification Coefficient data that is modified to create low-magnification coefficient data and addition data from the learned coefficient data and addition data, and further has little influence on the pixel value of the high-resolution block created as in the eighth modification example And the addition data can be ignored, and the low resolution block for calculating the high resolution block can be changed from the spatial block to the spatiotemporal block as in the ninth modification.
以上に示した実施形態によれば、高解像度画像中の画素の値を計算するために、低解像度画像中のどの画素を利用すればよいのかが明確になり、この画素を利用して高解像度化するための係数を学習し、その係数を利用して作成した高解像度ブロックを低解像度化すると、入力した低解像度画像に近付くので従来よりも誤差が減少するので、従来よりも高画質な高解像度画像を得ることができる。 According to the embodiment described above, it is clear which pixel in the low resolution image should be used to calculate the value of the pixel in the high resolution image. If a high-resolution block created using that coefficient is reduced in resolution, the error will be reduced compared to the conventional image because it approaches the input low-resolution image. A resolution image can be obtained.
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。 Note that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. In addition, various inventions can be formed by appropriately combining a plurality of components disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.
100,1200,1600、1800・・・画像高解像度化装置、101・・・ブロックサイズ決定部、102,1602・・・係数データ保持部、103・・・ブロック位置制御部、104,1202・・・作成部、105・・・低解像度画像、106,1004・・・サイズデータ、107,1006・・・ブロックサイズデータ、108・・・係数データ、109・・・位置データ、110・・・高解像度画像、1000,1400・・・学習装置、1001・・・低解像度画像作成部、1002・・・ブロック抽出部、1003・・・係数データ学習部、1005・・・学習用高解像度画像、・・・ブロックサイズデータ、1007・・・学習用低解像度画像、1008・・・学習用ブロック、1009・・・係数データ、1201,1603・・・加算データ保持部、1203,1402・・・加算データ、1401・・・加算データ学習部、1601・・・ラベリング部、1604・・・ラベルデータ、1801・・・第1ラベリング部、1802・・・第2ラベリング部、1803・・・第1ラベルデータ、1804・・・ブロックデータ、1805・・・第2ラベルデータ。
100, 1200, 1600, 1800... Image high resolution device, 101... Block size determination unit, 102, 1602 .. coefficient data holding unit, 103... Block position control unit, 104, 1202. Creation unit 105:
Claims (14)
前記第1サイズの縦の第1画素数と、サイズが前記第1サイズよりも大きい第2サイズの縦の第2画素数との第1最大公約数で該第1画素数を除した第1値を設定し、該第2画素数を該第1最大公約数で除した第2値を算出し、前記第1サイズの横の第3画素数と該第2サイズの横の第4画素数との第2最大公約数で該第3画素数を除した第3値を設定し、該第4画素数を該第2最大公約数で除した第4値を算出し、前記低解像度画像に対応する第1ブロックサイズとして、縦の画素数が該第1値であり、横の画素数が該第3値であるブロックより大きなブロックサイズに決定し、該第2サイズの高解像度画像に対応する第2ブロックサイズとして、縦の画素数を該第2値に、横の画素数を該第4値に決定し、該第1ブロックサイズと該第2ブロックサイズとを高解像度化のための処理単位とする決定手段と、
前記第1ブロックサイズの第1学習用ブロックと前記第2ブロックサイズの第2学習用ブロックとの組の1つ以上の組から、該第1学習用ブロックに第1係数をかけて算出したブロックと該第2学習用ブロックとの誤差を小さくするように学習された1以上の第1係数を保持し、1以上の第1係数から前記第1ブロックサイズと前記第2ブロックサイズに対応する係数を第2係数として読み出す第1読出手段と、
前記第1ブロックサイズのブロックの前記低解像度画像中の第1位置と、前記第2ブロックサイズのブロックの前記第1位置に対応する前記高解像度画像中の第2位置とを順次設定する設定手段と、
前記第2係数を前記第1位置の第1ブロックにかけて前記第2位置の第2ブロックを作成して前記高解像度画像を作成する作成手段と、を具備することを特徴とする画像高解像度化装置。 An input means for inputting a low-resolution image whose size indicating the number of vertical and horizontal pixels is the first size;
First obtained by dividing the first number of pixels in the vertical of the first size, the first number of pixels in the first greatest common divisor of the second number of pixels of the vertical larger second size than said first size set the value, the second number of pixels to calculate a second value obtained by dividing the first common divisor, fourth number of pixels next to the side of the third pixel count and said second size of said first size And a third value obtained by dividing the third pixel number by the second greatest common divisor, and a fourth value obtained by dividing the fourth pixel number by the second greatest common divisor is calculated. and the corresponding first block size, the number of vertical pixels is first value and the horizontal number of pixels is determined to be larger block size than the block is a third value, high-resolution image of the second size and a second block size corresponding to the vertical number of pixels in the second value, and number of horizontal pixels determined to fourth value, said first block size and the second Determining means for a block size as a processing unit for high-resolution,
A block calculated by multiplying the first learning block by a first coefficient from one or more sets of the first learning block having the first block size and the second learning block having the second block size. A coefficient corresponding to the first block size and the second block size from one or more first coefficients, wherein one or more first coefficients learned so as to reduce an error between the first learning block and the second learning block are retained. First reading means for reading as a second coefficient;
Setting means for sequentially setting a first position in the low-resolution image of the block of the first block size and a second position in the high-resolution image corresponding to the first position of the block of the second block size. When,
An image resolution enhancement apparatus, comprising: a creation unit configured to create the high-resolution image by creating the second block at the second position by applying the second coefficient to the first block at the first position. .
前記第1サイズの縦の画素数と、サイズが前記第1サイズよりも大きい第2サイズの縦の第2画素数との第1最大公約数で該第1画素数を除した第1値を設定し、該第2画素数を該第1最大公約数で除した第2値を算出し、前記第1サイズの横の第3画素数と該第2サイズの横の第4画素数との第2最大公約数で該第3画素数を除した第3値を設定し、該第4画素数を該第2最大公約数で除した第4値を算出し、前記低解像度画像に対応する第1ブロックサイズとして、縦の画素数が該第1値であり、横の画素数が該第3値であるブロックより大きなブロックサイズに決定し、該第2サイズである高解像度画像に対応する第2ブロックサイズとして、縦の画素数を該第2値に、横の画素数を該第4値に決定し、該第1ブロックサイズと該第2ブロックサイズとを高解像度化のための処理単位であるブロックのサイズとして決定する決定手段と、
前記第1ブロックサイズの第1学習用ブロックと前記第2ブロックサイズの第2学習用ブロックとの組の1つ以上の組から、該第1学習用ブロックに第1係数をかけて算出したブロックと該第2学習用ブロックとの誤差を小さくするように学習された1以上の第1係数を保持し、1以上の第1係数から前記第1ブロックサイズと前記第2ブロックサイズが表す第1高解像度化率よりも高い第2高解像度化率に対応する係数を第2係数として読み出す第1読出手段と、
前記第1ブロックサイズのブロックの前記低解像度画像中の第1位置と、前記第2ブロックサイズのブロックの前記第1位置に対応する前記高解像度画像中の第2位置とを順次設定する設定手段と、
前記第2係数から前記第1高解像度化率に対応する第3係数を作成し、該第3係数を前記第2係数として再設定し、再設定した該第2係数に前記第1位置の第1ブロックにかけて前記第2位置の第2ブロックを作成して前記高解像度画像を作成する作成手段と、を具備することを特徴とする画像高解像度化装置。 An input means for inputting a low-resolution image whose size indicating the number of vertical and horizontal pixels is the first size;
A first value obtained by dividing the first pixel number by a first greatest common divisor between the number of vertical pixels of the first size and the number of vertical second pixels of a second size that is larger than the first size . set, the second number of pixels to calculate a second value obtained by dividing the first greatest common divisor, and the fourth number of pixels next to the side of the third pixel count and said second size of said first size A third value obtained by dividing the third number of pixels by the second greatest common divisor is set, and a fourth value obtained by dividing the fourth number of pixels by the second greatest common divisor is calculated to correspond to the low-resolution image. and a first block size, the number of vertical pixels is first value and the horizontal number of pixels is determined to be larger block size than the block is a third value, the high-resolution image is the second size and a corresponding second block size, the number of vertical pixels to the second value, the number of horizontal pixels determined to fourth value, said first block size and the second Determining means for determining a block size as a block size of a processing unit for higher resolution,
A block calculated by multiplying the first learning block by a first coefficient from one or more sets of the first learning block having the first block size and the second learning block having the second block size. One or more first coefficients learned so as to reduce an error between the first learning block and the second learning block, and the first block size and the second block size represented by the first block size are represented by one or more first coefficients. First reading means for reading a coefficient corresponding to a second higher resolution ratio higher than the higher resolution ratio as a second coefficient;
Setting means for sequentially setting a first position in the low-resolution image of the block of the first block size and a second position in the high-resolution image corresponding to the first position of the block of the second block size. When,
A third coefficient corresponding to the first high resolution ratio is created from the second coefficient, the third coefficient is reset as the second coefficient, and the reset second coefficient is set to the second coefficient of the first position. An image high-resolution apparatus, comprising: a creating unit that creates the second block at the second position over one block to create the high-resolution image.
前記作成手段において、前記第2ブロックを、前記第2係数を前記第1位置の第1ブロックにかけて作成する代わりに、前記第2係数を前記第1位置の第1ブロックにかけてさらに前記第2加算データを足して作成することを特徴とする請求項1または請求項2に記載の画像高解像度化装置。 A first set of the first learning block having the first block size and a second learning block having the second block size and the first coefficient are multiplied by the first coefficient to the first learning block. One or more first addition data learned so as to reduce an error between the block calculated by adding the addition data and the second learning block is held, and the first block size is determined from the one or more first addition data. And second reading means for reading the first addition data corresponding to the second block size as the second addition data,
In the creating means, instead of creating the second block by applying the second coefficient to the first block at the first position, the second coefficient is applied to the first block at the first position, and the second addition data is further applied. The image resolution increasing device according to claim 1 or 2, wherein the image resolution increasing device according to claim 1 or 2 is added.
前記第2読出手段は、前記第1加算データの代わりに、前記第1学習用ブロックまたは該第1学習用ブロックに前記第1係数をかけて算出された第4ブロックの前記規則により算出されたラベルデータごとに学習された1以上の第3加算データを保持し、前記第1加算データから前記第2加算データを読み出す代わりに、前記第3加算データから前記第1ブロックサイズと前記第2ブロックサイズと前記第1ラベルデータに対応する加算データを前記第2加算データとして読み出すことを特徴とする請求項3に記載の画像高解像度化装置。 The first label data of the low resolution block or the third block is determined according to a rule relating to a value included in the low resolution block of the first position or the third block generated by applying the second coefficient to the first block of the first position. A calculation means for calculating,
The second reading means is calculated by the rule of the first learning block or the fourth block calculated by multiplying the first learning block by the first coefficient instead of the first addition data. Instead of holding one or more third addition data learned for each label data and reading the second addition data from the first addition data, the first block size and the second block are obtained from the third addition data. 4. The image high-resolution device according to claim 3, wherein addition data corresponding to a size and the first label data is read as the second addition data. 5.
サイズが前記高サイズよりも小さい低サイズである学習用低解像度画像を前記学習用高解像度画像から作成する作成手段と、
前記学習用低解像度画像と前記学習用高解像度画像とから、低ブロックサイズの第1学習用ブロックと高ブロックサイズの第2学習用ブロックとの組を抽出する抽出手段と、
前記第1学習用ブロックに第1係数をかけて算出したブロックと前記第2学習用ブロックとの誤差の、前記低ブロックサイズの第1学習用ブロックと前記高ブロックサイズの第2学習用ブロックとの組についての和が最も小さくなる該第1係数を算出する第1算出手段と、
前記低ブロックサイズ及び前記高ブロックサイズと、前記第1係数とを関連付けて保持する保持手段と、を具備し、
前記高ブロックサイズの縦の画素数は、前記高サイズの縦の画素数と前記低サイズの縦の画素数との最大公約数で前記高サイズの縦の画素数を除することで決定され、前記高ブロックサイズの横の画素数は、前記高サイズの横の画素数と前記低サイズの横の画素数との最大公約数で前記高サイズの横の画素数を除することで決定され、前記低ブロックサイズの縦の画素数は、前記高サイズの縦の画素数と前記低サイズの縦の画素数との最大公約数で前記低サイズの縦の画素数を除した値であり、前記低ブロックサイズの横の画素数は、前記高サイズの横の画素数と前記低サイズの横の画素数との最大公約数で前記低サイズの横の画素数を除した値よりも大きなブロックサイズに決定される、あるいは、決定されたものが入力されることを特徴とする学習装置。 Input means for inputting a learning high-resolution image having a high size indicating the number of vertical and horizontal pixels;
Creating means for creating a learning low resolution image having a size smaller than the high size from the learning high resolution image;
Extraction means for extracting a set of a first learning block having a low block size and a second learning block having a high block size from the learning low resolution image and the learning high resolution image;
A first learning block having a low block size and a second learning block having a high block size, which are errors of a block calculated by multiplying the first learning block by a first coefficient and the second learning block; First calculating means for calculating the first coefficient with the smallest sum for the set of
Holding means for holding the low block size and the high block size in association with the first coefficient, and
The number of vertical pixels of the high block size is determined by dividing the number of vertical pixels of the high size by the greatest common divisor of the number of vertical pixels of the high size and the number of vertical pixels of the low size , the number of horizontal pixels of the high-block size is determined by dividing the number of pixels next to the high size greatest common divisor of the number of pixels in the horizontal beside the the number of pixels low size of the high sizes, The number of vertical pixels of the low block size is a value obtained by dividing the number of vertical pixels of the low size by the greatest common divisor of the number of vertical pixels of the high size and the number of vertical pixels of the low size. The number of horizontal pixels of the low block size is larger than the value obtained by dividing the number of horizontal pixels of the low size by the greatest common divisor of the number of horizontal pixels of the high size and the number of horizontal pixels of the low size. are determined or characterized by what is determined is input Learning device to be.
サイズが前記高サイズよりも小さい低サイズである学習用低解像度画像を前記学習用高解像度画像から作成する作成手段と、
前記学習用低解像度画像と前記学習用高解像度画像とから、低ブロックサイズの第1学習用ブロックと高ブロックサイズの第2学習用ブロックとの組を抽出する抽出手段と、
低解像度化によって、前記第1学習用ブロックに包含され、前記第1学習用ブロックよりもサイズが小さいブロックになる前記高ブロックサイズのブロックを示すベクトルの集合に属するベクトルに、前記第1学習用ブロックを示す第1ベクトルを変換する係数行列の中から、該係数行列に右から前記第1ベクトルをかけて算出したベクトルと前記第2学習用ブロックを示すベクトルとの誤差の、前記低ブロックサイズの第1学習用ブロックと前記高ブロックサイズの第2学習用ブロックとの組についての和が最も小さくなる該係数行列を算出する第1算出手段と、
前記低ブロックサイズ及び前記高ブロックサイズと、前記係数行列とを関連付けて保持する保持手段と、を具備し、
前記高ブロックサイズの縦の画素数は、前記高サイズの縦の画素数と前記低サイズの縦の画素数との最大公約数で前記高サイズの縦の画素数を除することで決定され、前記高ブロックサイズの横の画素数は、前記高サイズの横の画素数と前記低サイズの横の画素数との最大公約数で前記高サイズの横の画素数を除することで決定され、前記低ブロックサイズの縦の画素数は、前記高サイズの縦の画素数と前記低サイズの縦の画素数との最大公約数で前記低サイズの縦の画素数を除した値であり、前記低ブロックサイズの横の画素数は、前記高サイズの横の画素数と前記低サイズの横の画素数との最大公約数で前記低サイズの横の画素数を除した値よりも大きなブロックサイズに決定される、あるいは、決定されたものが入力されることを特徴とする学習装置。 Input means for inputting a learning high-resolution image having a high size indicating the number of vertical and horizontal pixels;
Creating means for creating a learning low resolution image having a size smaller than the high size from the learning high resolution image;
Extraction means for extracting a set of a first learning block having a low block size and a second learning block having a high block size from the learning low resolution image and the learning high resolution image;
Due to the reduction in resolution, the first learning block is included in a vector belonging to a set of vectors indicating the high block size blocks that are included in the first learning block and become smaller in size than the first learning block . from the coefficient matrix to convert the first vector indicating a block, the error between the vector representing the right to the coefficient matrix and vector calculated by multiplying the first vector second learning block, the low block First calculation means for calculating the coefficient matrix having the smallest sum for a set of the first learning block of the size and the second learning block of the high block size;
Holding means for holding the low block size and the high block size in association with the coefficient matrix; and
The number of vertical pixels of the high block size is determined by dividing the number of vertical pixels of the high size by the greatest common divisor of the number of vertical pixels of the high size and the number of vertical pixels of the low size , the number of horizontal pixels of the high-block size is determined by dividing the number of pixels next to the high size greatest common divisor of the number of pixels in the horizontal beside the the number of pixels low size of the high sizes, The number of vertical pixels of the low block size is a value obtained by dividing the number of vertical pixels of the low size by the greatest common divisor of the number of vertical pixels of the high size and the number of vertical pixels of the low size. The number of horizontal pixels of the low block size is larger than the value obtained by dividing the number of horizontal pixels of the low size by the greatest common divisor of the number of horizontal pixels of the high size and the number of horizontal pixels of the low size. are determined or characterized by what is determined is input Learning device to be.
前記第1サイズの縦の第1画素数と、サイズが前記第1サイズよりも大きい第2サイズの縦の第2画素数との第1最大公約数で該第1画素数を除した値よりも大きな第1値を設定し、該第2画素数を該第1最大公約数で除した第2値を算出し、前記第1サイズの横の第3画素数と該第2サイズの横の第4画素数との第2最大公約数で該第3画素数を除した値よりも大きな第3値を設定し、該第4画素数を該第2最大公約数で除した第4値を算出し、前記低解像度画像に対応する第1ブロックサイズとして、縦の画素数を該第1値に、横の画素数を該第3値に決定し、該第2サイズの高解像度画像に対応する第2ブロックサイズとして、縦の画素数を該第2値に、横の画素数を該第4値に決定し、該第1ブロックサイズと該第2ブロックサイズとを高解像度化のための処理単位とし、
前記第1ブロックサイズの第1学習用ブロックと前記第2ブロックサイズの第2学習用ブロックとの組の1つ以上の組から、該第1学習用ブロックに第1係数をかけて算出したブロックと該第2学習用ブロックとの誤差を小さくするように学習された1以上の第1係数を保持する保持手段を用意し、
前記1以上の第1係数から前記第1ブロックサイズと前記第2ブロックサイズに対応する係数を第2係数として読み出し、
前記第1ブロックサイズのブロックの前記低解像度画像中の第1位置と、前記第2ブロックサイズのブロックの前記第1位置に対応する前記高解像度画像中の第2位置とを順次設定し、
前記第2係数を前記第1位置の第1ブロックにかけて前記第2位置の第2ブロックを作成して前記高解像度画像を作成することを特徴とする画像高解像度化方法。 Input a low resolution image whose size indicating the number of vertical and horizontal pixels is the first size,
A first number of pixels in the vertical of the first size, than the value obtained by dividing the first number of pixels in the first greatest common divisor of the second number of pixels of the vertical larger second size than said first size also set a large first value, the second number of pixels to calculate a second value obtained by dividing the first common divisor, next to next to the third pixel count and said second size of said first size A third value larger than a value obtained by dividing the third pixel number by the second greatest common divisor with the fourth pixel number is set, and a fourth value obtained by dividing the fourth pixel number by the second greatest common divisor is set. calculated, the as the first block size corresponding to the low-resolution image, the number of vertical pixels in the first value, the number of horizontal pixels determined to be the third value, the high-resolution image of the second size and a second block size corresponding to the vertical number of pixels in the second value, and number of horizontal pixels determined to fourth value, said first block size and the second block size Was processed Unit for high resolution,
A block calculated by multiplying the first learning block by a first coefficient from one or more sets of the first learning block having the first block size and the second learning block having the second block size. And holding means for holding one or more first coefficients learned so as to reduce an error between the second learning block and the second learning block,
A coefficient corresponding to the first block size and the second block size is read as a second coefficient from the one or more first coefficients;
Sequentially setting a first position in the low resolution image of the block of the first block size and a second position in the high resolution image corresponding to the first position of the block of the second block size;
A method for increasing the resolution of an image, wherein the second resolution is generated by applying the second coefficient to the first block at the first position to generate the second block at the second position.
サイズが前記高サイズよりも小さい低サイズである学習用低解像度画像を前記学習用高解像度画像から作成し、
前記学習用低解像度画像と前記学習用高解像度画像とから、低ブロックサイズの第1学習用ブロックと高ブロックサイズの第2学習用ブロックとの組を抽出し、
前記第1学習用ブロックに第1係数をかけて算出したブロックと前記第2学習用ブロックとの誤差の、前記低ブロックサイズの第1学習用ブロックと前記高ブロックサイズの第2学習用ブロックとの組についての和が最も小さくなる該第1係数を算出し、
前記低ブロックサイズ及び前記高ブロックサイズと、前記第1係数とを関連付けて保持する保持手段を用意し、
前記高ブロックサイズの縦の画素数は、前記高サイズの縦の画素数と前記低サイズの縦の画素数との最大公約数で前記高サイズの縦の画素数を除することで決定され、前記高ブロックサイズの横の画素数は、前記高サイズの横の画素数と前記低サイズの横の画素数との最大公約数で前記高サイズの横の画素数を除することで決定され、前記低ブロックサイズの縦の画素数は、前記高サイズの縦の画素数と前記低サイズの縦の画素数との最大公約数で前記低サイズの縦の画素数を除した値であり、前記低ブロックサイズの横の画素数は、前記高サイズの横の画素数と前記低サイズの横の画素数との最大公約数で前記低サイズの横の画素数を除した値よりも大きなブロックサイズに決定される、あるいは、決定されたものが入力されることを特徴とする学習方法。 Input a high-resolution learning image with a high size indicating the number of vertical and horizontal pixels,
A learning low-resolution image having a size smaller than the high size is created from the learning high-resolution image,
A set of a first learning block having a low block size and a second learning block having a high block size are extracted from the learning low resolution image and the learning high resolution image;
A first learning block having a low block size and a second learning block having a high block size, which are errors of a block calculated by multiplying the first learning block by a first coefficient and the second learning block; Calculating the first coefficient with the smallest sum for the set of
Preparing holding means for holding the low block size and the high block size in association with the first coefficient;
The number of vertical pixels of the high block size is determined by dividing the number of vertical pixels of the high size by the greatest common divisor of the number of vertical pixels of the high size and the number of vertical pixels of the low size , the number of horizontal pixels of the high-block size is determined by dividing the number of pixels next to the high size greatest common divisor of the number of pixels in the horizontal beside the the number of pixels low size of the high sizes, The number of vertical pixels of the low block size is a value obtained by dividing the number of vertical pixels of the low size by the greatest common divisor of the number of vertical pixels of the high size and the number of vertical pixels of the low size. The number of horizontal pixels of the low block size is larger than the value obtained by dividing the number of horizontal pixels of the low size by the greatest common divisor of the number of horizontal pixels of the high size and the number of horizontal pixels of the low size. are determined or characterized by what is determined is input Learning how to.
サイズが前記高サイズよりも小さい低サイズである学習用低解像度画像を前記学習用高解像度画像から作成し、
前記学習用低解像度画像と前記学習用高解像度画像とから、低ブロックサイズの第1学習用ブロックと高ブロックサイズの第2学習用ブロックとの組を抽出し、
低解像度化によって、前記第1学習用ブロックに包含され、前記第1学習用ブロックよりもサイズが小さいブロックになる前記高ブロックサイズのブロックを示すベクトルの集合に属するベクトルに、前記第1学習用ブロックを示す第1ベクトルを変換する係数行列の中から、該係数行列に右から前記第1ベクトルをかけて算出したベクトルと前記第2学習用ブロックを示すベクトルとの誤差の、前記低ブロックサイズの第1学習用ブロックと前記高ブロックサイズの第2学習用ブロックとの組についての和が最も小さくなる該係数行列を算出し、
前記低ブロックサイズ及び前記高ブロックサイズと、前記係数行列とを関連付けて保持する保持手段を用意し、
前記高ブロックサイズの縦の画素数は、前記高サイズの縦の画素数と前記低サイズの縦の画素数との最大公約数で前記高サイズの縦の画素数を除することで決定され、前記高ブロックサイズの横の画素数は、前記高サイズの横の画素数と前記低サイズの横の画素数との最大公約数で前記高サイズの横の画素数を除することで決定され、前記低ブロックサイズの縦の画素数は、前記高サイズの縦の画素数と前記低サイズの縦の画素数との最大公約数で前記低サイズの縦の画素数を除した値であり、前記低ブロックサイズの横の画素数は、前記高サイズの横の画素数と前記低サイズの横の画素数との最大公約数で前記低サイズの横の画素数を除した値よりも大きなブロックサイズに決定される、あるいは、決定されたものが入力されることを特徴とする学習方法。 Input a high-resolution learning image with a high size indicating the number of vertical and horizontal pixels,
A learning low-resolution image having a size smaller than the high size is created from the learning high-resolution image,
A set of a first learning block having a low block size and a second learning block having a high block size are extracted from the learning low resolution image and the learning high resolution image;
Due to the reduction in resolution, the first learning block is included in a vector belonging to a set of vectors indicating the high block size blocks that are included in the first learning block and become smaller in size than the first learning block . from the coefficient matrix to convert the first vector indicating a block, the error between the vector representing the right to the coefficient matrix and vector calculated by multiplying the first vector second learning block, the low block Calculating the coefficient matrix having the smallest sum for a set of the first learning block of the size and the second learning block of the high block size,
Preparing holding means for holding the low block size and the high block size in association with the coefficient matrix;
The number of vertical pixels of the high block size is determined by dividing the number of vertical pixels of the high size by the greatest common divisor of the number of vertical pixels of the high size and the number of vertical pixels of the low size , the number of horizontal pixels of the high-block size is determined by dividing the number of pixels next to the high size greatest common divisor of the number of pixels in the horizontal beside the the number of pixels low size of the high sizes, The number of vertical pixels of the low block size is a value obtained by dividing the number of vertical pixels of the low size by the greatest common divisor of the number of vertical pixels of the high size and the number of vertical pixels of the low size. The number of horizontal pixels of the low block size is larger than the value obtained by dividing the number of horizontal pixels of the low size by the greatest common divisor of the number of horizontal pixels of the high size and the number of horizontal pixels of the low size. are determined or characterized by what is determined is input Learning how to.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008048690A JP4956464B2 (en) | 2008-02-28 | 2008-02-28 | Image high resolution device, learning device and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008048690A JP4956464B2 (en) | 2008-02-28 | 2008-02-28 | Image high resolution device, learning device and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009207001A JP2009207001A (en) | 2009-09-10 |
JP4956464B2 true JP4956464B2 (en) | 2012-06-20 |
Family
ID=41148802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008048690A Expired - Fee Related JP4956464B2 (en) | 2008-02-28 | 2008-02-28 | Image high resolution device, learning device and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4956464B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9264635B2 (en) | 2012-12-25 | 2016-02-16 | Kabushiki Kaisha Toshiba | Image processing apparatus, image processing method, and imaging apparatus |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5085589B2 (en) * | 2009-02-26 | 2012-11-28 | 株式会社東芝 | Image processing apparatus and method |
US9420291B2 (en) | 2010-02-02 | 2016-08-16 | Thomson Licensing | Methods and apparatus for reducing vector quantization error through patch shifting |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3539552B2 (en) * | 1999-11-22 | 2004-07-07 | シャープ株式会社 | Image processing device |
JP4157568B2 (en) * | 2006-04-11 | 2008-10-01 | 株式会社東芝 | Method and apparatus for increasing image resolution |
-
2008
- 2008-02-28 JP JP2008048690A patent/JP4956464B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9264635B2 (en) | 2012-12-25 | 2016-02-16 | Kabushiki Kaisha Toshiba | Image processing apparatus, image processing method, and imaging apparatus |
Also Published As
Publication number | Publication date |
---|---|
JP2009207001A (en) | 2009-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sun et al. | Learned image downscaling for upscaling using content adaptive resampler | |
CN105517671B (en) | Video frame interpolation method and system based on optical flow method | |
JP5229235B2 (en) | Image processing apparatus, image processing method, image expansion apparatus, image compression apparatus, image transmission system, and image processing program | |
JP4987688B2 (en) | Method and apparatus for increasing image resolution | |
CN101510299B (en) | Image self-adapting method based on vision significance | |
JP2013225740A (en) | Image formation device, image display device, and image formation method and image formation program | |
KR20160004379A (en) | Methods of image fusion for image stabilization | |
JP2009524861A (en) | Method and apparatus for improving resolution of digital image | |
JP2015011585A (en) | Image processing apparatus, image forming apparatus, image forming system, image processing method, and program | |
CN108665415B (en) | Image quality improving method and device based on deep learning | |
JP4956464B2 (en) | Image high resolution device, learning device and method | |
CN115115522A (en) | Goods shelf commodity image splicing method and system | |
EP2765555B1 (en) | Image evaluation device, image selection device, image evaluation method, recording medium, and program | |
JP2006509292A (en) | Apparatus and method for removing false edges from a segmented image | |
US7327904B2 (en) | Pattern classification and filter design for increasing image resolution | |
US8743419B2 (en) | Image processing apparatus and method converting low-resolution image to high-resolution using signal value patterns | |
JP2010124397A (en) | Resolution enhancement device | |
JP4868249B2 (en) | Video signal processing device | |
JP4445953B2 (en) | Image correction method and apparatus using stamp | |
CN113066014A (en) | Image super-resolution method and device | |
JP2012150614A (en) | Free viewpoint image generation device | |
KR20090063101A (en) | Method for generating distances representative of the edge orientations in a video picture, corresponding device and use of the method for deinterlacing or format conversion | |
JP2005293265A (en) | Image processing device, and method | |
JPWO2015083502A1 (en) | Image processing apparatus, method, and program | |
JP2003517795A (en) | Motion estimation method for video images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101015 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120221 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120316 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4956464 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150323 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313121 Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |