JP2016115313A - Super-resolution device and program - Google Patents

Super-resolution device and program Download PDF

Info

Publication number
JP2016115313A
JP2016115313A JP2014256036A JP2014256036A JP2016115313A JP 2016115313 A JP2016115313 A JP 2016115313A JP 2014256036 A JP2014256036 A JP 2014256036A JP 2014256036 A JP2014256036 A JP 2014256036A JP 2016115313 A JP2016115313 A JP 2016115313A
Authority
JP
Japan
Prior art keywords
resolution
pixel
image
pixels
super
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014256036A
Other languages
Japanese (ja)
Other versions
JP6440305B2 (en
Inventor
俊枝 三須
Toshie Misu
俊枝 三須
境田 慎一
Shinichi Sakaida
慎一 境田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK filed Critical Nippon Hoso Kyokai NHK
Priority to JP2014256036A priority Critical patent/JP6440305B2/en
Publication of JP2016115313A publication Critical patent/JP2016115313A/en
Application granted granted Critical
Publication of JP6440305B2 publication Critical patent/JP6440305B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a learning type super-resolution device capable of suppressing a database capacity.SOLUTION: The pixel values of object pixels which are pixels in a prescribed-shaped area in an inputted image and are pixels obtained by excluding an input reference pixel group composed of a plurality of pixels in prescribed orders when the pixels in the area are arranged according to magnitude are normalized on the basis of pixel values of the pixels included in the input reference pixel group, a high resolution image corresponding to the area is acquired by referring to a database on the basis of information representing the arrangement of the normalized pixel values of the object pixels, and the inputted image is subjected to high resolution by correcting each pixel value of the acquired high resolution image on the basis of pixel values of the input reference pixel group.SELECTED DRAWING: Figure 1

Description

本発明は、超解像装置およびプログラムに関する。   The present invention relates to a super-resolution device and a program.

画像の解像度を変換する場合、入力画像に補間関数を畳み込み、入力画像とは異なる標本化周期で標本化を行うことが行われる。特に、出力画像の解像度の方が入力画像の解像度よりも高い場合には、入力画像のナイキスト周波数を超える信号成分を補うことで精細感のある出力画像を得る超解像技術が用いられることもある。
超解像技術には、1枚の画像からナイキスト周波数を超える信号成分を人工的に合成することで見た目の精細感を向上する手法があり、単一フレーム超解像技術と呼ばれる。
When converting the resolution of an image, an interpolation function is convolved with the input image, and sampling is performed at a sampling period different from that of the input image. In particular, when the resolution of the output image is higher than the resolution of the input image, a super-resolution technique that obtains a fine output image by supplementing the signal component exceeding the Nyquist frequency of the input image may be used. is there.
The super-resolution technique includes a technique for improving the fineness of appearance by artificially synthesizing a signal component exceeding the Nyquist frequency from one image, and is called a single frame super-resolution technique.

単一フレーム超解像技術の一種として、低解像画像と高解像画像の対で予め学習したデータベースを利用する学習型超解像技術がある。学習型超解像技術においては、低解像画像をブロック分割した部分領域(低解像パッチ)と、該部分領域に対応する高解像画像の部分領域(高解像パッチ)との対を予め大量にデータベース内に蓄えておく。超解像処理実行時には、入力された低解像画像をブロック分割した各低解像パッチをキーとして、上述のデータベースを参照し、対応する高解像パッチを取得する。取得された高解像パッチを貼り合わせることで高解像画像が生成される。学習型超解像の中には、入力低解像パッチの中域成分から高域成分を推定するためにデータベース参照を行う手法もある(例えば、特許文献1参照)。   One type of single-frame super-resolution technique is a learning-type super-resolution technique that uses a database that has been learned in advance with a pair of a low-resolution image and a high-resolution image. In learning-type super-resolution technology, a pair of a partial region (low-resolution patch) obtained by dividing a low-resolution image into blocks and a partial region (high-resolution patch) of a high-resolution image corresponding to the partial region is obtained. A large amount is stored in advance in the database. When the super-resolution processing is executed, the corresponding high-resolution patch is obtained by referring to the above-described database with each low-resolution patch obtained by dividing the input low-resolution image into blocks. A high resolution image is generated by pasting the acquired high resolution patches. In learning super-resolution, there is also a technique of referring to a database in order to estimate a high-frequency component from a middle-frequency component of an input low-resolution patch (for example, see Patent Document 1).

特許第4140690号公報Japanese Patent No. 4140690

しかしながら、特許文献1などの学習型超解像技術においては、さまざまな低解像パッチの濃淡パターンに応じて、数多くの対をデータベースに予め登録しておく必要があり、データベース容量すなわちROM(リードオンリーメモリ)の容量も膨大なものとなることがあるという問題がある。   However, in the learning-type super-resolution technique such as Patent Document 1, it is necessary to register a large number of pairs in the database in advance according to the density patterns of various low-resolution patches. There is a problem that the capacity of the (only memory) may become enormous.

本発明は、このような事情に鑑みてなされたもので、データベース容量を抑えることができる学習型の超解像装置、およびプログラムを提供する。   The present invention has been made in view of such circumstances, and provides a learning-type super-resolution device and a program that can reduce the database capacity.

(1)この発明は上述した課題を解決するためになされたもので、本発明の一態様は、入力された画像内の所定形状の領域内の画素であって、前記領域内の画素の画素値を大きさに従い整列したときの複数の所定順位の画素からなる入力基準画素群を除く画素である対象画素の画素値を、前記入力基準画素群に含まれる画素の画素値に基づき正規化し、
対象画素の正規化した画素値の並びを表す情報に基づいて、前記所定形状の画像中の画素であって、前記画像内において画素値を整列したときの前記複数の所定順位の画素からなる参照基準画素群を除く画素の画素値の並びを表す情報と、前記所定形状の画像よりも解像度の高い画像とを対応付けて記憶するデータベースを参照することにより、前記領域に対応する高解像画像を取得し、取得した高解像画像の各画素値を、前記入力基準画素群の画素値に基づいて補正することで、前記入力された画像を高解像度化することを特徴とする超解像装置である。
(1) The present invention has been made to solve the above-described problems, and one aspect of the present invention is a pixel in a region having a predetermined shape in an input image, and the pixel of the pixel in the region. Normalizing a pixel value of a target pixel that is a pixel excluding an input reference pixel group composed of a plurality of pixels in a predetermined order when values are arranged according to a size, based on a pixel value of a pixel included in the input reference pixel group;
A reference consisting of a plurality of pixels in the predetermined shape when the pixel values are aligned in the image, based on information representing the normalized arrangement of pixel values of the target pixel. A high-resolution image corresponding to the region by referring to a database that stores information indicating the arrangement of pixel values of pixels excluding the reference pixel group and an image having a higher resolution than the image having the predetermined shape. And resolving each pixel value of the acquired high-resolution image based on the pixel value of the input reference pixel group, thereby increasing the resolution of the input image. Device.

(2)また、本発明の他の態様は、(1)に記載の超解像装置であって、前記複数の所定順位の画素は、画素値が最大の画素である第1画素と、画素値が最小である第2画素であることを特徴とする。 (2) According to another aspect of the present invention, in the super-resolution device according to (1), the plurality of pixels in the predetermined order are a first pixel having a maximum pixel value, a pixel The second pixel having the minimum value is characterized in that

(3)また、本発明の他の態様は、(2)に記載の超解像装置であって、前記並びは、前記第1画素および前記第2画素を基準とした画素の並びであることを特徴とする。 (3) According to another aspect of the present invention, there is provided the super-resolution device according to (2), wherein the arrangement is an arrangement of pixels based on the first pixel and the second pixel. It is characterized by.

(4)また、本発明の他の態様は、(3)に記載の超解像装置であって、前記入力された画像を、前記所定形状に分割して、分割画像を生成する分割部と、前記分割画像毎に、当該分割画像中で最大の画素値と最小の画素値とに基づき、当該分割画像の画素値を正規化する正規化部と、前記分割画像毎に、当該分割画像中で画素値が最大である画素および最小である画素、を除く画素の正規化された画素値の、前記第1画素および前記第2画素を基準とした並びを表す情報をキーとして、前記データベースを参照して、当該分割画像に対応する高解像画像を取得する検索部と、前記検索部が取得した前記高解像画像を用いて、前記入力された画像を高解像度化した超解像画像を生成する超解像部とを備えることを特徴とする。 (4) According to another aspect of the present invention, there is provided the super-resolution device according to (3), wherein the input image is divided into the predetermined shape to generate a divided image. A normalization unit for normalizing pixel values of the divided image based on the maximum pixel value and the minimum pixel value in the divided image for each of the divided images; and for each divided image, In the database, the information representing the arrangement of the normalized pixel values of the pixels excluding the pixel having the maximum pixel value and the pixel having the minimum pixel value with reference to the first pixel and the second pixel is used as a key. Referring to a search unit that acquires a high-resolution image corresponding to the divided image, and a super-resolution image obtained by increasing the resolution of the input image using the high-resolution image acquired by the search unit. And a super resolving unit for generating.

(5)また、本発明の他の態様は、(4)に記載の超解像装置であって、前記キーは、前記分割画像中で画素値が最大である画素および最小である画素の配置種別を表す情報を含むことを特徴とする。 (5) According to another aspect of the present invention, in the super-resolution device according to (4), the key is an arrangement of a pixel having a maximum pixel value and a minimum pixel value in the divided image. It includes the information indicating the type.

(6)また、本発明の他の態様は、(3)または(4)に記載の超解像装置であって、前記超解像部は、前記分割画像各々を補間内挿して、前記検索部が取得した前記解像度の高い画像と同じ解像度にし、補間内挿した前記分割画像各々に、前記検索部が取得した前記解像度の高い画像を加算して、前記超解像画像を生成することを特徴とする。 (6) Further, another aspect of the present invention is the super-resolution device according to (3) or (4), in which the super-resolution unit interpolates each of the divided images and performs the search. Generating the super-resolution image by adding the high-resolution image acquired by the search unit to each of the divided images interpolated and interpolated with the same resolution as the high-resolution image acquired by the unit. Features.

(7)また、本発明の他の態様は、コンピュータを、入力された画像内の所定形状の領域内の画素であって、前記領域内の画素の画素値を大きさに従い整列したときの複数の所定順位の画素からなる入力基準画素群を除く画素である対象画素の画素値を、前記入力基準画素群に含まれる画素の画素値に基づき正規化し、対象画素の正規化した画素値の並びを表す情報に基づいて、前記所定形状の画像中の画素であって、前記画像内において画素値を整列したときの前記複数の所定順位の画素からなる参照基準画素群を除く画素の画素値の並びを表す情報と、前記所定形状の画像よりも解像度の高い高解像画像とを対応付けて記憶するデータベースを参照することにより、前記領域に対応する高解像画像を取得し、取得した高解像画像の各画素値を、前記入力基準画素群の画素値に基づいて補正することで、前記入力された画像を高解像度化する超解像装置として機能させるためのプログラムである。 (7) Further, according to another aspect of the present invention, there is provided a plurality of computers when pixels in a predetermined shape area in an input image and the pixel values of the pixels in the area are aligned according to size. The pixel values of the target pixels that are pixels excluding the input reference pixel group composed of pixels of the predetermined order are normalized based on the pixel values of the pixels included in the input reference pixel group, and the normalized pixel value array of the target pixels On the basis of the information indicating the pixel values of the pixels excluding the reference standard pixel group consisting of the plurality of pixels in the predetermined order when the pixel values are aligned in the image. The high resolution image corresponding to the region is acquired by referring to the database that stores the information indicating the arrangement and the high resolution image having a higher resolution than the image of the predetermined shape, and stores the acquired high resolution image. Each pixel of the resolution image The, by correcting on the basis of the pixel values of the input reference pixel group is a program for functioning the input image as a super-resolution device for high resolution.

この発明によれば、データベース容量を抑えることができる。   According to the present invention, the database capacity can be suppressed.

この発明の一実施形態による超解像システム10の構成を示す概略ブロック図である。1 is a schematic block diagram showing a configuration of a super-resolution system 10 according to an embodiment of the present invention. 同実施形態における幾何変換の順変換と逆変換とを示す図である。It is a figure which shows the forward transformation and reverse transformation of geometric transformation in the embodiment. 同実施形態における画素値が最大および最小の画素の配置と、適用する幾何変換との対応を示す図である。It is a figure which shows a response | compatibility with arrangement | positioning of the pixel with the largest and the smallest pixel value in the embodiment, and the geometric transformation to apply. 同実施形態における学習装置1の動作を説明する図である。It is a figure explaining operation | movement of the learning apparatus 1 in the embodiment. 同実施形態における超解像装置3の構成を示す概略ブロック図である。It is a schematic block diagram which shows the structure of the super-resolution apparatus 3 in the same embodiment.

以下、図面を参照して、本発明の実施の形態について説明する。図1は、この発明の一実施形態による超解像システム10の構成を示す概略ブロック図である。超解像システム10は、学習装置1、データベース2、超解像装置3を含む。超解像装置3は、予め学習装置1により構築されたデータベース2を用いて、画像の高解像化をする。   Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a schematic block diagram showing a configuration of a super-resolution system 10 according to an embodiment of the present invention. The super-resolution system 10 includes a learning device 1, a database 2, and a super-resolution device 3. The super-resolution device 3 uses the database 2 previously constructed by the learning device 1 to increase the resolution of the image.

従来の学習型超解像では、データベース内に低解像画像の部分領域(低解像パッチK)と、これに対応する高解像画像の部分領域(高解像パッチG)との対が記録されるのに対し、本実施形態に係るデータベース2は、低解像パッチKを正規化し低次元化した数値データ(以下、低解像キーN’)と、これに対応する高解像パッチを生成するための素材となるパッチ(高解像残差パッチE)との対が記録される。   In conventional learning-type super-resolution, a pair of a low-resolution image partial region (low-resolution patch K) and a corresponding high-resolution image partial region (high-resolution patch G) is stored in a database. Whereas the database 2 according to the present embodiment is recorded, numerical data obtained by normalizing and reducing the dimension of the low-resolution patch K (hereinafter referred to as a low-resolution key N ′) and the corresponding high-resolution patch A pair with a patch (high resolution residual patch E) that is a material for generating the image is recorded.

以下に、データベース2を構築するための学習装置1の構成について説明する。学習装置1は、分割部11と、分割部12と、正規化部13と、変換部14と、補間部15と、減算部16と、登録部17を備え、学習用に入力された低解像画像LSと高解像画像HSとに基づいてデータベース2にデータを登録・更新することで学習を行う。   Below, the structure of the learning apparatus 1 for constructing | assembling the database 2 is demonstrated. The learning device 1 includes a dividing unit 11, a dividing unit 12, a normalizing unit 13, a converting unit 14, an interpolating unit 15, a subtracting unit 16, and a registering unit 17, and a low solution input for learning. Learning is performed by registering and updating data in the database 2 based on the image image LS and the high-resolution image HS.

分割部11は、低解像画像LSから所定形状の低解像パッチKを切り出す。分割部12は、高解像画像HS内の低解像パッチKに対応する部分を、高解像パッチGとして切り出す。分割部11と分割部12とは、低解像画像LSと高解像画像HSとから各1箇所だけパッチを切り出してもよいし、画面内を走査しつつ順次パッチを切り出しても構わない。また、低解像画像LSと高解像画像HSとの対も、1対であっても構わないし、複数対であっても構わない。前記、順次パッチを切り出す場合には、正規化部13から登録部17までの各動作を繰り返し実行し、データベース2を順次更新する。   The dividing unit 11 cuts out a low-resolution patch K having a predetermined shape from the low-resolution image LS. The dividing unit 12 cuts out a portion corresponding to the low resolution patch K in the high resolution image HS as the high resolution patch G. The dividing unit 11 and the dividing unit 12 may cut out only one patch from each of the low resolution image LS and the high resolution image HS, or may cut out patches sequentially while scanning the screen. Further, the pair of the low resolution image LS and the high resolution image HS may be one pair or plural pairs. When the patches are cut out sequentially, the operations from the normalization unit 13 to the registration unit 17 are repeatedly executed to update the database 2 sequentially.

なお、低解像画像LSまたは高解像画像HSがカラー画像である場合には、色成分ごとに独立にデータベース2を備えそれぞれ独立に学習さてもよいし、全色成分共通のデータベース2を備えてこれを全色成分について学習させてもよい。   When the low-resolution image LS or the high-resolution image HS is a color image, the database 2 may be provided independently for each color component and may be learned independently, or the database 2 common to all color components may be provided. This may be learned for all color components.

正規化部13は、低解像パッチKを構成する画素について画素値の最小値mと最大値Mとを求め、これらに基づいて画素値レベルを正規化(以下、レベル変換)し、パッチJを生成する。例えば、正規化部13は、最小値mが「0.0」に、最大値が「1.0」になるように、レベル変換を行う。
パッチKにおいて、画像座標(i,j)における画素値をK(i,j)とする(他の画像やパッチについても同様に表記する)。このときのレベル変換は、例えば、(式1)で表される変換である。
The normalizing unit 13 obtains the minimum value m and the maximum value M of the pixel values of the pixels constituting the low resolution patch K, normalizes the pixel value level (hereinafter referred to as level conversion) based on these values, and applies the patch J Is generated. For example, the normalization unit 13 performs level conversion so that the minimum value m is “0.0” and the maximum value is “1.0”.
In the patch K, the pixel value at the image coordinates (i, j) is K (i, j) (other images and patches are also expressed in the same manner). The level conversion at this time is, for example, conversion expressed by (Expression 1).

Figure 2016115313
Figure 2016115313

正規化部13は、さらにパッチJ内において画素値が0.0および1.0をとる画素の配置に基づき、これが規定の配置になるよう幾何変換(回転変換または鏡像変換)を行う。なお、画素値が0.0の画素は、画素値が最小の画素であり、画素値が1.0の画素は、画素値が最大の画素である。正規化部13の幾何変換の例を、図2の「変換前」および「順変換後」の対(変換識別子T=0からT=7)として例示した。   The normalizing unit 13 further performs geometric transformation (rotation transformation or mirror image transformation) based on the arrangement of pixels having pixel values of 0.0 and 1.0 in the patch J so that the pixel arrangement becomes a prescribed arrangement. A pixel having a pixel value of 0.0 is a pixel having the minimum pixel value, and a pixel having a pixel value of 1.0 is a pixel having the maximum pixel value. An example of geometric transformation of the normalizing unit 13 is illustrated as a pair (conversion identifiers T = 0 to T = 7) of “before conversion” and “after forward conversion” in FIG.

正規化部13は、例えば、パッチJ内の値0.0(図中では0)および値1.0(図中では1)の配置を図3に示すテンプレート(パッチJのパターン)と照合し、合致するものに対応付けられている変換識別子Tの幾何変換(図2参照)を適用することで、正規化低解像パッチNを得る。なお、パッチJ内の値0.0および値1.0の配置が図3のテンプレートの複数に合致する場合には、正規化部13は、所定の規則によりその一つを選択して、当該選択テンプレートに対応付けられている変換識別子Tの幾何変換を行う。例えば、パッチJ内の値0および値1の配置が図3のテンプレートの複数に合致する場合には、配置種別Sの数値が最小のものを選択し、それでもなお唯一に絞り込めない場合には、変換識別子Tの数値が最小のものを選択する。   For example, the normalization unit 13 collates the arrangement of the value 0.0 (0 in the figure) and the value 1.0 (1 in the figure) in the patch J with the template (pattern of the patch J) shown in FIG. The normalized low-resolution patch N is obtained by applying the geometric transformation (see FIG. 2) of the transformation identifier T associated with the matching one. If the arrangement of the value 0.0 and the value 1.0 in the patch J matches a plurality of templates in FIG. 3, the normalization unit 13 selects one according to a predetermined rule, and The geometric transformation of the transformation identifier T associated with the selected template is performed. For example, when the arrangement of the value 0 and the value 1 in the patch J matches a plurality of templates in FIG. 3, if the arrangement type S has the smallest numerical value and still cannot be narrowed down only The one with the smallest numerical value of the conversion identifier T is selected.

正規化部13は、パッチJに対して前記幾何変換を適用した後のパッチを正規化低解像パッチNとして出力するとともに、正規化パラメータR=(m,M,S,T)を出力する。前記正規化パラメータRには、低解像パッチK内の画素値の画素値の最小値m、最大値M、パッチJにおける値0および値1(すなわち低解像パッチKにおける最大値および最小値)の配置を表す配置種別S、および幾何変換の変換識別子Tが含まれる。   The normalization unit 13 outputs a patch after applying the geometric transformation to the patch J as a normalized low-resolution patch N and outputs a normalization parameter R = (m, M, S, T). . The normalization parameter R includes a minimum value m, a maximum value M, a value 0 and a value 1 in the patch J (that is, a maximum value and a minimum value in the low-resolution patch K). ) And a conversion identifier T of geometric transformation.

変換部14は、高解像パッチGに対して(式2)に示すレベル変換を行い、パッチDを生成する。   The conversion unit 14 performs level conversion shown in (Expression 2) on the high-resolution patch G to generate a patch D.

Figure 2016115313
Figure 2016115313

なお、(式2)における最小値mおよび最大値Mは(高解像パッチGの最小値および最大値ではなく)低解像パッチKの最小値および最大値である。
続いて、変換部14は、変換識別子Tにより指定される無変換、回転、または鏡像の順変換を行い、その結果、パッチFを得る。
Note that the minimum value m and the maximum value M in (Equation 2) are the minimum value and the maximum value of the low resolution patch K (not the minimum value and maximum value of the high resolution patch G).
Subsequently, the conversion unit 14 performs no conversion, rotation, or forward conversion of the mirror image specified by the conversion identifier T, and as a result, the patch F is obtained.

補間部15は、正規化低解像パッチNを高解像パッチGと同じ解像度となるよう補間内挿により高解像化し、パッチPを得る。補間内挿には、例えば0次内挿(最近傍補間)を用いるが、より高次の内挿であってもよい。
例えば、高解像パッチの水平および垂直解像度が低解像パッチの水平および垂直解像度の2倍および2倍である場合には、補間部15は、(式3)で表される変換をする。
The interpolation unit 15 obtains a patch P by performing high-resolution interpolation interpolation so that the normalized low-resolution patch N has the same resolution as the high-resolution patch G. For interpolation, for example, 0th order interpolation (nearest neighbor interpolation) is used, but higher order interpolation may be used.
For example, when the horizontal and vertical resolutions of the high resolution patch are twice and twice the horizontal and vertical resolutions of the low resolution patch, the interpolation unit 15 performs the conversion represented by (Equation 3).

Figure 2016115313
Figure 2016115313

減算部16は、パッチFからパッチPを減じた差分画像を求め、その結果を高解像残差パッチEとして出力する。すなわち、減算部16は、(式4)で表される変換を行う。   The subtraction unit 16 obtains a difference image obtained by subtracting the patch P from the patch F, and outputs the result as a high-resolution residual patch E. That is, the subtracting unit 16 performs the conversion represented by (Expression 4).

Figure 2016115313
Figure 2016115313

登録部17は、配置種別Sおよび変換識別子Tを特定するために用いられた画素値最小および最大の2画素を除く画素列を所定の順序(並び)で走査することで得られる画素値の数列(以下、低解像キーN’)を作成する。この所定の順序は、配置種別S毎に予め決められている。すなわち、画素値最小および最大の画素の配置を基準とする順序である。例えば、低解像パッチが水平2画素×垂直2画素である場合には、正規化低解像パッチNを構成する4画素から2画素をピックアップし、2項の数列である低解像キーN’を作成する。具体的には、配置種別S=0または配置種別S=1の場合にはN’=(N(0,1),N(1,1))とし、配置種別S=2の場合にはN’=(N(0,1),N(1,0))とする。
続いて、登録部17は、配置種別Sおよび低解像キーN’と高解像残差パッチEとの対をデータベース2に登録する。
The registration unit 17 is a sequence of pixel values obtained by scanning a pixel column excluding the minimum and maximum pixel values used to specify the arrangement type S and the conversion identifier T in a predetermined order (alignment). (Hereinafter referred to as low resolution key N ′). This predetermined order is predetermined for each arrangement type S. That is, the order is based on the arrangement of the minimum and maximum pixel values. For example, when the low-resolution patch is 2 horizontal pixels × 2 vertical pixels, 2 pixels are picked up from 4 pixels constituting the normalized low-resolution patch N, and the low-resolution key N that is a sequence of two terms 'Create. Specifically, N ′ = (N (0,1), N (1,1)) when the arrangement type S = 0 or the arrangement type S = 1, and N when the arrangement type S = 2. Let '= (N (0,1), N (1,0)).
Subsequently, the registration unit 17 registers the pair of the arrangement type S and the low resolution key N ′ and the high resolution residual patch E in the database 2.

登録部17は、データベース2へ、例えば、配置種別Sおよび低解像キーN’を、検索キーとして与えたときに高解像残差パッチEが得られるよう対応付けて記録する。
配置種別Sおよび低解像キーN’に対応する高解像残差パッチEがデータベース2に未だ登録されていない場合には、登録部17は、配置種別Sおよび低解像キーN’に関連付けて高解像残差パッチEを登録する。
The registration unit 17 records, for example, the arrangement type S and the low resolution key N ′ in the database 2 in association with each other so that a high resolution residual patch E can be obtained when given as a search key.
When the high-resolution residual patch E corresponding to the arrangement type S and the low-resolution key N ′ is not yet registered in the database 2, the registration unit 17 associates the arrangement type S with the low-resolution key N ′. To register a high-resolution residual patch E.

配置種別Sおよび低解像キーN’に対応する高解像残差パッチEがデータベース2に既に登録されている場合には、登録部17は、配置種別Sおよび低解像キーN’にすでに関連付けられている高解像残差パッチを破棄して高解像残差パッチEを新規登録する。あるいは、配置種別Sおよび低解像キーN’に対応する高解像残差パッチEがデータベース2に既に登録されている場合には、登録部17は、配置種別Sおよび低解像キーN’にすでに関連付けられている高解像残差パッチと高解像残差パッチEを合成したもの(例えば、両パッチの相加平均)に登録を更新する。   When the high resolution residual patch E corresponding to the arrangement type S and the low resolution key N ′ is already registered in the database 2, the registration unit 17 has already registered the arrangement type S and the low resolution key N ′. The associated high resolution residual patch is discarded and a new high resolution residual patch E is registered. Alternatively, when the high resolution residual patch E corresponding to the arrangement type S and the low resolution key N ′ is already registered in the database 2, the registration unit 17 sets the arrangement type S and the low resolution key N ′. The registration is updated to a combination of the high-resolution residual patch and the high-resolution residual patch E already associated with (for example, the arithmetic average of both patches).

なお、さまざまな低解像パッチKと高解像パッチGの対でデータベース2の内容を更新した後、なおもすべての配置種別Sと低解像キーN’の組み合わせに対して高解像残差パッチEが対応付けられるとは限らない。このような場合、登録部17は、対応付けのなされていない組み合わせと同じ配置種別Sの中で、その組み合わせの低解像キーN’に最も近接しかつ対応付けなされている低解像キーN’’を探し、その低解像キーN’’に対応する高解像残差パッチを、その組み合わせに対応する高解像残差パッチEとみなして登録するよう動作しても構わない。または、登録部17は、対応付けのなされていない低解像キーN’に周囲の対応付けなされている低解像キーN’’をその距離が近い方から複数個選択し、これらに対応付けられている高解像残差パッチで演算(例えば距離に応じた重みづけによる相加平均)を施した結果を以て該低解像キーN’に対応する高解像残差パッチEとみなして登録するよう動作しても構わない。なお、N’とN’’間の距離は、例えばユークリッド距離により測るものとする。   After updating the contents of the database 2 with various pairs of the low resolution patch K and the high resolution patch G, the high resolution residual is still applied to all combinations of the arrangement type S and the low resolution key N ′. The difference patch E is not necessarily associated. In such a case, the registration unit 17 is closest to the low resolution key N ′ of the combination and is associated with the low resolution key N ′ in the same arrangement type S as the combination that is not associated. It may be operated to search for '' and register a high-resolution residual patch corresponding to the low-resolution key N '' as a high-resolution residual patch E corresponding to the combination. Alternatively, the registration unit 17 selects a plurality of low-resolution keys N ″ that are associated with the low-resolution keys N ′ that are not associated with each other from the shortest distance, and associates them with these. Registered as a high-resolution residual patch E corresponding to the low-resolution key N ′ with the result of computation (for example, arithmetic mean by weighting according to distance) performed on the high-resolution residual patch It does not matter if it operates. Note that the distance between N ′ and N ″ is measured by the Euclidean distance, for example.

以下、低解像パッチKが水平2画素、垂直2画素の計4画素からなり、一方、高解像パッチGが垂直4画素、水平4画素の計16画素からなる場合について、図4を参照しつつ学習装置1の動作を例示する。
学習装置1は、まず、分割部11において低解像パッチKを切り出す。低解像パッチKの一例を図4の100に示す。正規化部13は、正規化パラメータを求めるための3つの処理(最小値演算101、最大値演算102、および幾何変換判定103)と、レベル変換104の処理と、幾何変換106の処理とを行う。
Hereinafter, the case where the low resolution patch K is composed of a total of 4 pixels of 2 horizontal pixels and 2 vertical pixels, while the high resolution patch G is composed of 16 pixels of 4 vertical pixels and 4 horizontal pixels, see FIG. However, the operation of the learning device 1 is illustrated.
The learning device 1 first cuts out the low-resolution patch K in the dividing unit 11. An example of the low resolution patch K is shown at 100 in FIG. The normalization unit 13 performs three processes (minimum value calculation 101, maximum value calculation 102, and geometric transformation determination 103) for obtaining a normalization parameter, a level conversion 104 process, and a geometric conversion 106 process. .

最小値演算101では、正規化部13は、低解像パッチKの中から最小値mを求める(この例ではm=2)。最大値演算102では、正規化部13は、低解像パッチKの中から最大値Mを求める(この例ではM=6)。レベル変換104では、正規化部13は、低解像パッチKに対し、最小値mと最大値Mとに基づいて(式1)の変換を行うことでパッチJを求める。パッチJの演算例を105に示す。   In the minimum value calculation 101, the normalization unit 13 obtains the minimum value m from the low resolution patch K (m = 2 in this example). In the maximum value calculation 102, the normalization unit 13 obtains the maximum value M from the low resolution patch K (M = 6 in this example). In the level conversion 104, the normalization unit 13 obtains the patch J by performing the conversion of (Equation 1) on the low resolution patch K based on the minimum value m and the maximum value M. An operation example of the patch J is shown in 105.

幾何変換判定103では、正規化部13は、パッチJの値0と値1の配置から配置種別Sと幾何変換106にて適用すべき変換の変換識別子Tとを特定する。この例では、配置種別S=1、変換識別子T=4となる。幾何変換106では、正規化部13は、パッチJに対して変換識別子Tの幾何変換を実行する。幾何変換106において、図2の「変換前」からT=4の「順変換後」への変換を行った結果、107に示す正規化低解像パッチNが得られる。   In the geometric transformation determination 103, the normalization unit 13 specifies the arrangement type S and the transformation identifier T of the transformation to be applied in the geometric transformation 106 from the arrangement of the value 0 and the value 1 of the patch J. In this example, the arrangement type S = 1 and the conversion identifier T = 4. In the geometric transformation 106, the normalization unit 13 performs a geometric transformation of the transformation identifier T on the patch J. In the geometric transformation 106, the normalized low-resolution patch N indicated by 107 is obtained as a result of the transformation from “before transformation” in FIG. 2 to “after forward transformation” at T = 4.

変換部14は、レベル変換111の処理と幾何変換113の処理とを行う。レベル変換111では、変換部14は、正規化部13で得られた最小値m(この例ではm=2)および最大値M(この例ではM=6)とに基づいて(式2)の変換を行い、図4の112に示すパッチDを得る。幾何変換113では、変換部14は、パッチDに対し、幾何変換判定103で特定された変換識別子Tにより指定される無変換、回転、または鏡像の順変換を行い、その結果、114に示すパッチFを得る。   The conversion unit 14 performs level conversion 111 processing and geometric conversion 113 processing. In the level conversion 111, the conversion unit 14 is based on the minimum value m (m = 2 in this example) and the maximum value M (M = 6 in this example) obtained by the normalization unit 13 according to (Equation 2). Conversion is performed to obtain a patch D indicated by 112 in FIG. In the geometric transformation 113, the transformation unit 14 performs no transformation, rotation, or mirror image forward transformation designated by the transformation identifier T specified in the geometric transformation judgment 103 on the patch D, and as a result, the patch indicated by 114 is obtained. Get F.

補間部15は、107の正規化低解像パッチNを補間(この例では0次補間)し、109に示すパッチPを生成する。減算部16は、114のパッチFから画素毎に109のパッチPを減じ、その結果として115に示す高解像残差パッチEを得る。登録部17は、幾何変換判定103で特定された配置種別S=1に基づき正規化低解像パッチNから低解像キーN’=(0.25,0.50)(図4の108の点線内の2画素)を生成する。   The interpolating unit 15 interpolates the normalized low-resolution patch N 107 (0-order interpolation in this example), and generates a patch P indicated by 109. The subtracting unit 16 subtracts 109 patches P for each pixel from 114 patches F, and obtains a high-resolution residual patch E indicated by 115 as a result. The registration unit 17 determines from the normalized low resolution patch N to the low resolution key N ′ = (0.25, 0.50) (108 in FIG. 4) based on the arrangement type S = 1 specified in the geometric transformation determination 103. 2 pixels within the dotted line).

また、登録部17は、図4の108に示す低解像キーN’=(0.25,0.50)と、図4の115に示す高解像残差パッチE、および配置種別S=1の組をデータベース2へ登録/更新する。   Further, the registration unit 17 performs the low-resolution key N ′ = (0.25, 0.50) indicated by 108 in FIG. 4, the high-resolution residual patch E indicated by 115 in FIG. 4, and the arrangement type S = One set is registered / updated in the database 2.

次に、本実施形態に係る超解像装置3の構成について図5を参照しつつ説明する。図5は、超解像装置3の構成を示す概略ブロック図である。超解像装置3は、入力された低解像画像Lを、データベース2を参照しつつ高解像化し、高解像画像Hを出力する。超解像装置3は、分割部31と、正規化部32と、データベース2と、検索部33と、補間部34と、加算部35と、逆変換部36と、合成部37とを含む。   Next, the configuration of the super-resolution device 3 according to the present embodiment will be described with reference to FIG. FIG. 5 is a schematic block diagram showing the configuration of the super-resolution device 3. The super-resolution device 3 increases the resolution of the input low-resolution image L with reference to the database 2 and outputs the high-resolution image H. The super-resolution device 3 includes a dividing unit 31, a normalizing unit 32, a database 2, a search unit 33, an interpolation unit 34, an addition unit 35, an inverse conversion unit 36, and a synthesis unit 37.

分割部31は低解像画像Lから高解像パッチKを切り出す。分割部31は、低解像画像Lの画面内を走査しつつ順次パッチ(低解像パッチK)を切り出す。このとき、以降の正規化部32から逆変換部36の各動作は分割部31が低解像パッチLを切り出す都度実行し、その結果を合成部37において合成することで高解像画像Hが構成される。   The dividing unit 31 cuts out the high resolution patch K from the low resolution image L. The dividing unit 31 sequentially cuts out patches (low-resolution patches K) while scanning the screen of the low-resolution image L. At this time, the subsequent operations from the normalization unit 32 to the inverse conversion unit 36 are executed each time the dividing unit 31 cuts out the low-resolution patch L, and the result is synthesized by the synthesis unit 37 so that the high-resolution image H is synthesized. Composed.

低解像画像Lの水平解像度をC画素、垂直解像度をC画素とする。低解像パッチKの画素数を水平S画素、垂直S画素とする。分割部31が低解像画像Lの画面内を走査しつつ順次低解像パッチKを切り出す中で、例えば、画像座標(X,Y)を左上点とする低解像パッチKを切り出す場合には、分割部31は、(式5)を実行する。 Let the horizontal resolution of the low resolution image L be C x pixels and the vertical resolution be Cy pixels. Let the number of pixels of the low resolution patch K be horizontal Sx pixels and vertical Sy pixels. When the dividing unit 31 sequentially cuts out the low-resolution patch K while scanning the screen of the low-resolution image L, for example, when cutting out the low-resolution patch K having the image coordinates (X, Y) as the upper left point. The dividing unit 31 executes (Expression 5).

Figure 2016115313
Figure 2016115313

正規化部32は、分割部31から入力された低解像パッチKに対して、図1の正規化部13と同様の演算によりレベル変換および幾何変換を行い、正規化低解像パッチNと正規化パラメータR=(m,M,S,T)とを出力する。
検索部33は、正規化パラメータRの配置種別Sに基づいて正規化低解像パッチNから画素値最小および最大、を除く画素を選び、低解像キーN’を求める。具体的には、配置種別S=0または配置種別S=1の場合にはN’=(N(0,1),N(1,1))とし、配置種別S=2の場合にはN’=(N(0,1),N(1,0))とする。
The normalization unit 32 performs level conversion and geometric conversion on the low-resolution patch K input from the division unit 31 by the same calculation as the normalization unit 13 in FIG. The normalization parameter R = (m, M, S, T) is output.
The search unit 33 selects a pixel excluding the minimum and maximum pixel values from the normalized low resolution patch N based on the arrangement type S of the normalization parameter R, and obtains the low resolution key N ′. Specifically, N ′ = (N (0,1), N (1,1)) when the arrangement type S = 0 or the arrangement type S = 1, and N when the arrangement type S = 2. Let '= (N (0,1), N (1,0)).

また、検索部33は、配置種別Sおよび低解像キーN’を検索クエリとしてデータベース2に照会し、配置種別Sおよび低解像キーN’の組み合わせに対応する高解像残差パッチEを得る。なお、検索部33は、配置種別Sおよび低解像キーN’を検索クエリとしてデータベース2に照会した結果、対応する高解像残差パッチEが得られなかった場合(データベース2に登録されていなかった場合)、同じ配置種別Sの低解像キーの中で、該低解像キーN’に最も近接しかつ対応付けなされている低解像キーN’’を探し、低解像キーN’’に対応する高解像残差パッチを低解像キーN’に対応する高解像残差パッチEとみなして出力するよう動作しても構わない。   The search unit 33 also queries the database 2 using the arrangement type S and the low resolution key N ′ as a search query, and obtains a high resolution residual patch E corresponding to the combination of the arrangement type S and the low resolution key N ′. obtain. The search unit 33 refers to the database 2 using the arrangement type S and the low resolution key N ′ as a search query, and as a result, the corresponding high resolution residual patch E is not obtained (registered in the database 2). If not, the low resolution key N ″ closest to and associated with the low resolution key N ′ among the low resolution keys of the same arrangement type S is searched for, and the low resolution key N The high resolution residual patch corresponding to ″ may be regarded as the high resolution residual patch E corresponding to the low resolution key N ′ and output.

または、検索部33は、同じ配置種別Sの低解像キーの中で、対応付けのなされていない低解像キーN’に周囲の対応付けなされている低解像キーN’’をその距離が近い方から複数個選択し、これらに対応付けられている高解像残差パッチで演算(例えば距離に応じた重みづけによる相加平均)を施した結果を以て該低解像キーN’に対応する高解像残差パッチEとみなして出力するよう動作しても構わない。なお、N’とN’’間の距離は、例えばユークリッド距離により測るものとする。   Alternatively, the search unit 33 sets the distance between the low-resolution key N ″ that is associated with the surrounding low-resolution key N ′ that is not associated among the low-resolution keys of the same arrangement type S. Are selected from the nearer ones, and the result of arithmetic (for example, arithmetic mean by weighting according to distance) corresponding to these is applied to the low-resolution key N ′. Operation may be performed so that the corresponding high-resolution residual patch E is output. Note that the distance between N ′ and N ″ is measured by the Euclidean distance, for example.

補間部34は、図1の補間部15と同様の演算により、正規化低解像パッチNを補間内挿して高解像化し、パッチPを得る。加算部35は、(式6)で表される演算を行う。すなわち、加算部35は、検索部33からの高解像残差パッチEと、補間部34からのパッチPとを画素毎に加算し、パッチFを得る。   The interpolation unit 34 obtains a patch P by interpolating the normalized low-resolution patch N by high-resolution by the same calculation as the interpolation unit 15 of FIG. The adding unit 35 performs the calculation represented by (Expression 6). That is, the adding unit 35 adds the high-resolution residual patch E from the searching unit 33 and the patch P from the interpolating unit 34 for each pixel to obtain a patch F.

Figure 2016115313
Figure 2016115313

逆変換部36は、正規化部32からの正規化パラメータRのうち最小値m、最大値M、および変換識別子Tに基づき、パッチFに対して変換部14の逆変換に相当する演算を実行し、高解像パッチGを得る。
例えば、逆変換部36は、まず、パッチFに対し幾何変換113の逆変換に相当する演算を実行し、パッチDを得る。すなわち、パッチFに対し、変換識別子Tにより指定される無変換、回転、または鏡像の逆変換を図2に示すパターンで実行し、その結果としてパッチDを得る。続いて、逆変換部36は、パッチDに対してレベル変換111の逆変換に相当する演算を実行し、高解像パッチGを得る。なお、レベル変換111の逆変換は、(式7)で表される。
The inverse conversion unit 36 performs an operation corresponding to the inverse conversion of the conversion unit 14 on the patch F based on the minimum value m, the maximum value M, and the conversion identifier T among the normalization parameters R from the normalization unit 32. Then, a high resolution patch G is obtained.
For example, the inverse transformation unit 36 first performs an operation corresponding to the inverse transformation of the geometric transformation 113 on the patch F to obtain the patch D. That is, no conversion, rotation, or reverse conversion of the mirror image specified by the conversion identifier T is performed on the patch F in the pattern shown in FIG. Subsequently, the inverse conversion unit 36 performs an operation corresponding to the inverse conversion of the level conversion 111 on the patch D to obtain a high resolution patch G. The inverse conversion of the level conversion 111 is expressed by (Equation 7).

Figure 2016115313
Figure 2016115313

合成部37は、分割部31が低解像画像Lの画面内を走査するのに対応して、高解像画像における対応領域を走査しつつ、高解像パッチGを貼り合わせていくことにより高解像画像Hを構成する。   In response to the division unit 31 scanning the inside of the screen of the low resolution image L, the synthesizing unit 37 scans the corresponding region in the high resolution image and pastes the high resolution patch G together. A high resolution image H is constructed.

高解像画像Hの水平解像度をA・C画素、垂直解像度をA・C画素とする。高解像パッチGの画素数を水平A・S画素、垂直A・S画素とする。なお、Aは高解像画像Hの水平画素数を低解像画像Lの水平画素数で除した比率であり、また、Aは高解像画像Hの垂直画素数を低解像画像Lの垂直画素数で除した比率である。分割部31が低解像画像Lの画面内を走査しつつ順次低解像パッチKを切り出す中で、例えば、画像座標(X,Y)を左上点とする低解像パッチKを切り出した場合には、それに呼応して合成部37は、(式8)で表される処理を実行することで高解像画像Hを構成する。 The horizontal resolution of the high resolution image H is A x · C x pixels, and the vertical resolution is A y · C y pixels. Let the number of pixels of the high-resolution patch G be horizontal A x · S x pixels and vertical A y · S y pixels. Incidentally, A x is the ratio obtained by dividing the number of horizontal pixels of the high resolution image H in the number of horizontal pixels of the low resolution image L, also, A y are low-resolution images the number of vertical pixels of the high resolution image H This is the ratio divided by the number of vertical pixels of L. When the dividing unit 31 sequentially cuts out the low-resolution patch K while scanning the screen of the low-resolution image L, for example, when the low-resolution patch K having the image coordinate (X, Y) as the upper left point is cut out In response to this, the synthesizer 37 constructs the high-resolution image H by executing the processing represented by (Equation 8).

Figure 2016115313
Figure 2016115313

なお、上述の実施形態において、超解像装置3とデータベース2とは、異なる装置であるが、超解像装置3が、データベース2を含んでいてもよい。
また、超解像装置3において、加算部35と逆変換部36の処理順序を逆にしてもよい。この場合、補間部34は、低解像パッチKを補間内挿して高解像化し、パッチPを得る。
また、上述の実施形態において、低解像パッチKの形状は、2画素×2画素の正方形であったが、これに限らない。より画素数の多い正方形や長方形であってもよいし、矩形以外の形状であってもよい。
In the above-described embodiment, the super-resolution device 3 and the database 2 are different devices, but the super-resolution device 3 may include the database 2.
Further, in the super-resolution device 3, the processing order of the addition unit 35 and the inverse conversion unit 36 may be reversed. In this case, the interpolation unit 34 interpolates the low resolution patch K to obtain a high resolution and obtains the patch P.
In the above-described embodiment, the shape of the low-resolution patch K is a square of 2 pixels × 2 pixels, but is not limited thereto. A square or rectangle with a larger number of pixels may be used, or a shape other than a rectangle may be used.

このように、超解像装置3が使用するデータベース2では、低解像パッチKと高解像パッチGの対を学習する際に、低解像パッチKを表す情報として、低解像パッチK中で画素値が最大と最小の画素を除いた画素の画素値の並びを表す情報が用いられている。このため、画素値が最大と最小の画素の分だけ、低解像パッチKを表す情報のビット数が少なくなっている。すなわち、低解像パッチKを表す情報が取り得る値の範囲が小さくなっているので、データベース2のレコード数を抑え、容量を抑えることができる。   Thus, in the database 2 used by the super-resolution device 3, when learning a pair of the low-resolution patch K and the high-resolution patch G, the low-resolution patch K is used as information representing the low-resolution patch K. Among them, information representing the arrangement of pixel values of pixels excluding the pixels with the largest and smallest pixel values is used. For this reason, the number of bits of information representing the low-resolution patch K is decreased by the maximum and minimum pixel values. That is, since the range of values that can be taken by the information representing the low-resolution patch K is small, the number of records in the database 2 can be suppressed and the capacity can be suppressed.

また、画素値の並びを表す情報における並びは、回転、鏡像変換などの幾何変換を行い、画素値が最大と最小の画素を基準とした画素の並びとなっている。これにより、幾何変換により変換可能な関係にある低解像パッチKの集合に対して、一つの低解像パッチKを学習しておくだけで充分となる。すなわち、データベースの学習(対の登録)に際して、低解像パッチと高解像パッチの対の個数が不十分であると、学習のオーバフィッティング(過学習;自由度の高いモデルを不十分なデータで学習すると、個々のデータの偏りや雑音に左右されて不適切なモデルが構築されてしまう現象)が生じ、該データベースを用いた超解像処理結果の画質が劣化してしまうことが起き難くなる。   The arrangement in the information representing the arrangement of the pixel values is an arrangement of pixels based on the pixels having the largest and smallest pixel values by performing geometric transformation such as rotation and mirror image transformation. As a result, it is sufficient to learn one low-resolution patch K for a set of low-resolution patches K that can be converted by geometric transformation. That is, when learning the database (registering pairs), if the number of pairs of low-resolution patches and high-resolution patches is insufficient, overfitting of learning (overlearning; When learning with, a phenomenon in which an inappropriate model is constructed depending on the bias and noise of individual data) occurs, and the image quality of the super-resolution processing result using the database is unlikely to deteriorate. Become.

また、図1における学習装置1、データベース2、超解像装置3の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより学習装置1、データベース2、超解像装置3を実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。   1 is recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into a computer system. The learning device 1, the database 2, and the super-resolution device 3 may be realized by executing them. Here, the “computer system” includes an OS and hardware such as peripheral devices.

また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。   The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, the “computer-readable recording medium” dynamically holds a program for a short time like a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line. In this case, a volatile memory in a computer system serving as a server or a client in that case, and a program that holds a program for a certain period of time are also included. The program may be a program for realizing a part of the functions described above, and may be a program capable of realizing the functions described above in combination with a program already recorded in a computer system.

また、上述した図1における学習装置1、データベース2、超解像装置3の各機能ブロックは個別にチップ化してもよいし、一部、または全部を集積してチップ化してもよい。また、集積回路化の手法はLSIに限らず、専用回路、または汎用プロセッサで実現しても良い。ハイブリッド、モノリシックのいずれでも良い。一部は、ハードウェアにより、一部はソフトウェアにより機能を実現させても良い。
また、半導体技術の進歩により、LSIに代替する集積回路化等の技術が出現した場合、当該技術による集積回路を用いることも可能である。
In addition, each functional block of the learning device 1, the database 2, and the super-resolution device 3 in FIG. 1 described above may be individually chipped, or a part or all of them may be integrated into a chip. Further, the method of circuit integration is not limited to LSI, and implementation using a dedicated circuit or a general-purpose processor is also possible. Either hybrid or monolithic may be used. Some of the functions may be realized by hardware and some by software.
In addition, when a technology such as an integrated circuit that replaces an LSI appears due to progress in semiconductor technology, an integrated circuit based on the technology can be used.

以上、この発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。   The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes design changes and the like within a scope not departing from the gist of the present invention.

1…学習装置
2…データベース
3…超解像装置
10…超解像システム
11、12…分割部
13…正規化部
14…変換部
15…補間部
16…減算部
17…登録部
31…分割部
32…正規化部
33…検索部
34…補間部
35…加算部
36…逆変換部
37…合成部
DESCRIPTION OF SYMBOLS 1 ... Learning apparatus 2 ... Database 3 ... Super-resolution apparatus 10 ... Super-resolution system 11, 12 ... Dividing part 13 ... Normalization part 14 ... Conversion part 15 ... Interpolation part 16 ... Subtraction part 17 ... Registration part 31 ... Dividing part 32 ... Normalization unit 33 ... Search unit 34 ... Interpolation unit 35 ... Addition unit 36 ... Inverse conversion unit 37 ... Synthesis unit

Claims (7)

入力された画像内の所定形状の領域内の画素であって、前記領域内の画素の画素値を大きさに従い整列したときの複数の所定順位の画素からなる入力基準画素群を除く画素である対象画素の画素値を、前記入力基準画素群に含まれる画素の画素値に基づき正規化し、
対象画素の正規化した画素値の並びを表す情報に基づいて、前記所定形状の画像中の画素であって、前記画像内において画素値を整列したときの前記複数の所定順位の画素からなる参照基準画素群を除く画素の画素値の並びを表す情報と、前記所定形状の画像よりも解像度の高い高解像画像とを対応付けて記憶するデータベースを参照することにより、前記領域に対応する高解像画像を取得し、
取得した高解像画像の各画素値を、前記入力基準画素群の画素値に基づいて補正することで、前記入力された画像を高解像度化することを特徴とする超解像装置。
Pixels in a region of a predetermined shape in the input image, excluding an input reference pixel group composed of a plurality of pixels in a predetermined order when pixel values of the pixels in the region are aligned according to size Normalizing the pixel value of the target pixel based on the pixel values of the pixels included in the input reference pixel group;
A reference consisting of a plurality of pixels in the predetermined shape when the pixel values are aligned in the image, based on information representing the normalized arrangement of pixel values of the target pixel. By referring to a database that stores information indicating the arrangement of pixel values of pixels excluding the reference pixel group and a high-resolution image having a resolution higher than that of the image having the predetermined shape, the high value corresponding to the region is stored. Get the resolution image,
A super-resolution device that increases the resolution of the input image by correcting each pixel value of the acquired high-resolution image based on a pixel value of the input reference pixel group.
前記複数の所定順位の画素は、画素値が最大の画素である第1画素と、画素値が最小のである第2画素であることを特徴とする請求項1に記載の超解像装置。   2. The super-resolution device according to claim 1, wherein the plurality of pixels having a predetermined order are a first pixel having a maximum pixel value and a second pixel having a minimum pixel value. 前記並びは、前記第1画素および前記第2画素を基準とした画素の並びであることを特徴とする請求項2に記載の超解像装置。   The super-resolution apparatus according to claim 2, wherein the arrangement is an arrangement of pixels based on the first pixel and the second pixel. 前記入力された画像を、前記所定形状に分割して、分割画像を生成する分割部と、
前記分割画像毎に、当該分割画像中で最大の画素値と最小の画素値とに基づき、当該分割画像の画素値を正規化する正規化部と、
前記分割画像毎に、当該分割画像中で画素値が最大である画素および最小である画素、を除く画素の正規化された画素値の、前記第1画素および前記第2画素を基準とした並びを表す情報をキーとして、前記データベースを参照して、当該分割画像に対応する高解像画像を取得する検索部と、
前記検索部が取得した前記高解像画像を用いて、前記入力された画像を高解像度化した超解像画像を生成する超解像部と
を備えることを特徴とする請求項3に記載の超解像装置。
A dividing unit that divides the input image into the predetermined shape to generate a divided image;
For each divided image, a normalization unit that normalizes the pixel value of the divided image based on the maximum pixel value and the minimum pixel value in the divided image;
For each of the divided images, the normalized pixel values of the pixels excluding the pixel having the maximum pixel value and the pixel having the minimum pixel value in the divided image are arranged on the basis of the first pixel and the second pixel. A search unit that obtains a high-resolution image corresponding to the divided image with reference to the database using information representing
The super-resolution part which produces | generates the super-resolution image which raised the resolution of the said input image using the said high-resolution image which the said search part acquired. Super-resolution device.
前記キーは、前記分割画像中で画素値が最大である画素および最小である画素の配置種別を表す情報を含むことを特徴とする請求項4に記載の超解像装置。   The super-resolution device according to claim 4, wherein the key includes information representing an arrangement type of a pixel having a maximum pixel value and a minimum pixel value in the divided image. 前記超解像部は、前記分割画像各々を補間内挿して、前記検索部が取得した前記解像度の高い画像と同じ解像度にし、補間内挿した前記分割画像各々に、前記検索部が取得した前記解像度の高い画像を加算して、前記超解像画像を生成すること
を特徴とする請求項4または請求項5に記載の超解像装置。
The super-resolution unit interpolates each of the divided images to have the same resolution as the high-resolution image acquired by the search unit, and the search unit acquires the divided image obtained by interpolation interpolation. The super-resolution device according to claim 4 or 5, wherein the super-resolution image is generated by adding images having high resolution.
コンピュータを、
入力された画像内の所定形状の領域内の画素であって、前記領域内の画素の画素値を大きさに従い整列したときの複数の所定順位の画素からなる入力基準画素群を除く画素である対象画素の画素値を、前記入力基準画素群に含まれる画素の画素値に基づき正規化し、
対象画素の正規化した画素値の並びを表す情報に基づいて、前記所定形状の画像中の画素であって、前記画像内において画素値を整列したときの前記複数の所定順位の画素からなる参照基準画素群を除く画素の画素値の並びを表す情報と、前記所定形状の画像よりも解像度の高い高解像画像とを対応付けて記憶するデータベースを参照することにより、前記領域に対応する高解像画像を取得し、
取得した高解像画像の各画素値を、前記入力基準画素群の画素値に基づいて補正することで、前記入力された画像を高解像度化する超解像装置
として機能させるためのプログラム。
Computer
Pixels in a region of a predetermined shape in the input image, excluding an input reference pixel group composed of a plurality of pixels in a predetermined order when pixel values of the pixels in the region are aligned according to size Normalizing the pixel value of the target pixel based on the pixel values of the pixels included in the input reference pixel group;
A reference consisting of a plurality of pixels in the predetermined shape when the pixel values are aligned in the image, based on information representing the normalized arrangement of pixel values of the target pixel. By referring to a database that stores information indicating the arrangement of pixel values of pixels excluding the reference pixel group and a high-resolution image having a resolution higher than that of the image having the predetermined shape, the high value corresponding to the region is stored. Get the resolution image,
A program for functioning as a super-resolution device that increases the resolution of the input image by correcting each pixel value of the acquired high-resolution image based on the pixel value of the input reference pixel group.
JP2014256036A 2014-12-18 2014-12-18 Super-resolution apparatus and program Active JP6440305B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014256036A JP6440305B2 (en) 2014-12-18 2014-12-18 Super-resolution apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014256036A JP6440305B2 (en) 2014-12-18 2014-12-18 Super-resolution apparatus and program

Publications (2)

Publication Number Publication Date
JP2016115313A true JP2016115313A (en) 2016-06-23
JP6440305B2 JP6440305B2 (en) 2018-12-19

Family

ID=56141973

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014256036A Active JP6440305B2 (en) 2014-12-18 2014-12-18 Super-resolution apparatus and program

Country Status (1)

Country Link
JP (1) JP6440305B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114612294A (en) * 2020-12-08 2022-06-10 武汉Tcl集团工业研究院有限公司 Image super-resolution processing method and computer equipment
WO2023248593A1 (en) * 2022-06-20 2023-12-28 株式会社日立製作所 Image estimation method, evaluation value estimation method, and image estimation device
JP7507243B2 (en) 2020-02-17 2024-06-27 インテル コーポレイション Super-resolution processing using convolutional neural networks

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003018398A (en) * 2001-04-20 2003-01-17 Mitsubishi Electric Research Laboratories Inc Method for generating a super-resolution image from pixel image

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003018398A (en) * 2001-04-20 2003-01-17 Mitsubishi Electric Research Laboratories Inc Method for generating a super-resolution image from pixel image

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7507243B2 (en) 2020-02-17 2024-06-27 インテル コーポレイション Super-resolution processing using convolutional neural networks
CN114612294A (en) * 2020-12-08 2022-06-10 武汉Tcl集团工业研究院有限公司 Image super-resolution processing method and computer equipment
WO2023248593A1 (en) * 2022-06-20 2023-12-28 株式会社日立製作所 Image estimation method, evaluation value estimation method, and image estimation device

Also Published As

Publication number Publication date
JP6440305B2 (en) 2018-12-19

Similar Documents

Publication Publication Date Title
JP5183392B2 (en) Image processing apparatus, image processing method, and program
CN110555795A (en) High resolution style migration
JP3915563B2 (en) Image processing apparatus and image processing program
US9697583B2 (en) Image processing apparatus, image processing method, and computer-readable recording medium
US9824431B2 (en) Image synthesis apparatus, image synthesis method, and recording medium
US8605118B2 (en) Matrix generation apparatus, method, and program, and information processing apparatus
JP6320649B1 (en) Machine learning device and image recognition device
US9305329B2 (en) Low memory content aware fill
JP6440305B2 (en) Super-resolution apparatus and program
JP2015191293A (en) image processing apparatus, image processing method, and program
Zhang et al. GAIN: Gradient augmented inpainting network for irregular holes
US20230162409A1 (en) System and method for generating images of the same style based on layout
JP2007241356A (en) Image processor and image processing program
WO2015198368A1 (en) Image processing device and image processing method
WO2022016996A1 (en) Image processing method, device, electronic apparatus, and computer readable storage medium
JP2019106173A (en) Image processing method, image processing apparatus and program
JP5705391B1 (en) Image processing apparatus and image processing method
WO2020022519A1 (en) Image processing device, image processing method, and image processing program
JP2005352543A (en) Template matching device
Zhang et al. Bilateral upsampling network for single image super-resolution with arbitrary scaling factors
WO2018166084A1 (en) Image processing method and device for golf course image, and equipment
JPWO2019082283A1 (en) Image analyzer
JP2006050481A (en) Image processing apparatus, image processing method and program thereof
CN113705430B (en) Form detection method, device, equipment and storage medium based on detection model
JP2012205190A (en) Image processing apparatus and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171030

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181016

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181023

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181119

R150 Certificate of patent or registration of utility model

Ref document number: 6440305

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250