JP2020013225A - 高画質化学習装置および高画質化装置 - Google Patents

高画質化学習装置および高画質化装置 Download PDF

Info

Publication number
JP2020013225A
JP2020013225A JP2018133716A JP2018133716A JP2020013225A JP 2020013225 A JP2020013225 A JP 2020013225A JP 2018133716 A JP2018133716 A JP 2018133716A JP 2018133716 A JP2018133716 A JP 2018133716A JP 2020013225 A JP2020013225 A JP 2020013225A
Authority
JP
Japan
Prior art keywords
pixel
image
pixels
adjacent
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018133716A
Other languages
English (en)
Inventor
典昭 池田
Noriaki Ikeda
典昭 池田
英明 中辻
Hideaki Nakatsuji
英明 中辻
努 中岡
Tsutomu Nakaoka
努 中岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2018133716A priority Critical patent/JP2020013225A/ja
Publication of JP2020013225A publication Critical patent/JP2020013225A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)

Abstract

【課題】 小さい処理負荷で効率的に高画質化を行うことが可能な高画質化学習装置、高画質化装置を提供する。【解決手段】 解像度変換画像(a)から注目画素Aを含む隣接領域(c)と、注目画素Aを含む周辺領域(b)を抽出する領域抽出手段11と、注目画素Aに対応する高画質画像(d)上の画素を目標画素Rとして取得し、隣接領域内の画素のうち目標画素に最も近い画素値をもつ画素を近似画素として特定する近似画素特定手段12と、入力層と複数の中間層と出力層を有するニューラルネットワーク構成を有し、入力層は、周辺領域に含まれる各画素を取り込む手段を備え、出力層は、隣接領域に含まれる各画素に対応した数のニューロンを備え、出力層における近似画素に対応するニューロンの値を変化させるように、層間におけるニューロン間の係数を変化させる学習手段13を有する。【選択図】 図2

Description

本発明は画像を拡大する技術に関しており、例えば、パソコンやTV受像機などデジタル表示ディスプレイに対して、画素数が少ない入力画像信号を、表示画素数まで拡大して表示するための技術に関する。
従来、画素数が少なく、粗い低解像度の画像を、高精細な画像表示装置において表示させるため、高解像度の画像に変換することが行われている。このような高解像度化の手法としては、線形補間処理やニアレストネイバー処理等、様々な手法が用いられている。また、ニューラルネットワークを用いて高解像度化を行う技術も開発されている(特許文献1参照)。
特許文献1では、図1に示された、低解像度の画素グリッドの画像Bの特定画素A(i,j)の高解像度化の画素領域(m1×m2)を生成するため、図2に示されたように特定画素A(i,j)の近隣画素N1×N2をニューラルネットに入力することにより得られる。そしてこれら(m1×m2)画素領域の多くによって形成されM1×M2の完全な高解像度画像が得られる。またそのニューラルネットの学習用トレーニングセットは、高解像度画像を低解像度画像に変換し、先のN1×N2に相当するニューラルネットの入力とそれに対する目標画素を高解像度画像から得ることにより、トレーニングセットを生成する。
特開平8−263649
しかしながら、上記特許文献1では、ニューラルネットの出力に高解像度画像の画素グリッド (m1×m2)画素領域の画素を出力する構造になっている。この態様では、テキストなどの2値画像程度であれば、比較的小さな処理負荷で実現できることが想定できるが、それ以外のカラー値を実現する場合は、大きな処理負荷となり、安価なシステムの構築は難しくなることが容易に想定できる。特に、安価な表示システム向けの解像度変換機能の構築には、不向きである。
そこで、本発明は、小さい処理負荷で効率的に高画質化を行うことが可能な高画質化学習装置、高画質化装置を提供することを課題とする。
上記課題を解決するため、本発明では、
原画像と、当該原画像より画素数の多い高画質画像を用いて高画質化のための学習を行う高画質化学習装置であって、
原画像の画素数を増加させて前記高画質画像と同じ画素数の解像度変換画像を得る解像度変換手段と、
前記解像度変換画像から注目画素を含み当該注目画素に隣接する画素を含む隣接領域と、前記隣接領域と隣接領域外の画素を含む周辺領域を抽出する領域抽出手段と、
前記注目画素に対応する前記高画質画像上の画素を目標画素として取得し、前記隣接領域内の画素のうち前記目標画素に最も近い画素値をもつ画素を近似画素として特定する近似画素特定手段と、
入力層と複数の中間層と出力層を有するニューラルネットワーク構成を有し、前記入力層は、前記周辺領域に含まれる各画素を取り込む手段を備え、前記出力層は、前記隣接領域に含まれる各画素に対応した数のニューロンを備え、前記出力層における前記近似画素に対応するニューロンの値を変化させるように、層間におけるニューロン間の係数を変化させる学習手段と、
を有することを特徴とする高画質化学習装置を提供する。
また、本発明の高画質化学習装置は、
前記学習手段は、前記入力層が前記周辺領域に含まれる各画素の画素値を取得し、前記出力層の各ニューロンは、前記隣接領域に含まれる各画素の確率を出力し、前記近似画素に対応するニューロンの値である確率を大きくするように、前記ニューロン間の係数を変化させることを特徴とする。
また、本発明では、
原画像に対して高画質化を行う高画質化装置であって、
原画像の画素数を増加させて解像度変換画像を得る解像度変換手段と、
前記解像度変換画像から注目画素を含み当該注目画素に隣接する画素を含む隣接領域と、前記隣接領域と隣接領域外の画素を含む周辺領域を抽出する領域抽出手段と、
入力層と複数の中間層と出力層を有するニューラルネットワーク構成を有し、前記入力層は、前記周辺領域に含まれる各画素を取り込む手段を備え、前記出力層は、前記隣接領域に含まれる各画素に対応した数のニューロンを備え、前記出力層における各画素に対応したニューロンの値に基づいて、隣接領域内の1つ画素を最適画素として特定する最適画素特定手段と、
前記領域抽出手段により抽出された隣接領域内の画素の中から、前記最適画素特定手段により特定された画素に対応する画素の画素値を前記注目画素の画素値として与える画素値決定手段と、
を有することを特徴とする高画質化装置を提供する。
また、本発明の高画質化装置は、
前記最適画素特定手段は、前記入力層の各ニューロンが前記周辺領域に含まれる各画素の画素値を取得し、前記出力層の各ニューロンは、前記隣接領域に含まれる各画素の確率を出力し、前記確率の値が最も大きい出力層のニューロンに対応する前記隣接領域の画素を特定することを特徴とする。
また、本発明では、
原画像と、当該原画像より画素数の多い高画質画像を用いて高画質化のための学習を行いながら、前記原画像の高画質化を行う高画質化学習装置であって、
原画像の画素数を増加させて前記高画質画像と同じ画素数の解像度変換画像を得る解像度変換手段と、
前記解像度変換画像から注目画素を含み当該注目画素に隣接する画素を含む隣接領域と、前記隣接領域と隣接領域外の画素を含む周辺領域を抽出する領域抽出手段と、
前記注目画素に対応する前記高画質画像上の画素を目標画素として取得し、前記隣接領域内の画素のうち前記目標画素に最も近い画素値をもつ画素を近似画素として特定する近似画素特定手段と、
入力層と複数の中間層と出力層を有するニューラルネットワーク構成を有し、前記入力層は、前記周辺領域に含まれる各画素を取り込む手段を備え、前記出力層は、前記隣接領域に含まれる各画素に対応した数のニューロンを備え、前記出力層における前記近似画素に対応するニューロンの値を変化させるように、層間におけるニューロン間の係数を変化させるとともに、前記出力層における各画素に対応したニューロンの値に基づいて、隣接領域における画素を特定する最適画素特定手段と、
前記領域抽出手段により抽出された隣接領域内の画素の中から、前記最適画素特定手段により特定された画素に対応する画素の画素値を前記注目画素の画素値として与える画素値決定手段と、
を有することを特徴とする高画質化装置を提供する。
また、本発明の高画質化装置は、
前記最適画素特定手段は、前記入力層が前記周辺領域に含まれる各画素の画素値を取得し、前記出力層の各ニューロンは、前記隣接領域に含まれる各画素の確率を出力し、前記近似画素に対応するニューロンの値である確率を大きくするように、前記ニューロン間の係数を変化させるとともに、前記確率の値が最も大きい出力層のニューロンに対応する前記隣接領域の画素を特定することを特徴とする。
また、本発明では、
原画像の画素数を増加させて当該原画像より画素数の多い高画質画像と同じ画素数の解像度変換画像を得る解像度変換手段、
前記解像度変換画像から注目画素を含み当該注目画素に隣接する画素を含む隣接領域と、前記隣接領域と隣接領域外の画素を含む周辺領域を抽出する領域抽出手段、
前記注目画素に対応する前記高画質画像上の画素を目標画素として取得し、前記隣接領域内の画素のうち前記目標画素に最も近い画素値をもつ画素を近似画素として特定する近似画素特定手段、
入力層と複数の中間層と出力層を有するニューラルネットワーク構成を有し、前記入力層は、前記周辺領域に含まれる各画素を取り込む手段を備え、前記出力層は、前記隣接領域に含まれる各画素に対応した数のニューロンを備え、前記出力層における前記近似画素に対応するニューロンの値を変化させるように、層間におけるニューロン間の係数を変化させる学習手段、
としてコンピュータを機能させるためのプログラムを提供する。
また、本発明では、
原画像の画素数を増加させて解像度変換画像を得る解像度変換手段、
前記解像度変換画像から注目画素を含み当該注目画素に隣接する画素を含む隣接領域と、前記隣接領域と隣接領域外の画素を含む周辺領域を抽出する領域抽出手段、
入力層と複数の中間層と出力層を有するニューラルネットワーク構成を有し、前記入力層は、前記周辺領域に含まれる各画素を取り込む手段を備え、前記出力層は、前記隣接領域に含まれる各画素に対応した数のニューロンを備え、前記出力層における各画素に対応したニューロンの値に基づいて、隣接領域内の1つ画素を最適画素として特定する最適画素特定手段、
前記領域抽出手段により抽出された隣接領域内の画素の中から、前記最適画素特定手段により特定された画素に対応する画素の画素値を前記注目画素の画素値として与える画素値決定手段、
としてコンピュータを機能させるためのプログラムを提供する。
また、本発明では、
原画像の画素数を増加させて当該原画像より画素数の多い高画質画像と同じ画素数の解像度変換画像を得る解像度変換手段、
前記解像度変換画像から注目画素を含み当該注目画素に隣接する画素を含む隣接領域と、前記隣接領域と隣接領域外の画素を含む周辺領域を抽出する領域抽出手段、
前記注目画素に対応する前記高画質画像上の画素を目標画素として取得し、前記隣接領域内の画素のうち前記目標画素に最も近い画素値をもつ画素を近似画素として特定する近似画素特定手段、
入力層と複数の中間層と出力層を有するニューラルネットワーク構成を有し、前記入力層は、前記周辺領域に含まれる各画素を取り込む手段を備え、前記出力層は、前記隣接領域に含まれる各画素に対応した数のニューロンを備え、前記出力層における前記近似画素に対応するニューロンの値を変化させるように、層間におけるニューロン間の係数を変化させるとともに、前記出力層における各画素に対応したニューロンの値に基づいて、隣接領域における画素を特定する最適画素特定手段、
前記領域抽出手段により抽出された隣接領域内の画素の中から、前記最適画素特定手段により特定された画素に対応する画素の画素値を前記注目画素の画素値として与える画素値決定手段、
としてコンピュータを機能させるためのプログラムを提供する。
本発明によれば、小さい処理負荷で効率的に画像の高画質化を行うことが可能となる。
本発明の一実施形態に係る高画質化学習装置のハードウェア構成図である。 高画質化学習装置100の機能ブロックを含む学習処理の概念図である。 最適画素特定手段13aが有するニューラルネットワークの構成の概略を示す図である。 本実施形態に係る高画質化装置200の機能ブロック図である。 解像度変換手段14による解像度変換の概念図である。 領域抽出手段11による領域抽出の概念図である。 最適画素特定手段13aによるラベル出力の概念図である。 画素値決定手段22による画素の特定の概念図である。 学習と並行処理を行う高画質化装置210の機能ブロック図である。
以下、本発明の好適な実施形態について図面を参照して詳細に説明する。
本発明では、ニューラルネットワークに対して学習用のデータを与えて画像の高画質化のための学習を行い、学習済みのニューラルネットワークを用いて画像の高画質化を行う。または、ニューラルネットワークを用いて高画質化を行う際に、並行して学習を行ってニューラルネットワークを変化させる。
<1.学習時>
まず、ニューラルネットワークを用いた高画質化学習装置について説明する。図1は、本発明の一実施形態に係る高画質化学習装置のハードウェア構成図である。本実施形態に係る高画質化学習装置100は、汎用のコンピュータで実現することができ、図1に示すように、CPU(Central Processing Unit)1と、コンピュータのメインメモリであるRAM(Random Access Memory)2と、CPU1が実行するプログラムやデータを記憶するためのハードディスク、フラッシュメモリ等の大容量の記憶装置3と、キーボード、マウス等の指示入力I/F(インターフェース)4と、データ記憶媒体等の外部装置とデータ通信するためのデータ入出力I/F(インターフェース)5と、液晶ディスプレイ等の表示デバイスである表示部6と、を備え、互いにバスを介して接続されている。
学習用のデータを用いた高画質化学習装置100による機械学習について説明する。高画質化学習装置100による機械学習を行う際、高解像度化の対象とする画像である原画像と同内容を含む高画質画像を用意する。例えば、原画像と高画質画像は、同じ位置から解像度を変えて撮影した2つの画像のうち、低解像度の画像を原画像、高解像度の画像を高画質画像とすることにより得られる。このようにして、横N1画素×縦N2画素の原画像と、同一内容の横M1画素×縦M2画素の高画質画像を用意する(N1<M1、N2<M2)。原画像、高画質画像においては、各画素は画素値を有している。ここで、画素値とは、各座標に対応した画素が有する値であり、本実施形態では、R、G、Bの各色について8ビットで記録された輝度値である。すなわち、本実施形態では、各画素には、3色について計24ビットで表現された輝度値が、画素値として記録されている。
図2は、高画質化学習装置100の機能ブロックを含む学習処理の概念図である。図2において、11は領域抽出手段、12は近似画素特定手段、13は学習手段である。また、図2(a)は解像度変換画像、図2(b)は周辺領域、図2(c)は隣接領域、図2(d)は高画質画像である。領域抽出手段11は、原画像を解像度変換して得られた解像度変換画像における注目画素Aの周辺領域、隣接領域を抽出する手段である。周辺領域、隣接領域は、これらの領域に含まれる画素で構成される画像である。近似画素特定手段12は、注目画素Aに対応する高画質画像上の画素である目標画素Rが、隣接領域のどの画素に近いかを検索し、最も近い画素である近似画素を特定する手段である。学習手段13は、学習用セットとして学習用画像データと学習用ラベルを入力して、ニューロン間の係数を変化させることにより、学習を行う手段である。
領域抽出手段11、近似画素特定手段12、学習手段13は、CPU1が、記憶装置3に記憶されているプログラムを実行することにより実現される。すなわち、コンピュータが、専用のプログラムに従って各手段の内容を実行することになる。なお、本明細書において、コンピュータとは、CPU等の演算処理部を有し、データ処理が可能な装置を意味し、パーソナルコンピュータなどの汎用コンピュータだけでなく、タブレット端末やスマートフォン等の携帯型端末も含む。
高画質化学習装置100の処理動作について説明する。まず、高画質化学習装置100は、原画像を読み込む。読み込んだ原画像に対して解像度変換手段14(図5参照)が解像度変換を行う。具体的には、横n1倍、縦n2倍に画素数を増やすことにより解像度変換を行って、図2(a)に示すような横M1画素×縦M2画素の解像度変換画像を得る。すなわち、教師データとする高画質画像に合わせた画素数になるように解像度変換を行う。画素数を増やす解像度変換の手法としては、公知の線形補間処理やニアレストネイバー処理を用いることができる。本実施形態では、ニアレストネイバー処理を行っている。
次に、領域抽出手段11が、解像度変換画像から注目画素Aを中心とした横m1×縦m2画素を周辺領域として抽出する。さらに、注目画素Aを中心とした横3×縦3画素を隣接領域として抽出する。周辺領域、隣接領域のいずれも注目画素Aを含んだ領域である。周辺領域は、隣接領域と隣接領域外の画素を含む領域である。図2の例では、図2(b)に示すように、周辺領域はm1=m2=7であり、49画素の領域である。m1、m2は適宜設定することができるが、隣接領域の横3×縦3画素のさらに周囲の画素を全て含むようにm1、m2とも5以上であることが好ましい。また、m1=m2として周辺領域が正方形状となることが好ましい。この周辺領域は学習手段13の学習のための学習用画像データとして用いられる。また、隣接領域は、図2(c)に示すように、注目画素Aに隣接する、いわゆる8近傍の画素と、注目画素Aの計9画素の領域である。
次に、近似画素特定手段12は、注目画素Aと同一座標となる高画質画像上の画素を目標画素Rとして抽出する。具体的には、目標画素Rの画素値を取得する。解像度変換画像と高画質画像は、いずれも横M1画素×縦M2画素であるため、各画素が1対1で対応している。したがって、解像度変換画像の注目画素Aに対応する目標画素Rは一意に定まる。また、近似画素特定手段12は、領域抽出手段11により抽出された隣接領域を取得する。具体的には、隣接領域に含まれる注目画素Aおよび隣接画素C1〜C4、C6〜C9の9画素の画素値を取得する。次に、近似画素特定手段12は、解像度変換画像から抽出された隣接領域内の9画素の中から目標画素Rの画素値に最も近い画素値をもつ画素を1つ検索する。目標画素Rの画素値に最も近い画素値をもつ画素は近似画素として特定される。目標画素Rの画素値に最も近い画素値をもつ近似画素は、例えば、1画素がR、G、B3色の計24ビットで記録された画素値の差分演算を、目標画素Rと隣接領域内の9画素それぞれについて行い、差分の絶対値が最も小さい画素とすることにより特定することができる。注目画素Aが近似画素である場合は、ラベルLAを出力し、隣接画素C1〜C4、C6〜C9が近似画素である場合は、それぞれラベルL1〜L4、L6〜L9を出力する。ここで、ラベルとは、隣接領域内において画素を識別するための情報であり、注目画素Aとの相対的な位置関係を特定することができる情報である。例えば、図2(c)に示すような隣接領域の場合、ラベルL1は、注目画素Aから見て左上の位置にある画素であることを特定し、ラベルL2は、注目画素Aから見て真上の位置にある画素であることを特定している。ここで出力された1つのラベルが学習手段13の学習のための学習用ラベルとして用いられる。学習用画像データである周辺領域と、学習用ラベルは、1つの学習用セットとして学習手段13に与えられる。
続いて、学習手段13が、領域抽出手段11から抽出された周辺領域と、近似画素特定手段12から出力されたラベルを取得する。周辺領域としては、周辺領域に含まれる全ての画素、すなわち注目画素Aおよび隣接画素C1〜C4、C6〜C9の9画素を含むm1×m2画素の画素値を取得する。学習手段13は、入力層がm1×m2の画像取り込み手段、出力層が9ニューロンのニューラルネットワーク構成を有する。入力層と出力層の間には複数の中間層を有している。入力層には、周辺領域に含まれる各画素の画素値が入力され、出力層の9個の各ニューロンには、隣接領域に含まれる各画素のラベルに対応した確率が出力される。各層を結ぶニューロン間には演算時に乗じる係数(重み)が設定されており、ニューラルネットワークは、この係数を変化させることにより、出力層に出力させる値を学習用データに近付けていく。ここで、確率とは、そのラベルに対応した画素である可能性を示す数値であり、9個の出力ラベルの値の総和が“1”や“100”等のきりのよい数になるように設定されていてもよいし、単に9個の出力ラベルの大小を比較できる数であってもよい。
ここで、学習手段13が有するニューラルネットワークの構成について説明する。図3は、学習手段13が有するニューラルネットワークの構成の概略を示す図である。図3(a)は、入力される周辺領域との関係を示しており、図3(b)は、学習手段13が有するニューラルネットワークの構成の概略を示す図である。図3(b)に示すように、本実施形態では、学習手段13が有するニューラルネットワークは、入力層、畳み込み層、第1全結合層、第2全結合層の4層構成であり、ディープラーニングとしては、かなり小さな構成となっている。第2全結合層は出力層である。本実施形態では、m1=m2=9とし、隣接領域に含まれる9×9画素を入力する。畳み込み(Convolution)層は、3×3の行列係数を8セットで、画像の特徴を抽出する。第1全結合(Fully Connected)層では36個の出力を行い、第2全結合(Fully Connected)層では各ラベルに対応した9(=3×3)個の出力を行う。学習後は、学習手段13を実現するニューラルネットワークは、最適画素特定手段13aに変化し、後述する高画質化装置200において、第2全結合層であるは出力層の9ニューロンのうちの1つに対応したラベルを出力する。
したがって、学習手段13は、領域抽出手段11から周辺領域を取得すると、周辺領域内の各画素の画素値を入力して、隣接領域に含まれる各画素のラベルに対応した確率を出力する。この結果、ラベルL1〜L4、LA、L6〜L9それぞれの確率が出力値として得られる。そして、学習手段13は、近似画素特定手段12から取得したラベルの確率を特定し、そのラベルの確率を大きくし、ラベルL1〜L4、LA、L6〜L9のうち、他の8個のラベルの確率を小さくするように、各ニューロン間の係数を変化させる。このようにして、学習手段13は、ニューロン間の係数を変化させることにより、高画質画像に近付くように学習していく。
上記処理は、解像度変換画像の各画素を注目画素Aとし、注目画素を解像度変換画像の上において順次変更しながら行う。現実的な処理としては、注目画素を中心とした周辺領域のm1×m2画素が解像度変換画像に収まるような範囲で行うことになる。したがって、解像度変換画像の全ての画素を注目画素Aとできるわけではなく、解像度変換画像の周縁部の一部の画素は、注目画素Aとして扱われないことになるが、実用上問題ないレベルである。多くの原画像に対応する解像度変換画像、高画質画像を用意し、上記のようにして学習を繰り返していくことによりニューラルネットワークが学習済みモデルとなった最適画素特定手段13aが得られる。このようにして、本実施形態に係る高画質化学習装置100は、原画像と画素数の多い高画質画像を用い、原画像から得られた解像度変換画像から注目画素Aを含む隣接領域と、注目画素Aを含む周辺領域を抽出し、注目画素Aに対応する高画質画像上の画素を目標画素Rとし、目標画素Rに最も近い画素値をもつ画素を近似画素として特定し、抽出された周辺領域と、特定された近似画素の位置を学習用セットとしてニューラルネットワークに与え、ニューラルネットワークの層間におけるニューロン間の係数を変化させるようにしたので、注目画素Aに与えるべき画素値自体を演算することなく、特定された画素の画素値をそのまま利用することができるため、小さい演算処理負荷で高画質化のための学習を効率的に行うことが可能となる。
<2.学習後の高解像度化>
次に、学習済みモデルを備えたニューラルネットワークを有する高画質化装置の処理動作について説明する。図4は、本実施形態に係る高画質化装置200の機能ブロック図である。図4において、14は解像度変換手段、11は領域抽出手段、13aは最適画素特定手段、22は画素値決定手段である。解像度変換手段14は、原画像に対して解像度変換を行い、横n1倍、縦n2倍に画素を増加させて解像度変換画像を作成する手段であり、高画質化学習装置100が備える解像度変換手段14と同様のものである。領域抽出手段11は、図2に示した高画質化学習装置100が備えるものと同様の機能を有しており、解像度変換画像における注目画素Aの周辺領域、隣接領域を抽出する手段である。最適画素特定手段13aは、図2に示した高画質化学習装置100において学習手段13が高画質化を学習した結果であるニューラルネットワークの学習済みモデルを有し、領域抽出手段11により抽出された周辺領域内のm1×m2画素を入力層に入力し、隣接領域内の1画素のラベルを出力する手段である。画素値決定手段22は、最適画素特定手段13aから取得したラベルに応じて、領域抽出手段11により抽出された隣接領域内から1画素を最適画素として選択する手段である。
本実施形態に係る高画質化装置200は、高画質化学習装置100と同様、汎用のコンピュータで実現することができる。高画質化装置200のハードウェア構成は、高画質化学習装置100と同様、図1に示したような構成となっている。
図4に示した解像度変換手段14、領域抽出手段11、最適画素特定手段13a、画素値決定手段22は、CPU1が、記憶装置3に記憶されているプログラムを実行することにより実現される。すなわち、コンピュータが、専用のプログラムに従って各手段の内容を実行することになる。
高画質化装置200の処理動作について説明する。まず、解像度変換手段14が、原画像に対して解像度変換を行い、横n1倍、縦n2倍に画素を増加させた解像度変換画像を得る。解像度変換手段14は、公知の解像度変換アルゴリズムを用いて解像度変換を行う。公知の解像度変換アルゴリズムとしては、線形補間処理やニアレストネイバー処理等を用いることができる。本実施形態では、演算処理負荷が小さく、回路設計した際にも、より回路規模が小さくて済むニアレストネイバー処理を用いている。線形補間処理など数値演算処理でも演算処理負荷が小さいが、画像のボケ感、あるいは画像エッジの強調処理では、不自然差が残る。このような数値演算処理では、さらなる高画質化を図ろうとすると、演算処理負荷、演算回路規模が膨大なものとなってしまう。一方、ニアレストネイバー処理に関しては、演算処理負荷は小さく、画像のボケ感は無く、形状のくっきり感が維持できる。ただし、高画質感には欠けた画像形状のガタガタ感が生じる。そこで、本実施形態では、数値演算処理の問題点を避けて、ニアレストレイバー処理の良い面を生かす。ニアレストネイバー処理を行って得られる解像度変換画像を用いることにより、後に行われるニューラルネットワークを備えた最適画素特定手段13aによる処理により、数値演算処理を少なくして、ガタガタ感を無くすなどして円滑に高画質化が進むようにしている。図5は、解像度変換手段14による解像度変換の概念図である。図5に示すように、横N1×縦N2画素の原画像は、解像度変換手段14により横n1×縦n2倍に解像度変換されて、横M1×縦M2画素の解像度変換画像が得られる。
次に、領域抽出手段11が、解像度変換画像から注目画素Aを中心とした横m1×縦m2画素を周辺領域として抽出する。さらに、注目画素Aを中心とした横3×縦3画素を隣接領域として抽出する。周辺領域、隣接領域のいずれも注目画素Aを含んだ領域である。図2の例では、周辺領域はm1=m2=7であり、49画素の領域である。また、隣接領域は注目画素Aに隣接する、いわゆる8近傍の画素と、注目画素Aの計9画素の領域である。図6は、領域抽出手段11による領域切出しの概念図である。図6に示すように、横M1×縦M2画素の解像度変換画像から、解像度変換手段14は、注目画素Aを中心とした横3×縦3画素の隣接領域と、注目画素Aを中心とした横m1×縦m2画素の周辺領域を抽出する。
次に、最適画素特定手段13aが、領域抽出手段11から抽出された周辺領域を取得する。周辺領域としては、周辺領域に含まれる全ての画素、すなわち注目画素Aおよび隣接画素C1〜C4、C6〜C9の9画素を含むm1×m2画素の画素値を取得する。最適画素特定手段13aは、入力層がm1×m2の画像取り込み手段、出力層が9ニューロンのニューラルネットワークを有する。入力層のm1×m2個の各ニューロンには、周辺領域に含まれる各画素の画素値が入力され、出力層の9個の各ニューロンには、隣接領域に含まれる各画素のラベルに対応した確率が出力される。
したがって、最適画素特定手段13aは、領域抽出手段11から周辺領域を取得すると、周辺領域内の各画素の画素値を入力して、隣接領域に含まれる各画素のラベルに対応した確率を出力層に出力する。そして、ラベルL1〜L4、LA、L6〜L9のうち、最も高い確率を有するラベルを出力する。図7は、最適画素特定手段13aによるラベル出力の概念図である。図7に示すように、横m1×縦m2画素の周辺領域から、最適画素特定手段13aは、横3×縦3画素の隣接領域内の1つの画素を最適画素として特定するラベルを出力する。最適画素とは、隣接領域内の画素のうち、注目画素の画素値として与えるべき画素値をもつ画素である。
次に、画素値決定手段22は、領域抽出手段11から抽出された隣接領域と、最適画素特定手段13aから出力されたラベルを取得する。そして、画素値決定手段22は、最適画素特定手段13aから取得したラベルに対応する隣接領域内の画素を特定し、その画素の画素値を注目画素Aに与えるべき画素値として出力する。図8は、画素値決定手段22による画素の特定の概念図である。図8に示すように、画素値決定手段22は、最適画素特定手段13aから取得したラベル(L1〜L4、LA、L6〜L9のうちの1つ)に対応する画素を、領域抽出手段11から取得した隣接領域内から特定し、隣接領域内の画素(C1〜C4、CA、C6〜C9のうちの1つ)の画素値を出力する。この結果、解像度変換画像の注目画素Aに与えるべき画素値が得られる。
解像度変換手段14により得られた横M1×縦M2画素の解像度変換画像を走査しながら、解像度変換画像の各画素を注目画素Aとし、各注目画素Aについて画素値決定手段22により与えるべき画素値を決定することができる。画素値決定手段22により得られた画素値で解像度変換画像の各画素の画素値を置き換えていくことにより、高画質化画像が得られる。このようにして、本実施形態に係る高画質化装置200は、原画像から得られた解像度変換画像から注目画素Aを含む隣接領域と、注目画素Aを含む周辺領域を抽出し、学習済みモデルに入力された周辺領域に応じて出力された値に基づいて、隣接領域内の1つの画素の画素値を注目画素Aに与えるようにしたので、注目画素Aに与えるべき画素値自体を演算することなく、隣接領域内で特定された画素の画素値をそのまま利用することができるため、小さい演算処理負荷で高画質化を行うことが可能となる。
<3.高解像度化と学習の並行処理>
次に、高解像度化と学習の並行処理について説明する。図9は、学習と並行処理を行う高画質化装置210の機能ブロック図である。図4に示した高画質化装置200と比較すると、近似画素特定手段12を備え、高画質画像を用いて、最適画素特定手段13bが学習を行う点が異なっている。近似画素特定手段12は、図2に示した高画質化学習装置100が備えるものと同様の機能を有している。また、最適画素特定手段13bは、図2に示した高画質化学習装置100が備える学習手段13、図4に示した高画質化装置200が備える最適画素特定手段13aの双方の機能を備えており、学習をしてニューロン間の係数を変化させるとともに、1つのラベルを出力する機能を有する。
本実施形態に係る高画質化装置210は、高画質化学習装置100、高画質化装置200と同様、汎用のコンピュータで実現することができる。高画質化装置210のハードウェア構成は、高画質化学習装置100、高画質化装置200と同様、図1に示したような構成となっている。
図9に示した解像度変換手段14、領域抽出手段11、最適画素特定手段13b、画素値決定手段22、近似画素特定手段12は、CPU1が、記憶装置3に記憶されているプログラムを実行することにより実現される。すなわち、コンピュータが、専用のプログラムに従って各手段の内容を実行することになる。
高画質化装置210の処理動作について説明する。図2に示した高画質化装置200と同様に、まず、解像度変換手段14が、原画像に対して解像度変換を行い、横n1倍、縦n2倍に画素を増加させた解像度変換画像を得る。解像度変換手段14は、公知の解像度変換アルゴリズムを用いて解像度変換を行う。次に、領域抽出手段11が、図4に示した高画質化装置200と同様に、解像度変換画像から注目画素Aを中心とした横m1×縦m2画素を周辺領域として抽出する。さらに、注目画素Aを中心とした横3×縦3画素を隣接領域として抽出する。
近似画素特定手段12が、解像度変換画像の注目画素Aと同一座標となる高画質画像上の画素を目標画素Rとして抽出し、領域抽出手段11により抽出された隣接領域を取得する。そして、近似画素特定手段12は、解像度変換画像から抽出された隣接領域内の9画素の中から目標画素Rの画素値に最も近い画素値をもつ画素を1つ検索し、近似画素として特定し、ラベルL1〜L4、LA、L6〜L9の中から近似画素に対応する1つのラベルを出力する。
次に、最適画素特定手段13bが、領域抽出手段11から取得した周辺領域内の各画素の画素値を入力して、隣接領域に含まれる各画素のラベルに対応した確率を出力する。この結果、ラベルL1〜L4、LA、L6〜L9それぞれの確率が出力値として得られる。そして、最適画素特定手段13bは、ラベルL1〜L4、LA、L6〜L9のうち、最も高い確率を有するラベルを画素値決定手段22に出力する。画素値決定手段22により決定された画素値を注目画素Aに与えることにより高画質化が行われる。
高画質化と並行して、最適画素特定手段13bは、近似画素特定手段12から取得したラベルの確率を特定し、そのラベルの確率を大きくし、ラベルL1〜L4、LA、L6〜L9のうち、他の8個のラベルの確率を小さくするように、各ニューロン間の係数を変化させる。このようにして、最適画素特定手段13bは、ニューロン間の係数を変化させることにより、高画質画像に近付くように学習する。
このようにして、本実施形態に係る高画質化装置210は、原画像と画素数の多い高画質画像を用い、原画像から得られた解像度変換画像から注目画素Aを含む隣接領域と、注目画素Aを含む周辺領域を抽出し、注目画素Aに対応する高画質画像上の画素を目標画素Rとし、目標画素Rに最も近い画素値をもつ画素を近似画素として特定し、抽出された周辺領域と、特定された近似画素の位置を学習セットとしてニューラルネットワークに与え、ニューラルネットワークの層間におけるニューロン間の係数を変化させるとともに、ニューラルネットワークの学習により得られた学習済みモデルに入力された周辺領域に応じて出力された値に基づいて、隣接領域内の1つの画素の画素値を注目画素Aに与えるようにしたので、注目画素Aに与えるべき画素値自体を演算することなく、隣接領域内で特定された画素の画素値をそのまま利用することができるため、小さい演算処理負荷で、高画質化のための学習を効率的に行いながら、並行して高画質化を行うことが可能となる。
以上、本発明の好適な実施形態について説明したが、本発明は上記実施形態に限定されず、種々の変形が可能である。例えば、上記実施形態では、コンピュータにおいて、CPUがプログラムを実行することにより、上記各手段を実現するようにしたが、上記各手段を演算回路としてハードウェアに組み込むようにしても良い。この場合、例えば液晶ディスプレイ等の表示装置に組み込むことにより、入力された原画像を高画質化して表示することも可能となる。
1・・・CPU(Central Processing Unit)
2・・・RAM(Random Access Memory)
3・・・記憶装置
4・・・指示入力I/F
5・・・データ入出力I/F
6・・・表示部
11・・・領域抽出手段
12・・・近似画素特定手段
13・・・学習手段
13a、13b・・・最適画素特定手段
14・・・解像度変換手段
22・・・画素値決定手段
100・・・高画質化学習装置
200、210・・・高画質化装置

Claims (9)

  1. 原画像と、当該原画像より画素数の多い高画質画像を用いて高画質化のための学習を行う高画質化学習装置であって、
    原画像の画素数を増加させて前記高画質画像と同じ画素数の解像度変換画像を得る解像度変換手段と、
    前記解像度変換画像から注目画素を含み当該注目画素に隣接する画素を含む隣接領域と、前記隣接領域と隣接領域外の画素を含む周辺領域を抽出する領域抽出手段と、
    前記注目画素に対応する前記高画質画像上の画素を目標画素として取得し、前記隣接領域内の画素のうち前記目標画素に最も近い画素値をもつ画素を近似画素として特定する近似画素特定手段と、
    入力層と複数の中間層と出力層を有するニューラルネットワーク構成を有し、前記入力層は、前記周辺領域に含まれる各画素を取り込む手段を備え、前記出力層は、前記隣接領域に含まれる各画素に対応した数のニューロンを備え、前記出力層における前記近似画素に対応するニューロンの値を変化させるように、層間におけるニューロン間の係数を変化させる学習手段と、
    を有することを特徴とする高画質化学習装置。
  2. 前記学習手段は、前記入力層が前記周辺領域に含まれる各画素の画素値を取得し、前記出力層の各ニューロンは、前記隣接領域に含まれる各画素の確率を出力し、前記近似画素に対応するニューロンの値である確率を大きくするように、前記ニューロン間の係数を変化させることを特徴とする請求項1に記載の高画質化学習装置。
  3. 原画像に対して高画質化を行う高画質化装置であって、
    原画像の画素数を増加させて解像度変換画像を得る解像度変換手段と、
    前記解像度変換画像から注目画素を含み当該注目画素に隣接する画素を含む隣接領域と、前記隣接領域と隣接領域外の画素を含む周辺領域を抽出する領域抽出手段と、
    入力層と複数の中間層と出力層を有するニューラルネットワーク構成を有し、前記入力層は、前記周辺領域に含まれる各画素を取り込む手段を備え、前記出力層は、前記隣接領域に含まれる各画素に対応した数のニューロンを備え、前記出力層における各画素に対応したニューロンの値に基づいて、隣接領域内の1つ画素を最適画素として特定する最適画素特定手段と、
    前記領域抽出手段により抽出された隣接領域内の画素の中から、前記最適画素特定手段により特定された画素に対応する画素の画素値を前記注目画素の画素値として与える画素値決定手段と、
    を有することを特徴とする高画質化装置。
  4. 前記最適画素特定手段は、前記入力層が前記周辺領域に含まれる各画素の画素値を取得し、前記出力層の各ニューロンは、前記隣接領域に含まれる各画素の確率を出力し、前記確率の値が最も大きい出力層のニューロンに対応する前記隣接領域の画素を特定することを特徴とする請求項3に記載の高画質化装置。
  5. 原画像と、当該原画像より画素数の多い高画質画像を用いて高画質化のための学習を行いながら、前記原画像の高画質化を行う高画質化学習装置であって、
    原画像の画素数を増加させて前記高画質画像と同じ画素数の解像度変換画像を得る解像度変換手段と、
    前記解像度変換画像から注目画素を含み当該注目画素に隣接する画素を含む隣接領域と、前記隣接領域と隣接領域外の画素を含む周辺領域を抽出する領域抽出手段と、
    前記注目画素に対応する前記高画質画像上の画素を目標画素として取得し、前記隣接領域内の画素のうち前記目標画素に最も近い画素値をもつ画素を近似画素として特定する近似画素特定手段と、
    入力層と複数の中間層と出力層を有するニューラルネットワーク構成を有し、前記入力層は、前記周辺領域に含まれる各画素を取り込む手段を備え、前記出力層は、前記隣接領域に含まれる各画素に対応した数のニューロンを備え、前記出力層における前記近似画素に対応するニューロンの値を変化させるように、層間におけるニューロン間の係数を変化させるとともに、前記出力層における各画素に対応したニューロンの値に基づいて、隣接領域における画素を特定する最適画素特定手段と、
    前記領域抽出手段により抽出された隣接領域内の画素の中から、前記最適画素特定手段により特定された画素に対応する画素の画素値を前記注目画素の画素値として与える画素値決定手段と、
    を有することを特徴とする高画質化装置。
  6. 前記最適画素特定手段は、前記入力層が前記周辺領域に含まれる各画素の画素値を取得し、前記出力層の各ニューロンは、前記隣接領域に含まれる各画素の確率を出力し、前記近似画素に対応するニューロンの値である確率を大きくするように、前記ニューロン間の係数を変化させるとともに、前記確率の値が最も大きい出力層のニューロンに対応する前記隣接領域の画素を特定することを特徴とする請求項5に記載の高画質化装置。
  7. 原画像の画素数を増加させて当該原画像より画素数の多い高画質画像と同じ画素数の解像度変換画像を得る解像度変換手段、
    前記解像度変換画像から注目画素を含み当該注目画素に隣接する画素を含む隣接領域と、前記隣接領域と隣接領域外の画素を含む周辺領域を抽出する領域抽出手段、
    前記注目画素に対応する前記高画質画像上の画素を目標画素として取得し、前記隣接領域内の画素のうち前記目標画素に最も近い画素値をもつ画素を近似画素として特定する近似画素特定手段、
    入力層と複数の中間層と出力層を有するニューラルネットワーク構成を有し、前記入力層は、前記周辺領域に含まれる各画素を取り込む手段を備え、前記出力層は、前記隣接領域に含まれる各画素に対応した数のニューロンを備え、前記出力層における前記近似画素に対応するニューロンの値を変化させるように、層間におけるニューロン間の係数を変化させる学習手段、
    としてコンピュータを機能させるためのプログラム。
  8. 原画像の画素数を増加させて解像度変換画像を得る解像度変換手段、
    前記解像度変換画像から注目画素を含み当該注目画素に隣接する画素を含む隣接領域と、前記隣接領域と隣接領域外の画素を含む周辺領域を抽出する領域抽出手段、
    入力層と複数の中間層と出力層を有するニューラルネットワーク構成を有し、前記入力層は、前記周辺領域に含まれる各画素を取り込む手段を備え、前記出力層は、前記隣接領域に含まれる各画素に対応した数のニューロンを備え、前記出力層における各画素に対応したニューロンの値に基づいて、隣接領域内の1つ画素を最適画素として特定する最適画素特定手段、
    前記領域抽出手段により抽出された隣接領域内の画素の中から、前記最適画素特定手段により特定された画素に対応する画素の画素値を前記注目画素の画素値として与える画素値決定手段、
    としてコンピュータを機能させるためのプログラム。
  9. 原画像の画素数を増加させて当該原画像より画素数の多い高画質画像と同じ画素数の解像度変換画像を得る解像度変換手段、
    前記解像度変換画像から注目画素を含み当該注目画素に隣接する画素を含む隣接領域と、前記隣接領域と隣接領域外の画素を含む周辺領域を抽出する領域抽出手段、
    前記注目画素に対応する前記高画質画像上の画素を目標画素として取得し、前記隣接領域内の画素のうち前記目標画素に最も近い画素値をもつ画素を近似画素として特定する近似画素特定手段、
    入力層と複数の中間層と出力層を有するニューラルネットワーク構成を有し、前記入力層は、前記周辺領域に含まれる各画素を取り込む手段を備え、前記出力層は、前記隣接領域に含まれる各画素に対応した数のニューロンを備え、前記出力層における前記近似画素に対応するニューロンの値を変化させるように、層間におけるニューロン間の係数を変化させるとともに、前記出力層における各画素に対応したニューロンの値に基づいて、隣接領域における画素を特定する最適画素特定手段、
    前記領域抽出手段により抽出された隣接領域内の画素の中から、前記最適画素特定手段により特定された画素に対応する画素の画素値を前記注目画素の画素値として与える画素値決定手段、
    としてコンピュータを機能させるためのプログラム。
JP2018133716A 2018-07-13 2018-07-13 高画質化学習装置および高画質化装置 Pending JP2020013225A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018133716A JP2020013225A (ja) 2018-07-13 2018-07-13 高画質化学習装置および高画質化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018133716A JP2020013225A (ja) 2018-07-13 2018-07-13 高画質化学習装置および高画質化装置

Publications (1)

Publication Number Publication Date
JP2020013225A true JP2020013225A (ja) 2020-01-23

Family

ID=69169292

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018133716A Pending JP2020013225A (ja) 2018-07-13 2018-07-13 高画質化学習装置および高画質化装置

Country Status (1)

Country Link
JP (1) JP2020013225A (ja)

Similar Documents

Publication Publication Date Title
CN109472270B (zh) 图像风格转换方法、装置及设备
CN108229490B (zh) 关键点检测方法、神经网络训练方法、装置和电子设备
JP3915563B2 (ja) 画像処理装置および画像処理プログラム
WO2015083396A1 (ja) 画像処理装置及び画像処理方法
US20200279166A1 (en) Information processing device
JP4772819B2 (ja) 画像検索装置および画像検索方法
WO2016002068A1 (ja) 画像拡大装置、画像拡大方法、及び監視カメラ、並びにプログラム及び記録媒体
EP4207051A1 (en) Image super-resolution method and electronic device
JP2013109758A (ja) 画像処理方法、および画像処理装置
US11481919B2 (en) Information processing device
US20230260083A1 (en) Computer-implemented method, computer program product and system for processing images
WO2015198368A1 (ja) 画像処理装置及び画像処理方法
JP2023003763A (ja) 学習装置、画像処理装置、学習処理方法、及びプログラム
JP2008134791A (ja) 画像処理装置及び画像処理プログラム
JP2020013225A (ja) 高画質化学習装置および高画質化装置
JP2020016928A (ja) 画像処理装置、画像処理システム、画像処理方法及びプログラム
JP6440305B2 (ja) 超解像装置およびプログラム
CN114627293A (zh) 基于多任务学习的人像抠图方法
JP2008158847A (ja) 画像配信装置および画像配信方法
JP5701467B1 (ja) 画像処理装置及び画像処理方法
JP3783815B2 (ja) 画像処理装置
CN112771578B (zh) 使用细分缩放和深度上缩放的图像生成
CN115019022B (zh) 一种基于双深度融合网络的轮廓检测方法
WO2023228717A1 (ja) コンピュータプログラム、処理方法、および、処理装置
JP2008186124A (ja) 画像データ処理方法、画像データ処理プログラム及び画像データ処理装置