JP2007328735A - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP2007328735A
JP2007328735A JP2006161491A JP2006161491A JP2007328735A JP 2007328735 A JP2007328735 A JP 2007328735A JP 2006161491 A JP2006161491 A JP 2006161491A JP 2006161491 A JP2006161491 A JP 2006161491A JP 2007328735 A JP2007328735 A JP 2007328735A
Authority
JP
Japan
Prior art keywords
pixels
image processing
pixel data
neural network
interpolation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006161491A
Other languages
English (en)
Other versions
JP4692401B2 (ja
Inventor
Kunio Yamada
邦男 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2006161491A priority Critical patent/JP4692401B2/ja
Publication of JP2007328735A publication Critical patent/JP2007328735A/ja
Application granted granted Critical
Publication of JP4692401B2 publication Critical patent/JP4692401B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】ニューラルネットワークを効果的に利用して、画像の処理(例えば画素補間処理)を行う。
【解決手段】第1のニューラルネットワーク部101は、周辺画素の画素データに対して、その補間画素の画素データ(NN補間結果)を出力するニューラルネットワークを有している。また、バイキュービック補間処理部103は、周辺画素の画素データに対してバイキュービック補間法による処理を行い、補間画素の画素データ(バイキュービック補間結果)を出力する。一方、第2のニューラルネットワーク部102には、第1のニューラルネットワーク部が周辺画素の画素データに対して適切な補間結果を出力できるか否かを判断するニューラルネットワークが構築される。そして、混合比決定部104が、第2のニューラルネットワーク部による判断結果(峻別結果)に基づいて、バイキュービック補間結果とNN補間結果とを混合し、補間画素の画素データとして出力する。
【選択図】図1

Description

本発明は、画像(静止画像又は動画像)の処理を行う画像処理装置及び画像処理プログラムに関し、特に、主に画像の解像度や倍率を変更するための画像補間処理を行う画像処理装置及び画像処理プログラムに関する。
ニューラルネットワークを用いた画像処理に関して、1980年代から1990年代にかけて多くの研究開発や技術提案がなされている。例えば、下記の特許文献1〜3には、階層型ニューラルネットワークをバックプロパゲーション法によって学習を施したものを用いて処理を行うことにより、インタレースをプログレッシブ化するためのライン補間を行う技術が開示されている。
一方、下記の特許文献4〜7には、解像度や滑らかな補間性能の向上を図るために、階層型ニューラルネットワークを用いて解像度や倍率を変更するための補間を行う技術が開示されている。
特開平5−37910号公報 特開平7−240901号公報 特開平8−18926号公報 特開平6−12486号公報 特開平9−51430号公報 特開平9−319866号公報 特開平10−164519号公報
しかしながら、上述の特許文献1〜7に開示されている技術はそれぞれ下記の問題を有している。例えば、特許文献4に開示されている技術では、あらかじめ画像の統計的データを用意する必要があるという問題がある。
また、特許文献5に開示されている技術は、従来用いられていたフィルタの組み合わせ係数をニューラルネットワークによって制御することで、複雑な論理選択をパターン処理的にニューラルネットワークで代行させるものである。しかしながら、ここでは、原画像に対するフィルタ選択の方法を学習させて他の画像に適用することになるため、学習パターンは事実上限られたものになり、どのような画像であっても対応可能な画像処理機構を構築することは困難であるという問題がある。
また、特許文献6、7に開示されている技術は、画素値及び画素位置を入力信号とするニューラルネットワークを用いて画像1フレーム(フィールド)の階調曲面を推定して、これを用いて補間するものであるが、1フレーム(フィールド)ごとのニューラルネットワークの荷重の更新が必要な上、ニューラルネットワークで再現が可能な曲面の形態には限界があると考えられるため、高精度の動画の補間処理には不向きであるという問題がある。
さらに、特許文献1に開示されている技術では、教師信号を実画像とした場合には、学習に用いられた画像以外に対する入力画像に関しては、その性能を十分に発揮できるとは言えない。
一方、特許文献2、3に開示されている技術では、入出力の双方を含む学習対象となる周辺画素値の組み合わせを人工的に生成させているため、様々なパターンに対して万遍なく学習を行うことが可能になる。しかしながら、この場合においても、学習済みではないパターンが入力された場合には、ニューラルネットワークの汎化能力をもってしても正しい補間が行われず、結果的にノイズ的な補間信号が出力されてしまうことがある。
上記の問題を解決するため、本発明は、ニューラルネットワークを効果的に利用して、画像の処理を行うための画像処理装置及び画像処理プログラムを提供することを目的とする。
上記の目的を達成するため、本発明では、第1のニューラルネットワークを用いた画像処理による結果の適合性を第2のニューラルネットワークによって判断し、この判断結果に基づいて、第1のニューラルネットワークを用いた画像処理による結果と、それ以外の画像処理による結果との混合比を決定して、これらの画像処理による結果を混合したものを画像処理による結果として出力する。
すなわち、本発明によれば、複数の画素の画素データを入力値とし、前記複数の画素を補間する補間画素の画素データを出力値とする画像処理装置であって、
前記複数の画素の画素データに対して、前記複数の画素を補間する補間画素の第1画素データを出力する第1ニューラルネットワークで構成される手段であり、前記第1ニューラルネットワークは、あらかじめ生成されている複数の画素の画素データと、前記複数の画素の画素データに対応する補間画素の画素データとの関係が学習されているニューラルネットワークである第1画像処理手段と、
前記第1画像処理手段とは異なる画像処理を実行し、前記複数の画素の画素データに対して、前記複数の画素を補間する補間画素の第2画素データを出力する第2画像処理手段と、
前記複数の画素の画素データに対する前記第1画像処理手段による画像処理の適合性を判断して、前記第1画像処理手段の適合性を示す値を出力する第2ニューラルネットワークで構成される手段であり、前記第2ニューラルネットワークは、前記第1ニューラルネットワークの学習に用いられた前記あらかじめ生成されている複数の画素の画素データと、前記第1ニューラルネットワークが学習済みであることを示す第1の特定値との関係があらかじめ学習されているとともに、ランダムに生成される複数の画素の画素データと、前記第1ニューラルネットワークによって学習済みではないことを示す特定の値との関係が学習されているニューラルネットワークである適合性判断手段と、
前記適合性判断手段から出力される前記第1画像処理手段の適合性を示す値に基づいて、前記第1画像処理手段から出力される前記第1画素データと、前記第2画像処理手段から出力される前記第2画素データとを混合し、前記複数の画素を補間する補間画素の画素データを前記出力値として出力する画素値混合手段とを、
有する画像処理装置が提供される。
また、本発明によれば、複数の画素の画素データを入力値とし、前記複数の画素を補間する補間画素の画素データを出力値とする画像処理方法をコンピュータに実行させる画像処理プログラムであって、
前記複数の画素の画素データに対して、前記複数の画素を補間する補間画素の第1画素データを出力する第1ニューラルネットワークで構成される第1画像処理機構を実現する第1画像処理機構実現ステップと、
前記第1画像処理機構が、あらかじめ生成されている複数の画素の画素データと、前記複数の画素の画素データに対応する補間画素の画素データとの関係を学習する第1学習ステップと、
前記第1画像処理手段とは異なる画像処理を実行し、前記複数の画素の画素データに対して、前記複数の画素を補間する補間画素の第2画素データを出力する第2画像処理機構を実現する第2画像処理機構実現ステップと、
前記複数の画素の画素データに対する前記第1画像処理機構による画像処理の適合性を判断して、前記第1画像処理機構の適合性を示す値を出力する第2ニューラルネットワークで構成される適合性判断機構を実現する適合性判断機構実現ステップと、
前記適合性判断機構が、前記第1ニューラルネットワークの学習に用いられた前記あらかじめ生成されている複数の画素の画素データと、前記第1ニューラルネットワークが学習済みであることを示す第1の特定値との関係があらかじめ学習されているとともに、ランダムに生成される複数の画素の画素データと、前記第1ニューラルネットワークが学習済みではないことを示す第2の特定値との関係を学習する第2学習ステップと、
前記適合性判断機構から出力される前記第1画像処理機構の適合性を示す値に基づいて、前記第1画像処理機構から出力される前記第1画素データと、前記第2画像処理機構から出力される前記第2画素データとを混合し、前記複数の画素を補間する補間画素の画素データを前記出力値として出力する画素値混合ステップとを、
有する画像処理方法をコンピュータに実行させる画像処理プログラムが提供される。
本発明は、上記の構成を有しており、ニューラルネットワークを用いた画像処理結果が適切か否かの判断を行うことで、ニューラルネットワークを効果的に利用して、自然で高品位な画像を生成するための処理を実現するという効果を有している。
以下、図面を参照しながら、本発明の実施の形態について説明する。
まず、図1を参照しながら、本発明の実施の形態における画像処理装置の構成について説明する。図1は、本発明の実施の形態における画像処理装置の構成の一例を示すブロック図である。なお、以下の説明では、図1に図示されている画像処理装置が、図2に図示されているような4×4の画素を周辺画素(入力画素)として、これらの周辺画素の中心付近に存在する5点の補間画素を求める画像処理を行う場合について説明する。図2において、○(白抜きの丸)が周辺画素、●(黒塗りの丸)が補間画素である。図2に図示されている周辺画素と補間画素の関係によれば、事実上、正方格子状に配列された周辺画素の水平方向・垂直方向(正方格子を形成する垂直な2軸方向)共に、4×4の周辺画素を2倍の画素数にするための解像度変換の処理が行われることに相当する。
図1において、周辺画素(例えば、図2に図示されている4×4の画素)を入力画素として、周辺画素の画素値が、第1のニューラルネットワーク部(第1のNN部)101、第2のニューラルネットワーク部(第2のNN部)102、バイキュービック補間処理部103に入力される。
第1のニューラルネットワーク部101は、4×4の周辺画素を入力画素とし、ニューラルネットワークを利用して5点の補間画素の画素値(5値のNN補間結果)を出力する機能を有している。なお、第1のニューラルネットワーク部101には、例えば後述の斜め線補間に特化した学習が施される。
一方、第2のニューラルネットワーク部102は、4×4の周辺画素を入力画素とし、ニューラルネットワークを利用して第1のニューラルネットワーク部101の適合性の峻別結果(第1のニューラルネットワーク部101によるNN補間結果の妥当性)を出力する機能を有している。なお、第2のニューラルネットワーク部102には、後述のように、第1のニューラルネットワーク部101の適合性を峻別することに特化した学習が施される。すなわち、第2のニューラルネットワーク部102は、第1のニューラルネットワーク部101にとって学習済みの画素パターンが入力画素として入力されたか否かを判断することが可能である。
また、バイキュービック補間処理部103は、4×4の周辺画素を入力画素とし、これらの周辺画素に関する補間画素の画素値(5値のバイキュービック補間結果)を求めるバイキュービック補間法を実行する機能を有している。
第1のニューラルネットワーク部101によるNN補間結果、及びバイキュービック補間処理部103によるバイキュービック補間結果は共に、図2に図示されているように5値であり、混合比決定部104に供給される。また、第2のニューラルネットワーク部102によって演算される第1のニューラルネットワーク部101の適合性の峻別結果も混合比決定部104に供給される。
そして、混合比決定部104では、NN補間結果の5値及びバイキュービック補間結果の5値のそれぞれに関して、第2ニューラルネットワーク部102の峻別結果に基づく混合比が決定され、決定された混合比に基づいてNN補間結果及びバイキュービック補間結果が混合された5値の補間結果が出力される。すなわち、混合比決定部104では、第1ニューラルネットワーク部101による画像処理の長所をいかすことができる場合に限定して、最終的に出力される補間結果に、第1ニューラルネットワーク部101による画像処理結果が反映されるようにすることが可能となる。
上記の第1及び第2ニューラルネットワーク部101、102は共に、例えばバックプロパゲーションを学習アルゴリズムとする層状の構造(入力層、中間層、出力層の3層)を有する周知のニューラルネットワークであり、可変の重みで結ばれた多数のユニット(ニューロン)の結合体である。
例えば、第1及び第2のニューラルネットワーク部101、102は両方共、周辺画素に対応した16個のユニットの入力層を有している。また、中間層に関しては、例えば、第1のニューラルネットワーク部101では24個のユニット、第2のニューラルネットワーク部102では16個のユニットにより構成されており、出力層に関しては、それぞれ5個のユニット及び1個のユニットにより構成されている。なお、周知のニューラルネットワークと同様に、各ユニットは、非線形の入出力特性を有する変換系であり、各ユニットには、前層からの出力値に独立した重みが乗算されて得られた前層からの総和が入力され、この総和が非線形変換されて後層に出力されるように構成されている。
そして、第1及び第2のニューラルネットワーク部101、102では、後述のように学習用の情報信号(すなわち、補間すべき画素と周辺画素との関係など)を利用して、上記のニューラルネットワークの学習が行われ、ユニット間の重みをあらかじめ定めたニューラルネットワークが学習構築される。すなわち、ニューラルネットワークの出力信号と、学習用の教師信号とを比較して、その差が小さくなるように、例えばバックプロパゲーションの学習アルゴリズムに基づいて、ユニット間の重みが変更されて、各ユニット間の重みが決定される。
次に、本発明の実施の形態における第1のニューラルネットワーク部101の学習動作の一例について説明する。なお、以下の説明では、図4に図示されている入出力データを参照しながら、図3に図示されているフローチャートに係る動作について説明する。
図3は、本発明の実施の形態において、第1のニューラルネットワーク部の学習動作の一例を説明するためのフローチャートであり、図4は、本発明の実施の形態において、人工的な生成パターンで分割された領域における入出力データの組み合わせの一例を示す図である。
図3において、第1のニューラルネットワーク部101は、周辺画素i00〜i15が入力された場合、周辺画素i00〜i15と出力すべき補間画素o0〜o4とを含む領域を、ライン(画素配列における水平方向及び垂直方向)に対して斜めの線分で複数の領域に分割する(ステップS301)。
すなわち、第1のニューラルネットワーク部101は、図4に示すように、周辺画素i00〜i15と補間画素o0〜o4とを含む領域を、2本の線分で3つの領域(エリア)A、B、Cに分割する。これらの線分は、ライン(水平画素ライン)に対して斜めの線分であり、例えば点線で示す直線y=ax+bを中心とし、両側の幅(距離)tの位置にある線分(直線y=ax+bとの距離がそれぞれt/2の傾きaの線分)である。
なお、説明のため、図4では、周辺画素i00〜i15と補間画素o0〜o4とを含むフィールド画面を、o0を中心としてx軸及びy軸の座標で表示し、変数a、b、tは、−1.5≦a≦1.5、−2≦b≦2、0≦t≦4の範囲に限定して、周辺画素i00〜i15と補間画素o0〜o4とを含む領域が分割されるものとする。これらの変数a、b、tは、上記の範囲内で、乱数発生させてランダムに生成されたものであり、周辺画素i00〜i15と補間画素o0〜o4とを含む領域は、ランダムに生成された様々な斜めの線分により分割されることになる。なお、上記の変数a、b、tの範囲は一例であり、これらに限定されるものではない。
また、第1のニューラルネットワーク部101は、垂直方向に近い線分(水平方向に対して傾きの非常に大きな線分)についての学習も実行するために、xとyとを入れ替えたx=ay+bをベースとするパターンについても学習を行う。
ステップS301の領域分割の結果、周辺画素i00〜i15及び補間画素o0〜o4は、分割された領域のいずれかに属することになる。例えば、図4に示す例では、領域(エリア)Aには周辺画素i00、i01が属し、領域(エリア)Bには周辺画素i02〜i09と補間画素o00〜o03とが属し、領域(エリア)Cには周辺画素i10〜i15と補間画素o04とが属している。
続いて、第1のニューラルネットワーク部101は、分割された各領域内で共通となるように、各領域における画素データを生成する(ステップS302)。すなわち、画素データが8ビットの輝度レベルで表現される場合には、0から255までのレベル値を乱数発生させ、3つの領域(エリアA〜C)のそれぞれに属する画素レベルとして3つのレベル値を生成する。
例えば、領域(エリア)Aの画素レベルは「40」、領域(エリア)Bの画素レベルは「55」、領域(エリア)Cの画素レベルは「100」などのように、領域単位で画素レベルがランダムに生成される。上記の場合には、領域(エリア)Aに属する周辺画素i00、i01のレベルは「40」であり、領域(エリア)Bに属する周辺画素i02〜i09、補間画素o00〜o03のレベルは「55」であり、領域(エリア)Cに属する周辺画素i10〜i15、補間画素o04のレベルは「100」であることを意味する。
そして、ステップS302で各領域単位で設定された周辺画素の画素データが、第1のニューラルネットワーク部101内のニューラルネットワークに入力され、その入力値に対応したニューラルネットワークの出力値が出力される。第1のニューラルネットワーク部101に入力された周辺画素の画素データと、ステップS302での補間画素o0〜o4の画素データとの関係に基づいて、ニューラルネットワークの学習が実行されていく(ステップS303)。
すなわち、領域(エリア)Aに属する周辺画素i00、i01の画素レベルは「40」、領域(エリア)Bに属する周辺画素i02〜i09、補間画素o00〜o03のレベルは「55」、領域(エリア)Cに属する周辺画素i10〜i15、補間画素o04のレベルは「100」となり、第1ニューラルネットワーク部101内のニューラルネットワークから、それまでに設定された重みに基づいて出力値が出力される。そして、補間画素o00〜o03に係る出力値と補間画素o00〜o03の画素レベル「55」との差や、補間画素o04に係る出力値と補間画素o04の画素レベル「100」との差が小さくなるように重みが計算、変更される。
また、上述のステップS301〜S303の処理による学習は、例えば、図5A〜図5Dに図示されているような様々な分割例に関して繰り返し行われる。その結果、様々な周辺画素の画素データの組み合わせに対して学習が行われる。なお、上述のステップS301〜S303の処理による学習は、例えばあらかじめ定められた所定の学習回数だけ行われ(ステップS304)、第1のニューラルネットワーク部101内のニューラルネットワークが学習によって徐々に構築されていく。
以上、説明したように、第1のニューラルネットワーク部101では、斜めの線分によって分割された各領域に関する補間パターンが効率的に学習されて、ニューラルネットワークが構築されるので、水平方向及び垂直方向のそれぞれに対して傾きの小さな斜めの線分のエイリアシングが少ない自然な補間が可能になる。
次に、本発明の実施の形態における第2のニューラルネットワーク部102の学習動作の一例について説明する。図6は、本発明の実施の形態において、第2のニューラルネットワーク部の学習動作の一例を説明するためのフローチャートである。
第2のニューラルネットワーク部102は、学習の繰り返し回数を管理するカウンタを有しており、学習動作の開始と共に、まずカウンタkの値をリセット(k=0)する(ステップS401)。
第2のニューラルネットワーク部102は、このカウンタkの値に基づいて異なる処理を行う。すなわち、第2のニューラルネットワーク部102は、カウンタkの値の偶奇を判断し、カウンタkが偶数の場合(ただし、ここではk=0は偶数と判断されるものとする)には、上述の第1のニューラルネットワーク部101における処理(図3のステップS301、S302)と同様に、斜めの線分による補間で用いたパターンの信号を生成して設定するとともに(ステップS403、S404)、出力側の教師信号として『1』を与えて、ニューラルネットワークを学習させる(ステップS405)。そして、カウンタkを1つインクリメント(k=k+1)して(ステップS406)、カウンタkが所定の回数に達しているか否かを判断し(ステップS408)、カウンタkが所定の回数に達していない場合には、再びステップS402に戻る。
一方、カウンタkが奇数の場合には、入力信号(16値)すべてを乱数発生させた0から255までの画素レベルに設定し、出力側の教師信号として『0』を与えて、ニューラルネットワークを学習させる(ステップS409)。そして、カウンタkを1つインクリメント(k=k+1)して(ステップS406)、カウンタkが所定の回数に達しているか否かを判断し(ステップS408)、カウンタkが所定の回数に達していない場合には、再びステップS402に戻る。また、カウンタkが所定の回数に達した場合には、学習動作は終了となる。
このように、第2のニューラルネットワーク部102は、斜めの線分による補間に対して『1』の出力信号を、ランダムパターンに対して『0』の出力信号をニューラルネットワークに交互に学習させることによって、第1のニューラルネットワーク部102による入力信号パターンに対する適合性を判定する峻別能力を持つことが可能になる。すなわち、第2のニューラルネットワーク部102は、第1のニューラルネットワーク部101によるNN補間結果の適合性が高いと判定できる場合には、『1』に近い値の出力信号を出力し、第1のニューラルネットワーク部101によるNN補間結果の適合性が低いと判定できる場合には、『0』に近い値の出力信号を出力する。
そして、第2のニューラルネットワーク部102からの出力信号は混合比決定部104に供給され、この出力信号に基づいて、混合比決定部104で、NN補間結果とバイキュービック補間結果の混合比が決定される。例えば、混合比決定部104は、第2のニューラルネットワーク部102から出力信号の値『m』(ただし、0≦m≦1)を受けた場合、各補間画素に関して『m』を内分比として用い、(1−m)×{NN補間結果}+m×{バイキュービック補間結果}を補間結果として出力することが可能である。なお、NN補間結果とバイキュービック補間結果との混合は、上記の内分を用いた演算に限定されるものではなく、任意の混合方法を用いることが可能である。
以上、説明したように、第2のニューラルネットワーク部102では、第1のニューラルネットワーク部101によるNN補間結果の適合性を判定するニューラルネットワークが構築され、NN補間結果の適合性(峻別結果)が出力されるようになる。その結果、第2のニューラルネットワーク部102からの峻別結果に基づいて、混合比決定部104が、第1のニューラルネットワーク部101によるNN補間結果と、バイキュービック補間処理部103によるバイキュービック補間結果とを適切な混合比で混合することが可能となり、自然で高品位な補間画像を得ることが可能となる。
なお、上述の実施の形態では、混合比決定部104から、第1のニューラルネットワーク部101によるNN補間結果と、バイキュービック補間処理部103によるバイキュービック補間結果とが混合されて出力される場合について説明しているが、第2のニューラルネットワーク部102から出力されるNN補間結果の適合性に基づいて、第1のニューラルネットワーク部101によるNN補間結果、及びバイキュービック補間処理部103によるバイキュービック補間結果のいずれか一方が選択され、補間結果として出力されるようにしてもよい。また、上述の実施の形態では、第1のニューラルネットワーク部101による画像処理方式とは異なる画像処理方式によって補間画素の画素データを計算する画像処理部として、バイキュービック補間法を実行するバイキュービック画像処理部103が設けられているが、必ずしもバイキュービック補間法に限定されるものではなく、他の任意の画像補間方式を実行することが可能な画像処理部が設けられてもよい。
なお、上述の実施の形態では、本発明に係る画像処理装置の機能がブロックによって図示されているが、これらの各機能はハードウェア及び/又はソフトウェア(プログラム)によって実現可能である。また、上述の説明で用いた各フローチャートの処理は、例えば、CPU(Central Processing Unit:中央演算処理装置)に所定のプログラムを実行させることによって実現することも可能である。また、本発明に係る画像処理装置の機能を実現するプログラムは、記録媒体から読み取られてコンピュータに取り込まれてもよく、また、通信ネットワークを介して伝送されてコンピュータに取り込まれてもよい。
本発明は、ニューラルネットワークを効果的に利用して、画像の処理を行うことを可能にするという効果を有しており、画像処理技術(特に、主に画像の解像度や倍率を変更するための画像補間技術)に適用可能である。
本発明の実施の形態における画像処理装置の構成の一例を示すブロック図である。 本発明の実施の形態における画像処理装置に入力される周辺画素と、同画像処理装置から出力される補間画素の一例を模式的に示す図である。 本発明の実施の形態において、第1のニューラルネットワーク部の学習動作の一例を説明するためのフローチャートである。 本発明の実施の形態において、人工的な生成パターンで分割された領域における入出力データの組み合わせの一例を示す図である。 本発明の実施の形態において、入力画素に対する分割例の第1の例を示す図である。 本発明の実施の形態において、入力画素に対する分割例の第2の例を示す図である。 本発明の実施の形態において、入力画素に対する分割例の第3の例を示す図である。 本発明の実施の形態において、入力画素に対する分割例の第4の例を示す図である。 本発明の実施の形態において、第2のニューラルネットワーク部の学習動作の一例を説明するためのフローチャートである。
符号の説明
101 第1のニューラルネットワーク部(第1のNN部)
102 第2のニューラルネットワーク部(第2のNN部)
103 バイキュービック補間処理部
104 混合比決定部

Claims (2)

  1. 複数の画素の画素データを入力値とし、前記複数の画素を補間する補間画素の画素データを出力値とする画像処理装置であって、
    前記複数の画素の画素データに対して、前記複数の画素を補間する補間画素の第1画素データを出力する第1ニューラルネットワークで構成される手段であり、前記第1ニューラルネットワークは、あらかじめ生成されている複数の画素の画素データと、前記複数の画素の画素データに対応する補間画素の画素データとの関係が学習されているニューラルネットワークである第1画像処理手段と、
    前記第1画像処理手段とは異なる画像処理を実行し、前記複数の画素の画素データに対して、前記複数の画素を補間する補間画素の第2画素データを出力する第2画像処理手段と、
    前記複数の画素の画素データに対する前記第1画像処理手段による画像処理の適合性を判断して、前記第1画像処理手段の適合性を示す値を出力する第2ニューラルネットワークで構成される手段であり、前記第2ニューラルネットワークは、前記第1ニューラルネットワークの学習に用いられた前記あらかじめ生成されている複数の画素の画素データと、前記第1ニューラルネットワークが学習済みであることを示す第1の特定値との関係があらかじめ学習されているとともに、ランダムに生成される複数の画素の画素データと、前記第1ニューラルネットワークによって学習済みではないことを示す特定の値との関係が学習されているニューラルネットワークである適合性判断手段と、
    前記適合性判断手段から出力される前記第1画像処理手段の適合性を示す値に基づいて、前記第1画像処理手段から出力される前記第1画素データと、前記第2画像処理手段から出力される前記第2画素データとを混合し、前記複数の画素を補間する補間画素の画素データを前記出力値として出力する画素値混合手段とを、
    有する画像処理装置。
  2. 複数の画素の画素データを入力値とし、前記複数の画素を補間する補間画素の画素データを出力値とする画像処理方法をコンピュータに実行させる画像処理プログラムであって、
    前記複数の画素の画素データに対して、前記複数の画素を補間する補間画素の第1画素データを出力する第1ニューラルネットワークで構成される第1画像処理機構を実現する第1画像処理機構実現ステップと、
    前記第1画像処理機構が、あらかじめ生成されている複数の画素の画素データと、前記複数の画素の画素データに対応する補間画素の画素データとの関係を学習する第1学習ステップと、
    前記第1画像処理手段とは異なる画像処理を実行し、前記複数の画素の画素データに対して、前記複数の画素を補間する補間画素の第2画素データを出力する第2画像処理機構を実現する第2画像処理機構実現ステップと、
    前記複数の画素の画素データに対する前記第1画像処理機構による画像処理の適合性を判断して、前記第1画像処理機構の適合性を示す値を出力する第2ニューラルネットワークで構成される適合性判断機構を実現する適合性判断機構実現ステップと、
    前記適合性判断機構が、前記第1ニューラルネットワークの学習に用いられた前記あらかじめ生成されている複数の画素の画素データと、前記第1ニューラルネットワークが学習済みであることを示す第1の特定値との関係があらかじめ学習されているとともに、ランダムに生成される複数の画素の画素データと、前記第1ニューラルネットワークが学習済みではないことを示す第2の特定値との関係を学習する第2学習ステップと、
    前記適合性判断機構から出力される前記第1画像処理機構の適合性を示す値に基づいて、前記第1画像処理機構から出力される前記第1画素データと、前記第2画像処理機構から出力される前記第2画素データとを混合し、前記複数の画素を補間する補間画素の画素データを前記出力値として出力する画素値混合ステップとを、
    有する画像処理方法をコンピュータに実行させる画像処理プログラム。
JP2006161491A 2006-06-09 2006-06-09 画像処理装置及び画像処理プログラム Active JP4692401B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006161491A JP4692401B2 (ja) 2006-06-09 2006-06-09 画像処理装置及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006161491A JP4692401B2 (ja) 2006-06-09 2006-06-09 画像処理装置及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2007328735A true JP2007328735A (ja) 2007-12-20
JP4692401B2 JP4692401B2 (ja) 2011-06-01

Family

ID=38929133

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006161491A Active JP4692401B2 (ja) 2006-06-09 2006-06-09 画像処理装置及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP4692401B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101070981B1 (ko) 2009-11-05 2011-10-06 홍익대학교 산학협력단 경계선 성분 분류 기반 신경회로망 모델을 이용한 영상 화질 개선방법
JP6347028B1 (ja) * 2017-10-13 2018-06-27 株式会社ツバサファクトリー アップサンプル装置、コンピュータプログラム、コンピュータシステム、機器、及びアップサンプル方法
JP2020508504A (ja) * 2017-02-24 2020-03-19 ディープマインド テクノロジーズ リミテッド ニューラルネットワークを使用した繰り返しマルチスケール画像生成
CN112348742A (zh) * 2020-11-03 2021-02-09 北京信工博特智能科技有限公司 一种基于深度学习的图像非线性插值获取方法及获取系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0951430A (ja) * 1995-08-09 1997-02-18 Fuji Photo Film Co Ltd 画像データ補間演算方法および装置
JPH09319866A (ja) * 1996-05-27 1997-12-12 Sharp Corp 画像処理方法
JP2002323371A (ja) * 2001-04-27 2002-11-08 Toshiba Corp 音響診断装置及び音響診断方法
JP2005217592A (ja) * 2004-01-28 2005-08-11 Mega Chips Corp 画素補間フィルタ生成装置および画素補間装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0951430A (ja) * 1995-08-09 1997-02-18 Fuji Photo Film Co Ltd 画像データ補間演算方法および装置
JPH09319866A (ja) * 1996-05-27 1997-12-12 Sharp Corp 画像処理方法
JP2002323371A (ja) * 2001-04-27 2002-11-08 Toshiba Corp 音響診断装置及び音響診断方法
JP2005217592A (ja) * 2004-01-28 2005-08-11 Mega Chips Corp 画素補間フィルタ生成装置および画素補間装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101070981B1 (ko) 2009-11-05 2011-10-06 홍익대학교 산학협력단 경계선 성분 분류 기반 신경회로망 모델을 이용한 영상 화질 개선방법
JP2020508504A (ja) * 2017-02-24 2020-03-19 ディープマインド テクノロジーズ リミテッド ニューラルネットワークを使用した繰り返しマルチスケール画像生成
US11361403B2 (en) 2017-02-24 2022-06-14 Deepmind Technologies Limited Iterative multiscale image generation using neural networks
US11734797B2 (en) 2017-02-24 2023-08-22 Deepmind Technologies Limited Iterative multiscale image generation using neural networks
JP6347028B1 (ja) * 2017-10-13 2018-06-27 株式会社ツバサファクトリー アップサンプル装置、コンピュータプログラム、コンピュータシステム、機器、及びアップサンプル方法
JP2019074892A (ja) * 2017-10-13 2019-05-16 株式会社ツバサファクトリー アップサンプル装置、コンピュータプログラム、コンピュータシステム、機器、及びアップサンプル方法
CN112348742A (zh) * 2020-11-03 2021-02-09 北京信工博特智能科技有限公司 一种基于深度学习的图像非线性插值获取方法及获取系统
CN112348742B (zh) * 2020-11-03 2024-03-26 北京信工博特智能科技有限公司 一种基于深度学习的图像非线性插值获取方法及获取系统

Also Published As

Publication number Publication date
JP4692401B2 (ja) 2011-06-01

Similar Documents

Publication Publication Date Title
JP5685064B2 (ja) 画像表示装置、画像表示装置の駆動方法及び画像表示プログラム、並びに、階調変換装置
JP4692401B2 (ja) 画像処理装置及び画像処理プログラム
JPH09163162A (ja) 画像処理方法及び装置
JP2000339449A (ja) 画像処理装置及び方法
JP5316385B2 (ja) 画像処理装置及び画像処理プログラム
JP2014135628A (ja) 画像処理装置及び画像処理方法
WO2022124026A1 (ja) 学習済モデルの生成方法および情報処理装置
US6628427B1 (en) Method and apparatus for image processing which improves performance of gray scale image transformation
JP5203316B2 (ja) 表示制御装置、および、モアレ解消方法
JP3519186B2 (ja) 画像中間調処理装置
JP4108517B2 (ja) ハーフトーン化処理方法及びハーフトーン化処理システム
JPH07121695A (ja) 画像階調変換方法及び画像処理装置
JP3539533B2 (ja) 画像データ補間装置
JP3757644B2 (ja) 画像処理装置
JPH07199903A (ja) 多階調幅太データ生成方法およびその装置
JP6108217B2 (ja) 画像変換処理方法、それを実行させるためのプログラム及び画像変換処理装置
JP4965378B2 (ja) 画像形成方法および画像形成システム
JP3974271B2 (ja) 画像処理方法及び画像処理装置
JP2000115541A (ja) 画像処理装置
JPH0383178A (ja) ディザ画像の拡大処理方式
JP4517287B2 (ja) 画像処理装置、画像処理方法及びそのプログラム
JP6108218B2 (ja) 画像変換処理方法、それを実行させるためのプログラム及び画像変換処理装置
JP2854489B2 (ja) 画像データ変換装置及び画像データ変換方法
JP2010218312A (ja) 画像拡大方法及び画像拡大装置
JP2001148783A (ja) 画像処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080630

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110125

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140304

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4692401

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140304

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140304

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350