JP2007251688A - 画像処理装置および画像処理方法、並びにプログラム - Google Patents

画像処理装置および画像処理方法、並びにプログラム Download PDF

Info

Publication number
JP2007251688A
JP2007251688A JP2006073558A JP2006073558A JP2007251688A JP 2007251688 A JP2007251688 A JP 2007251688A JP 2006073558 A JP2006073558 A JP 2006073558A JP 2006073558 A JP2006073558 A JP 2006073558A JP 2007251688 A JP2007251688 A JP 2007251688A
Authority
JP
Japan
Prior art keywords
image
pixel
pixels
unit
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006073558A
Other languages
English (en)
Other versions
JP4470899B2 (ja
Inventor
Tetsujiro Kondo
哲二郎 近藤
Masashi Uchida
真史 内田
Takuo Morimura
卓夫 守村
Daisuke Kikuchi
大介 菊地
Takashi Miyai
岳志 宮井
Hideo Kasama
英雄 笠間
Takeshi Kunihiro
威 國弘
Yoshiteru Nakamura
芳晃 中村
Hideki Mori
英樹 森
Yasuhiko Kan
靖彦 管
Kenichiro Hosokawa
健一郎 細川
Shizuo Chikaoka
志津男 近岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2006073558A priority Critical patent/JP4470899B2/ja
Priority to KR1020070025645A priority patent/KR20070094520A/ko
Priority to US11/687,294 priority patent/US8264600B2/en
Publication of JP2007251688A publication Critical patent/JP2007251688A/ja
Application granted granted Critical
Publication of JP4470899B2 publication Critical patent/JP4470899B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0135Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving interpolation processes
    • H04N7/014Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving interpolation processes involving the use of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0117Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving conversion of the spatial resolution of the incoming video signal
    • H04N7/012Conversion between an interlaced and a progressive signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Graphics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Television Systems (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】入力された画像を、画素数の異なる高品質な画像に的確に変換することができる。【解決手段】IP変換部121は、インターレース方式のSD画像に対して、IP変換を行う。出力位相変換部112は、IP変換の結果得られるプログレッシブ方式のSD画像に対して補間を行い、HD画像とする。自然画予測部113は、補間の結果得られるプログレッシブ方式のHD画像により求められる、そのHD画像のうちの自然画像を高品質にした自然高品質画像の画素である注目画素を、そのHD画像の特徴に応じて、クラスに分類する。自然画予測部113は、複数のプログレッシブ方式のHD画像を用いた学習により獲得された、クラスごとの予測係数を格納する。自然画予測部113は、HD画像と、注目画素のクラスの予測係数とを用いて演算することで、HD画像から自然高品質画像を求める。本発明は、画像処理装置に適用できる。
【選択図】図8

Description

本発明は、画像処理装置および画像処理方法、並びにプログラムに関し、特に、入力された画像を、画素数の異なる高品質な画像に的確に変換することができるようにする画像処理装置および画像処理方法、並びにプログラムに関する。
本出願人は、SD(Standard Definition)画像からHD(High Definition)画像に変換する変換処理を先に提案している(例えば、特許文献1参照)。この変換処理は、入力されたSD画像の所定領域の複数画素の特徴をADRC(Adaptive Dynamic Range Coding)(適応的ダイナミックレンジ符号化)などを用いて求め、その特徴に応じて、SD画像により求められるHD画像の画素である注目画素を、クラスに分類し、そのクラスに対応する、学習処理によりクラスごとに予め求めておいた予測係数と、SD画像の所定領域の複数画素の画素値との線形1次式を演算することにより、入力されたSD画像からHD画像を予測する処理である。
図1は、従来の変換処理を行う変換装置1の一例を示すブロック図である。
図1の変換装置1は、クラスタップ抽出部11、ADRC処理部12、予測係数メモリ13、予測タップ抽出部14、および予測演算部15により構成される。
変換装置1には、インターレース方式のSD画像が入力され、そのSD画像はクラスタップ抽出部11と予測タップ抽出部14に供給される。
クラスタップ抽出部11は、入力されたインターレース方式のSD画像により求められるインターレース方式のHD画像を構成する画素を、順次、注目画素とし、その注目画素をクラスに分類するために用いる、入力されたSD画像を構成する画素の幾つかを、クラスタップとして抽出する。クラスタップ抽出部11は、抽出されたクラスタップを、ADRC処理部12に供給する。
ADRC処理部12は、クラスタップ抽出部11から供給されるクラスタップを構成する画素の画素値を、クラスタップの波形の特徴として、その画素値に対してADRC処理などを行い、その結果得られるADRCコードを、クラスタップの特徴として検出する。
なお、KビットADRCにおいては、例えば、クラスタップを構成する画素の画素値の最大値MAXと最小値MINが検出され、DR=MAX-MINを、集合の局所的なダイナミックレンジとし、このダイナミックレンジDRに基づいて、クラスタップを構成する画素値がKビットに再量子化される。即ち、クラスタップを構成する各画素の画素値から、最小値MINが減算され、その減算値がDR/2Kで除算される。
そして、以上のようにして得られる、クラスタップを構成するKビットの各画素の画素値を、所定の順番で並べたビット列が、ADRCコードとして出力される。従って、クラスタップが、例えば、1ビットADRC処理された場合には、そのクラスタップを構成する各画素の画素値は、最大値MAXと最小値MINとの平均値で除算されて、除算結果の小数点以下は切り捨てられ、これにより、各画素の画素値が1ビットとされる。即ち、各画素の画素値が2値化される。そして、その1ビットの画素値を所定の順番で並べたビット列が、ADRCコードとして出力される。
ADRC処理部12は、検出されたADRCコードに基づいてクラスを決定することにより、注目画素をクラスに分類し、そのクラスを予測係数メモリ13に供給する。例えば、ADRC処理部12は、ADRCコードをそのままクラスとして、予測係数メモリ13に供給する。
予測係数メモリ13は、図7を参照して後述する学習により獲得されたクラスごとの予測係数を格納している。予測係数メモリ13は、ADRC処理部12から供給されるクラスに基づいて、そのクラスの予測係数を読み出し、予測演算部15に供給する。
予測タップ抽出部14は、入力されるインターレース方式のSD画像から、注目画素の画素値を予測するのに用いるSD画像を構成する画素を、予測タップとして抽出する。具体的には、予測タップ抽出部14は、注目画素に対応するSD画像の画素、例えば注目画素に対して空間的に最も近い位置にあるSD画像の画素に対して、空間的に近い位置にある複数の画素を、SD画像から、予測タップとして抽出する。予測タップ抽出部14は、予測タップを予測演算部15に供給する。
なお、予測タップとクラスタップは、同一のタップ構造を有するものとすることも、異なるタップ構造を有するものとすることも可能である。
予測演算部15は、予測タップ抽出部14から供給される予測タップと、予測係数メモリ13から供給される予測係数とを用いて、注目画素の真値の予測値を求める線形一次式の演算などの予測演算を行う。これにより、予測演算部15は、注目画素の画素値の予測値、即ち、インターレース方式のHD画像を構成する画素の画素値を求めて出力する。
図2は、図1のクラスタップ抽出部11により抽出されるクラスタップのタップ構造の一例を示している。なお、図2において、図中白丸はSD画像の画素を表し、図中菱形はHD画像の画素を表す。このことは、後述する図3においても同様である。
図2では、9個の画素で、クラスタップが構成されている。即ち、注目画素27に対応する、m番目(m=1,2,・・・のいずれか)のフィールドのSD画像を構成する画素23、その画素の上方向に隣接する1画素20と下方向に隣接する1画素26、左方向に隣接する画素21,22と右方向に隣接する2画素24,25、および、そのフィールドより1フィールド前であるm−1番目のフィールドのSD画像を構成する、画素23に対応する位置28の上方向に隣接する1画素29と下方向に隣接する1画素30から、クラスタップが構成されている。
図3は、図1の予測タップ抽出部14により抽出される予測タップのタップ構造の一例を示している。
図3では、13個の画素で、予測タップが構成されている。即ち、注目画素47に対応する、m番目(m=1,2,・・・のいずれか)のフィールドのSD画像を構成する画素43、その画素の上方向に隣接する1画素40と下方向に隣接する1画素46、左方向に隣接する画素41,42と右方向に隣接する2画素44,45、そのフィールドより1フィールド前であるm−1番目のフィールドのSD画像を構成する、画素43に対応する位置48の上方向に隣接する1画素50と下方向に隣接する1画素53のそれぞれを中心として横方向に並ぶ3画素49,50,51,52,53,54から、予測タップが構成されている。
図4と図5は、変換装置1に入力されるインターレース方式のSD画像の画素と、変換装置1から出力されるインターレース方式のHD画像の画素の位置関係を示す図である。
なお、図4と図5において、白丸は、SD画像の偶数番目のフィールド(以下、偶数フィールドと称する)の画素を表し、黒丸は、奇数番目のフィールド(以下、奇数フィールドと称する)の画素を表す。また、白色の菱形は、HD画像の所定のフレームを構成する偶数フィールドの画素を表し、黒色の菱形は、奇数フィールドの画素を表す。さらに、HD画像の垂直方向と水平方向の画素の間隔を1とする。
図4は、奇数フィールドと偶数フィールドにおける、HD画像の画素とSD画像の画素の垂直方向の位置関係を表している。なお、図4において、横方向は時間を表し、縦方向は、画素の垂直方向の位置を表している。
図4に示されるように、奇数フィールドのSD画像の画素71が配置される垂直方向の位置は、垂直方向において画素71から最も近い位置にあるHD画像の画素61から、下方向に1/2だけ離れた位置、即ち、画素61の直下の画素62から上方向に3/2だけ離れた位置である。
また、偶数フィールドのSD画像の画素72が配置される垂直方向の位置は、垂直方向において画素72から最も近い位置にあるHD画像の画素64から、上方向に1/2だけ離れた位置、即ち、画素64の直上の画素63から下方向に3/2だけ離れた位置である。
図5は、HD画像の画素とSD画像の画素の水平方向の位置関係を表している。なお、図5の画像は、説明の便宜上、奇数フィールドと偶数フィールドを合成した画像となっている。
図5に示されるように、SD画像の奇数フィールドの画素71と偶数フィールドの画素72が配置される水平方向の位置は、水平方向において画素71と画素72から最も近い位置にあるHD画像の画素61と、その右隣の画素81との中間である。即ち、画素71と画素72の水平方向の位置は、画素61から右方向に1/2だけ離れた位置であり、かつ画素81から左方向に1/2だけ離れた位置である。
以上のように、変換前のSD画像と変換後のHD画像の画素数、即ち画素のサンプリング周波数に差があるため、SD画像とHD画像の画素の位置にズレが生じる。
次に、図6のフローチャートを参照して、図1の変換装置1がインターレース方式のHD画像を予測する予測処理について説明する。この予測処理は、例えば、変換装置1にインターレース方式のSD画像が入力されたとき、開始される。
初めに、ステップS1において、クラスタップ抽出部11は、入力されたインターレース方式のSD画像により予測される、インターレース方式のHD画像を構成する画素のうちの1つを、注目画素として選択する。
ステップS2において、クラスタップ抽出部11は、図2に示されるような、ステップS1で選択された注目画素のクラスを分類するのに用いる、SD画像を構成する画素の幾つかを、入力されたSD画像からクラスタップとして抽出し、ADRC処理部12に供給する。
ステップS3において、ADRC処理部12は、クラスタップ抽出部11から供給されるクラスタップを構成する画素の画素値に対して、ADRC処理などを行い、その結果得られるADRCコードを、クラスタップの特徴として検出する。
ステップS4において、ADRC処理部12は、ステップS3で検出されたADRCコードに基づいてクラスを決定し、そのクラスを予測係数メモリ13に供給する。
ステップS5において、予測タップ抽出部14は、入力されたSD画像から、注目画素の画素値を予測するのに用いるSD画像を構成する画素を、予測タップとして抽出する。予測タップ抽出部14は、予測タップを予測演算部15に供給する。
ステップS6において、予測係数メモリ13は、ADRC処理部12から供給されるクラスに基づいて、そのクラスの予測係数を読み出し、予測演算部15に供給する。
ステップS7において、予測演算部15は、予測タップ抽出部14から供給される予測タップと、予測係数メモリ13から供給される予測係数とを用いて、注目画素の真値の予測値を求める線形一次式の演算などの予測演算を行う。
ステップS8において、予測演算部15は、予測演算の結果得られた注目画素の画素値の予測値、即ち、インターレース方式のHD画像を構成する画素の画素値を出力する。
ステップS9において、クラスタップ抽出部11は、入力されたインターレース方式のSD画像により求められる、インターレース方式のHD画像を構成するすべての画素を、注目画素としたかどうかを判定する。
ステップS9で、クラスタップ抽出部11は、まだすべての画素を注目画素としていないと判定した場合、ステップS10において、クラスタップ抽出部11は、インターレース方式のHD画像を構成する画素のうち、まだ注目画素としていないものを、新たに注目画素として決定し、処理をステップS2に戻して、以下同様の処理を繰り返す。一方、ステップS9で、クラスタップ抽出部11は、すべての画素を注目画素としたと判定した場合、処理を終了する。
以上のようにして、変換装置1は、入力されたSD画像から、HD画像を予測し、出力する。即ち、変換装置1は、SD画像をHD画像に変換し、出力する。
図7は、図1の予測係数メモリ13に格納されるクラスごとの予測係数を求める学習を行う学習装置90の構成例を示すブロック図である。
図7の学習装置90は、2次元間引きフィルタ91、クラスタップ抽出部92、ADRC処理部93、予測タップ抽出部94、正規方程式生成部95、および係数生成部96により構成される。
学習装置90には、図示せぬデータベースから読み出された、予測処理後の目標のインターレース方式のHD画像となる教師画像が入力され、その教師画像は、2次元間引きフィルタ91と正規方程式生成部95に供給される。
2次元間引きフィルタ91は、入力されたインターレース方式のHD画像である教師画像に対して、垂直方向および水平方向の画素を、それぞれ間引き、垂直方向および水平方向の画素数を1/2にする。即ち、2次元間引きフィルタ91は、入力されたインターレース方式のHD画像から、予測処理が行われる前の画像に相当するインターレース方式のSD画像である生徒画像を生成する。2次元間引きフィルタ91は、その生徒画像をクラスタップ抽出部92と予測タップ抽出部94に供給する。
クラスタップ抽出部92は、図1のクラスタップ抽出部11と同様に構成される。クラスタップ抽出部92は、教師画像を構成する画素を、順次、注目教師画素として、その注目教師画素について、生徒画像から、図2に示されるようなクラスタップを抽出する。クラスタップ抽出部92は、そのクラスタップをADRC処理部93に供給する。
ADRC処理部93は、図1のADRC処理部12と同様に構成される。ADRC処理部93は、クラスタップ抽出部92から供給されるクラスタップを構成する画素の画素値に対して、ADRC処理などを行い、その結果得られるADRCコードを、クラスタップの特徴として検出する。ADRC処理部93は、そのADRCコードに基づいてクラスを決定し、そのクラスを正規方程式生成部95に供給する。
予測タップ抽出部94は、図1の予測タップ抽出部14と同様に構成される。予測タップ抽出部94は、2次元間引きフィルタ91から供給される生徒画像から、注目画素の画素値を予測するのに用いる生徒画像を構成する画素を、予測タップとして抽出する。予測タップ抽出部94は、予測タップを正規方程式生成部95に供給する。
正規方程式生成部95は、入力された教師画像と、予測タップ抽出部94から供給される予測タップのペアを、予測係数の学習に用いられる学習対として、ADRC処理部93から供給されるクラスごとに、正規方程式をたてると、その正規方程式を予測係数生成部96に供給する。
予測係数生成部96は、正規方程式生成部95から供給されるクラスごとの正規方程式を解くことにより、予測誤差を統計的に最小にする予測係数をクラスごとに求めて、予測係数メモリ97に出力し、格納させる。この予測係数メモリ97に格納された予測係数は、図1の予測係数メモリ13に格納される。
このようにして、学習装置90により獲得された、予測誤差が最小となる予測係数を用いて、変換装置1は、SD画像をHD画像に変換するので、高い精度の変換処理を行うことができる。
特開平7−79418号公報
しかしながら、上述したように、SD画像とHD画像の画素の位置にはズレがあるため、変換装置1は、HD画像の画素である注目画素の位相に対して、垂直方向および水平方向に位相がシフトしたSD画像の画素からなる予測タップを用いて、注目画素の画素値を予測しなければならない。
その結果、変換装置1は、HD画像を正確に予測することができない場合がある。特に、SD画像とHD画像の画素の数の差が大きい場合、HD画像の空間的な波形の連続性が失われる場合がある。
本発明は、このような状況に鑑みてなされたものであり、入力された画像を、画素数の異なる高品質な画像に的確に変換することができるようにするものである。
本発明の第1の側面の画像処理装置は、第1の画素数の画素から構成されるインターレース画像を第1のプログレッシブ画像にIP変換する変換手段と、前記第1のプログレッシブ画像に対して補間を行うことにより、生成目標とする画像の画素数である第2の画素数の画素から構成される第2のプログレッシブ画像を生成する補間手段と、前記第2のプログレッシブ画像により求められる、その第2のプログレッシブ画像に比べて高品質な前記第2の画素数の画素から構成される、前記生成目標の画像としての第3のプログレッシブ画像の画素である注目画素を、その第2のプログレッシブ画像の特徴に応じて、クラスに分類する分類手段と、前記第2の画素数の画素から構成される複数のプログレッシブ画像を用いた学習により獲得された、前記クラスごとの予測係数を格納する格納手段と、前記第2のプログレッシブ画像と、前記注目画素の前記クラスの予測係数とを用いて演算することで、前記第2のプログレッシブ画像から、前記生成目標の画像としての前記第3のプログレッシブ画像を求める演算手段とを備える。
前記変換手段には、前記インターレース画像を、プログレッシブ方式の中間画像に変換するIP変換手段と、前記中間画像の画素の間隔より短い距離を最小単位とする前記インターレース画像の動きベクトルを検出する動きベクトル検出手段と、前記動きベクトルの垂直方向の成分である垂直動き量に基づいて、前記インターレース画像に画素が存在する位置にある第1のタイプの画素に対する第1の巡回係数、および、前記インターレース画像に画素が存在しない位置にある第2のタイプの画素に対する第2の巡回係数を設定する巡回係数設定手段と、前記動きベクトルに基づいて、過去の前記第1のプログレッシブ画像に対して動き補償を施した画像である動き補償画像を生成する動き補償手段と、前記中間画像の前記第1のタイプの画素の画素値と前記動き補償画像の対応する位置にある画素の画素値とを前記第1の巡回係数を用いて重み付け加算し、前記中間画像の前記第2のタイプの画素の画素値と前記動き補償画像の対応する位置にある画素の画素値とを前記第2の巡回係数を用いて重み付け加算した画素値からなる前記第1のプログレッシブ画像を生成する出力画像生成手段とを設けることができる。
本発明の第1の側面の画像処理方法は、第1の画素数の画素から構成されるインターレース画像を第1のプログレッシブ画像にIP変換し、前記第1のプログレッシブ画像に対して補間を行うことにより、生成目標とする画像の画素数である第2の画素数の画素から構成される第2のプログレッシブ画像を生成し、前記第2のプログレッシブ画像により求められる、その第2のプログレッシブ画像に比べて高品質な前記第2の画素数の画素から構成される、前記生成目標の画像としての第3のプログレッシブ画像の画素である注目画素を、その第2のプログレッシブ画像の特徴に応じて、クラスに分類し、前記第2の画素数の画素から構成される複数のプログレッシブ画像を用いた学習により獲得された、前記クラスごとの予測係数のうち、前記注目画素の前記クラスの予測係数と、前記第2のプログレッシブ画像とを用いて演算することで、前記第2のプログレッシブ画像から、前記生成目標の画像としての前記第3のプログレッシブ画像を求めるステップを含む。
本発明の第1の側面のプログラムは、第1の画素数の画素から構成されるインターレース画像を第1のプログレッシブ画像にIP変換し、前記第1のプログレッシブ画像に対して補間を行うことにより、生成目標とする画像の画素数である第2の画素数の画素から構成される第2のプログレッシブ画像を生成し、前記第2のプログレッシブ画像により求められる、その第2のプログレッシブ画像に比べて高品質な前記第2の画素数の画素から構成される、前記生成目標の画像としての第3のプログレッシブ画像の画素である注目画素を、その第2のプログレッシブ画像の特徴に応じて、クラスに分類し、前記第2の画素数の画素から構成される複数のプログレッシブ画像を用いた学習により獲得された、前記クラスごとの予測係数のうち、前記注目画素の前記クラスの予測係数と、前記第2のプログレッシブ画像とを用いて演算することで、前記第2のプログレッシブ画像から、前記生成目標の画像としての前記第3のプログレッシブ画像を求めるステップを含む。
本発明の第1の側面においては、第1の画素数の画素から構成されるインターレース画像が第1のプログレッシブ画像にIP変換され、第1のプログレッシブ画像に対して補間が行われることにより、生成目標とする画像の画素数である第2の画素数の画素から構成される第2のプログレッシブ画像が生成され、第2のプログレッシブ画像により求められる、その第2のプログレッシブ画像に比べて高品質な第2の画素数の画素から構成される、生成目標の画像としての第3のプログレッシブ画像の画素である注目画素が、その第2のプログレッシブ画像の特徴に応じて、クラスに分類され、第2の画素数の画素から構成される複数のプログレッシブ画像を用いた学習により獲得された、クラスごとの予測係数のうち、注目画素のクラスの予測係数と、第2のプログレッシブ画像とを用いて演算することで、第2のプログレッシブ画像から、生成目標の画像としての第3のプログレッシブ画像が求められる。
本発明によれば、入力された画像を、画素数の異なる高品質な画像に的確に変換することができる。
以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書又は図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書又は図面に記載されていることを確認するためのものである。従って、明細書又は図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
本発明の第1の側面の画像処理装置(例えば、図8の画像処理装置101)は、第1の画素数の画素から構成されるインターレース画像(例えば、画像I1)を第1のプログレッシブ画像(例えば、画像P2)にIP変換する変換手段(例えば、図8の巡回型IP変換部111)と、前記第1のプログレッシブ画像に対して補間を行うことにより、生成目標とする画像の画素数である第2の画素数の画素から構成される第2のプログレッシブ画像(例えば、HD画像)を生成する補間手段(例えば、図8の出力位相変換部112)と、前記第2のプログレッシブ画像により求められる、その第2のプログレッシブ画像に比べて高品質な前記第2の画素数の画素から構成される、前記生成目標の画像としての第3のプログレッシブ画像の画素である注目画素を、その第2のプログレッシブ画像の特徴に応じて、クラスに分類する分類手段(例えば、図33のADRC処理部552)と、前記第2の画素数の画素から構成される複数のプログレッシブ画像を用いた学習により獲得された、前記クラスごとの予測係数を格納する格納手段(例えば、図33の予測係数メモリ555)と、前記第2のプログレッシブ画像と、前記注目画素の前記クラスの予測係数とを用いて演算することで、前記第2のプログレッシブ画像から、前記生成目標の画像としての前記第3のプログレッシブ画像を求める演算手段(例えば、図33の予測演算部557)とを備える。
前記変換手段は、前記インターレース画像を、プログレッシブ方式の中間画像(例えば、画像P1)に変換するIP変換手段(例えば、図9のIP変換部121)と、前記中間画像の画素の間隔より短い距離を最小単位とする前記インターレース画像の動きベクトル(例えば、動きベクトルV)を検出する動きベクトル検出手段(例えば、図9の動きベクトル検出部131と、前記動きベクトルの垂直方向の成分である垂直動き量(例えば、垂直動き量VY)に基づいて、前記インターレース画像に画素が存在する位置にある第1のタイプの画素(例えば、タイプAの画素)に対する第1の巡回係数(例えば、巡回係数KA)、および、前記インターレース画像に画素が存在しない位置にある第2のタイプの画素(例えば、タイプBの画素)に対する第2の巡回係数(例えば、巡回係数KB)を設定する巡回係数設定手段(例えば、図9の巡回係数設定部133)と、前記動きベクトルに基づいて、過去の前記第1のプログレッシブ画像(例えば、画像P3)に対して動き補償を施した画像である動き補償画像(例えば、画像P4)を生成する動き補償手段(例えば、図9の動き補償部134)と、前記中間画像の前記第1のタイプの画素の画素値と前記動き補償画像の対応する位置にある画素の画素値とを前記第1の巡回係数を用いて重み付け加算し、前記中間画像の前記第2のタイプの画素の画素値と前記動き補償画像の対応する位置にある画素の画素値とを前記第2の巡回係数を用いて重み付け加算した画素値からなる前記第1のプログレッシブ画像を生成する出力画像生成手段(例えば、図9の積和演算部135)とを備える。
本発明の第1の側面の画像処理方法とプログラムは、第1の画素数の画素から構成されるインターレース画像(例えば、画像I1)を第1のプログレッシブ画像(例えば、画像P2)にIP変換し(例えば、図13のステップS11)、前記第1のプログレッシブ画像(例えば、画像P2)に対して補間を行うことにより、生成目標とする画像の画素数である第2の画素数の画素から構成される第2のプログレッシブ画像(例えば、HD画像)を生成し(例えば、図13のステップS13)、前記第2のプログレッシブ画像により求められる、その第2のプログレッシブ画像に比べて高品質な前記第2の画素数の画素から構成される、前記生成目標の画像としての第3のプログレッシブ画像の画素である注目画素を、その第2のプログレッシブ画像の特徴に応じて、クラスに分類し(例えば、図36のステップS554)、前記第2の画素数の画素から構成される複数のプログレッシブ画像を用いた学習により獲得された、前記クラスごとの予測係数のうち、前記注目画素の前記クラスの予測係数と、前記第2のプログレッシブ画像とを用いて演算することで、前記第2のプログレッシブ画像から、前記生成目標の画像としての前記第3のプログレッシブ画像を求める(例えば、図36のステップS559)ステップを含む。
以下、図を参照して、本発明の実施の形態について説明する。
図8は、本発明を適用した画像変換装置101の一実施の形態を示すブロック図である。画像変換装置101は、巡回型IP変換部111、出力位相変換部112、自然画予測部113、人工画予測部114、自然画人工画判定部115、および、合成部116により構成される。また、巡回型IP変換部111は、IP変換部121および巡回型変換部122により構成される。
巡回型IP変換部111のIP変換部121および巡回型変換部122には、処理対象となるインターレース方式のSD(Standard Definition)画像が入力される。
IP変換部121は、所定の方法に基づいて、入力されたインターレース方式のSD画像(以下、入力画像とも称する)をプログレッシブ方式のSD画像(以下、中間画像とも称する)にIP変換し、IP変換したプログレッシブ方式のSD画像を巡回型変換部122に供給する。
巡回型変換部122は、入力画像と、1フレーム前に巡回型変換部122から出力されたプログレッシブ方式のSD画像(以下、出力画像とも称する)との間の動きベクトルを求める。巡回型変換部122は、入力画像の画素値と、求めた動きベクトルに基づいて、出力画像に動き補償を施した画像の画素値とを、巡回係数を用いて重み付け加算することにより、中間画像の画質を向上させる。巡回型変換部122は、中間画像をより高画質のプログレッシブ方式のSD画像である出力画像に変換し、出力画像を出力位相変換部112に供給する。なお、巡回係数は、中間画像の各画素について、変換前の入力画像において画素が存在する位置にあるか否か、動きベクトルの垂直方向の大きさ、および、動きベクトルの確からしさを表す信頼度確からしさに基づいて設定される。
出力位相変換部112は、巡回型変換部122から供給される第1の画素数のSD画像に対して、水平方向および垂直方向に補間を行うことにより、第1の画素数より多い第2の画素数のHD(High Definition)画像を生成する。出力位相変換部112は、そのHD画像を、自然画予測部113、人工画予測部114、および、自然画人工画判定部115に供給する。
自然画予測部113は、出力位相変換部112から供給されるHD画像から、そのHD画像のうちの自然画像を高品質にしたHD画像(以下、自然高品質画像と称する)を予測する。具体的には、自然画予測部113は、HD画像の特徴に応じて、そのHD画像から求められる自然高品質画像の画素である注目画素を、自然画像の特徴に適したクラスに分類する。そして、自然画予測部113は、そのクラスに対応する、自然高品質画像を予測するための予測係数と、HD画像とを用いて演算することにより、出力位相変換部112から供給されたHD画像から、自然高品質画像を予測する。自然画予測部113は、その自然高品質画像を合成部116に供給する。
ここで、自然画像とは、後述する人工画像ではない画像のことであり、自然界に存在するものをそのまま撮像することにより得られる画像である。
人工画予測部114は、自然画予測部113と同様に、出力位相変換部112から供給されるHD画像から、そのHD画像のうちの人工画像を高品質にしたHD画像(以下、人工高品質画像と称する)を予測する。具体的には、人工画予測部114は、HD画像の特徴に応じて、そのHD画像から求められる人工高品質画像の画素である注目画素を、人工画像の特徴に適したクラスに分類する。そして、人工画予測部114は、そのクラスに対応する、人工高品質画像を予測するための予測係数と、HD画像とを用いて演算することにより、出力位相変換部112から供給されたHD画像から、人工高品質画像を予測する。人工画予測部114は、その人工高品質画像を合成部116に出力する。
ここで、人工画像とは、文字や単純な図形などの、階調が少なく、エッジの位置を表す位相情報がはっきりした、すなわち、平坦部分が多い人工的な画像である。換言すれば、人工画像は、文字や単純図形等の階調があまり無く、輪郭等の位置を表す情報が支配的になっている画像である。
自然画人工画判定部115は、出力位相変換部112より供給されるHD画像の各画素について、人工画像に分類される領域、または、自然画像に分類される領域のいずれの領域に属するかを判定し、判定結果を人工画度として合成部116に出力する。すなわち、人工画度とは、人工画像と自然画像との中間に分類される領域において自然画像における人工画像の割合を0乃至1の値で示したものである。
合成部116は、自然画人工画判定部115より供給される判定結果に基づいて、自然画予測部113から供給される自然高品質画像の各画素の画素値と、人工画予測部114から供給される人工高品質画像の各画素の画素値とを人工画度に応じた割合で合成し、合成の結果得られるHD画像を出力する。
図9は、図8の巡回型IP変換部111の巡回型変換部122の機能的構成を詳細に示したブロック図である。巡回型変換部122は、動きベクトル検出部131、MCブロック差分検出部132、巡回係数設定部133、動き補償部134、積和演算部135、および、フレームメモリ136により構成される。
なお、以下、巡回型IP変換部111で処理される各画像の画素の位置を表す座標系について、水平(横)方向をx軸方向とし、垂直(縦)方向をy軸方向とする。すなわち、各画素の座標は、(x,y)で表される。また、以下、外部からIP変換部121に入力されるインターレース方式のSD画像である入力画像を画像I1とも称し、IP変換部121から出力されるプログレッシブ方式のSD画像である中間画像を画像P1とも称する。
また、一般的に、プログレッシブ画像には、IP変換前のインターレース画像において画素が存在する位置にある画素と、存在しない位置にある画素の2種類の画素がある。以下、この2種類の画素を区別する場合、前者をAタイプの画素、後者をBタイプの画素という。
図10は、IP変換前のインターレース画像およびIP変換後のプログレッシブ画像の画素の位置の関係を示す図である。図10の横軸方向は、時間を示し、縦軸方向は、画素の位置を示す。この図10の例において、白丸に囲まれた黒丸で示される画素が、Aタイプの画素であり、黒丸のみで示される画素が、Bタイプの画素である。
動きベクトル検出部131は、画像I1の各画素の動きベクトルを検出する。具体的には、動きベクトル検出部131は、1フレーム前に巡回型変換部122から出力されたプログレッシブSD画像である出力画像であって、フレームメモリ136に記憶されている画像(以下、画像P3とも称する)を、フレームメモリ136から読み出す。動きベクトル検出部131は、図25を参照して後述するように、画像I1を、所定の大きさ、すなわち、縦N×横M画素のブロックに分割し、ブロックごとに、画素以下精度で、すなわち、プログレッシブ画像における画素の間隔より短い距離を最小単位として、動きベクトルを検出する。なお、画像I1に実際に存在しないBタイプの画素に対しては、その画素が含まれるブロックの動きベクトルが適用される。
なお、以下、ブロックなど、各画像内の所定のブロックの位置を表す座標系について、画素の位置を表す座標系と区別するために、水平(横)方向をX軸方向とし、垂直(縦)方向をY軸方向とする。すなわち、各ブロックの座標は(X,Y)で表される。また、以下、座標(X,Y)のブロックの動きベクトルをV(X,Y)と表し、動きベクトルV(X,Y)の水平方向の成分である水平動き量をVX(X,Y)と表し、動きベクトルV(X,Y)の垂直方向の成分である垂直動き量をVY(X,Y)と表す。なお、以下、水平動き量および垂直動き量の大きさは、プログレッシブ画像における画素間隔を基準として表すことにする。また、以下、各ブロックの左上隅の画素を基準画素といい、基準画素の座標を基準座標という。
動きベクトル検出部131は、検出した動きベクトルV(水平動き量VXおよび垂直動き量VY)を示す情報を、MCブロック差分検出部132、巡回係数設定部133、および、動き補償部134に供給する。また、動きベクトル検出部131は、動きベクトルの検出に用いた画像I1および画像P3をMCブロック差分検出部132に供給する。
MCブロック差分検出部132は、図16および図17を参照して後述するように、画像I1のブロックごとに、各ブロックの画素値と、そのブロックに対応する画像P3のブロック、すなわち、画像I1の各ブロックを動きベクトルVで示される方向および距離だけ移動させた位置にある画像P3のブロックの画素値との差分値であるMCブロック差分値を検出する。MCブロック差分検出部132は、検出したMCブロック差分値を示す情報を巡回係数設定部133に供給する。
なお、以下、画像I1の座標(X,Y)のブロックに対応するブロック差分値を、BD(X,Y)と表す。
巡回係数設定部133は、図15などを参照して後述するように、動きベクトルV、および、MCブロック差分値BDに基づいて、Aタイプの画素に対する巡回係数KA、および、Bタイプの画素に対する巡回係数KBを設定する。なお、以下、座標(x,y)のAタイプの画素に対する巡回係数KAをKA(x,y)と表し、座標(x,y)のBタイプの画素に対する巡回係数KBをKB(x,y)と表す。巡回係数設定部133は、設定した巡回係数KAおよびKBを示す情報を積和演算部135に供給する。
動き補償部134は、フレームメモリ136から画像P3を読み出す。動き補償部134は、図15を参照して後述するように、動きベクトルVに基づいて、画像P3に対して動き補償を施した画像P4を生成する。動き補償部134は、画像P4を積和演算部135に供給する。
積和演算部135は、図17を参照して後述するように、画像P1のAタイプの画素の画素値と画像P4の対応する位置にある画素の画素値とを巡回係数KAを用いて重み付け加算し、画像P1のBタイプの画素の画素値と画像P4の対応する位置にある画素の画素値とを巡回係数KBを用いて重みづけ加算した画素値からなるプログレッシブ方式のSD画像である出力画像(以下、画像P2とも称する)を生成する。積和演算部135は、画像P2を出力位相変換部112に供給するとともに、フレームメモリ136に記憶させる。
なお、以下、画像I1および画像P1乃至P4の座標(x,y)の画素の画素値を、それぞれ、I1(x,y)およびP1(x,y)乃至P4(x,y)と表す。
図11は、動きベクトル検出部131の機能的構成を示すブロック図である。動きベクトル検出部131は、動き評価値検出部151、画素精度動きベクトル検出部152、タップ抽出部153,154、ADRC(Adaptive Dynamic Range Coding)処理部155、クラス分類部156、係数メモリ157、予測演算部158、および、画素以下精度動きベクトル検出部159により構成される。
動き評価値検出部151は、外部から入力される画像I1を取得し、フレームメモリ136から画像P3を取得する。動き評価値検出部151は、画像I1を所定の大きさのブロックに分割し、各ブロックを順次注目ブロックとする。さらに、動き評価値検出部151は、図25を参照して後述するように、画像P3の所定の範囲内の画素を、順次、注目画素とし、注目画素を基準画素とする注目ブロックと同じ大きさのブロック(以下、比較対象ブロックと称する)と注目ブロックとの対応する位置にある画素の画素値との差分をとり、その差分値の絶対値を合計した値を、注目画素に対する動き評価値として求める。動き評価値検出部151は、検出した動き評価値を示す情報を、画素精度動きベクトル検出部152、および、タップ抽出部153,154に供給する。また、動き評価値検出部151は、動きベクトルの検出に用いた画像I1および画像P3をMCブロック差分検出部132に供給する。
なお、以下、座標(x,y)の注目画素に対する動き評価値をM(x,y)と表す。
画素精度動きベクトル検出部152は、図25を参照して後述するように、動き評価値Mが最小となる画素(以下、最小評価値画素と称する)の座標と、注目ブロックの基準画素の座標とを結ぶベクトルを、注目ブロックに対する画素精度、すなわち、プログレッシブ画像における画素の間隔と等しい距離を最小単位とする動きベクトルとして検出する。画素精度動きベクトル検出部152は、検出した画素精度の動きベクトルを示す情報をタップ抽出部153,154に供給する。
タップ抽出部153は、図25を参照して後述するように、最小評価値画素と最小評価値画素に隣接する画素との間の位置、すなわち、画素以下精度の位置(以下、予測位置ともいう)における動き評価値を予測するのに用いる画素であって、最小評価値画素を含む最小評価値画素の近傍の画像P3の画素に対応する動き評価値Mを予測タップとして抽出する。タップ抽出部153は、抽出した予測タップを予測演算部158に供給する。
タップ抽出部154は、図25を参照して後述するように、最小評価値画素を、幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる画像P3のいくつかの画素に対応する動き評価値Mを、クラスタップとして抽出する。タップ抽出部154は、抽出したクラスタップをADRC処理部155に供給する。
ADRC処理部155は、クラスタップを構成する画素の動き評価値MをADRC処理し、その結果得られるADRCコードを示す情報をクラス分類部156に供給する。
なお、KビットADRCにおいては、例えば、クラスタップを構成する画素の動き評価値Mの最大値MAXと最小値MINが検出され、DR=MAX-MINを、クラスタップを構成する動き評価値Mの集合の局所的なダイナミックレンジとし、このダイナミックレンジDRに基づいて、クラスタップを構成する動き評価値MがKビットに再量子化される。即ち、クラスタップを構成する各画素の動き評価値Mから、最小値MINが減算され、その減算値がDR/2Kで除算(量子化)される。そして、以上のようにして得られる、クラスタップを構成するKビットの各画素の動き評価値Mを、所定の順番で並べたビット列が、ADRCコードとして出力される。
クラス分類部156は、ADRC処理部155からのADRCコードに基づき、最小評価値画素をクラス分類し、その結果得られるクラスに対応するクラスコードを示す情報を、係数メモリ157に供給する。
係数メモリ157は、後述する学習によってあらかじめ求められたクラスごとのタップ係数のセットを記憶している。係数メモリ157は、その記憶しているタップ係数のセットのうちの、クラス分類部156から供給されるクラスコードに対応するアドレスに記憶されているタップ係数、すなわち、クラス分類部156から供給されるクラスコードが表すクラスのタップ係数を、予測演算部158に供給する。
予測演算部158は、図25を参照して後述するように、タップ抽出部153が出力する予測タップと、係数メモリ157が出力するタップ係数とを取得し、その予測タップとタップ係数とを用いて、予測位置における動き評価値Mの真値の予測値を求める所定の予測演算を行う。これにより、予測演算部158は、予測位置における動き評価値M'の予測値を求めて、画素以下精度動きベクトル検出部159に供給する。
画素以下精度動きベクトル検出部159は、最小評価値画素および予測位置の中から動き評価値が最小となる画素または位置を検出し、検出した画素または位置の座標と、注目ブロックの基準画素の座標とを結ぶベクトルを、注目ブロックに対する画素以下精度の動きベクトルVとして検出する。画素以下精度動きベクトル検出部159は、検出した動きベクトルVを示す情報をMCブロック差分検出部132および巡回係数設定部133、および、動き補償部134に供給する。
図12は、巡回係数設定部133の機能的構成を示すブロック図である。巡回係数設定部133は、基本巡回係数設定部171、動き分散検出部172、および、巡回係数算出部173により構成される。また、巡回係数算出部173は、動き分散差し引き量算出部181、MCブロック差分差し引き量算出部182、および、減算部183−1乃至183−4により構成される。
基本巡回係数設定部171は、図18と図19を参照して後述するように、垂直動き量VYに基づいて、画像P1のAタイプの画素に対する基本巡回係数KA0、および、Bタイプの画素に対する基本巡回係数KB0を設定する。なお、以下、座標(x,y)の画素に対する基本巡回係数KA0をKA0(x,y)と表し、座標(x,y)の画素に対する基本巡回係数KB0をKB0(x,y)と表す。基本巡回係数設定部171は、基本巡回係数KA0を示す情報を減算部183−1に供給し、基本巡回係数KB0を示す情報を減算部183−3に供給する。
動き分散検出部172は、図21および図24を参照して後述するように、動きベクトル検出部131により検出された動きベクトルVの信頼度として、周囲の動きベクトルVとの間のばらつきの度合いを示す動き分散MDを検出する。なお、以下、動きベクトルV(X,Y)に対する動き分散MDを、MD(X,Y)と表す。動き分散検出部172は、動き分散MDを示す情報を動き分散差し引き量算出部181に供給する。
動き分散差し引き量算出部181は、図15を参照して後述するように、動き分散MDに基づいて、基本巡回係数KA0,KB0を補正するための補正値である動き分散差し引き量KM1を算出する。なお、以下、画像P1の座標(x,y)の画素に対する動き分散差し引き量KM1を、KM1(x,y)と表す。動き分散差し引き量算出部181は、動き分散差し引き量KM1を示す情報を減算部183−1および183−3に供給する。
MCブロック差分差し引き量算出部182は、図15を参照して後述するように、MCブロック差分値BDに基づいて、基本巡回係数KA0,KB0を補正するための補正値であるMCブロック差分差し引き量KM2を算出する。なお、以下、画像P1の座標(x,y)の画素に対する動き分散差し引き量KM2を、KM2(x,y)と表す。MCブロック差分差し引き量算出部182は、MCブロック差分差し引き量KM2を示す情報を減算部183−2および183−4に供給する。
減算部183−1は、基本巡回係数KA0から動き分散差し引き量KM1を差し引き、さらに、減算部183−2は、減算部183−1による算出値からMCブロック差分差し引き量KM2を差し引く。これにより、巡回係数KAが算出される。なお、以下、画像P1の座標(x,y)の画素に対する巡回係数KAをKA(x,y)と表す。減算部183−2は、巡回係数KAを示す情報を積和演算部135に供給する。
減算部183−3は、基本巡回係数KB0から動き分散差し引き量KM1を差し引き、さらに、減算部183−4は、減算部183−3による算出値からMCブロック差分差し引き量KM2を差し引く。これにより、巡回係数KBが算出される。なお、以下、画像P1の座標(x,y)の画素に対する巡回係数KBをKB(x,y)と表す。減算部183−4は、巡回係数KBを示す情報を積和演算部135に供給する。
次に、図13のフローチャートを参照して、画像変換装置101により実行される画像変換処理を説明する。なお、この処理は、例えば、外部から画像I1の入力が開始されたとき開始される。
ステップS11において、IP変換部121は、IP変換処理を行う。具体的には、IP変換部121は、外部から入力されるインターレース方式の画像I1をIP変換することにより、プログレッシブ方式の画像P1を生成する。ここで、図14を参照して、IP変換部121が行うIP変換処理の一例である、動き適応型と呼ばれる方法を用いたIP変換処理について説明する。
図14は、インターレース画像における垂直方向の画素の並びを示す図である。図14の横軸方向は時間を示し、縦軸方向は画素の位置を示す。また、図内の白丸は画素を示す。なお、図内の左端の画素の列はn−1番目のフィールドに属し、真ん中の画素の列はn番目のフィールドに属し、右端の画素の列はn+1番目のフィールドに属するものとする。
以下、n番目のフィールドのインターレース画像をプログレッシブ画像に変換する場合に、位置xに補間する画素(Bタイプの画素)の画素値を算出する例について説明する。なお、n−1番目のフィールドにおいて、位置xに対応する位置にある画素の画素値をa、n+1番目のフィールドにおいて、位置xに対応する位置にある画素の画素値をbとする。また、n番目のフィールドにおいて、位置xの上に隣接する画素の画素値をc、下に隣接する画素の画素値をdとする。
例えば、|a−b|≦|c−d|である場合、位置xは画像の動きが少ない静止領域に含まれると見なされ、位置xの画素値は、前後のフィールドにおいて位置xに対応する位置にある画素の画素値の平均値である(a+b)/2とされる。一方、|a−b|>|c−d|である場合、位置xは画像の動きが大きい動作領域に含まれると見なされ、位置xの画素値は、上下方向に隣接する画素値の平均値である(c+d)/2とされる。なお、他の位置のBタイプの画素についても、同様の方法により画素値が求められる。
なお、IP変換部121が行うIP変換の方法は、特定の方法に限定されるものではなく、例えば、クラス分類適応処理を用いた方法を用いるようにしてもよい。なお、クラス分類適応処理を用いたIP変換の方法については、例えば、本件出願人が先に出願した特開2000−50213号公報などに、その詳細が開示されている。
また、画像I1をそのままIP変換するのではなく、IP変換する前に、ノイズ除去などの画質を向上させる画像処理を画像I1に施すようにしてもよい。
ただし、ここで行われるのはあくまでIP変換であり、図10や図14に示されるように、奇数フィールドの画素に対応する位置の画素を偶数フィールドに作成するとともに、逆に、偶数フィールドの画素に対応する位置の画素を奇数フィールドに作成するものであり、その限りにおいて各フィールドの画素数は増加するが、画素数はそれより増加することはない。
IP変換部121は、生成した画像P1を順に積和演算部135に供給する。
ステップS12において、巡回型変換部122は、巡回型変換処理を行う。巡回型変換処理の詳細は、図15を参照して後述するが、この処理により、画像P1がより高画質の画像P2に変換され、画像P2が出力位相変換部112に供給される。
ステップS13において、出力位相変換部112は、出力位相変換処理を行う。出力位相変換処理の詳細は、図29や図32を参照して後述するが、この処理により、SD画像である画像P2がHD画像に変換される。すなわち、ここで、生成目標とするHD画像の画素数と同じ画素数の画像とされる。そのHD画像が、自然画予測部113、人工画予測部114、および、自然画人工画判定部115に供給される。
ステップS14において、自然画予測部113は、自然画予測処理を行う。自然画予測処理の詳細は、図36を参照して後述するが、この処理により、HD画像から自然高品質画像が予測され、その自然高品質画像が合成部116に供給される。
ステップS15において、人工画予測部114は、人工画予測処理を行う。人工画予測処理の詳細は、図45を参照して後述するが、この処理により、HD画像から人工高品質画像が予測され、その人工高品質画像が合成部116に出力される。
ステップS16において、自然画人工画判定部115は、自然画人工画判定処理を行う。具体的には、自然画人工画判定部115は、出力位相変換部112より供給されるHD画像の各画素について、人工画像に分類される領域、または、自然画像に分類される領域のいずれの領域に属するかを判定し、判定結果を人工画度として合成部116に出力する。
ステップS17において、合成部116は、画像を合成する。具体的には、合成部116は、自然画人工画判定部115より供給される人工画度に基づいて、自然画予測部113から供給される自然高品質画像の各画素の画素値と、人工画予測部114から供給される人工高品質画像の各画素の画素値とを人工画度に応じた割合で合成する。合成部116は、合成した画像を後段の装置に出力する。
なお、複数の画像の画像変換を連続して行う場合、上述したステップS11乃至S17の処理が繰り返し実行される。
次に、図15を参照して、図13のステップS12の巡回型変換処理の詳細を説明する。
ステップS21において、動きベクトル検出部131は、動きベクトル検出処理を行う。動きベクトル検出処理の詳細は、図25を参照して後述するが、この処理により、画像I1の各画素の画素以下精度の動きベクトルVが検出される。また、検出された動きベクトルVの水平動き量VXおよび垂直動き量VYを示す情報が、動きベクトル検出部131から、MCブロック差分検出部132および巡回係数設定部133、および、動き補償部134に供給される。また、動きベクトルVの検出に用いた画像I1および画像P3が、動きベクトル検出部131からMCブロック差分検出部132に供給される。
ステップS22において、MCブロック差分検出部132は、MCブロック差分値を検出する。ここで、図16および図17を参照して、MCブロック差分値の検出方法を説明する。
まず、図16に示されるように、画像I1のブロックB0に対応する位置にある画像P3のブロックをB0'とする。また、ブロックB0の動きベクトルVで示される方向および距離だけブロックB0'を移動させたブロックをブロックB1とする。
動きベクトルVは画素以下精度であるため、水平動き量VXまたは垂直動き量VYに小数部分が存在する場合、ブロックB1の画素の位置は、画像P3の実際の画素の位置と一致しない。ここで、図17を参照して、ブロックB1が、画像P3における実際の画素の位置と一致しない場合に、ブロックB1の各画素の画素値を算出する方法を説明する。
図17の黒丸で示される画素zは、ブロックB1内の1つの画素であって、画像P3に実在しない位置にある画素である。白丸で示される画素a乃至dは、画素zに隣接する(すなわち、最も近い)画像P3に実在する画素である。画素a乃至dおよび画素zの画素値を、それぞれav乃至dvおよびzvとし、画素zの左斜め上にある画素aと画素zと間のx軸方向の距離をxd、y軸方向の距離をydとした場合、画素zの画素値zvは、以下の式(1)に基づいて算出される。
zv=(1−yd)×((1−xd)×av+xd×bv)+yd×((1−xd)×cv+xd×dv) ・・・(1)
なお、ブロックB1の画素の位置が、画像P3に実在する画素の位置と一致する場合、そのまま画像P3の画素値がブロックB1の各画素の画素値とされる。
MCブロック差分検出部132は、ブロックB1の各画素の画素値を算出した後、以下の式(2)に基づいて、MCブロック差分値BDを算出する。
Figure 2007251688
なお、B0(i,j)は、ブロックB0の左上隅の画素である基準画素を原点(0,0)とする位置(i,j)にあるブロックB0内の画素の画素値を示し、B1(i,j)は、ブロックB1の基準画素を原点(0,0)とする位置(i,j)にあるブロックB1内の画素の画素値を示す。すなわち、MCブロック差分値BDは、ブロックB0とブロックB1の対応する位置にある画素の画素値の差分をとり、その差分値の絶対値の合計値となる。
従って、現在のフレームと1つ前のフレームの対応するブロック内の画像の変化が大きいほど、MCブロック差分値BDは大きくなる。すなわち、MCブロック差分値BDが大きいブロックは、被写体が変形もしくは複雑な動きをしていたり、小さな被写体が複数存在していたり、被写体のエッジ部分を含んでいたりするなどの原因により、画像の動きが複雑な領域のブロックである可能性が高い。従って、そのブロックについて検出された動きベクトルVは正確に検出されていない可能性が高く、その動きベクトルVの信頼度は低いと言える。
MCブロック差分検出部132は、画像I1の各ブロックについて、MCブロック差分値BDを検出し、検出したMCブロック差分値BDを示す情報をMCブロック差分差し引き量算出部182に供給する。
ステップS23において、基本巡回係数設定部171は、基本巡回係数を設定する。具体的には、基本巡回係数設定部171は、画像P1のAタイプの画素に対する基本巡回係数KA0を、その画素が含まれるブロックの垂直動き量VY、および、図18に示されるグラフに基づいて設定し、Bタイプの画素に対する基本巡回係数KB0を、その画素が含まれるブロックの垂直動き量VX、および、図19に示されるグラフに基づいて設定する。
ここで、図18および図19に示されるグラフについて説明する。図18は、垂直動き量VYと基本巡回係数KA0の関係を示すグラフであり、図19は、垂直動き量VYと基本巡回係数KB0の関係を示すグラフである。
ところで、画像の垂直折り返し歪みは、画素以下精度の垂直動き量に応じて変化する性質がある。具体的には、各画素の垂直動き量の絶対値が、画素間隔の奇数倍に近い領域ほど、垂直折り返し歪みは大きくなり、0または画素間隔の偶数倍に近い領域ほど、垂直折り返し歪みは小さくなる。例えば、図20に示されるn番目のフレームの画素Paの垂直動き量VYが、図内のVY1,VY3,VY5,VY7のように、画素間隔の奇数倍に近いほど、垂直折り返し歪みは大きくなり、VY2,VY4,VY6のように、0.0または画素間隔の偶数倍に近いほど、垂直折り返し歪みは小さくなる。
なお、後述するように、巡回係数の値が大きいほど、垂直折り返し歪みを抑制する効果が高くなる一方、画像のボケが発生しやすくなり、値が小さいほど、垂直折り返し歪みを抑制する効果が低くなる一方、画像のボケの発生が抑制される。従って、図18および図19のグラフに示されるように、垂直動き量VYの絶対値が0または偶数に近いほど、すなわち、垂直方向の画素間隔の偶数倍に近いほど、画像のボケを抑制できるように、基本巡回係数KA0,KB0が小さい値に設定され、垂直動き量VYの絶対値が奇数に近いほど、すなわち、垂直方向の画素の間隔の奇数倍に近いほど、垂直折り返し歪みが抑制されるように、基本巡回係数KA0,KB0が大きい値に設定される。
なお、垂直動き量VYの絶対値が0または偶数の場合、垂直折り返し歪みは発生しないが、図18および図19のグラフのように、垂直折り返し歪み以外のランダムなノイズを除去できるように、基本巡回係数KA0,KB0を0以外の適当な値に設定するようにしてもよい。
また、Bタイプの画素は、変換前の画像I1に元々なかった画素であり、少々のボケは許容される。従って、折り返し歪みおよびランダムノイズがより抑制されるように、同じ値の垂直動き量VYに対して、KB0の方がKA0よりも大きい値に設定される。
このように、画素のタイプおよび垂直動き量に応じて、基本巡回係数KA0,KB0を設定することにより、画像P1の解像度を良好に保ちつつ、すなわち、画像をぼかさずに、垂直折り返し歪みやノイズを除去することが可能になる。
基本巡回係数設定部171は、基本巡回係数KA0を示す情報を減算部183−1に供給し、基本巡回係数KB0を示す情報を減算部183−3に供給する。
ステップS24において、動き分散検出部172は、動き分散を検出する。ここで、図21および図22を参照して、動き分散について説明する。
図21および図22は、動きベクトルの分布の例を示す図である。図21に示されるように、斜線で示されるブロックの動きベクトルV0aが、周辺の動きベクトルV1a乃至V8aとほぼ同様である場合、すなわち、動きベクトルV0aと周辺のブロックの動きベクトルV1a乃至V8aとの類似性が高い場合、動きベクトルV0aは正確に求められている可能性が高く、動きベクトルV0aの信頼度は高いと言える。
一方、図22に示されるように、斜線で示されるブロックの動きベクトルV0bおよび周辺のブロックの動きベクトルV1b乃至V8bの大きさや向きが大きく異なる場合、すなわち、動きベクトルV0bと周辺の動きベクトルV1b乃至V8bとの類似性が低い場合、動きベクトルV0bは正確に求められていない可能性が高く、動きベクトルV0bの信頼度は低いと言える。
そこで、動き分散検出部172は、動きベクトル検出部131により検出された動きベクトルVの信頼度として、各動きベクトルVについて、周辺の動きベクトルVとのばらつきの度合いを示す動き分散MD0を検出する。
具体的には、例えば、図23の斜線で示される座標(X,Y)のブロックBpの動きベクトルV(X,Y)に対する動き分散MD0(X,Y)を、ブロックBpを中心とする縦Nb0×横Mb0ブロック(画素数で表現した場合、縦Np0×横Mp0画素)の領域D0を対象に、以下の式(3)に基づいて算出する。なお、領域D0の左上隅の画素の座標を(x0,y0)とする。
Figure 2007251688
なお、vx0(x,y)は、座標(x,y)の画素が含まれるブロックの水平動き量を示し、vy0(x,y)は、座標(x,y)の画素が含まれるブロックの垂直動き量を示す。
すなわち、動き分散MD0は、ブロックBpの動きベクトルVと、領域D0内の各画素の動きベクトルVとの間の距離の2乗の平均値を表す。
また、動き分散検出部172は、動きベクトルVの信頼度として、各動きベクトルVについて、その動きベクトルVに対応する画素(またはブロック)を、動きベクトルVで示される方向および距離だけ移動した位置の周辺における1フレーム前の動きベクトルVとのばらつきを示す動き分散MD1を検出する。
具体的には、例えば、まず、図23のブロックBpに対応する位置にある1フレーム前の画像のブロックを、図24のブロックBp'とする。また、ブロックBpの動きベクトルV(X,Y)の水平動き量VX(X,Y)および垂直動き量VY(X,Y)の小数点以下を四捨五入した値により示される方向および距離だけブロックBp'を移動させたブロックをブロックBmとする。動き分散検出部172は、ブロックBpの動きベクトルV(X,Y)に対する動き分散MD1(X,Y)を、ブロックBmを中心とする縦Nb1×横Mb1ブロック(画素数で表現した場合、縦Np1×横Mp1画素)の領域D1を対象に、以下の式(4)に基づいて算出する。なお、領域D1の左上隅の画素の座標を(x1,y1)とする。
Figure 2007251688
なお、vx1(x,y)は、1フレーム前の座標(x,y)の画素が含まれるブロックの水平動き量を示し、vy1(x,y)は、1フレーム前の座標(x,y)の画素が含まれるブロックの垂直動き量を示す。
すなわち、動き分散MD1は、ブロックBpの動きベクトルVと、領域D1内の各画素の動きベクトルVとの間の距離の2乗の平均値を表す。
さらに、動き分散検出部172は、以下の式(5)に基づいて、動き分散MD(X,Y)を算出する。
MD(X,Y)=MD1(X,Y)+MD2(X,Y) ・・・(5)
従って、対象となる動きベクトルVと周囲の動きベクトルVとの間のばらつきが大きいほど、動き分散MD(X,Y)は大きくなる。すなわち、その動きベクトルV(X,Y)に対応する画素およびその近傍は、被写体が変形もしくは複雑な動きをしていたり、小さな被写体が複数存在していたりするなどの原因により、画像の動きが複雑な領域である可能性が高い。従って、その動きベクトルVは正確に検出されていない可能性が高く、その動きベクトルV(X,Y)の信頼度は低いと言える。
動き分散検出部172は、上述した方法に従って、各動きベクトルVに対する動き分散MDを算出し、動き分散MDを示す情報を動き分散差し引き量算出部181に供給する。
ステップS25において、動き分散差し引き量算出部181は、動き分散差し引き量を算出する。具体的には、動き分散差し引き量算出部181は、画像P1の各画素に対する動き分散差し引き量KM1を、その画素が含まれるブロックの動き分散MDを用いて、以下の式(6)に基づいて算出する。
KM1(x,y)= a1×MD(X,Y)+b1 ・・・(6)
なお、a1およびb1は所定の値の定数である。ただし、定数a1は正の値とされる。また、式(6)の右辺の値が0より小さくなる場合、KM1(x,y)は0に補正される。
動き分散差し引き量算出部181は、算出した動き分散差し引き量KM1を示す情報を減算部183−1および183−3に供給する。
ステップS26において、MCブロック差分差し引き量算出部182は、MCブロック差分差し引き量を求める。具体的には、MCブロック差分差し引き量算出部182は、画像P1の各画素に対するMCブロック差分差し引き量KM2を、その画素が含まれるブロックのMCブロック差分値BDを用いて、以下の式(7)に基づいて算出する。
KM2(x,y)= a2×BD(X,Y)+b2 ・・・(7)
なお、a2,b2は所定の定数である。ただし、定数a2は正の値とされる。また、式(7)の右辺の値が0より小さくなった場合、KM2(x,y)は0に補正される。
ステップS27において、減算部183−1乃至183−4は、巡回係数を算出する。具体的には、減算部183−1は、基本巡回係数KA0から動き分散差し引き量KM1を引いた値を減算部183−2に供給する。減算部183−2は、減算部183−1から供給される値からMCブロック差分差し引き量KM2を引いた値を巡回係数KAとして、積和演算部135に供給する。すなわち、画像P1の座標(x,y)にあるAタイプの画素に対する巡回係数KA(x,y)は、以下の式(8)に基づいて算出される。
KA(x,y)=KA0(x,y)−KM1(x,y)−KM2(x,y) ・・・(8)
また、減算部183−3は、基本巡回係数KB0から動き分散差し引き量KM1を引いた値を減算部183−4に供給する。減算部183−4は、減算部183−3から供給される値からMCブロック差分差し引き量KM2を引いた値を巡回係数KBとして、積和演算部135に供給する。すなわち、画像P1の座標(x,y)にあるBタイプの画素に対する巡回係数KB(x,y)は、以下の式(9)に基づいて算出される。
KB(x,y)=KB0(x,y)−KM1(x,y)−KM2(x,y) ・・・(9)
すなわち、巡回係数KA(x,y)およびKB(x,y)は、動き分散差し引き量KM1(x,y)またはMCブロック差分差し引き量KM2(x,y)が大きいほど、すなわち、動き分散MD(x,y)またはMCブロック差分値BD(x,y)が大きいほど、小さくなるように補正される。
ステップS28において、動き補償部134は、1フレーム前の出力画像に対して動き補償を施す。具体的には、動き補償部134は、フレームメモリ136から1フレーム前の画像P3を読み出す。動き補償部134は、動きベクトルVを用いて、画像P3に対して動き補償を施した画像P4を生成する。
なお、画像P4の各画素の画素値は、その画素に対応する位置にある画像P1の画素の動きベクトルVで示される方向および距離だけ移動した位置にある画像P3の画素の画素値とされる。ただし、動きベクトルVの水平動き量VXまたは垂直動き量VYに小数部分が存在し、画像P3の動きベクトルVだけ移動した位置に実際の画素が存在しない場合、図17を参照して上述した方法と同様の方法により、画像P4の画素値が算出される。
動き補償部134は、画像P4の画素値P4(x,y)を順に積和演算部135に供給する。
ステップS29において、積和演算部135は、画像を合成し、巡回型変換処理は終了する。具体的には、積和演算部135は、画像P1と画像P4の対応する位置にある画素の画素値を、巡回係数KAまたはKBを用いて、重み付け加算する。すなわち、積和演算部135は、Aタイプの画素については、巡回係数KAを用いて、以下の式(10)に基づいて、画像P2の画素値P2(x,y)を算出し、Bタイプの画素については、巡回係数KBを用いて、以下の式(11)に基づいて、画像P2の画素値P2(x,y)を算出する。
P2(x,y)=(1−KA(x,y))×P1(x,y)+KA(x,y)×P4(x,y) ・・・(10)
P2(x,y)=(1−KB(x,y))×P1(x,y)+KB(x,y)×P4(x,y) ・・・(11)
一般的に、巡回係数KA(x,y)およびKB(x,y)の値が大きくなるほど、画像P2における画像P4の成分の占める割合が大きくなるため、画像P2における、垂直折り返し歪みの発生の抑制効果が高くなる一方、画像のボケが発生しやすくなり、巡回係数KA(x,y)およびKB(x,y)の値が小さくなるほど、画像P2において画像P4の成分の占める割合が小さくなるため、画像P2における垂直折り返し歪みの発生の抑制効果が低くなる一方、画像のボケの発生は抑制される。
本発明の実施の形態では、巡回係数KA(x,y)およびKB(x,y)は、上述したように、動き分散差し引き量KM1(x,y)またはMCブロック差分差し引き量KM2(x,y)が大きいほど、すなわち、動き分散MD(x,y)またはMCブロック差分値BD(x,y)が大きいほど小さくなる。
すなわち、座標(x,y)の画素の動きベクトルV(X,Y)の信頼度が低く、重み付け加算する画像P1の画素と画像P4の画素との相関が低い可能性が高い場合、または、その画素が、折り返し歪みまたはランダムノイズが目立ちにくい、画像の動きが複雑な領域に含まれる可能性が高い場合、画素値P2(x,y)における画素値P1(x,y)の成分が占める割合が大きくなる。一方、座標(x,y)の画素の動きベクトルV(X,Y)の信頼度が高く、重み付け加算する画像P1の画素と画像P4の画素との相関が高い可能性が高い場合、または、その画素が、折り返し歪みまたはランダムノイズが目立ちやすい、広い範囲にわたって画像の動きが少ない領域に含まれる可能性が高い場合、画素値P2(x,y)における画素値P1(x,y)の成分が占める割合が大きくなる。
また、垂直動き量VY(X,Y)の絶対値が奇数に近いほど、すなわち、垂直折り返し歪みが大きいほど、巡回係数KA(x,y)およびKB(x,y)は大きくなり、画素値P2(x,y)における画素値P4(x,y)の成分が占める割合が大きくなる。一方、垂直動き量VY(X,Y)の絶対値が0または偶数に近いほど、すなわち、垂直折り返し歪みが小さいほど、巡回係数KA(x,y)およびKB(x,y)は小さくなり、画素値P2(x,y)における画素値P1(x,y)の成分が占める割合が大きくなる。
さらに、同じ垂直動き量VYに対して、Bタイプの画素に対する基本巡回係数KB0の方がAタイプの画素に対する基本巡回係数KA0より大きな値に設定され、かつ、動き分散差し引き量KM1およびMCブロック差し引き量KM2は画素のタイプの違いにより値は変わらないので、同様の画像の領域においては、巡回係数KB(x,y)の方がKA(x,y)より大きくなり、画像P2のBタイプの画素の方が、Aタイプの画素より、画素値P2(x,y)における画素値P4(x,y)の成分が占める割合が大きくなる。
従って、画像P2において、垂直折り返し歪みおよびランダムノイズが抑制されるとともに、画像のボケが抑制され、解像度の高い画質を得ることができる。
積和演算部135は、生成した画像P2を出力位相変換部112に供給するとともに、フレームメモリ136に記憶させる。
次に、図25のフローチャートを参照して、図15のステップS21の動きベクトル検出処理の詳細を説明する。
ステップS41において、動き評価値検出部151は、1フレーム前の画像を取得する。具体的には、動き評価値検出部151は、1フレーム前の出力画像である画像P3を、フレームメモリ136から読み出す。
ステップS42において、動き評価値検出部151は、画素位置の動き評価値を算出する。具体的には、動き評価値検出部151は、画像I1内のブロックのうち、まだ動きベクトルを検出していないブロックを1つ選択して、注目ブロックとする。動き評価値検出部151は、画像P3の所定の範囲内の画素を、順次、注目画素とし、各注目画素における動き評価値M(x,y)を、以下の式(12)により求める。
Figure 2007251688
なお、式(12)において、注目画素の座標を(x,y)とし、注目ブロックの基準画素(左上隅)の座標を(xb,yb)とする。
すなわち、動き評価値Mは、注目画素を基準画素とする比較対象ブロックと注目ブロックとの対応する位置にある画素の画素値の差分をとり、その差分値の絶対値を合計した値であり、動き評価値Mが小さいほど、比較対象ブロック内の画像は、より注目ブロック内の画像に近いと言える。
動き評価値検出部151は、検出した各画素の動き評価値Mを示す情報を画素精度動きベクトル検出部152、および、タップ抽出部153,154に供給する。
ステップS43において、画素精度動きベクトル検出部152は、画素精度の動きベクトルを検出する。具体的には、画素精度動きベクトル検出部152は、動き評価値Mが最小となる最小評価値画素を検出する。画素精度動きベクトル検出部152は、最小評価値画素の座標と注目ブロックの基準画素の座標とを結ぶベクトルを、注目ブロックの画素精度の動きベクトルとして検出する。画素精度動きベクトル検出部152は、検出した画素精度の動きベクトルを示す情報をタップ抽出部153,154に供給する。
ステップS44において、タップ抽出部153は、予測タップを抽出する。具体的には、タップ抽出部153は、最小評価値画素を含む最小評価値画素の近傍の画像P3の画素に対応する動き評価値Mを予測タップとして抽出する。
図26は、画像P3の一部を示す図である。なお、図26において、最小評価値画素を画素p0とし、画素p0乃至p24に対応する動き評価値を動き評価値M0乃至M24とする。例えば、タップ抽出部153は、最小評価値画素である画素p0、画素p0の外周に隣接する画素p1乃至p8、および、画素p1乃至p8の外周に隣接する画素p9乃至p24に対応する動き評価値M0乃至M24を、予測タップとして抽出する。タップ抽出部153は、抽出した予測タップを予測演算部158に供給する。
ステップS45において、タップ抽出部154は、クラスタップを抽出する。例えば、タップ抽出部154は、図26に示される例において、最小評価値画素である画素p0および画素p0に隣接する画素p1乃至p8に対応する動き評価値M0乃至M8を、クラスタップとして抽出する。タップ抽出部154は、抽出したクラスタップをADRC処理部155に供給する。
ステップS46において、ADRC処理部155は、ADRC処理を行う。具体的には、ADRC処理部155は、クラスタップを構成する画素の動き評価値MをADRC処理し、その結果得られるADRCコードを示す情報をクラス分類部156に供給する。
ステップS47において、クラス分類部156は、クラス分類を行う。具体的には、クラス分類部156は、ADRC処理部155からのADRCコードに基づき、最小評価値画素をクラス分類し、その結果得られるクラスに対応するクラスコードを示す情報を、係数メモリ157に供給する。
ステップS48において、係数メモリ157は、タップ係数を供給する。具体的には、係数メモリ157は、内部に記憶しているタップ係数のセットのうち、最小評価値画素のクラスコードに対応するタップ係数を取得する。係数メモリ157は、取得したタップ係数を予測演算部158に供給する。
ステップS49において、予測演算部158は、予測演算を行う。具体的には、例えば、図26に示される例において、画素p0と画素p1乃至p8とを結ぶ直線上の位置であって、ちょうど中間の位置p1'乃至p8'を予測位置とした場合、予測演算部158は、以下の式(13)に基づいて、位置p1'乃至p8'における動き評価値M1'乃至M8'を算出する。
Figure 2007251688
ただし、m=1乃至8である。
なお、Wmn(n=0乃至24)は、位置Pm'(m=1乃至8)の動き評価値Mm'(m=1乃至8)を算出するために用いるタップ係数である。
予測演算部158は、各予測位置における動き評価値Mm'を、画素以下精度動きベクトル検出部159に供給する。
ステップS50において、画素以下精度動きベクトル検出部159は、画素以下精度の動きベクトルを検出する。具体的には、例えば、図26に示される例の場合、画素以下精度動きベクトル検出部159は、画素p0および位置p1'乃至p8'の動き評価値のうち、最小となるものを検出する。画素以下精度動きベクトル検出部159は、動き評価値が最小の画素または位置の座標と、注目ブロックの基準画素の座標とを結ぶベクトルを、注目ブロックに対する画素以下精度の動きベクトルVとして検出する。すなわち、この例においては、画素の間隔の2分の1の精度で動きベクトルが検出される。
なお、画素間に設定する予測位置の数を増やすことにより、より高い精度で、すなわち、より小さい単位で動きベクトルを検出することが可能となる。
画素以下精度動きベクトル検出部159は、検出した動きベクトルVを示す情報をMCブロック差分検出部132、巡回係数設定部133、および、動き補償部134に供給する。
ステップS51において、動き評価値検出部151は、動きベクトルを全て検出したかを判定する。まだ動きベクトルを検出していないブロックが残っている場合、動き評価値検出部151は、動きベクトルをまだ全て検出していないと判定し、処理はステップS42に戻る。その後、ステップS51において、動きベクトルを全て検出したと判定されるまで、ステップS42乃至S51の処理が繰り返し実行される。
ステップS51において、動きベクトルが全て検出されたと判定された場合、処理はステップS52に進む。
ステップS52において、動き評価値検出部151は、動きベクトルの検出に用いた画像を供給し、画素以下精度動きベクトル検出処理は終了する。具体的には、動き評価値検出部151は、動きベクトルの検出に用いた画像I1および画像P3をMCブロック差分検出部132に供給する。
次に、係数メモリ157に記憶されるタップ係数の学習について説明する。
まず、より一般化した例に基づいて、クラス分類適応処理におけるタップ係数の学習について説明する。具体的には、HD画像を構成する画素(以下、適宜、HD画素という)の画素値yを、SD画像を構成する画素(以下、適宜、SD画素という)から、HD画素を予測するための予測タップとして抽出される複数のSD画素と、タップ係数とを用いて、次の線形1次式による線形結合によって求める線形1次結合モデルの例に基づいて、タップ係数の学習について説明する。
Figure 2007251688
但し、式(14)において、xnは、HD画素yについての予測タップを構成する、n番目のSD画像データの画素の画素値を表し、Wnは、n番目のSD画素の画素値と乗算されるn番目のタップ係数を表す。なお、式(14)では、予測タップが、N個のSD画素x1,x2,・・・,xNで構成されるものとしてある。
いま、第kサンプルのHD画素の画素値の真値をykと表すとともに、式(14)によって得られるその真値ykの予測値をyk’と表すと、その予測誤差ekは、次式で表される。
Figure 2007251688
式(15)の予測値yk’は、式(14)にしたがって求められるため、式(15)のyk’を、式(14)にしたがって置き換えると、次式が得られる。
Figure 2007251688
但し、式(16)において、xn,kは、第kサンプルのHD画素についての予測タップを構成するn番目のSD画素を表す。
式(16)の予測誤差ekを0とするタップ係数Wnが、HD画素を予測するのに最適なものとなるが、すべてのHD画素について、そのようなタップ係数Wnを求めることは、一般には困難である。
そこで、タップ係数Wnが最適なものであることを表す規範として、例えば、最小自乗法を採用することとすると、最適なタップ係数Wnは、統計的な誤差としての、例えば、次式で表される自乗誤差の総和Eを最小にすることで求めることができる。
Figure 2007251688
但し、式(17)において、Kは、HD画素ykと、そのHD画素ykについての予測タップを構成するSD画素x1,k,x2,k,・・・,xN,kとのセットのサンプル数を表す。
式(17)の自乗誤差の総和Eを極小にするタップ係数Wnは、その総和Eをタップ係数Wnで偏微分したものを0とするものであり、従って、次式を満たす必要がある。
Figure 2007251688
そこで、上述の式(18)をタップ係数Wnで偏微分すると、次式が得られる。
Figure 2007251688
式(18)と式(19)から、次式が得られる。
Figure 2007251688
式(20)のekに、式(16)を代入することにより、式(20)は、式(21)に示す正規方程式で表すことができる。
Figure 2007251688
式(21)の正規方程式は、HD画素ykとSD画素xn,kのセットを、ある程度の数だけ用意することで、求めるべきタップ係数Wnの数と同じ数だけたてることができ、従って、式(21)を解くことで、最適なタップ係数Wnを求めることができる。なお、式(21)を解くにあたっては、例えば、掃き出し法(Gauss-Jordanの消去法)などを採用することが可能である。但し、式(21)を解くには、式(21)において、タップ係数Wnにかかる左辺の行列が正則である必要がある。
以上のように、多数のHD画素y1,y2,・・・,yKを、タップ係数の学習の教師となる教師データとするとともに、各HD画素ykについての予測タップを構成するSD画素x1,k,x2,k,・・・,xN,kを、タップ係数の学習の生徒となる生徒データとして、式(21)を解くことにより、最適なタップ係数Wnを求めることができる。
ここで、教師データyとして、予測位置にも画素が存在する、画像P3より画素密度が高い画像の各画素について検出した動き評価値Mからなる画像(以下、動き評価教師画像と称する)を採用し、生徒データxとして、画像P3と同じ画素密度となるように、動き評価教師画像から画素を間引いた画像を採用することにより、式(13)で用いられるタップ係数を求めることができる。
なお、クラス分類適応処理を用いた画素以下精度の動きベクトルを検出する方法については、例えば、本件出願人が先に出願した特開平9−187013号公報などに、その詳細が開示されている。
以上のようにして、インターレース方式の画像を、より良好な画質のプログレッシブ方式の画像に変換することができる。
また、例えば、巡回型IP変換部111からは、垂直折り返し歪みやノイズが取り除かれた画像が出力されるため、後段の画像処理装置において、より良好な画質を得ることができる。例えば、本件出願人が先に出願した特開2002−218413号公報に記載されている、クラス分類適応処理を用いて画質を複数の軸で自由に調整する処理において、より強く解像度を上げるように調整することが可能となり、より良好な画質を得ることができる。
なお、以上の説明では、画像I1の動きベクトルVを検出する対象となる画像を1フレーム前の出力画像である画像P3とする例について説明したが、例えば、画像P3の代わりに、1フィールド前の入力画像である画像I2または2フィールド前の入力画像である画像I3を用いるようにしてもよい。
なお、画素以下精度の動きベクトルの検出方法は、上述した方法に限定されるものではなく、他の方法を用いるようにしてもよい。
また、以上の説明では、SD画像をIP変換処理する例について説明したが、もちろん、巡回型変換部122は、HD画像など高解像度の画像のIP変換処理を行うことも可能である。
図27は、図8の出力位相変換部112の第1の実施の形態の詳細構成例を示すブロック図である。
図27の出力位相変換部112は、垂直補間部501と水平補間部502により構成され、巡回型変換部122から供給される、プログレッシブ方式のSD画像である画像P2を、プログレッシブ方式のHD画像に変換する。
垂直補間部501は、巡回型変換部122から供給されるSD画像が変換されることにより得られるHD画像を構成する画素を、順次、変換注目画素とし、その変換注目画素を求めるために用いるSD画像を構成する画素の幾つかを、変換タップとして抽出する。垂直補間部501は、変換タップを用いて、SD画像の垂直方向の位相をシフトするための演算(以下、垂直位相シフト演算と称する)を行う。垂直補間部501は、その垂直位相シフト演算の結果得られる値を、水平補間部502に供給する。
水平補間部502は、垂直補間部501から供給される値の、水平方向の位相をシフトするための演算(以下、水平位相シフト演算と称する)を行う。水平補間部502は、その水平位相シフト演算の結果得られる値を、注目変換画素の画素値、即ちHD画像の画素値として、図8の自然画予測部113と人工画予測部114、並びに自然画人工画判定部115に供給する。
次に、図28を参照して、出力位相変換部112における垂直位相シフト演算と水平位相シフト演算について説明する。
図28では、変換注目画素Bを囲む、補間前のSD画像の4個の画素A11,A12,A22,A21と、さらに、それらを囲む12個の画素A00,A01,A02,A03,A13,A23,A33,A32,A31,A30,A20,A10の、垂直方向と水平方向に4個ずつ並ぶ計16個の画素から、変換タップが構成される。
なお、画素Ai,j(i=0,1,2,3のいずれか、j=0,1,2,3のいずれか)のiは、変換タップを構成する画素のうちの、画素Ai,jの水平方向の順番を表し、jは、変換タップを構成する画素のうちの、画素Ai,jの垂直方向の順番を表す。ここで、水平方向の順番は、左から順に付与されるものとし、垂直方向の順番は、上から順に付与されるものとする。
また、変換注目画素Bは、画素A1,1から水平方向に距離dhだけ離れ、垂直方向に距離dvだけ離れた位置にあるものとし、隣接する画素Ai,jどうしの水平方向および垂直方向の距離は1であるものとする。
ここで、変換タップを構成する画素Ai,jの画素値を画素値ai,jとすると、垂直補間部501は、その画素値ai,j、および距離dvを用いて、以下の式(22)にしたがう垂直位相シフト演算を行う。
Figure 2007251688
なお、式(22)において、値bxiは、垂直方向の位置が、変換注目画素Bの垂直方向の位置と同一であり、水平方向の位置が、画素Ai,jの位置と同一の位置にあると仮定した画素Ciの画素値である。また、c(j-dv-1)は、補間係数であり、例えばサンプリング定数に基づいて求められるsinc関数である。なお、補間係数cは、sinc関数に、適切な窓関数を乗算した値であってもよい。
次に、水平補間部502は、式(22)により求められた4個の値bxiおよび距離dhを用いて、式(23)にしたがう水平位相シフト演算を行い、変換注目画素Bの画素値byを求める。
Figure 2007251688
次に、図29を参照して、図27の出力位相変換部112が行う図13のステップS13の出力位相変換処理の詳細を説明する。
ステップS501において、垂直補間部501は、巡回型変換部122から供給される、プログレッシブ方式のSD画像である画像P2が変換されることにより得られる、プログレッシブ方式のHD画像の画素を、変換注目画素Bとし、その変換注目画素Bを求めるために用いるSD画像を構成する画素の幾つかを、図28に示されるような変換タップとして抽出する。
ステップS502において、垂直補間部501は、変換タップを用いて、上述した式(22)にしたがう垂直位相シフト演算を行い、その結果得られる値bxiを水平補間部502に供給する。
ステップS503において、水平補間部502は、垂直補間部501から供給される値bxiを用いて、上述した式(23)にしたがう水平位相シフト演算を行い、変換注目画素Bの画素値by、即ちHD画像を構成する画素の画素値を求める。ステップS504において、水平補間部502は、ステップS503で求められたHD画像を構成する画素の画素値を、図8の自然画予測部113と人工画予測部114、並びに自然画人工画判定部115に出力する。
ステップS505において、垂直補間部501は、SD画像が変換されることにより得られるHD画像を構成するすべての画素を、変換注目画素Bとしたかどうか、すなわち生成したかどうかを判定する。ステップS505で、まだHD画像を構成するすべての画素を、変換注目画素Bとしていない(生成していない)と判定された場合、ステップS506において、垂直補間部501は、HD画像を構成する画素のうち、まだ注目画素としていないものを、新たに変換注目画素Bとして決定し、処理をステップS501に戻し、以下、同様の処理を繰り返す。
一方、ステップS505において、垂直補間部501は、HD画像を構成するすべての画素を変換注目画素Bとしたと判定した場合、出力位相変換処理を終了する。
以上のようにして、生成目標とされる画素数の画像としてのプログレッシブ方式のHD画像が生成される。
図30は、図8の出力位相変換部112の第2の実施の形態の詳細構成例を示すブロック図である。
図30の出力位相変換部112は、二次元補間部531により構成される。図30の出力位相変換部112は、図27の出力位相変換部112のように、垂直方向と水平方向の2つの方向に分けて、位相のシフトを行うのではなく、1度に垂直方向と水平方向の位相のシフトを行う。
二次元補間部531は、図27の垂直補間部501と同様に、図8の巡回型変換部122から供給される、プログレッシブ方式のSD画像である画像P2が変換されることにより得られるプログレッシブ方式のHD画像を構成する画素を、順次、変換注目画素Bとし、その変換注目画素Bを求めるために用いるSD画像を構成する画素の幾つかを、変換タップとして抽出する。
また、二次元補間部531は、変換タップを用いて、SD画像の垂直方向および水平方向の位相をシフトするための演算(以下、2次元位相シフト演算と称する)を行う。二次元補間部531は、その2次元位相シフト演算の結果得られる値を、注目変換画素Bの画素値、即ちHD画像の画素値として、図8の自然画予測部113と人工画予測部114、並びに自然画人工画判定部115に供給する。
次に、図31を参照して、図30の二次元補間部531における2次元位相シフト演算について説明する。
なお、図31において、変換注目画素B、変換タップの構成は、図28の場合と同一であるので、説明は省略する。
変換タップを構成する画素Ai,jの画素値を画素値ai,jとすると、二次元補間部531は、その画素値ai,j、距離dv、および距離dhを用いて、以下の式(24)にしたがう2次元位相シフト演算を行い、変換注目画素の画素値byを求める。
Figure 2007251688
なお、式(24)において、cij(dh,dv)は、画素Ai,jごとの補間係数であり、例えばサンプリング定数に基づいて求められるsinc関数である。
次に、図32を参照して、図30の二次元補間部531が行う図13のステップS13の出力位相変換処理の詳細を説明する。
ステップS531において、二次元補間部531は、図27の垂直補間部501と同様に、巡回型変換部122から供給される、プログレッシブ方式のSD画像である画像P2が変換されることにより得られるプログレッシブ方式のHD画像の画素を、変換注目画素Bとし、その変換注目画素Bを求めるために用いるSD画像を構成する画素の幾つかを、図31に示されるような変換タップとして抽出する。
ステップS532において、二次元補間部531は、変換タップを用いて、上述した式(24)にしたがう2次元位相シフト演算を行い、変換注目画素Bの画素値by、即ちHD画像を構成する画素の画素値を求める。
ステップS533において、二次元補間部531は、ステップS532で求められたHD画像を構成する画素の画素値を、図8の自然画予測部113と人工画予測部114、並びに自然画人工画判定部115に出力する。
ステップS534とステップS535は、図29のステップS505とステップS506の処理と同様の処理であるので、説明は省略する。
なお、上述した説明では、画像変換装置101に入力される画像がSD画像であり、画像変換装置101から出力する画像がHD画像であるものとして、出力位相変換部112が、SD画像をHD画像に変換するものとしたが、出力位相変換部112は、入力される画像を、後段の自然画予測部113または人工画予測部114から出力する画像の画素数と同一の画素数の画像に変換すればよく、変換前と変換後の画像は、SD画像とHD画像に限定されない。
図33は、図8の自然画予測部113の構成例を示すブロック図である。
図33の自然画予測部113は、クラスタップ抽出部551、ADRC処理部552、係数種メモリ553、予測係数生成部554、予測係数メモリ555、予測タップ抽出部556、および予測演算部557により構成され、出力位相変換部112から供給されるプログレッシブ方式のHD画像から、そのHD画像のうちの自然画像を高品質にした自然高品質画像を予測する。
自然画予測部113には、図8の出力位相変換部112から供給される、プログレッシブ方式のHD画像が入力され、そのHD画像はクラスタップ抽出部551と予測タップ抽出部556に供給される。
クラスタップ抽出部551は、入力されたHD画像により求められる、自然高品質画像を構成する画素を、順次、注目画素とし、その自然注目画素をクラスに分類するために用いる、入力されたHD画像を構成する画素の幾つかを、クラスタップとして抽出する。クラスタップ抽出部551は、抽出されたクラスタップを、ADRC処理部552に供給する。
ADRC処理部552は、クラスタップ抽出部551から供給されるクラスタップを構成する画素の画素値を、クラスタップの波形の特徴として、その画素値に対してADRC処理などを行い、その結果得られるADRCコードを、クラスタップの特徴として検出する。ADRC処理部552は、検出されたADRCコードに基づいてクラスを決定することにより、注目画素をクラスに分類し、そのクラスを予測係数メモリ555に供給する。
係数種メモリ553は、図37乃至図39を参照して後述する学習により獲得されたクラスごとの係数種を格納している。
予測係数生成部554は、係数種メモリ553から係数種を読み出す。予測係数生成部554は、ユーザにより入力される水平方向の解像度を決定するためのパラメータhと、垂直方向の解像度を決定するためのパラメータvとに基づいて、そのパラメータhとvを含む多項式を用いて、読み出された係数種から予測係数を生成し、予測係数メモリ555に供給して記憶させる。
予測係数メモリ555は、ADRC処理部552から供給されるクラスに応じて、そのクラスの予測係数を読み出し、予測演算部557に供給する。
予測タップ抽出部556は、入力されたHD画像から、注目画素の画素値を予測するのに用いるHD画像を構成する画素を、予測タップとして抽出する。予測タップ抽出部556は、予測タップを予測演算部557に供給する。
予測演算部557は、予測タップ抽出部556から供給される予測タップと、予測係数メモリ555から供給される予測係数とを用いて予測演算を行う。予測演算部557の出力したHD画像は合成部116に出力される。
図34は、図33のクラスタップ抽出部551により抽出されるクラスタップのタップ構造の一例を示している。
なお、図中白丸は、出力位相変換部112から供給されるHD画像の画素のうち、クラスタップを構成する画素を表し、点線の丸は、クラスタップを構成しない画素を表し、黒丸は注目画素を表している。このことは、後述する図35においても同様である。
図34では、9個の画素で、クラスタップが構成されている。即ち、注目画素q6に対応するHD画像を構成する画素p64を中心として、縦方向に1画素置きに並ぶ5画素p60,p61,p64,p67,p68、横方向に1画素置きに並ぶ画素p64を除いた4画素p62,p63,p65,p66から、略十字形状のクラスタップが構成されている。
図35は、図33の予測タップ抽出部556により抽出される予測タップのタップ構造の一例を示している。
図35では、13個の画素で、予測タップが構成されている。即ち、図35では、出力位相変換部112から供給されるHD画像のうちの、注目画素q8に対応する画素p86を中心として縦方向に1画素置きに並ぶ5画素p80,p82,p86,p90,p92、横方向に1画素置きに並ぶ画素p86を除いた4画素p84、p85,p87,p88、画素p85を中心として、縦方向に1画素置きに並ぶ画素p85を除いた2画素p81,p89、画素p87を中心として、縦方向に1画素置きに並ぶ画素p87を除いた2画素p83,p91から、略ひし形状の予測タップが構成されている。
なお、図34と図35では、クラスタップを構成する9画素p60乃至p68と、予測タップを構成する13画素p80乃至p92は、上下方向(垂直方向)または左右方向(水平方向)に1画素置きに、即ち2画素間隔で並んでいるが、その間隔は、これに限定されず、出力位相変換部112における変換前のSD画像と変換後のHD画像の画素数の比率、即ち補間倍率に応じて変更するとよい。
例えば、水平方向と垂直方向の各画素数が、それぞれ2倍になるように、出力位相変換部112が画像を変換した場合、図34と図35に示されるように、垂直方向または水平方向に2画素間隔で並ぶ画素から、クラスタップと予測タップを構成すると、補間された画素および補間前から存在する画素のうちの一方だけで、クラスタップと予測タップが構成されるので、それらの両方が混在する、例えばクラスタップと予測タップが1画素間隔で並ぶ画素から構成される場合よりも、自然画予測部113による予測処理の結果の精度が向上する。
次に、図36を参照して、図33の自然画予測部113が行う図13のステップS14の自然画予測処理の詳細を説明する。
初めに、ステップS551において、クラスタップ抽出部551は、図27の出力位相変換部112から入力されたHD画像により求められる自然高品質画像を構成する画素のうちの1つを、注目画素として選択する。
ステップS552において、クラスタップ抽出部551は、図34に示されるような、ステップS551で選択された注目画素のクラス分類を行うのに用いる、入力されたHD画像を構成する画素の幾つかを、HD画像からクラスタップとして抽出し、ADRC処理部552に供給する。
ステップS553において、ADRC処理部552は、クラスタップ抽出部551から供給されるクラスタップを構成する画素の画素値に対して、ADRC処理を行い、その結果得られるADRCコードを、クラスタップのパターンとして検出する。
ステップS554において、ADRC処理部552は、ADRCコードに基づいてクラスを決定することにより、注目画素をクラスに分類し、そのクラスを予測係数メモリ555に供給する。
ステップS555において、予想係数生成部554は、係数種メモリ553から係数種を読み出す。
ステップS556において、予測係数生成部554は、ユーザにより入力されたパラメータhとvに基づいて、パラメータhとvを含む多項式を用いて、係数種メモリ553から読み出された係数種から予測係数を生成し、予測係数メモリ555に供給して記憶させる。この係数種から予測係数を生成する処理の詳細については後述する。
ステップS557において、予測係数メモリ555は、ADRC処理部552から供給されるクラスに基づいて、そのクラスの予測係数を読み出し、予測演算部557に供給する。
ステップS558において、予測タップ抽出部556は、入力されたHD画像から、図35に示されるような、注目画素の画素値を予測するのに用いるHD画像を構成する画素を、予測タップとして抽出する。予測タップ抽出部556は、予測タップを予測演算部557に供給する。
ステップS559において、予測演算部557は、予測タップ抽出部556から供給される予測タップと、予測係数メモリ555から供給される予測係数とを用いて、注目画素の真値の予測値を求める線形一次式などの予測演算を行う。具体的には、例えば、予測演算部557は、上述した式(14)において、xnに注目画素についての予測タップを構成するn番目のHD画像の画素の画素値を代入し、Wnに予測係数を代入して、yを注目画素の予測値として求める。
ステップS560において、予測演算部557は、予測演算の結果得られた注目画素の画素値の予測値、即ち、自然高品質画像を構成する画素の画素値を合成部116に出力する。
ステップS561において、クラスタップ抽出部551は、入力されたHD画像により求められる自然高品質画像を構成するすべての画素を、注目画素としたかどうかを判定する。ステップS561で、すべての画素をまだ注目画素としていないと判定された場合、ステップS562において、クラスタップ抽出部551は、自然高品質画像を構成する画素のうち、まだ注目画素としていないものを、新たに注目画素として決定し、処理をステップS552に戻し、以下同様の処理を繰り返す。一方、ステップS561で、クラスタップ抽出部551は、すべての画素を注目画素としたと判定した場合、自然画予測処理を終了する。
以上のようにして、自然画予測部113は、出力位相変換部112から供給されるHD画像から、自然高品質画像を予測し、出力する。即ち、自然画予測部113は、HD画像を自然高品質画像に変換し、出力する。
以上のように、図8の画像変換装置101では、出力位相変換部112が、巡回型変換部122から供給されるSD画像を、自然画予測部113から出力するHD画像に変換して、自然画予測部113に供給するので、予測前と予測後の画像の画素数が同一であり、予測前後の画像の画素の位置にはズレがなくなる。
従って、自然画予測部113は、自然高品質画像の画素である注目画素の位相と同一の位相のHD画像の画素からなる予測タップを用いて、注目画素の画素値を予測することができる。その結果、自然画予測部113は、自然高品質画像を正確に予測し、高精度の画像変換を行うことができる。即ち、出力位相変換部112と自然画予測部113は、巡回型変換部122から入力されるSD画像である画像P2を、画素数の異なる高品質なHD画像である自然高品質画像に的確に変換することができる。
また、自然画予測部113は、クラスタップを構成する画素の画素値を、クラスタップの波形の特徴として、注目画素をクラスに分類するので、平坦部分が比較的少ない自然画像の特徴を分類するのに適した分類を行うことができる。その結果、自然画予測部113は、HD画像のうちの自然画像の品質を、的確に高めることができる。
次に、図33の予測係数生成部554において予測係数を生成する多項式と、その多項式に用いられる係数種の学習について説明する。
いま、入力されたパラメータhとv、並びに係数種を用いて予測係数を生成する式として、例えば、多項式を採用することとすると、クラスごと、かつパラメータhとvの組み合わせごとの予測係数Wnは、次の多項式によって求められる。
Figure 2007251688
但し、式(25)において、wn,k(k=0,1・・・,9)は、式(14)で表される画素値yの自然高品質画像画素についての予測タップを構成する、n番目のHD画像の画素の画素値xnと乗算されるn番目の予測係数Wnを生成するための係数種のうちの、k番目の項の係数を表す。
ここで、パラメータhとvに対応する、n番目の予測係数の真値をWvhnと表すとともに、式(25)によって得られるその真値Wvhnの推測値をWvhn'と表すと、その推測誤差evhnは、次式で表される。
Figure 2007251688
式(26)の推測値Wvhn'は、式(25)にしたがって求められるため、式(26)の推測値Wvhn'を、式(25)にしたがって置き換えると、次式が得られる。
Figure 2007251688
なお、式(27)において、wvhn,kは、予測係数Wvhnを生成するための係数種のうちの、k番目の項の係数を表す。また、式(27)において、tkは次式で定義される。
Figure 2007251688
式(26)または式(27)の予測誤差evhnを0、即ち統計的に最小にする係数種wvhn,kが、予測係数を推測するのに最適なものとなるが、すべての予測係数について、そのような係数種wvhn,kを求めることは、一般には困難である。
そこで、係数種wvhn,kが最適なものであることを表す規範として、例えば、最小自乗法を採用することとすると、最適な係数種wvhn,kは、次式で表される自乗誤差の総和Eを最小にすることで求めることができる。
Figure 2007251688
但し、式(29)において、Vは、パラメータvの種類の数を表し、Hは、パラメータhの種類の数を表す。
式(29)の自乗誤差の総和Eの最小値は、式(30)に示すように、総和Eを係数種wvhn,kで偏微分したものを0とするwvhn,kによって与えられる。
Figure 2007251688
ここで、XklとYkをそれぞれ以下の式(31)と式(32)で定義すると、式(30)は以下の式(33)の正規方程式に書き換えられる。
Figure 2007251688
Figure 2007251688
Figure 2007251688
式(33)の正規方程式は、例えば、掃き出し法(Gauss-Jordanの消去法)などを用いることにより、係数種wn,kについて解くことができる。
式(33)の正規方程式をクラスごとにたてて解くことにより、最適な係数種として、自乗誤差の総和Eを最小にする係数種wn,kを、クラスごとに求めることができる。
図37は、式(33)の正規方程式をたてて解くことによりクラスごとの係数種wn,kを求める学習を行う学習装置601の構成例を示すブロック図である。
図37の学習装置601は、帯域制限フィルタ611、クラスタップ抽出部612、ADRC処理部613、予測タップ抽出部614、正規方程式生成部615、予測係数生成部616、正規方程式生成部617、係数種決定部618、および係数種メモリ619により構成される。
この学習装置601は、上述したクラス分類処理におけるタップ係数の学習と同様に、予測係数Wvhnを学習した後、式(33)の正規方程式をたてて解くことにより係数種wn,kを学習する。即ち、学習装置601は、教師データyとして、予測処理後の目標の自然画像に相当する画像である教師画像を採用し、生徒データxとして、予測処理が行われる前の自然画像に相当する画像である生徒画像を採用し、パラメータhとvの組み合わせごと、かつクラスごとに上述した式(21)の正規方程式をたてて解くことにより、パラメータhとvの組み合わせごと、かつクラスごとのタップ係数Wnを予測係数Wvhnとして求める。
そして、さらに、この予測係数Wvhnにより、上述した式(33)の正規方程式がクラスごとに生成され、その正規方程式を解くことでクラスごとの係数種wn,kが生成される。
学習装置601には、図示せぬデータベースから読み出された、教師画像が複数入力され、その教師画像は、帯域制限フィルタ611と正規方程式生成部615に供給される。また、学習装置601には、ユーザの指示に基づいて、パラメータhとvが外部から入力され、帯域制限フィルタ611と正規方程式生成部615に供給される。なお、学習装置601には、1枚の教師画像が学習装置601に入力されるごとに、パラメータhとvの全通りの組み合わせが入力されるようになっている。
帯域制限フィルタ611は、外部から入力されるパラメータhとvに応じて、図示せぬデータベースから取得された教師画像の、垂直方向および水平方向の帯域をそれぞれ制限するフィルタ処理を行う。これにより、パラメータhとvの組み合わせごとの生徒画像が生成される。例えば、パラメータhの種類が9種類であり、パラメータvの種類が9種類である場合、帯域制限フィルタ611は、外部から入力されるパラメータhとvに応じて、1枚の教師画像から81種類の生徒画像を生成する。
帯域制限フィルタ611は、その生徒画像をクラスタップ抽出部612と予測タップ抽出部614に供給する。
クラスタップ抽出部612は、図33のクラスタップ抽出部551と同様に構成される。クラスタップ抽出部612は、教師画像を構成する画素を、順次、注目教師画素として、その注目教師画素について、生徒画像から、図34に示されるような、図33のクラスタップ抽出部551が抽出するクラスタップと同一のタップ構造のクラスタップを抽出し、ADRC処理部613に供給する。
予測タップ抽出部614は、図33の予測タップ抽出部556と同様に構成される。予測タップ抽出部614は、帯域制限フィルタ611から供給される生徒画像から、図35に示されるような、注目教師画素の画素値を予測するのに用いる生徒画像を構成する画素を、予測タップとして抽出する。予測タップ抽出部614は、予測タップを正規方程式生成部615に供給する。
正規方程式生成部615は、入力された教師画像と、予測タップ抽出部614から供給される予測タップのペアを、予測係数の学習に用いられる学習対として、ADRC処理部613から供給されるクラスごと、かつ外部から入力されるパラメータhとvの組み合わせごとに、上述した式(21)の正規方程式をたてると、その正規方程式を予測係数生成部616に供給する。
予測係数生成部616は、式(21)の正規方程式を解き、パラメータhとvの組み合わせごと、かつクラスごとに予測係数Wvhnを求め、正規方程式生成部617に供給する。
正規方程式生成部617は、予測係数生成部616からの予測係数Wvhnに基づいて、上述した式(33)の正規方程式をクラスごとに生成し、係数種決定部618に出力する。係数種生成部618は、クラスごとの式(33)の正規方程式を解き、クラスごとの係数種wn,kを求めて係数種メモリ619に格納する。この係数種メモリ619に格納された係数種は、図33の係数種メモリ553に格納される。
次に、図38を参照して、教師画像と生徒画像の画素の位置関係を説明する。
図38において、菱形は教師画像の画素を表し、白丸は生徒画像の画素を表している。また、図中横軸は水平方向の位置を表し、縦軸は垂直方向の位置を表す。
図38に示されるように、教師画像と生徒画像の画素の水平方向および垂直方向の位置は同一となっている。即ち、教師画像と生徒画像は同位相である。
次に、図39のフローチャートを参照して、図37の学習装置601の学習処理について説明する。
初めに、ステップS601において、帯域制限フィルタ611は、入力されたパラメータhとvに応じて、入力された教師画像の垂直方向および水平方向の帯域をそれぞれ制限するフィルタ処理を行うことにより、入力された教師画像から生徒画像を生成し、クラスタップ抽出部612と予測タップ抽出部614に供給する。
ステップS602において、クラスタップ抽出部612は、図33のクラスタップ抽出部551と同様に、教師画像を構成する画素のうちの1つを注目教師画素として、選択する。
ステップS603において、クラスタップ抽出部612は、クラスタップ抽出部551と同様に、生徒画像から、図34に示されるようなクラスタップを抽出し、ADRC処理部613に供給する。
ステップS604において、ADRC処理部613は、クラスタップを構成する画素の画素値に対して、ADRC処理を行う。ステップS605において、ADRC処理部613は、ADRC処理の結果得られるADRCコードに基づいて、クラスを決定し、そのクラスを正規方程式生成部615に供給する。
ステップS606において、予測タップ抽出部614は、図33の予測タップ抽出部556と同様に、注目教師画素について、帯域制限フィルタ611から供給される生徒画像から、図35に示されるような予測タップを抽出し、正規方程式生成部615に供給する。
ステップS607において、正規方程式生成部615は、入力される教師画像から注目教師画素を抽出し、その注目教師画素と、予測タップ抽出部614から供給される注目教師画素について構成された予測タップを構成する生徒画像とを対象とした式(21)の足し込みを、パラメータhおよびvの組み合わせごと、かつADRC処理部613から供給されるクラスごとに行う。
ステップS608において、クラスタップ抽出部612は、入力されるすべての教師画像の画素を注目教師画素としたかどうかを判定する。ステップS608で、まだすべての教師画像の画素を注目教師画素としていないと判定された場合、ステップS609において、クラスタップ抽出部612は、教師画像の画素のうち、まだ注目教師画素としていないものを、新たに注目教師画素として決定する。そして、処理はステップS603に戻り、以下、同様の処理が繰り返される。
一方、ステップS608で、すべての教師画像の画素を注目教師画素としたと判定された場合、ステップS610において、正規方程式生成部615は、いままでの処理によって得られたパラメータhおよびvの組み合わせごと、かつクラスごとの式(21)における左辺の行列と、右辺のベクトルを、正規方程式として予測係数生成部616に供給する。
ステップS611において、予測係数生成部616は、正規方程式生成部615から供給される、パラメータhおよびvの組み合わせごと、かつクラスごとの式(21)における左辺の行列と右辺のベクトルによって構成される正規方程式を解き、パラメータhおよびvの組み合わせごと、かつクラスごとの予測係数Wvhnを求めて、正規方程式生成部617に出力する。
ステップS612において、正規方程式生成部617は、予測係数Wvhnに基づいて、式(33)の正規方程式をクラスごとに生成し、係数種決定部618に出力する。
ステップS613において、係数種決定部618は、式(33)の正規方程式を解き、クラスごとの係数種wn,kを求める。係数種メモリ619は、ステップS614において、その係数種wn,kを記憶する。この係数種が図33の係数種メモリ553に記憶される。
以上のように、自然画予測部113は、自然画像を用いた学習により獲得された係数種よにり生成された予測係数を用いて、自然高品質画像を予測するので、出力位相変換部112から供給されるHD画像のうちの自然画像の品質を的確に高めることができる。
また、自然画予測部113は、クラスタップを構成する画素の画素値を、クラスタップの波形の特徴として、その特徴に応じて、注目画素をクラスに分類するので、自然画像の注目画素を、的確に分類することができる。その結果、自然画予測部113は、このクラスごとに学習により獲得された係数種により生成された予測係数を用いて、HD画像から自然高品質画像を予測することにより、より高品質の自然高品質画像を出力することができる。
図40は、図8の人工画予測部114の第1の実施の形態の詳細構成例を示している。
図40の人工画予測部114は、クラス分類部651、係数種メモリ652、予測係数生成部653、予測係数メモリ654、および予測部655により構成され、出力位相変換部112から供給されるプログレッシブ方式のHD画像から、そのHD画像のうちの人工画像を高品質にした人工高品質画像を予測する。
出力位相変換部112から供給されるHD画像は、クラス分類部651と予測部655に入力される。クラス分類部651は、そのHD画像により求められる人工高品質画像を構成する画素を、順次、注目画素とし、その注目画素を、HD画像の位相の特徴に応じて、幾つかのクラスのうちのいずれかのクラスに分類する。クラス分類部651は、分類されたクラスを予測係数メモリ654に供給する。
係数種メモリ652は、例えばROM(Read Only Memory)などにより構成され、図47乃至図49を参照して後述する学習により獲得されたクラスごとの係数種を格納している。
予測係数生成部653は、ユーザにより入力されるパラメータhとvを含む式(25)の多項式を用いて、係数種メモリ652より読み出された係数種wn,kから予測係数Wnを生成し、予測係数メモリ654に記憶させる。
予測係数メモリ654は、クラス分類部651から供給されるクラスに基づいて、そのクラスの予測係数Wnを読み出し、予測部655に供給する。
予測部655は、HD画像と、予測係数メモリ654から供給される予測係数Wnとを用いて、注目画素の真値の予測値を求める所定の予測演算を行う。これにより、予測部655は、注目画素の画素値の予測値、即ち、人工高品質画像を構成する画素の画素値を求めて、図8の合成部116に出力する。
図41は、図40のクラス分類部651の詳細構成例を示すブロック図である。
図41のクラス分類部651は、クラスタップ抽出部671、差分算出部672、およびADRC(Adaptive Dynamic Range Coding)処理部673により構成される。
クラスタップ抽出部671は、注目画素をクラスに分類するために用いるHD画像を構成する画素の幾つかを、クラスタップとして抽出し、差分算出部672に供給する。
差分算出部672は、クラスタップ抽出部671から供給されるクラスタップを構成する画素のうちの、隣接する2つの画素どうし(以下、隣接画素と称する)の画素値の差分の絶対値(以下、隣接差分絶対値と称する)を、クラスタップの位相の特徴として、隣接画素ごとに算出する。差分算出部672は、各隣接画素の隣接差分絶対値を、ADRC処理部673に供給する。
ADRC処理部673は、差分算出部672から供給される隣接差分絶対値に対して、1ビットADRC処理を行う。具体的には、ADRC処理部673は、クラスタップの隣接差分絶対値を、その最大値MAXと最小値MINとの平均値で除算し、その除算結果の小数点以下を切り捨てることにより、隣接差分絶対値を1ビットにする。即ち、ADRC処理部673は、隣接差分絶対値を2値化する。
そして、ADRC処理部673は、その1ビットの画素値を所定の順番で並べたビット列を、注目画素のクラスとして決定する。従って、クラスは、クラスタップ内のエッジの位置を表す位相情報となる。即ち、クラスは、クラスタップの位相を縮退した値となる。ADRC処理部673は、決定されたクラスを、図40の予測係数メモリ654に供給する。
以上のように、クラス分類部651は、各隣接画素の隣接差分絶対値を、クラスタップの位相の特徴として、その位相の特徴に応じて、注目画素をクラスに分類する。
図42は、図41のクラスタップ抽出部671により抽出されるクラスタップのタップ構造の例を示している。なお、クラスタップのタップ構造は、図42に示されている以外の構造とすることも可能である。
図42では、図8の出力位相変換部112から供給されるHD画像のうちの、注目画素に対応する画素p124と、その画素の上方向、左方向、右方向、下方向にそれぞれ隣接する2画素p120,p121,p122,p123,p125,p126,p127,p128とから、いわば十字形状のクラスタップが構成されている。
図41の差分算出部672は、クラスタップを構成する9個の画素p120乃至p128のうちの、隣接画素である画素p120とp121,p121とp124,p122とp123,p123とp124,p124とp125,p125とp126,p124とp127,p127とp128の8個の隣接差分絶対値d0乃至d7を算出し、ADRC処理部673に供給する。その結果、ADRC処理部673から8ビットで表されるクラスが出力される。
図43は、図40の予測部655の詳細構成例を示すブロック図である。
図43の予測部655は、予測タップ抽出部691と予測演算部692から構成される。
予測タップ抽出部691は、注目画素の画素値を予測するのに用いるHD画像を構成する画素を、予測タップとして抽出する。
具体的には、予測タップ抽出部691は、注目画素に対応するHD画像の画素、例えば、注目画素に対して空間的に最も近い位置にあるHD画像の画素に対して、空間的に近い位置にある複数の画素を、HD画像から、予測タップとして抽出する。予測タップ抽出部691は、予測タップを予測演算部692に供給する。
なお、予測タップとクラスタップは、同一のタップ構造を有するものとすることも、異なるタップ構造を有するものとすることも可能である。
予測演算部692には、予測タップ抽出部691から供給される予測タップのほかに、図40の予測係数メモリ654から予測係数が供給される。予測演算部692は、その予測タップと予測係数とを用いて、注目画素の真値の予測値を求める、式(14)に示した予測演算を行う。これにより、予測演算部692は、注目画素の画素値の予測値、即ち、人工高品質画像を構成する画素の画素値を求めて、図8の合成部116に出力する。
図44は、図43の予測タップ抽出部691により抽出される予測タップのタップ構造の例を示している。なお、予測タップのタップ構造は、図44に示されている以外の構造とすることも可能である。
図44では、13個の画素で、予測タップが構成されている。即ち、図44では、出力位相変換部112から供給されるHD画像のうちの、注目画素に対応する画素p146を中心として縦方向に並ぶ5画素p140,p142,p146,p150,p152、注目画素に対応する画素p146の左と右に隣接する画素p145,p147それぞれを中心として縦方向に並ぶ3画素p141,p145,p149,p143,p147,p151、および注目画素に対応する画素p146から左と右に2画素だけ離れた画素p144,p148から、略ひし形状の予測タップが構成されている。
次に、図45を参照して、図40の人工画予測部114が行う図13のステップS15の人工画予測処理の詳細を説明する。
初めに、ステップS701において、クラス分類部651は、求める人工高品質画像を構成する画素のうちの所定の画素である注目画素を、その注目画素に対応するHD画像の位相の特徴に応じてクラスに分類するクラス分類処理を行う。このクラス分類処理の詳細は、図46を参照して後述する。
ステップS702において、係数種メモリ652は係数種wn,kを読み出し、予測係数生成部653に出力する。ステップS703において、予測係数生成部653は、ユーザにより入力されたパラメータhとvに基づいて、そのパラメータhとvを含む式(25)の多項式を用いて、係数種wn,kから予測係数Wnを生成し、予測係数メモリ555に供給して記憶させる。
ステップS704において、予測係数メモリ654は、クラス分類部651により分類されたクラスに基づいて、そのクラスの予測係数Wnを読み出し、予測部655の予測演算部692に供給する。
ステップS705において、予測タップ抽出部691は、出力位相変換部112から供給されるHD画像から、図44に示されるような、注目画素の画素値を予測するのに用いるHD画像を構成する画素を、予測タップとして抽出し、予測演算部692に供給する。
ステップS706において、予測演算部692は、予測タップ抽出部691から供給される予測タップと、予測係数メモリ654から供給される予測係数Wnとを用いて、式(14)に示した予測演算を行うことにより、人工高品質画像を構成する画素の画素値を求める。ステップS707において、予測演算部692は、ステップS706で求められた人工高品質画像を構成する画素の画素値を、図8の合成部116に出力する。
ステップS708において、クラス分類部651は、人工高品質画像を構成するすべての画素を注目画素としたかどうかを判定し、まだ人工高品質画像を構成するすべての画素を注目画素としていないと判定された場合、ステップS709において、クラス分類部651は、人工高品質画像を構成する画素のうち、まだ注目画素としていないものを新たに注目画素として決定し、処理をステップS701に戻し、以下、同様の処理を繰り返す。
一方、ステップS708において、クラス分類部651は、人工高品質画像を構成するすべての画素を注目画素としたと判定した場合、人工画予測処理を終了する。
以上のようにして、人工画予測部114は、出力位相変換部112から供給されるHD画像から、人工高品質画像を予測し、出力する。即ち、人工画予測部114は、HD画像を人工高品質画像に変換し、出力する。
次に、図46のフローチャートを参照して、図45のステップS701のクラス分類処理について説明する。
ステップS721において、クラス分類部651のクラスタップ抽出部671(図41)は、図42に示されるような、注目画素のクラス分類を行うのに用いるHD画像を構成する画素の幾つかを、クラスタップとして抽出し、差分算出部672に供給する。
ステップS722において、差分算出部672は、クラスタップ抽出部671から供給されるクラスタップを構成する画素のうちの、各隣接画素の隣接差分絶対値を算出し、各隣接画素の隣接差分絶対値をADRC処理部673に供給する。
ステップS723において、ADRC処理部673は、差分算出部672から供給される隣接差分絶対値に対して、1ビットADRC処理を行う。ADRC処理部673は、その結果得られるビット列を、クラスとして決定することにより、注目画素をクラスに分類する。そして、ADRC処理部673は、そのクラスを図40の予測係数メモリ654に供給する。その後、処理は図45のステップS701に戻る。
図47は、図40の係数種メモリ652に格納される係数種を求める学習を行う学習装置811の構成例を示すブロック図である。
図47の学習装置811は、生徒画像生成部821、クラス分類部822、生成部823、係数生成部824、正規方程式生成部825、係数種決定部826、および係数種メモリ827により構成される。
この学習装置811は、上述したクラス分類処理におけるタップ係数の学習と同様に、予測係数Wvhnを学習した後、式(33)の正規方程式をたてて解くことにより係数種wn,kを学習する。即ち、学習装置811は、教師データyとして、予測処理後の目標の人工画像に相当する画像である教師画像を採用し、生徒データxとして、予測処理が行われる前の人工画像に相当する画像である生徒画像を採用し、ユーザの指示に基づいて外部から入力されるパラメータhとvの組み合わせごと、かつクラスごとに上述した式(21)の正規方程式をたてて解くことにより、パラメータhとvの組み合わせごと、かつクラスごとのタップ係数Wnを予測係数Wvhnとして求める。
そして、この予測係数Wvhnによりクラスごとに生成される上述した式(33)の正規方程式を解くことで、クラスごとの係数種wn,kが生成され、記憶される。
学習装置811には、図示せぬデータベースから読み出された教師画像が複数入力され、その教師画像は、生徒画像生成部821と生成部823に供給される。また、学習装置811には、パラメータhおよびvが入力され、生徒画像生成部821、および生成部823に供給される。
生徒画像生成部821は、例えばローパスフィルタなどにより構成され、パラメータhおよびvに応じて、図示せぬデータベースから取得された人工画像である教師画像の品質を劣化させることにより、パラメータhおよびvの組み合わせごとの生徒画像を生成する。生徒画像生成部821は、その生徒画像をクラス分類部822と生成部823に供給する。
クラス分類部822は、人工画予測部114の図41のクラス分類部651と同様に構成される。クラス分類部822は、教師画像を構成する画素を、順次、注目教師画素として、その注目教師画素について、生徒画像から、図41のクラスタップ抽出部671が抽出するクラスタップ(図42)と同一のタップ構造のクラスタップを抽出する。
そして、クラス分類部822は、クラスタップを構成する画素のうちの各隣接画素の隣接差分絶対値を算出し、その隣接差分絶対値に対して、1ビットADRC処理を行う。クラス分類部822は、その結果得られるビット列を、注目教師画素のクラスとして決定し、生成部823に供給する。
生成部823は、教師画像と、生徒画像生成部821から供給される生徒画像のペアを、予測係数の学習に用いられる学習対として、外部から入力されるパラメータhとvの組み合わせごと、かつクラス分類部822から供給されるクラスごとに、式(21)に示した正規方程式をたてると、その正規方程式を、係数生成部824に供給する。
係数生成部824は、生成部823から供給される、パラメータhとvの組み合わせごと、かつクラスごとの正規方程式を解くことにより、予測係数Wvhnを、パラメータhとvの組み合わせごと、かつクラスごとに求めて正規方程式生成部825に出力する。
正規方程式生成部825は、予測係数Wvhnに基づいて式(33)の正規方程式をクラスごとに生成し、係数種決定部826に出力する。係数種決定部826は、正規方程式を解くことで、係数種wn,kを求め、係数種メモリ827に格納する。係数種メモリ827に格納された係数種wn,kは、図40の係数種メモリ652に格納される。
図48は、図47の生成部823の詳細構成例を示すブロック図である。
図48の生成部823は、予測タップ抽出部831と正規方程式生成部832により構成される。
生成部823に供給される学習対の生徒画像は、予測タップ抽出部831に供給され、教師画像は、正規方程式生成部832に供給される。
予測タップ抽出部831は、学習対の教師画像を構成する画素を、順次、注目教師画素とし、その注目教師画素について、学習対の生徒画像から、図43の予測タップ抽出部691が抽出する予測タップ(図44)と同一のタップ構造の予測タップを抽出し、正規方程式生成部832に供給する。
正規方程式生成部832は、教師画像から、注目教師画素を抽出し、その注目教師画素と、予測タップ抽出部831から供給される注目教師画素について構成された予測タップを構成する生徒画像とを対象とした足し込みを、外部から入力されるパラメータhとvの組み合わせごと、かつクラス分類部822から供給されるクラスごとに行う。
そして、正規方程式生成部832は、学習装置811に入力されるすべての教師画像の画素を注目教師画素として、上述の足し込みを行うことにより、各クラスについて、式(21)に示した正規方程式をたてると、その正規方程式を、図47の係数生成部824に供給する。
次に、図49のフローチャートを参照して、図47の学習装置811の学習処理について説明する。
初めに、ステップS741において、生徒画像生成部821は、外部から入力されたパラメータhとvに応じて、入力された教師画像から生徒画像を生成し、クラス分類部822と生成部823に供給する。
ステップS742において、クラス分類部822は、図46のクラス分類処理と同様に、教師画像のうちの所定の画素である注目教師画素を、その注目教師画素に対応する生徒画像の位相の特徴に応じて、クラスに分類するクラス分類処理を行う。クラス分類部822は、決定されたクラスを生成部823の正規方程式生成部832(図48)に供給する。
ステップS743において、図48の予測タップ抽出部831は、注目教師画素について、生徒画像生成部821から供給される生徒画像から、予測タップを抽出し、正規方程式生成部832に供給する。
ステップS744において、正規方程式生成部832は、入力される教師画像から注目教師画素を抽出し、その注目教師画素と、予測タップ抽出部831から供給される注目教師画素について構成された予測タップを構成する生徒画像とを対象とした式(21)の足し込みを、パラメータhおよびvの組み合わせごと、かつラス分類部822から供給されるクラスごとに行う。
ステップS745において、クラス分類部822は、入力されるすべての教師画像の画素を注目教師画素としたかどうかを判定する。ステップS745で、まだすべての教師画像の画素を注目教師画素としていないと判定された場合、ステップS746において、予測タップ抽出部831は、まだ注目教師画素としていない教師画像の画素を、新たに注目教師画素として決定する。そして、処理はステップS742に戻り、以下、同様の処理が繰り返される。
一方、ステップS745で、すべての教師画像の画素を注目教師画素としたと判定された場合、ステップS747において、正規方程式生成部832は、いままでの処理によって得られたパラメータhおよびvの組み合わせごと、かつクラスごとの式(21)における左辺の行列と、右辺のベクトルを、正規方程式として係数生成部824に供給する。
ステップS748において、係数生成部824は、生成部823から供給される、パラメータhおよびvの組み合わせごと、かつクラスごとの式(21)における左辺の行列と右辺のベクトルによって構成される正規方程式を解き、パラメータhおよびvの組み合わせごと、かつクラスごとの予測係数Wvhnを求め、正規方程式生成部825に出力する。
ステップS749において、正規方程式生成部825は、予測係数Wvhnに基づいて式(33)の正規方程式をクラスごとに生成し、係数種決定部826に出力する。ステップS750において、係数種決定部826は、クラスごとの式(33)の正規方程式を解き、クラスごとの係数種wn,kを求める。ステップS751において、係数種メモリ827は、係数種wn,kを記憶する。この係数種が図40の係数種メモリ652に記憶される。
以上のように、人工画予測部114は、人工画像を用いた学習により獲得された係数種により生成される予測係数を用いて、人工高品質画像を予測するので、出力位相変換部112から供給されるHD画像のうちの人工画像の品質を的確に高めることができる。
また、人工画予測部114は、クラスタップのエッジの位置を位相の特徴として、その特徴に応じて、注目画素をクラスに分類するので、階調が少なく、位相情報がはっきりした人工画像の注目画素を、的確に分類することができる。その結果、人工画予測部114は、このクラスごとに学習により獲得された係数種により生成される予測係数を用いて、HD画像から人工高品質画像を予測することにより、より高品質の人工高品質画像を出力することができる。
以上のようにして、自然画予測部113から出力された自然高品質画像の各画素の画素値と、人工画予測部114から出力された人工高品質画増の各画素の画素値は、合成部116により、人工画度に応じた割合で合成され、出力される。
即ち、合成部116は、出力位相変換部112から出力されるHD画像の領域のうちの、自然画像に分類される領域には、自然画予測部113により変換されたHD画像を、人工画像に分類される領域には、人工画予測部114により変換されたHD画像を配置する。その結果、画像処理装置101は、高品質なHD画像を出力することができる。
なお、上述した説明では、係数種が学習されるようにしたが、予測係数そのものが学習されるようにしてもよい。この場合、自然画予測部113と人工画予測部114は、学習により獲得された予測係数そのものを用いて予測を行う。
上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
そこで、図50は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
プログラムは、コンピュータに内蔵されている記録媒体としての記録部908やROM(Read Only Memory)902に予め記録しておくことができる。
あるいはまた、プログラムは、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto Optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブルメディア911に、一時的あるいは永続的に記録しておくことができる。このようなリムーバブルメディア911は、いわゆるパッケージソフトウエアとして提供することができる。
なお、プログラムは、上述したようなリムーバブルメディア911からコンピュータにインストールする他、ダウンロードサイトから、デジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを、通信部909で受信し、内蔵する記録部908にインストールすることができる。
コンピュータは、CPU(Central Processing Unit)901を内蔵している。CPU901には、バス904を介して、入出力インターフェース905が接続されており、CPU901は、入出力インターフェース905を介して、ユーザによって、キーボードや、マウス、マイク等で構成される入力部906が操作等されることにより指令が入力されると、それにしたがって、ROM902に格納されているプログラムを実行する。あるいは、また、CPU901は、記録部908に格納されているプログラム、衛星若しくはネットワークから転送され、通信部909で受信されて記録部908にインストールされたプログラム、またはドライブ910に装着されたリムーバブルメディア911から読み出されて記録部908にインストールされたプログラムを、RAM(Random Access Memory)903にロードして実行する。
これにより、CPU901は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU901は、その処理結果を、必要に応じて、例えば、入出力インターフェース905を介して、LCD(Liquid Crystal Display)やスピーカ等で構成される出力部907から出力、あるいは、通信部909から送信、さらには、記録部908に記録等させる。
なお、コンピュータに各種の処理を行わせるためのプログラムを記述する処理ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含むものである。
また、プログラムは、1のコンピュータにより処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
従来の変換処理を行う変換装置の一例を示すブロック図である。 クラスタップのタップ構造の一例を示す図である。 予測タップのタップ構造の一例を示す図である。 HD画像の画素とSD画像の画素の垂直方向の位置関係を表す図である。 HD画像の画素とSD画像の画素の水平方向の位置関係を表す図である。 図1の変換装置がHD画像を予測する予測処理について説明するフローチャートである。 図1の予測係数メモリに格納される予測係数を求める学習を行う学習装置の構成例を示すブロック図である。 本発明を適用した画像変換装置の一実施の形態の構成を示すブロック図である。 図8の巡回型IP変換部の機能的構成を示すブロック図である。 プログレッシブ画像の画素のタイプを説明する図である。 図9の動きベクトル検出部の機能的構成を示すブロック図である。 図9の巡回係数設定部の機能的構成を示すブロック図である。 図8の画像変換装置により実行される画像変換処理を説明するフローチャートである。 動き適応型の方法を用いたIP変換処理を説明する図である。 図13のステップS12の巡回型変換処理の詳細を説明するフローチャートである。 MCブロック差分値BDの検出方法を説明する図である。 MCブロック差分値BDの検出方法を説明する図である。 垂直動き量VYと基本巡回係数KA0の関係を示すグラフである。 垂直動き量VYと基本巡回係数KB0の関係を示すグラフである。 垂直動き量VYと垂直折り返し歪みの大きさの関係を説明する図である。 動きベクトルの分布の例を示す図である。 動きベクトルの分布の他の例を示す図である。 動き分散MD0の算出方法を説明する図である。 動き分散MD1の算出方法を説明する図である。 図15のステップS21の動きベクトル検出処理の詳細を説明するフローチャートである。 画素以下精度の動きベクトルを検出する方法を説明する図である。 出力位相変換部の第1の実施の形態の詳細構成例を示すブロック図である。 垂直位相シフト演算と水平位相シフト演算について説明する図である。 出力位相変換処理の詳細を説明するフローチャートである。 出力位相変換部の第2の実施の形態の詳細構成例を示すブロック図である。 2次元位相シフト演算について説明する図である。 他の出力位相変換処理の詳細を説明するフローチャートである。 自然画予測部の詳細構成例を示すブロック図である。 クラスタップのタップ構造を示す図である。 予測タップのタップ構造を示す図である。 自然画予測処理の詳細を説明するフローチャートである。 学習装置の構成例を示すブロック図である。 教師画像と生徒画像の画素の位置関係を説明する図である。 学習処理を説明するフローチャートである。 人工画予測部の構成例を示すブロック図である。 クラス分類部の詳細構成例を示すブロック図である。 他のクラスタップのタップ構造を示す図である。 予測部の詳細構成例を示すブロック図である。 他の予測タップのタップ構造を示す図である。 人工画予測処理を説明するフローチャートである。 クラス分類処理を説明するフローチャートである。 他の学習装置の構成例を示すブロック図である。 生成部の詳細構成例を示すブロック図である。 他の学習処理を説明するフローチャートである。 本発明を適用したコンピュータの一実施の形態の構成例を示すブロック図である。
符号の説明
101 画像変換装置, 111 巡回型IP変換部, 112 出力位相変換部, 113 自然画予測部, 121 IP変換部, 122 巡回型変換部, 131 動きベクトル検出部, 132 MCブロック差分検出部, 133 巡回係数設定部, 134 動き補償部, 135 積和演算部, 136 フレームメモリ, 151 動き評価値検出部, 152 画素精度動きベクトル検出部, 153,154 タップ抽出部, 156 クラス分類部, 157 係数メモリ, 158 予測演算部, 159 画素以下精度動きベクトル検出部, 171 基本巡回係数設定部, 172 動き分散検出部, 173 巡回係数算出部, 181 動き分散差し引き量算出部, 182 MCブロック差分算出部, 183 減算部, 201 巡回型変換部, 211 フレームメモリ, 212 動きベクトル検出部, 213 MCブロック差分検出部, 301 巡回型変換部, 311,312 フレームメモリ, 313 動きベクトル検出部, 314 MCブロック差分検出部, 552 ADRC処理部, 555 予測係数メモリ, 557 予測演算部

Claims (4)

  1. 第1の画素数の画素から構成されるインターレース画像を第1のプログレッシブ画像にIP変換する変換手段と、
    前記第1のプログレッシブ画像に対して補間を行うことにより、生成目標とする画像の画素数である第2の画素数の画素から構成される第2のプログレッシブ画像を生成する補間手段と、
    前記第2のプログレッシブ画像により求められる、その第2のプログレッシブ画像に比べて高品質な前記第2の画素数の画素から構成される、前記生成目標の画像としての第3のプログレッシブ画像の画素である注目画素を、その第2のプログレッシブ画像の特徴に応じて、クラスに分類する分類手段と、
    前記第2の画素数の画素から構成される複数のプログレッシブ画像を用いた学習により獲得された、前記クラスごとの予測係数を格納する格納手段と、
    前記第2のプログレッシブ画像と、前記注目画素の前記クラスの予測係数とを用いて演算することで、前記第2のプログレッシブ画像から、前記生成目標の画像としての前記第3のプログレッシブ画像を求める演算手段と
    を備える画像処理装置。
  2. 前記変換手段は、
    前記インターレース画像を、プログレッシブ方式の中間画像に変換するIP変換手段と、
    前記中間画像の画素の間隔より短い距離を最小単位とする前記インターレース画像の動きベクトルを検出する動きベクトル検出手段と、
    前記動きベクトルの垂直方向の成分である垂直動き量に基づいて、前記インターレース画像に画素が存在する位置にある第1のタイプの画素に対する第1の巡回係数、および、前記インターレース画像に画素が存在しない位置にある第2のタイプの画素に対する第2の巡回係数を設定する巡回係数設定手段と、
    前記動きベクトルに基づいて、過去の前記第1のプログレッシブ画像に対して動き補償を施した画像である動き補償画像を生成する動き補償手段と、
    前記中間画像の前記第1のタイプの画素の画素値と前記動き補償画像の対応する位置にある画素の画素値とを前記第1の巡回係数を用いて重み付け加算し、前記中間画像の前記第2のタイプの画素の画素値と前記動き補償画像の対応する位置にある画素の画素値とを前記第2の巡回係数を用いて重み付け加算した画素値からなる前記第1のプログレッシブ画像を生成する出力画像生成手段と
    を備える
    請求項1に記載の画像処理装置。
  3. 第1の画素数の画素から構成されるインターレース画像を第1のプログレッシブ画像にIP変換し、
    前記第1のプログレッシブ画像に対して補間を行うことにより、生成目標とする画像の画素数である第2の画素数の画素から構成される第2のプログレッシブ画像を生成し、
    前記第2のプログレッシブ画像により求められる、その第2のプログレッシブ画像に比べて高品質な前記第2の画素数の画素から構成される、前記生成目標の画像としての第3のプログレッシブ画像の画素である注目画素を、その第2のプログレッシブ画像の特徴に応じて、クラスに分類し、
    前記第2の画素数の画素から構成される複数のプログレッシブ画像を用いた学習により獲得された、前記クラスごとの予測係数のうち、前記注目画素の前記クラスの予測係数と、前記第2のプログレッシブ画像とを用いて演算することで、前記第2のプログレッシブ画像から、前記生成目標の画像としての前記第3のプログレッシブ画像を求める
    ステップを含む画像処理方法。
  4. 第1の画素数の画素から構成されるインターレース画像を第1のプログレッシブ画像にIP変換し、
    前記第1のプログレッシブ画像に対して補間を行うことにより、生成目標とする画像の画素数である第2の画素数の画素から構成される第2のプログレッシブ画像を生成し、
    前記第2のプログレッシブ画像により求められる、その第2のプログレッシブ画像に比べて高品質な前記第2の画素数の画素から構成される、前記生成目標の画像としての第3のプログレッシブ画像の画素である注目画素を、その第2のプログレッシブ画像の特徴に応じて、クラスに分類し、
    前記第2の画素数の画素から構成される複数のプログレッシブ画像を用いた学習により獲得された、前記クラスごとの予測係数のうち、前記注目画素の前記クラスの予測係数と、前記第2のプログレッシブ画像とを用いて演算することで、前記第2のプログレッシブ画像から、前記生成目標の画像としての前記第3のプログレッシブ画像を求める
    ステップを含むプログラム。
JP2006073558A 2006-03-16 2006-03-16 画像処理装置および画像処理方法、並びにプログラム Expired - Fee Related JP4470899B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006073558A JP4470899B2 (ja) 2006-03-16 2006-03-16 画像処理装置および画像処理方法、並びにプログラム
KR1020070025645A KR20070094520A (ko) 2006-03-16 2007-03-15 화상 처리 장치 및 화상 처리 방법과 프로그램
US11/687,294 US8264600B2 (en) 2006-03-16 2007-03-16 Image processing apparatus for converting a lower resolution image into a higher resolution image using cyclic coefficients

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006073558A JP4470899B2 (ja) 2006-03-16 2006-03-16 画像処理装置および画像処理方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2007251688A true JP2007251688A (ja) 2007-09-27
JP4470899B2 JP4470899B2 (ja) 2010-06-02

Family

ID=38517369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006073558A Expired - Fee Related JP4470899B2 (ja) 2006-03-16 2006-03-16 画像処理装置および画像処理方法、並びにプログラム

Country Status (3)

Country Link
US (1) US8264600B2 (ja)
JP (1) JP4470899B2 (ja)
KR (1) KR20070094520A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009152820A (ja) * 2007-12-20 2009-07-09 Sony Corp 学習装置および方法、画像処理装置および方法、並びにプログラム
JP2010014879A (ja) * 2008-07-02 2010-01-21 Sony Corp 係数生成装置および方法、画像生成装置および方法、並びにプログラム
WO2013114675A1 (ja) * 2012-01-31 2013-08-08 株式会社日立ハイテクノロジーズ 画像処理装置、歪補正マップ作成装置、および半導体計測装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4265291B2 (ja) * 2003-06-06 2009-05-20 ソニー株式会社 情報信号の処理装置および処理方法、並びに情報信号の処理方法を実行するためのプログラム
JP4735696B2 (ja) * 2008-09-26 2011-07-27 ソニー株式会社 画像処理装置、画像処理方法、およびプログラム
JP5201408B2 (ja) * 2008-09-30 2013-06-05 ソニー株式会社 フレーム周波数変換装置、フレーム周波数変換方法、その方法を実行するためのプログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体並びに動きベクトル検出装置及び予測係数生成装置
JP2013003892A (ja) * 2011-06-17 2013-01-07 Sony Corp 画像処理装置および方法、プログラム、並びに記録媒体
US8692933B1 (en) 2011-10-20 2014-04-08 Marvell International Ltd. Method and apparatus for buffering anchor frames in motion compensation systems
US8941780B2 (en) * 2013-01-22 2015-01-27 Silicon Image, Inc. Mechanism for facilitating dynamic phase detection with high jitter tolerance for images of media streams
JP2014200008A (ja) * 2013-03-29 2014-10-23 ソニー株式会社 画像処理装置および方法、並びにプログラム
WO2018185881A1 (ja) * 2017-04-05 2018-10-11 オリンパス株式会社 相関値演算装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5317397A (en) * 1991-05-31 1994-05-31 Kabushiki Kaisha Toshiba Predictive coding using spatial-temporal filtering and plural motion vectors
KR100360206B1 (ko) * 1992-12-10 2003-02-11 소니 가부시끼 가이샤 화상신호변환장치
JP3321915B2 (ja) 1993-06-18 2002-09-09 ソニー株式会社 画像信号変換装置
JP3358725B2 (ja) * 1999-08-26 2002-12-24 松下電器産業株式会社 撮像装置
JP2001318745A (ja) * 2000-05-11 2001-11-16 Sony Corp データ処理装置およびデータ処理方法、並びに記録媒体
US7460178B2 (en) * 2004-05-14 2008-12-02 Sony Corporation Image processing apparatus and image processing method
JP4470898B2 (ja) * 2006-03-16 2010-06-02 ソニー株式会社 画像処理装置および方法、並びに、プログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009152820A (ja) * 2007-12-20 2009-07-09 Sony Corp 学習装置および方法、画像処理装置および方法、並びにプログラム
JP2010014879A (ja) * 2008-07-02 2010-01-21 Sony Corp 係数生成装置および方法、画像生成装置および方法、並びにプログラム
JP4548520B2 (ja) * 2008-07-02 2010-09-22 ソニー株式会社 係数生成装置および方法、画像生成装置および方法、並びにプログラム
WO2013114675A1 (ja) * 2012-01-31 2013-08-08 株式会社日立ハイテクノロジーズ 画像処理装置、歪補正マップ作成装置、および半導体計測装置
JP2013156959A (ja) * 2012-01-31 2013-08-15 Hitachi High-Technologies Corp 画像処理装置および方法と歪補正マップ作成装置および方法と半導体計測装置
KR20140099313A (ko) * 2012-01-31 2014-08-11 가부시키가이샤 히다치 하이테크놀로지즈 화상 처리 장치, 왜곡 보정 맵 작성 장치, 및 반도체 계측 장치
KR101627950B1 (ko) * 2012-01-31 2016-06-07 가부시키가이샤 히다치 하이테크놀로지즈 화상 처리 장치, 왜곡 보정 맵 작성 장치, 및 반도체 계측 장치
US9514528B2 (en) 2012-01-31 2016-12-06 Hitachi High-Technologies Corporation Image processing apparatus, distortion-corrected map creation apparatus, and semiconductor measurement apparatus

Also Published As

Publication number Publication date
US20070216802A1 (en) 2007-09-20
KR20070094520A (ko) 2007-09-20
JP4470899B2 (ja) 2010-06-02
US8264600B2 (en) 2012-09-11

Similar Documents

Publication Publication Date Title
JP4470899B2 (ja) 画像処理装置および画像処理方法、並びにプログラム
JP4683294B2 (ja) 画像処理装置および方法、プログラム記録媒体、並びにプログラム
US20090123083A1 (en) Image processing apparatus and method, learning apparatus and method, and program
JP2013021635A (ja) 画像処理装置、画像処理方法、プログラム、及び記録媒体
US20100080299A1 (en) Frame frequency conversion apparatus, frame frequency conversion method, program for achieving the method, computer readable recording medium recording the program, motion vector detection apparatus, and prediction coefficient generation apparatus
JP4470898B2 (ja) 画像処理装置および方法、並びに、プログラム
JP2013009293A (ja) 画像処理装置、画像処理方法、プログラム、および記録媒体、並びに学習装置
JP2009303108A (ja) 画像処理装置および画像処理方法、並びにプログラム
JP2010118940A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2007251690A (ja) 画像処理装置および方法、学習装置および方法、並びにプログラム
JP4250598B2 (ja) 動き補償型ip変換処理装置及び動き補償型ip変換処理方法
JP4470282B2 (ja) 画像処理装置および画像処理方法
JP4470324B2 (ja) 画像信号変換装置および方法
JP3861325B2 (ja) 動きベクトル検出装置および検出方法
JP4250806B2 (ja) フィールド周波数変換装置および変換方法
JP2005311588A (ja) 信号処理装置および方法、記録媒体、並びにプログラム
JP4232430B2 (ja) 画像処理装置および方法、記録媒体、並びに、プログラム
JP4650684B2 (ja) 画像処理装置および方法、プログラム並びに記録媒体
KR101108635B1 (ko) 계수 데이터의 생성 장치 및 생성 방법, 정보 신호의 처리 장치 및 처리 방법, 및 그것을 기록한 매체
JP2007074593A (ja) 画像処理装置および方法、プログラム並びに記録媒体
JP4099554B2 (ja) 画像情報変換装置および画像情報変換方法
JP4310847B2 (ja) 画像情報変換装置および変換方法
JP4193236B2 (ja) 画像情報変換装置、画像情報変換方法、およびテレビジョン受像機
JP4241720B2 (ja) 積和演算回路
JP2011216967A (ja) 画像処理装置および方法、並びにプログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100209

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100222

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130312

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130312

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140312

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees