JP4932900B2 - ロバストな超解像度ビデオスケーリング方法及び装置 - Google Patents

ロバストな超解像度ビデオスケーリング方法及び装置 Download PDF

Info

Publication number
JP4932900B2
JP4932900B2 JP2009504572A JP2009504572A JP4932900B2 JP 4932900 B2 JP4932900 B2 JP 4932900B2 JP 2009504572 A JP2009504572 A JP 2009504572A JP 2009504572 A JP2009504572 A JP 2009504572A JP 4932900 B2 JP4932900 B2 JP 4932900B2
Authority
JP
Japan
Prior art keywords
value
new point
image
input
interpolator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009504572A
Other languages
English (en)
Other versions
JP2009533909A (ja
Inventor
ブルーナ,ジョアン
マラット,ステファン
Original Assignee
ゾラン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ゾラン filed Critical ゾラン
Publication of JP2009533909A publication Critical patent/JP2009533909A/ja
Application granted granted Critical
Publication of JP4932900B2 publication Critical patent/JP4932900B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4007Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Television Systems (AREA)
  • Image Processing (AREA)
  • Control Of Indicators Other Than Cathode Ray Tubes (AREA)

Description

本発明は、概してビデオ画像の処理に関し、更に具体的にはスケーリングによってビデオシーケンスの形式を変換する技術に関するものである。ビデオ形式の多重度には、入力されるビデオの形式を表示装置が要求する又は送信のために必要な形式に適合させることが要求される。インターレース方式のビデオにおいて、フィールドとも称される各連続的な画像は、偶数及び奇数行を時間内に二者択一的に呈する。NTSC、PAL及びSECAMテレビ形式等の標準画質テレビ(SDTV)は、インターレース方式である。ブラウン管(CRT)等のインターレース方式のモニターは、偶数及び奇数行をインターレーススキャンすることによって、これらのフィールドを表示するように設計されている。プログレッシブ方式のビデオ画像の形式は、各画像に全ての行(偶数及び奇数)を組み入れている。LCDビデオモニターは、プログレッシブ方式のビデオを表示するように設計されている。従って入力されるインターレース方式のビデオは、プログレッシブ方式のビデオを出力するために、インターレース方式のビデオシーケンスの各フィールドにおいて欠けている奇数及び偶数行をそれぞれ計算するデインターレース処理を行う必要がある。720行のプログレッシブ形式720p、あるいは1080行のインターレース形式1080iを用いる、幾つかのハイビジョンテレビ形式もまた適用されている。SDTVビデオ形式をHDTVビデオ形式に変換するには、通常デインターレース処理を行い、例えばNTSCの486行を720pHDTVの720行に変更するなど、行数を変更する必要がある。
デインターレース及びビデオシーケンスの行数の変更は、インターレース方式のサンプリンググリッド上に定義された入力ビデオを出力サンプリンググリッド上に定義された出力ビデオへ変換するスケーリング操作である。デインターレースとは、出力サンプリンググリッドが偶数及び奇数行の両方を含んでいるスケーリング方法である。行数の更なる修正により、出力サンプリンググリッドが更に修正される。ビデオのスケーリングには、異なる入力サンプリンググリッド上に定義された入力ビデオのピクセル値から、所定の出力サンプリンググリッド上のピクセル値を算定することが必要である。
第1の方法は、時間tにおける入力ビデオ画像から時間tにおける各出力ビデオ画像をFIRフィルタリングを用いて算定し、入力サンプル値から出力グリッド上のサンプルを算定する空間補間を行う方法である。入力画像がインターレースされると、シャノンのサンプリング・レートを大きく下回ってサンプルが抽出され、これにより得られたビデオに補間によるアーチファクトがはっきりと現われる。指向性の補間によって部分的にこれらのアーチファクトを削減することができるが完全ではなく、これは、補間を行うのに必要な情報が入手できないためである。入力画像がプログレッシブ方式である場合、サンプリング密度の増加によってぼやけた画像も生成される。米国特許第6614489号明細書にはこの方法の実施例が記載されている。
「運動適応」と称される第2の方法では、画像において運動が局所的に検出されない場合に時間補間が行われ、大きな運動が検出された場合に空間補間が行われる。大きな運動が存在すると、これらの技術では空間補間が行われるため、空間補間技術と同様に同じタイプのアーチファクトが生じる。米国特許第5428398号明細書には、この方法の実施例が記載されている。
「運動補正」と称される第3の方法では、画像内での移動が測定され、測定された運動を考慮に入れた時間内補間が実施される。時間内の幾つかの画像の情報を組み合わせることにより、上記方法は、スケーリング処理後の画像の空間解像度を向上させ、より細部まで復元させることができる。これは超解像度処理と呼ばれる。ただし、現存する運動補正の技術は不安定であり、目に見えるアーチファクトが生じてしまう。実際、特にインターレースされたアンダーサンプリング画像の画像画素の移動を正確に計算するのは難しい。閉鎖による運動の不継続又は例えばほこりによって生じた細かい運動、あるいは運動透明視により、これらの運動ベクトルを時間補間に用いる場合に、運動推定に誤差が生じ、アーチファクトをもたらす。これらのアーチファクトを低減するために、運動補正スケーリング方法においては、測定された運動が信頼に足るものでない場合、空間補間が行われる。したがって運動のアーチファクトは、空間スケーリングによってもたらされるアーチファクトが生じる代わりに削減される。米国特許第6940557号明細書には、この方法の実施例が記載されている。
最先端のビデオスケーリング方法のうちで、高品質の超解像度スケーリングを行うために、入力ビデオシーケンスによって供給される時空間情報をフルに活用するものは一つもない。従って、本発明の目的は、少なくとも幾つかの上述した欠点を未然に防ぐあるいは軽減させて、ビデオシーケンスをスケーリング手法で変換することである。
本発明の主な目的は、デインターレース処理を含む、入力ビデオのロバストな超解像度スケーリング処理を行う方法及び手段を考案することである。
本発明による方法は、時空間入力グリッド上に定義された入力画像でビデオ信号を処理する。この方法では、所定の時空間出力グリッド上にビデオが出力される。入力グリッドにはない出力グリッドのポイントである新しいポイントの新しい時空間グリッド上で計算が行われる。
本発明は、所定の一群のパラメータ化された補間器を適用し、この補間器は、新しいグリッドの新しいポイントそれぞれの時空間近傍の入力ビデオ値のパラメータ化された重み付け平均化を実行し、各新しいポイントにおいてパラメータ化された補間値を出力する新しい線形演算子である。運動を推定し推定された運動に従って空間又は時間補間のいずれかに決定し補間値を算定する運動適応又は運動補正技術とは対照的に、本発明においては、運動の推定を必要としないため、このような運動の推定によって一般に発生する誤差が軽減される。補間値を最適化するために運動を推定する代わりに、全ての見込まれる補間器が算定され、負の対数尤度により定義される損失値を最小化する、最適な補間器がロバストな最大尤度技術で選択される。
各新しいポイントにおいて、本方法は、時空間近傍における入力ビデオ値を前提として、新しいポイント値の条件付確率分布を推定する。上記近傍における入手可能なデータ量が限られており、ビデオ値のばらつきが大きいため、区間鈍感型確率分布を用いてロバストな結果を得る。新しいポイントそれぞれに対して、この新しいポイントの時空間的近傍における入力画像値から1つの区間が推定され、これにより、この新しいポイントの出力画像値の確率密度が、この値の区間内において最大値を有するように推定される。
各新しいポイントに対して、本発明は、前記新しいポイントに関連する値の区間内において一定及び最大である第2の確率分布に基づく鈍感型損失値を各パラメータ化された補間値に対して算定する。第2の確率分布は、本明細書において「区間−鈍感型」とも称される。この鈍感型損失値は、前記新しいポイントに関連する値の区間から定義される区間−鈍感型確率分布に対する前記補間値の負の対数尤度を表す。
各パラメータ化された補間器に対して、各新しいポイントの空間近傍における加重和に合わせて正規化するために鈍感型損失値が空間的に選別され、この正規化された損失値は最小損失値選択工程で入力される。
前記新しいグリッドの各新しいポイントに対して、本発明はこの新しいポイントにおける全てのパラメータ化された補間値のうちで、正規化された損失値を最小化する最適なパラメータ化された補間値を選択する。次に、出力グリッドの各出力ポイントにおける値が、この出力ポイントが入力グリッド内にある場合に入力ビデオ値と等しいか、あるいはこの出力ポイントが新しいポイントである場合にこの出力ポイントにおける最適なパラメータ化された補間値に等しいかのいずれかであるビデオが出力される。
本発明においては、各新しいポイントごとに鈍感型区間を、新しいポイントの時空間近傍を複数の近傍に分割するロバスト工程によって推定することができる。各小近傍に対して、部分的鈍感型区間が、この小近傍の入力画像値を仕分けすることによって得られる特定の階数の2つの値から推定され、単一の鈍感型区間が、この複数の部分的鈍感型区間を組み合わせることにより得られる。
本発明においては、区間−鈍感型確率分布は、鈍感型区間の外側に指数関数的減衰を有するバプニック区間鈍感型確率分布であり得る。
本発明による方法は、総変動増分による鈍感型損失値のペナリゼーションを更に含むことができる。このペナリゼーションにより、選択された最適な補間値によりもたらされた振動を制御する。各パラメータ化された補間器及び各新しいポイントに対して、本方法は、新しいポイントの一次元近傍において、パラメータ化された補間器によって計算される入力画像値及び補間値の集約から得られる、総変動増分の算定を含むこともできる。この一次元近傍は選択により水平又は垂直にすることができる。各パラメータ化された補間器に対して、この総変動増分は各新しいポイントの空間近傍の加重和を用いて空間的に選別され、この正規化された総変動増分が最小損失値選択工程の入力に加えられる。各新しいポイントに対して、正規化された鈍感型損失値を前記新しいポイントにおける正規化された総変動増分によってペナライズすることができ、これにより、選択された最適なパラメータ化された指向性補間によりこのペナライズされた正規化鈍感型損失値が新しいポイントにおける全てのパラメータ化された補間値のうちで最小化される。
本発明においては、パラメータ化された補間器は、入力グリッドのパラメータ化された時空方向に沿って線形補間値を算定する、パラメータ化された指向性補間器であり得る。
本発明による方法は、指向性マッチングエラーによる鈍感型損失値のペナリゼーションを更に含み得る。ペナライズされた指向性補間器に対しては、このペナリゼーションによって、選択された最適な補間値の時空方向における入力画像値の変動が確実に小さくなる。パラメータ化された時空方向に沿ったパラメータ化された指向性補間器のそれぞれと各新しいポイントに対して、時空方向に沿って新しいポイントに合わせて配向されている補間入力ビデオ値間の差から指向性マッチングエラーが算定される。パラメータ化された指向性補間器のそれぞれに対して、各新しいポイントの空間近傍における加重和を用いて指向性マッチングエラーが選別され、この正規化されたマッチングエラーが最小損失値の選択工程の入力に加えられる。各新しいポイントに対して、正規化された鈍感型損失値が正規化されたマッチングエラーによってペナライズされ、この新しいポイントにおけるパラメータ化された補間値全てのうちでこのペナライズされた正規化鈍感型損失値を最小化する最適なパラメータ化された指向性補間値が選択される。各新しいポイントに対して、正規化された鈍感型損失値は、この新しいポイントにおける正規化された総変動増分及び正規化されたマッチングエラーの両方によってもペナライズすることができ、これにより最適なパラメータ化された指向性補間値が選択される。
本発明の方法は、特にプログレッシブ方式のビデオを出力するためにインターレースされる入力ビデオに適用される。上記デインターレース処理に対しては、本発明による方法は、入力画像を「テレシネフィルム方式」又は「インターレース方式のビデオ」に分類するステップと、入力画像が「前の」入力画像又は「次の」入力画像のどちらに最も類似しているかを特定するステップとを更に含み得る。次に、各新しいポイントにおける最適なパラメータ化された指向性補間値の選択が変更され、画像の種類によって、この新しいポイントにおけるぺナライズされた正規化鈍感型損失値を最小化するか、あるいはこの新しいポイントの位置における「次の」又は「前の」画像値の複写であるかのいずれかとなる。
本発明の別態様は、時空間入力グリッドのポイントにおけるそれぞれの入力画像値を有する入力ビデオ信号を処理し、前記入力グリッドのポイント及び新しいポイントを包含する時空間出力グリッドのポイントにおけるそれぞれの出力画像値を有する出力ビデオ信号を送信するためのデジタルビデオスケーリング方法に関する。該方法は、前記新しいポイントそれぞれに対して下記のステップを含む。所定の一群のパラメータ化された線形補間器を、前記新しいポイントのそれぞれの時空近傍の入力画像値に適用し、一群の各補間器に対して前記新しいポイントの補間値を供給する。一群の各補間器に対して、前記新しいポイントの一次元空間近傍において前記補間器によって計算される入力画像値及び補間値の集約から得られる総変動増分を算定する。一群の各補間器に対して、前記新しいポイントの空間近傍での総変動増分を空間的に選別する。選別された総変動増分に応じて最小化基準を満たす前記一群の補間器を選択し、選択された補間器の補間値が前記新しいポイントの出力画像値としてみなされる。上記最小化基準は通常、選別された総変動増分を、上述したような区間−鈍感型確率分布から生成され選別された損失値で有利に構成される別のコスト又は損失値と組み合わせている。しかし、他のコスト又は損失関数も、本発明の代替実施形態において使用することができる。
本発明は更に、テレビの画面上に画像を表示するテレビジョン方式を備え、このテレビジョン方式が、入力ビデオ信号を受信する手段、上に開示した方法に従って入力ビデオ信号を処理する手段と、該処理する手段によって生成された出力ビデオ信号を表示する手段とを備える。
本発明は更に、上に開示した方法を実行するように構成された算定手段を備える、ビデオスケーリング装置を含む。
本発明は更に、コンピュータプログラム製品がコンピュータ処理装置内で実行される場合に、上に開示した方法を実行するための命令を備える、コンピュータプログラム製品を含む。
本発明とともに、本発明の前述及び他の目的、本発明の様々な特徴は、添付の図とともに下記の説明を読むことにより更に十分に理解できる。
図1に、本発明を例示する第1の装置を示す。該装置は、時空間入力グリッドG上に定義された2D画像のビデオ信号を処理する。tが整数パラメータである各時間インデックスtに対し、時空間入力グリッドGは、Rにおける座標がx(n,n,t)=nτ+αnτ+tτ+τ(t)であるポイントのグリッドであり、この座標において、τ=(1,0,0)及びτ=(0,1,0)が正規化された水平及び垂直の空間ベクトル、τ=(0,0,1)が時間ベクトル、τ(t)がビデオがインターレース方式であるかプログレッシブ方式であるかによって変わる空間シフトである。入力ビデオがインターレース方式である場合、入力ビデオは2つの時刻t及びt+1における2つのフィールドから成り、時刻tについては、第1のフィールドにも偶数行が含まれ、第2のフィールドには奇数行が含まれる。この場合、入力グリッドはRにおいてα=2及びtが偶数の場合はτ(t)=(0,0,0)、tが奇数の場合はτ(t)=(0,1,0)で定義される。入力ビデオがプログレッシブ方式の場合、入力グリッドはRにおいてα=1及び全てのtに対してτ(t)=(0,0,0)で定義される。各入力グリッドポイントx(n,n,t)に対し入力ビデオの画像値はv(n,n,t)となる。例えば、PAL基準によれば、整数n、nはそれぞれ1から720まで、及び1から288までの範囲にあり、αは2に等しく、tの一単位に相当する時間増分は20ミリ秒である。
画像値は一般に多成分の値である。例えば、YCbCrの色空間において、各グリッドポイントは輝度を特定するY成分、及び共に色を特定する2つの彩度成分CbとCrを有する。本明細書においては、処理工程を単一成分において説明しているため、画像値v(n,n,t)は単一成分の値全てを特定するのに使用される。しかし、幾つかの代替方法では、全ての成分を同時に処理することが可能であり、下記に更に説明する。
図1の超解像度システムでは、時空間出力グリッドG^上に定義された2D画像のビデオストリームが出力される。各時刻tにおいて、出力グリッドG^はポイントx(n,n,t)=ατ+ααnτ+tτ+τ(t)の均一な空間グリッドであり、ここでn,n及びtは整数、(α,α)は1より大きい又は小さい入力グリッドに対する空間スケーリングパラメータ、τ(t)は空間シフトである。出力グリッドがインターレース方式のグリッドの場合、tが偶数である場合はτ(t)=(0,0,0)であり、tが奇数である場合はτ(t)=(0,1,0)である。出力グリッドがプログレッシブ方式のグリッドである場合、全てのtにおいてτ(t)=(0,0,0)である。次に、n=(n,n)となる。各出力グリッドポイントx^(n,t)に対して、出力ビデオは値v^(n,t)によって特定される。入力グリッドがインターレース方式であり、出力グリッドがプログレッシブ方式である場合、スケーリングシステムはデインターレースシステムといわれる。α=α=1が成り立つ場合、尺度単位のデインターレースシステムといわれる。例えば、720pHDTV基準では、整数n、nはそれぞれ1から1280まで及び1から720までの範囲にある。入力ビデオがPAL基準に基づく場合、パラメータはα=576/720、α=720/1280である。
各時間tにおいて、超解像度スケーリングシステムは、画像v(n,t+d)の入力を取り込み、通常1から5の間である遅延dの遅れで画像v^(n,t)を出力する。新しいグリッドG~は、Gに属さない出力グリッドG^の全てのポイント一式として定義される。新しいポイントとは、新しいグリッドのポイントである。
^(n,t)の計算は最大尤度法で行われる。推測的に定義される一群の補間器により、各新しいポイントの一群の画像値が得られる。未知の新しいポイント値の条件付確率分布は、各新しいポイントの近傍で得られた入力画像値から推定される。
装置には、入力ビデオの入力を取り込み、マルチパラメータγで指標付けされた一群の線形補間器{Eγγ∈Γを所定のパラメータ一式Γに適用するパラメータ化された補間モジュール(101)が含まれる。モジュール(101)は、各新しいグリッドポイントx^(n,t)∈G~において、一群の補間値{v^ γ(n,t)}γ∈Γを出力する。線形補間器Eγは、x^(n,t)∈G~のvγ(n,t)を│s│≦dである入力画像値v^(n’,t−s)のパラメータ化された加重平均で算定する:
Figure 0004932900
二次元補間カーネルKγ(x)は有限サポートを有するため、和(1)はx(n’,t−s)がx^(n,t)に十分近い有限項数で評価される。全ての最先端の補間器を本発明において使用することができる。指向性時空補間器の例示実施形態を後に説明する。補間は、異なる方向に沿って、分離可能な一次元線形補間によって実行される。f(p)の値からのuにおけるある一次元線形補間値は、FIR線形フィルタリングによって計算可能である:
Figure 0004932900
ここで、補間カーネルKは〔−Δ,Δ〕に含まれるサポートを有し、全てのu∈〔0,1〕に対してΣΔ p=−ΔK(u−p)=1が満たされる。通常△は1から8の間である。
鈍感型対数尤度
各新しいポイントx^(n,t)における最適な補間値の選択は、近傍の入力ビデオ値v(p,t)から計算される負の対数尤度を最小化することによって有利に行われる。近傍の入力画像値が既知である新しいポイントの画像値の条件付確率分布は、鈍感型区間を用いて推定され、鈍感型区間内では、この区間内の確率分布値の判別を可能にするデータが欠けるため、この確率分布が最大限及び一定になるように推定される。ポイントxと区間I=〔a,b〕との間の距離は、下記のように表される:
Figure 0004932900
区間鈍感型確率分布p(u)は、I=〔a,b〕及び∈=b−aに対して下記のように定義される:
Figure 0004932900
ここで、定数∈全てに対してf(0,∈)=1が成り立ち、f(u,∈)はuの単調減少関数であり、ηが∫p(u)dx=1が成り立つように調整される。f(u,∈)には何を選択してもよい。バプニックロバスト区間鈍感型確率分布は下記のように定義される:
Figure 0004932900
これは、f(∈,u)=exp(−u)に対応する。f(∈,u)=exp(−u/∈)を選択することもまた可能である。
本装置は、各新しいポイントx^(n,t)∈G~に対して、鈍感型区間I(n,t)=〔a(n,t),b(n,t)〕を算定する鈍感型区間推定モジュール(102)を有し、鈍感型区間I(n,t)=〔a(n,t),b(n,t)〕内にはx(n,t)の出力画像値が位置する可能性が高いが、この中には異なる値の確率を判別する重要な情報が含まれていない。区間I(n,t)は、x(n’,t’)が特定の近傍x^(n,t)のN(n,t)にある入力画像値v(n’,t’)から計算される。C(n,t)を、この近傍のポイント数と仮定する。例示の実施形態においては、近傍x^(n,t)のN(n,t)は、|t−t’|≦dである入力グリッドポイント一式、x(n’,t’)として定義され、ここでx(n’,t’)の空間座標は、x^(n,t)の空間座標の中央にある幅2Δを有する空間的正方形にあり、ここでΔは所定のパラメータである。通常Δは1から5の間である。
例示の実施形態では、鈍感型区間は平均値m(n,t)及び近傍の全てのポイントの標準偏差σ(n,t)から算定される:
Figure 0004932900
モジュール(102)は、I(n,t)=〔m(n,t)−βσ(n,t),m(n,t)+βσ(n,t)〕を設定し、ここでβは通常3よりも小さい定数である。別の実施形態では、モジュール(102)はN(n,t)のポイントの順位化された統計値から鈍感型区間を推定する。v≧vk+1である場合のN(n,t)の順位化された値C(n,t)を{v1≦k≦C(n,t)で示す。pをp<C(n,t)/2となる正の整数とする。C(n,t)が偶数の場合、k=C(n,t)/2−p+1及びk=C(n,t)/2+pであり、C(n,t)が奇数の場合、k=(C(n,t)+1)/2−p及びk=(C(n,t)+1)/2+pである。順位化された統計値である鈍感型区間I(n,t)=〔a(n,t),b(n,t)〕は、a(n,t)=vk1及びb(n,t)=vk2によって定義される。通常pは1から3の間である。
更に別の例示実施形態では、鈍感型区間の推定はN(n,t)を複数の互いに素であるサブセットN(n,t)=U i=1(n,t)に分割することによって行われる。鈍感型区間I(n,t)は、平均値及び標準偏差手法又は順位化統計手法等の全ての手法を用いて、各N(n,t)から計算される。これらの鈍感型区間は次に組み合わされて、単一の鈍感型区間を形成する。例示の実施形態では、N(n,t)はt’=tに対する全てのポイントx(n’,t’)∈N(n,t)の一集団N(n,t)に、及びt’≠tに対する全てのポイントx(n’,t’)∈N(n,t)の一集団N(n,t)に分離される。2つの鈍感型区間I(n,t)及びI(n,t)が非空交差を有する場合、最終的な鈍感型区間I(n,t)はこの交差として定義され、そうでない場合、区間I(n,t)は2つの区間の結合として設定できる。
本装置は更に、各補間器Eγ及び各新しいポイントx^(n,t)∈G~に対して、I(n,t)=〔a(n,t),b(n,t)〕に関して計算された区間鈍感型確率分布に対するv^ γ(n,t)の負の対数尤度を出力する、鈍感型損失値計算モジュール(103)を含む。この目的は、負の対数尤度から追加の定数を除去できるように、この損失値を最小化することである。(2)の結果、この損失値は∈(n,t)=b(n,t)−a(n,t)に対して、下記のように表される:
Figure 0004932900
バプニックロバスト区間鈍感型確率分布(3)に対しては、この損失値は下記のように表される:
Figure 0004932900
空間正規化モジュール(104)は、各γ∈Γに対して及び各新しいポイントx^(n,t)∈G~において計算された鈍感型損失値lγ(n,t)の入力を取り込み、空間低域フィルタリングを行って、空間近傍N~ (n,t)上の正規化された損失値をこの近傍上の加重和を生成することによって算定する。例示の実施形態においては、N~ (n,t)は、新しいグリッドポイントの固定番号Cを含むx^(n,t)に中心がある長方形であり、全ての加重は1に設定される。正規化は従って、通常16から256の間である、これらのCポイント上の和として計算される:
Figure 0004932900
この和を評価するのに、最先端の全ての高速アルゴリズムを使用することが可能である。別の例示実施形態では、この和は、N~ (n,t)の全ての加重の和が全ての新しいポイントx^(n,t)∈G~に対して変わらない定数に等しい加重和に置き換えられる。
図1に示す装置は、各新しいポイントx^(n,t)∈G~及び全てのγ∈Γに対する入力値l^ γ(n,t)を取り込み、全ての補間器上の損失値l^ γ(n,t)を最小化する最適な補間器のパラメータφ(n,t)∈Γを求める最小損失値選択モジュール(105)を有する:
Figure 0004932900
損失値選択モジュール(105)は、各新しいポイントに対する最小損失補間値v^ φ(n,t)(n,t)を出力する。
入力/新しいグリッド集約モジュール(106)は、各新しいポイントx^(n,t)∈G~及び入力ビデオ値v(p,t)の最小損失補間値v^ φ(n,t)(n,t)の入力を取り込み、出力グリッドG^上に定義される超解像度ビデオを出力する。各新しいポイントx^(n,t)∈G~に対し、集約モジュール(106)は、最小損失補間値v^(n,t)=v^ φ(n,t)(n,t)を出力する。入力グリッドx^(n,t)=x(p,t)∈G内の各出力ポイントに対して、集約モジュール(106)は、対応する入力ビデオ値v^(n,t)=v(p,t)を出力する。
上述した図1の例示実施形態の詳細説明により、同業者には様々な代替物、変更物、及び同等物が明らかとなる。例えば、メモリー要求を削減するための、モジュール(101)、(102)、(103)、(104)及び(105)での計算による空間位置特定を有効利用する全ての最先端の最適化及び計算の順序付けは、本発明の構想から外れることなく同じ機能を実行する。
上述した装置は、ビデオ画像の単一成分を処理する。多成分画像に対しては、全ての成分を個々に処理することができる。本発明に含まれる別の可能性としては、全ての成分を同時に処理して、モジュール(103)の鈍感型損失値を各成分に対して得られる鈍感型損失値の加重和として定義し、これにより全ての所定の新しいグリッドポイントの全ての成分に対して同じ最適な補間器Eγを選択することである。
総変動ペナリゼーション
本発明による方法は更に、鈍感型損失値を総変動増分によってペナライズすることを含む。このペナリゼーションを行うことにより、選択された最適な補間によりもたらされた振動が制御される。
図2に本発明による別の装置を示す。この実施形態においては、パラメータ化された補間値を選択するのに用いた損失関数が、総変動増分によってペナライズされる。図2のモジュール(201)、(202)、(203)及び(204)は、それぞれ図1のモジュール(101)、(102)、(103)及び(104)と同一である。図2のモジュール(208)は図1のモジュール(106)とも同一である。
図2に示す装置は、各補間器Eγに対して補間された新しいポイント値のグリッドを各新しいポイントx^(n,t)∈G~の近傍で入力ビデオ値のグリッドに挿入することにより得られる総変動増分を算定する総変動増分モジュール(205)を備えている。好ましい実施形態においては、近傍は一次元であり、水平又は垂直のいずれかになるように選択される。デインターレースシステムでは、この近傍はデインターレース処理の結果得られる垂直方向の総画像変動増分を制御するために垂直になるように選択される。垂直の一次元近傍が選択された例示の実施形態を下に説明する。同じ手法は画像の行と列の役割を交換することにより、水平の近傍に対して適用される。
^(n,t)∈G~の垂直の一次元近傍は、x^(n,t)の中央に位置するサイズLの垂直セグメントである。Lの値は、通常1から15の間のパラメータである。最上部から最下部まで、x^(n,t)の垂直近傍にあるG~の新しいポイントの垂直座標を{h^ で示し、Eγを用いて計算される対応する補間値を{v^ で示す。図4に入力ポイントx(p,t)の位置を十字、新しいポイントx^(n,t)を黒い丸、他の新しいポイントx^(n’,t)を白い丸、そして一次元の垂直近傍を垂直の破線セグメントで示す。この垂直セグメントを交差する各入力画像行に対して、入力画像値が画像行に沿った一次元の補間操作によって交差位置で計算される。最上部から最下部まで、これらの交差位置の垂直座標を{hで示し、対応する入力画像値を{vで示す。これらの補間ポイントの位置を、図4において三角形で示す。入力グリッドがインターレース方式のグリッドであり、出力グリッドがスケーリングファクタがα=α=1であるプログレッシブ方式のグリッドである場合、図5に示すように、新しいポイントは入力ポイントと同じ列上にあり、値vは入力ビデオ値に対応する。
垂直座標h^ の垂直近傍の各新しいポイントに対して、h>h≧hk+1である座標h及びhk+1の2つの連続する入力画像ポイントが存在するか、あるいはこのポイントが垂直セグメントの最下部又は最上部のポイントに対応するかのいずれかである。第1の条件が満たされる場合、v及びvk+1の間にv^ を挿入することによって得られる総変動増分は、|v^ −I|で表されるv^ 及び区間I=〔min(v,vk+1),max(v,vk+1)〕の間の距離に等しい。この距離は、2つの入力画像ポイント値の間に位置する垂直近傍で各新しいポイントに対して計算される。
逆に、垂直座標hの垂直近傍の各入力ポイントに対しては、h^ l’>h≧h^ l’+1である座標h^ l’及びh^ l’+1の2つの連続する新しいポイントが存在するか、あるいはこのポイントが垂直セグメントの最下部又は最上部のポイントに対応するかのいずれかである。v^ l’−1及びv^ l’の間にvを挿入することによって得られる総変動増分は、|v−I^ l’|で表されるv及び区間I^ l’=〔min(v^ l’,v^ l’−1),max(v^ l’,v^ l’−1)〕の間の距離に等しい。この距離は、2つの新しいポイント画像値v^ l’−1及びv^の間に位置する各vに対して計算される。
この結果得られたx^(n,t)の垂直近傍における推定器Eγの総変動増分測定量は、wγ(n,t)で表される。これは、この垂直近傍の2つの新しいポイント画像値v^ l’−1及びv^ l’との間に位置する全ての入力ポイントvと、2つの入力画像ポイント値v及びvk+1の間に位置する全ての補間値に対して得られた総変動増分を集約することによって計算される。例示の実施形態では、wγ(n,t)はこれら全ての総変動増分の加重平均である。更に別の例示実施形態では、wγ(n,t)はこれら全ての総変動増分における順位化された統計から得られる。wγ(n,t)の値は、全ての総変動増分の順位化されたリストのp値として得られ、pは正の整数である。
図2に示す空間正規化モジュール(206)は、各パラメータ化された補間器Eγに対して各新しいポイントx^(n,t)∈G~で計算される総変動の値wγ(n,t)の入力を取り込み、空間低域フィルタリングを行って、より大きい空間近傍上の加重和で正規化された総変動増分を計算する。例示の実施形態においては、モジュール(206)は、新しいグリッドポイントの通常4から64の間である固定数Cを含む長方形の空間近傍x^(n,t)のN~ (n,t)の和を算定する:
Figure 0004932900
別の例示実施形態においては、この和はN~ (n,t)の全ての加重の和が全ての新しいポイントx^(n,t)∈G~に対して変わらない定数に等しい加重和と置き換えられる。
最小損失値選択モジュール(207)は、各新しいポイントx^(n,t)∈G~に対する及び各補間器Eγに対する正規化された区間鈍感型損失値l^ γ(n,t)及び正規化された総変動値w^ γ(n,t)の入力を取り込み、ペナライズされた損失値を算定する
Figure 0004932900
ここで、λは通常1から10の間である所定のペナリゼーション定数である。モジュール(207)は、全ての補間器においてペナライズされた損失値l^ γ(n,t)を最小化する最適な補間器のパラメータφ(n,t)∈Гを求める:
Figure 0004932900
そして、モジュール(207)は、各新しいポイントに対して最小損失推定値v^ φ(n、t)(n,t)を出力する。
最適な補間器の選択の精度を上げるために、図1を参照して記述されている区間鈍感型損失値とは異なる損失測定値に、総変動ペナリゼーションを適用することができる。従って、総変動ペナリゼーションは、本発明とは異なる構成において使用することができる。
図1に示した装置と同様に、上述した装置はビデオ画像の単一成分を処理する。多成分画像に対しては、全ての成分を個々に処理することができる。本発明に含まれる別の可能性としては、全ての成分を同時に処理して、モジュール(207)のペナライズされた損失値を各成分に対して得られるペナライズされた損失値の加重和として定義し、これにより所定の新しいグリッドポイントにおける全ての成分に対して同じ最適な補間器Eγを選択することである。
パラメータ化された指向性補間値
図3に本発明による装置の別の実施形態を示す。補間はパラメータ化された方向に沿って実施され、指向性マッチング損失値によってこれらの方向に沿った入力画像の変動測定値が得られる。図3のモジュール(302)、(303)、(304)、(306)はそれぞれ図2のモジュール(202)、(203)、(204)、(206)と同一であり、モジュール(311)はモジュール(208)と同一である。
パラメータ化された指向性補間器モジュール(301)は入力ビデオの入力を取り込み、方向パラメータを含むマルチパラメータγで指標付けされ、一群の線形補間器{Eγγ∈Γを適用することにより得られる一群の補間値{v^ γ(n,t)}γ∈Γを各新しいグリッドポイントx^(n,t)∈G~で算定する。好ましい実施形態においては、これらのパラメータ化された指向性補間器は、入力画像の行又は列に沿った一次元補間によって、そしてパラメータ化された時空方向に沿った指向性補間によって計算される。一次元補間には、全ての最先端の手法を活用することができる。
指向性マッチングエラーモジュール(307)は、入力ビデオを受信して、パラメータ化された指向性補間器{Eγγ∈Γに関連する一群の指向性マッチングエラー値{eγ(n,t)}γ∈Γを各新しいグリッドポイントx^(n,t)∈G~において算定する。好ましい実施形態においては、これらのマッチングエラーは各パラメータ化された方向に沿った入力画像値間の差から計算される。これらの指向性マッチングエラーによって、各指向性補間器の時空方向における入力ビデオの変動値が数値表示される。
好ましい実行例においては、補間器は空間ベクトルw=wτ+wτ(w,w,0)によって特定された時空方向と、入力画像v(p,t−s)及びv(p,t+s)を特定する時間増分によってパラメータ化され、時間増分からx^(n,t)の補間値が計算される。これらの補間器はしたがって、時空パラメータのΓの所定の一群のうちから選択されるマルチパラメータ値γ=(w,w,s)によって特定される。
Γにおける時間的推移sの最大値は、超解像度システムの遅延dである。s=dとなるまでの画像x(n,t+s)は、新しいポイント値vγ(n,t)を推定するのに必要であり、これらの推定を実行するためには、t−d≦t’≦t+dに対しては2d+1画像x(n,t’)であることを覚えておかなければならない。
s=0の場合、vγ(n,t)は入力画像値v(n’,t)から空間補間器を用いて計算される。この空間補間は、最初に優先的な方向、すなわち水平又は垂直方向のいずれかに沿って、その後に空間的方向w=(w,w,0)に沿って分離可能な補間によって行われる。入力ビデオがインターレース方式の場合、優先的な補間の方向には、サンプリングの分布が列より行に沿ってのほうが2倍大きいため、水平方向が選択される。入力ビデオがプログレッシブ方式である場合、優先的な補間の方向には、水平方向(1,0)における(w,w)の角度がπ/4よりも小さい場合に垂直方向を選択することができ、この場合、w=1を正規化し、優先的な補間の方向には、水平方向における(w,w)の角度がπ/4よりも大きい場合に水平方向が選択され、この場合、w=1を正規化する。
従って、優先的な補間の方向がx^(n,t)において水平と仮定すると、w=(w,1)となる。x^(n,t)が入力グリッドの行上に位置している場合は、vγ(n,t)は、一次元の線形補間によってx^(n,t)においてこの行に沿って計算することができる。x^(n,t)が入力グリッドの行上に位置していない場合、その位置は、x^(n,t)=xτ+αxτ+τ(t)+tτで表すことができ、nをn<x<n+1となるように固有の整数とする。y=x(n,t)+α(n+1−x)wとz=x^(n,t)−α(x−n)wを、x^(n,t)のw方向における入力画像行の真上及び真下の予測値とする。yにおける画像値vは、n’=(p,n)に対して行v(n’,t)に沿った入力画像値の補間を、変数pに沿った一次元補間法を用いて行うことによって得られ、zにおける画像値vは、n’=(p,n+1)に対して行v(n’,t)に沿った入力画像値の一次元補間法を実施することによって得られる。例示の実施形態においては、x^(n,t)における画像の補間値は、一次の線形補間値v及びvで定義される:
Figure 0004932900
^(n,t)の補間器Eγに対しモジュール(307)によって計算された指向性マッチングエラーは、v及びvの間のw方向における指向性の変動量である:
Figure 0004932900
ここで、η>0は推測的に選択された固定指数であり、通常1又は2に等しい。尺度単位でデインターレース処理が行われる特殊な例では、x=n+1/2であり、従ってv^ γ=(n,t)=(v+v)/2となる。この例を図6に示す。
優先的な補間の方向が水平ではなく垂直である場合、w=(1,w)であり、入力画像の行及び列の役割を交換し、及びαを1に置き換えるだけでなく、水平及び垂直座標軸の役割を交換することによって、同じ算定方法を補間器に対して適用することができる。
s>0である場合、t−s及びt+sにおける画像でのx^(n,t)の時空予測値は、y=x^(n,t)−w−sτ及びz=x^(n,t)+w+sτに位置する。位置yにおける画像値vは、グリッドポイントx(n’,t−s)の入力画像値v(n’,t−s)の行及び列に沿った分離可能な補間によって計算される。同様に、位置zの画像値vは、グリッドポイントx(n’,t−s)の入力画像値v(n’,t+s)の行及び列に沿った分離可能な補間によって計算される。x^(n,t)の推定画像値は、v^ γ(n,t)=(v+vz)/2であり、指向性マッチングエラーは、eγ(n,t)=|v−vηである。
好ましい実施形態においては、各新しいポイントx^(n,t)に対して、t−s及びt+sにおける予測位置y及びzがこれらの行及び列に沿った固定因数で入力画像値v(n’,t−s)及びv(n’,t+s)をオーバーサンプリングすることにより推測的に計算された均一のグリッド上に位置するように、全て可能性のある方向一式wが選択される。
デインターレースシステムにおいては、優先的な空間補間の方向は水平方向である。例示の実施形態では、尺度単位で、s=0に対する一群の空間方向ベクトルwは、{(k/q,1,0)}−K≦k≦Kであり、ここでqは固定整数である。図6に、これらの空間補間を行うのに必要なオーバーサンプリングを、通常の選択条件であるq=2及びK=4で示す。十字は入力画像ポイントx(p,t)を示し、白い丸は中間の補間ポイントであり、黒い丸は異なる9方向の出発点である新しいポイントである。一群の時空方向ベクトルは、時間的推移のパリティによって変わる。sが奇数である場合、一群の時空方向ベクトルは{w=(k/q,2l,0)}−Kl≦k≦Kl,−L≦l≦Lであり、s>0が偶数の場合、一群の時空方向ベクトルは{w=(k/q,2l+1,0)}−Kl≦k≦Kl,−L≦l≦Lであり、ここでKはlによって変わり、又は、通常2から8の間の値である定数として選択される。qの値は通常1から8の間の値であり、Lの値は通常1から5の間の値である。このような一群の方向に対して、全ての予測位置y及びzは、入力画像行v(n’,t−s)及びv(n’,t+s)を因数qでオーバーサンプリングすることにより得られる均一のグリッドに沿った位置である。図7に、オーバーサンプリングの因数q=2に対応する時空間補間の方向を示す。十字は入力画像ポイントx(p,t)を示し、白い丸は中間の補間ポイントであり、黒い丸は新しいポイントx^(n,t)である。
図3に示す空間正規化モジュール(308)は、各パラメータ化された補間器Eγに対する各新しいポイントx^(n,t)∈G~において計算された指向性マッチングエラーeγ(n,t)の入力値を取り込み、空間低域フィルタリングを行ってより大きい空間近傍上の加重和を用いて正規化された指向性マッチングエラーを算定する。例示の実施形態では、モジュール(308)は、通常16から256の間の値である新しいグリッドポイントの固定数Cを含むx^(n,t)の長方形の空間近傍N~ (n,t)上の和を算定する:
Figure 0004932900
別の例示実施形態では、この和はN~ (n,t)の全ての加重の和が全ての新しいポイントx^(n,t)∈G~に対して変わらない定数と等しい加重和に置き換えられる。
尺度単位を用いるデインターレースシステムにおいては、テレシネフィルム形式の入力ビデオのデインターレース処理のケースを組み入れるために、前の及び次の画像の複製を行う2つの単一の補間器が組み込まれる。前の画像の複製を行う補間器をEγpと記載し、Eγpはx(n’,t−1)がx^(n,t)と同じ空間位置を有するvγp(n,t)=v(n’,t−1)を設定し、次の画像の複製を行う補間器をEγnと記載し、Eγnはx(n’,t+1)がx^(n,t)と同じ空間位置を有するvγn(n,t)=v(n’,t+1)を設定する。
デインターレースシステムにおいて、スケーリングシステムは、各入力画像v(n,t)に対して画像が「インターレース型ビデオ」シーケンスであるか又は「テレシネフィルム型ビデオ」であるかを特定する画像の種類c(t)を出力するグローバルビデオ/フィルム分類器(309)を備えることもできる。「インターレース型ビデオ」のカテゴリーは、画像がインターレースされたビデオのフィールドであることを表す。「テレシネフィルム型」のカテゴリーは、入力画像がテレシネフィルムのフィールドであることを表す。これら種類の各々は、画像v(n,t)が「前の」入力画像に最も類似しているか、あるいは「次の」入力画像に最も類似しているかを特定することにより、微細化される。従って、4つの種類は、「テレシネフィルム型、次」、「テレシネフィルム型、前」、「インターレース型ビデオ、次」及び「インターレース型ビデオ、前」となる。
第1の実施形態では、グローバルビデオ/フィルム分類器(309)は、ユーザーにより画像が「インターレース型ビデオ」画像であるか、あるいは「テレシネフィルム型」画像であるかを特定することが可能となるユーザーインターフェースを有する。モジュール(309)の自動的な実施形態では、分類は大域的な総変動増分を測定することによって行われる。各新しいポイントx^(n,t)に対して総変動増分モジュール(305)は各補間器Eγに及び特に前の及び次の画像からの複製に相当するγ=γ及びγ=γに対応する総変動増分wγ(n,t)を出力する。モジュール(309)はこれら総変動増分wγp(n,t)とwγn(n,t)の入力値を取り込み、新しいグリッド全体にわたる大域的な総変動増分を算定する:
もし
Figure 0004932900
が成り立つ場合、
Figure 0004932900

Figure 0004932900
、及び
Figure 0004932900
上述の式では、η>1が通常10より小さく、η>1が通常10より小さい場合、画像の種類c(t)は「テレシネ型」画像に設定される。そうでない場合、推測的に通常1バイトの画像に対して1から50の間に設定される閾値Tに対し、
Figure 0004932900
が成り立つ場合には、c(t)もまた「テレシネフィルム型」に設定される。そうでない場合には、c(t)は「インターレース型ビデオ」画像に設定される。いずれの場合も、Wγn(t)<Wγp(t)である場合に、画像が次の画像により類似していることを示すサブ種類は「次」と判断され、そうでない場合は、サブ種類は「前」と判断される。
最小損失値選択モジュール(310)は、各新しいポイントx^(n,t)∈G~及び各補間器Eγに対して正規化された区間鈍感型損失値l^ γ(n,t)、正規化された総変動増分w^ γ(n,t)、及び正規化された指向性マッチングエラーe^ γ(n,t)の入力値を取り込む。モジュール(310)はペナライズされた損失値を算定し、設定された画像の種類c(t)によって最適な補間器のパラメータφ(n,t)を求める条件付最小化を行う。モジュール(310)は、各新しいポイントに対して最小損失推定値v^ φ(n,t)(n,t)を出力する。
スケーリングシステムが尺度単位のデインターレースシステムでない場合、各新しいポイントx^(n,t)に対して、正規化された鈍感型損失値は入力された総変動増分及び指向性マッチングエラーによってペナライズされる:
Figure 0004932900
ここで、λ及びμは2つのペナリゼーション定数である。λ及びμには、通常1から10の数が選択される。最小損失値選択モジュール(310)は、2つの複製補間器を除いて、このペナライズされた損失値を最小化するパラメータξを求める:
Figure 0004932900
そして、φ(n,t)=ξを設定する。
スケーリングシステムが尺度単位のデインターレースシステムである場合、最適な補間器の選択は、グローバルビデオ/フィルム分類器(309)の出力によって変わる。画像の種類c(t)が「テレシネフィルム型、次」である場合、分類器(309)は次の画像からの複製に対応するφ(n,t)=γを設定する。画像の種類c(t)が「テレシネフィルム型、前」である場合、前の画像からの複製に対応するφ(n,t)=γを設定する。画像の種類が「インターレース型ビデオ」である場合、[数23]((数(9))と同様に最小損失値補間器指標ξが計算される。画像の種類c(t)が「インターレース型ビデオ、次」である場合、この最適な補間器は局所的にテレシネ化されたシーケンスに対して次の画像補間器からの複製と比較される。もし
Figure 0004932900
が成り立ち、λ’がペナリゼーション定数である場合、φ(n,t)=ξであり、そうでない場合は、φ(n,t)=γである。λ’は通常1から10までの数から選択される。同様に、画像の種類c(t)が「インターレース型ビデオ、前」の場合、もし
Figure 0004932900
が成り立ち、λ’がペナリゼーション定数である場合、φ(n,t)=ξであり、そうでない場合は、φ(n,t)=γである。
図1及び図2に記載の装置のように、上述した装置はビデオ画像の単一成分を処理する。
複数の成分を含む画像に対しては、全ての成分を個々に処理することができる。本発明に含まれる別の可能性は、全ての成分を同時に処理してモジュール(310)のペナライズされた損失値を各成分に対して得られるペナライズされた損失値の加重和として定義し、これにより所定の新しいグリッドポイントの全ての成分に対して同じ最適な補間器Eγを選択する。
本発明は、汎用マイクロプロセッサ、若しくはデジタル信号プロセッサによって実行されるソフトウェアとして実現することができ、この場合図1ないし3を参照して上述したモジュールは、ソフトウェアモジュール又はルーティンである、あるいはソフトウェアモジュール又はルーティンの一部を形成している、と理解される。本発明はまた、例えばASIC又はFPGA等におけるハードウェア要素として実現することもでき、この場合、上述したモジュールは固体の要素の領域を形成することが可能である。本発明のこれらの実施形態は、インターレース方式のSDTVビデオを受信し、HDTVビデオを出力あるいは表示するセットトップボックスまたはハイビジョンテレビセット等の種々のユニットに組み込むことができる。本発明はまた、入力ビデオの形式を変更して規定のビデオ形式を出力するために、アップ/クロス/ダウンコンバータに組み込むこともできる。
本発明の例示の実施形態の詳細の説明を上述したが、様々な代替物、変更物、同等物は同業者に明らかとなるであろう。例えば、本発明のパラメータ化された補間器モジュール又は最小損失値選択モジュールの異なる要素は、ある特定の機能を行うものとして本明細書に記述されており、同業者は本発明の精神から逸脱することなしに、サービスモジュールにおけるほかの要素又は回路が上記の機能の幾つかあるいは全てを実施できることを理解するであろう。従って上述した説明により、添付の請求項によって規定された本発明の範囲が限定されると判断するべきではない。
ビデオ入力を取り込み、区間鈍感型損失値を最小化することにより所定の出力グリッド上で出力ビデオを算定する、本発明の例示実施形態を示すブロック図である。 ビデオ入力を取り込み、正規化された総変動増分によってペナライズされた区間鈍感型損失値を最小化することにより所定の出力グリッド上で出力ビデオを算定する、本発明の構成例を示すブロック図である。 ビデオ入力を取り込み、総変動増分及び指向性マッチングエラーによってペナライズされた鈍感型損失値を最小化することにより所定の出力グリッド上で出力ビデオを算定する、本発明の構成例を示すブロック図である。 総変動増分を計算するための入力グリッドポイント及び新しいポイントの形態を示す概略図である。 デインターレースシステムの総変動増分を計算するための入力グリッドポイント及び新しいポイントの形態を示す概略図である。 新しいポイントの指向性空間補間に使用される入力グリッドポイントを示す概略図である。 新しいポイントの指向性時空補間に使用される入力グリッドポイントを示す概略図である。

Claims (16)

  1. 時空間入力グリッドのポイントのそれぞれの入力画像値を有する入力ビデオ信号を処理し、前記入力グリッドのポイント及び新しいポイントを包含する時空間出力グリッドのポイントのそれぞれの出力画像値を有する出力ビデオ信号を送信するためのデジタルビデオスケーリング方法であって、前記方法が、前記新しいポイントそれぞれに対する下記のステップ、すなわち:
    (a)所定の一群のパラメータ化された線形補間器を、前記新しいポイントのそれぞれの時空近傍の入力画像値に適用し、それにより前記一群の補間器それぞれ前記新しいポイントの補間値を供給するステップ;
    (b)前記新しいポイントの出力画像値の確率分布が、前記値の区間内で最大になると推定されるように、前記新しいポイントに関連する値の区間を、前記新しいポイントの時空近傍の入力画像値から推定するステップ;
    (c)前記新しいポイントの補間値それぞれに対する損失値を、前記新しいポイントに関連する値の区間内で一定及び最大である第2の確率分布に基づいて算定するステップ;
    (d)前記新しいポイントの空間近傍において、前記一群の補間器それぞれについて算定した損失値を空間的にフィルタ処理するステップ; 及び、
    (e)フィルタ処理された損失値に応じて最小化基準を満たす前記一群のうち1つの補間器を選択するステップであって、選択された補間器に対する補間値が前記新しいポイントの出力画像値として採用されるステップ
    を含む、デジタルビデオスケーリング方法。
  2. 新しいポイントの補間値に対して算定された損失値が、第2の確率分布に対する前記補間値の負の対数尤度を表す、請求項1に記載のスケーリング方法。
  3. 新しいポイントの値の区間を推定するステップが、
    (a)前記値の区間を推定するのに使用される時空近傍を、複数の小近傍に分割すること;
    (b)入力画像値を前記小近傍の各々に仕分けすること;
    (c)前記小近傍の各々に対して、仕分けされた入力画像値の内の順位の2つの値から部分区間を推定すること; 及び、
    (d)複数の部分区間を組み合わせて、前記新しいポイントに関連する値の区間を形成すること、
    を含む、請求項1又は2に記載のスケーリング方法。
  4. 前記第2の確率分布が前記値の区間の外側において指数関数的減衰を有する、請求項1ないし3のいずれか1項に記載のスケーリング方法。
  5. 前記新しいポイントのそれぞれと、前記一群の補間器のそれぞれに対して、下記のステップ、すなわち:
    (a)前記新しいポイントの一次元空間近傍において前記補間器によって計算される入力画像値及び補間値の集約から得られる総変動増分を算定すること; 及び、
    (b)前記新しいポイントの空間近傍での前記総変動増分を空間的にフィルタ処理すること
    を更に含み、新しいポイントに対する前記一群のうち1つの補間器を選択するための最小化基準が、フィルタ処理された総変動増分に更に依存する、請求項1ないし4のいずれか1項に記載のスケーリング方法。
  6. 前記一次元空間近傍が、垂直又は水平の空間近傍である、請求項5に記載のスケーリング方法。
  7. 新しいポイントに対して前記一群のうち1つの補間器を選択する最小化基準が、フィルタ処理された損失値の加重和及びフィルタ処理された総変動増分の加重和を含む、請求項5又は6に記載のスケーリング方法。
  8. 前記一群の補間器が、入力グリッドの各々パラメータ化した時空方向に沿った線形補間値を算定するためのパラメータ化された指向性補間器を含む、請求項1ないし7のいずれか1項に記載のスケーリング方法。
  9. 前記新しいポイントの各々と、前記一群の指向性補間器の各々に対して、下記のステップ、すなわち:
    (a)前記補間器に対応する時空方向に沿って前記新しいポイントに配向している補間入力画像値間の差から指向性マッチングエラーを算定するステップ; 及び、
    (b)前記新しいポイントの空間近傍での前記指向性マッチングエラーを空間的にフィルタ処理するステップ;
    を更に含み、新しいポイントに対する前記一群のうち1つの補間器を選択するための最小化基準が、フィルタ処理された指向性マッチングエラーに更に依存する、請求項8に記載のスケーリング方法。
  10. 新しいポイントに対する前記一群のうち1つの補間器を選択するための最小化基準が、フィルタ処理された損失値の加重和と、フィルタ処理された指向性マッチングエラーの加重和とを含む、請求項9に記載のスケーリング方法。
  11. 新しいポイントに対する前記一群のうち1つの補間器を選択するための最小化基準が、フィルタ処理された損失値の加重和と、フィルタ処理された総変動増分の加重和と、及びフィルタ処理された指向性マッチングエラーの加重和とを含む、請求項5及び9の両方に記載のスケーリング方法。
  12. 入力ビデオ信号がインターレース方式であり、出力ビデオ信号がプログレッシブ方式である、請求項1ないし11のいずれか1項に記載のスケーリング方法。
  13. 請求項12に記載のスケーリング方法であって、下記のステップ、すなわち:
    (a) 入力ビデオ信号の各画像を、「インターレース方式のビデオ」又は「テレシネ方式」に分類するステップ;と、
    (b) 前記画像が、入力ビデオ信号の次の画像よりも入力ビデオ信号の前の画像に更に類似しているかどうかを決定するステップ;
    を更に含み、
    「テレシネ方式」に分類された連続的な画像間の新しいポイントの値が、前記新しいポイントの位置において次の又は前の画像を複写することにより合成される一方で、「インターレース方式のビデオ」に分類された画像の新しいポイントの値が、前記一群の選択された補間器によって合成される、請求項12に記載のスケーリング方法。
  14. テレビの画面上に画像を表示するテレビジョン方式であって、このテレビジョン方式が、入力ビデオ信号を受信する手段、請求項1ないし13のいずれか1項に記載の方法に従って入力ビデオ信号を処理する手段と、前記処理する手段によって生成された出力ビデオ信号を表示する手段とを備える、テレビの画面上に画像を表示するテレビジョン方式。
  15. 請求項1ないし13のいずれか1項に記載の方法を実行するように構成された計算手段を備える、ビデオスケーリング装置。
  16. コンピュータプログラムがコンピュータ処理装置内で実行される場合に、請求項1ないし13のいずれか1項に記載の方法を実行するための命令を備える、コンピュータプログラム。
JP2009504572A 2006-04-12 2006-04-12 ロバストな超解像度ビデオスケーリング方法及び装置 Expired - Fee Related JP4932900B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2006/004316 WO2007115583A1 (en) 2006-04-12 2006-04-12 Method and apparatus for robust super-resolution video scaling

Publications (2)

Publication Number Publication Date
JP2009533909A JP2009533909A (ja) 2009-09-17
JP4932900B2 true JP4932900B2 (ja) 2012-05-16

Family

ID=36722577

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009504572A Expired - Fee Related JP4932900B2 (ja) 2006-04-12 2006-04-12 ロバストな超解像度ビデオスケーリング方法及び装置

Country Status (5)

Country Link
US (1) US8054380B2 (ja)
EP (1) EP2008240B1 (ja)
JP (1) JP4932900B2 (ja)
CN (1) CN101473346B (ja)
WO (1) WO2007115583A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100763917B1 (ko) * 2006-06-21 2007-10-05 삼성전자주식회사 고속으로 움직임을 추정하는 방법 및 장치
US8244057B2 (en) 2007-06-06 2012-08-14 Microsoft Corporation Removal of image artifacts from sensor dust
WO2009087493A1 (en) 2008-01-11 2009-07-16 Zoran (France) Sparse geometry for super resolution video processing
US8351510B1 (en) 2008-02-01 2013-01-08 Zenverge, Inc. Motion compensated noise reduction using shared motion estimation engine
US9288535B2 (en) 2010-04-02 2016-03-15 Zoran (France) S.A. Cadence detection for interlaced video based on temporal regularity
US8712191B2 (en) 2010-05-11 2014-04-29 Zoran (France) S.A. Method for detecting directions of regularity in a two-dimensional image
GB2494065B (en) * 2010-06-07 2016-06-08 Zoran (France) Image interpolation method with decision mixing
JP6465876B2 (ja) 2013-06-28 2019-02-06 ディー−ウェイブ システムズ インコーポレイテッド データの量子処理のためのシステムおよび方法
US10318881B2 (en) 2013-06-28 2019-06-11 D-Wave Systems Inc. Systems and methods for quantum processing of data
CN105427245B (zh) * 2015-11-06 2018-12-07 浙江宇视科技有限公司 一种双三次插值误差累积消除方法及装置
JP7134949B2 (ja) 2016-09-26 2022-09-12 ディー-ウェイブ システムズ インコーポレイテッド サンプリングサーバからサンプリングするためのシステム、方法、及び装置
CN107995490A (zh) * 2017-12-14 2018-05-04 清华大学 信号获取方法及装置
US11586915B2 (en) 2017-12-14 2023-02-21 D-Wave Systems Inc. Systems and methods for collaborative filtering with variational autoencoders
US11386346B2 (en) 2018-07-10 2022-07-12 D-Wave Systems Inc. Systems and methods for quantum bayesian networks
US11461644B2 (en) 2018-11-15 2022-10-04 D-Wave Systems Inc. Systems and methods for semantic segmentation
US11468293B2 (en) 2018-12-14 2022-10-11 D-Wave Systems Inc. Simulating and post-processing using a generative adversarial network
US11900264B2 (en) 2019-02-08 2024-02-13 D-Wave Systems Inc. Systems and methods for hybrid quantum-classical computing
US11625612B2 (en) 2019-02-12 2023-04-11 D-Wave Systems Inc. Systems and methods for domain adaptation

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5428398A (en) 1992-04-10 1995-06-27 Faroudja; Yves C. Method and apparatus for producing from a standard-bandwidth television signal a signal which when reproduced provides a high-definition-like video image relatively free of artifacts
US5661525A (en) * 1995-03-27 1997-08-26 Lucent Technologies Inc. Method and apparatus for converting an interlaced video frame sequence into a progressively-scanned sequence
US5936676A (en) * 1997-08-21 1999-08-10 Miranda Technologies Inc. Apparatus and method for line interpolating an interlaced video signal
US6181382B1 (en) * 1998-04-03 2001-01-30 Miranda Technologies Inc. HDTV up converter
KR100303728B1 (ko) * 1999-07-29 2001-09-29 구자홍 격행주사 영상의 디인터레이싱 방법
GB2352910B (en) 1999-07-30 2004-03-03 Sony Uk Ltd Method of processing signals and apparatus for signal processing
US6940557B2 (en) 2001-02-08 2005-09-06 Micronas Semiconductors, Inc. Adaptive interlace-to-progressive scan conversion algorithm
US20060045384A1 (en) * 2002-09-11 2006-03-02 Koninklijke Philips Electronics N.V. Unit for and method of image conversion
KR100568105B1 (ko) * 2003-10-02 2006-04-05 삼성전자주식회사 에지 기반의 영상 적응형 디인터레이싱 방법
KR100995398B1 (ko) * 2004-01-20 2010-11-19 삼성전자주식회사 수직 및 수평 방향의 패턴을 고려한 전역 움직임 보상순차주사화 방법
CN1312635C (zh) * 2004-03-17 2007-04-25 致伸科技股份有限公司 图像的缩放方法
US7352919B2 (en) * 2004-04-28 2008-04-01 Seiko Epson Corporation Method and system of generating a high-resolution image from a set of low-resolution images
CN1293514C (zh) * 2004-07-08 2007-01-03 北京中星微电子有限公司 一种数字图像的缩放处理系统
CN100351869C (zh) * 2004-09-15 2007-11-28 致伸科技股份有限公司 一种数字图像插值处理方法
US7567294B2 (en) * 2005-03-28 2009-07-28 Intel Corporation Gradient adaptive video de-interlacing
DE102005063072B4 (de) * 2005-12-30 2017-02-02 Entropic Communications, Inc. Verfahren und Vorrichtung zur Zwischenzeileninterpolation

Also Published As

Publication number Publication date
WO2007115583A1 (en) 2007-10-18
US20090278981A1 (en) 2009-11-12
CN101473346B (zh) 2012-06-20
US8054380B2 (en) 2011-11-08
EP2008240B1 (en) 2014-01-08
EP2008240A1 (en) 2008-12-31
CN101473346A (zh) 2009-07-01
JP2009533909A (ja) 2009-09-17

Similar Documents

Publication Publication Date Title
JP4932900B2 (ja) ロバストな超解像度ビデオスケーリング方法及び装置
US6614484B1 (en) Deinterlacing method for video signals based on edge-directional interpolation
US20050232357A1 (en) Motion vector estimation at image borders
JP4997281B2 (ja) イメージ中の推定動きベクトルの決定方法、コンピュータプログラムおよびディスプレイ装置
KR100739744B1 (ko) 인터레이스트 비디오 시퀀스에서 잡음-적응 움직임 검출방법 및 시스템
US8340186B2 (en) Method for interpolating a previous and subsequent image of an input image sequence
US20030086498A1 (en) Apparatus and method of converting frame and/or field rate using adaptive motion compensation
JP4103073B2 (ja) ビデオ信号を変換する方法および装置
US7519230B2 (en) Background motion vector detection
US10026155B1 (en) Image-processing apparatus
US6614485B2 (en) Deinterlacing apparatus
EP1039746B1 (en) Line interpolation method and apparatus
KR100979811B1 (ko) 수평 방향 에지의 패턴을 고려한 순차주사화 장치 및 방법
JP2006504175A (ja) フォールバックを用いる画像処理装置
US8761262B2 (en) Motion vector refining apparatus
US8514332B2 (en) Method and system for non-linear blending in motion-based video processing
US20100039517A1 (en) Film cadence detection
JP5139086B2 (ja) インターレース方式から非インターレース方式へのビデオデータの変換
JPH08163573A (ja) 動きベクトル検出装置、およびこの装置を用いた順次走査変換装置
WO2006085062A2 (en) Conversion of video data from interlaced to non-interlaced format
KR100931110B1 (ko) 퍼지 룰 기반 에지 복원 알고리즘을 이용하는 디인터레이싱장치 및 방법
KR20120040764A (ko) 에지맵을 이용한 디인터레이싱 장치 및 방법
JP4250807B2 (ja) フィールド周波数変換装置および変換方法
KR100949137B1 (ko) 영상 보간 장치와 그 방법 및 그 방법이 기록된 컴퓨터로읽을 수 있는 기록매체
EP1547378A1 (en) A unit for and method of image conversion

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110712

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110727

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120215

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150224

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees