JP4625240B2 - コンピュータ実施される方法、システムおよびコンピュータ可読媒体 - Google Patents
コンピュータ実施される方法、システムおよびコンピュータ可読媒体 Download PDFInfo
- Publication number
- JP4625240B2 JP4625240B2 JP2003107078A JP2003107078A JP4625240B2 JP 4625240 B2 JP4625240 B2 JP 4625240B2 JP 2003107078 A JP2003107078 A JP 2003107078A JP 2003107078 A JP2003107078 A JP 2003107078A JP 4625240 B2 JP4625240 B2 JP 4625240B2
- Authority
- JP
- Japan
- Prior art keywords
- filter
- stage
- pixel
- bicubic
- reduced
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 230000033001 locomotion Effects 0.000 claims abstract description 131
- 238000001914 filtration Methods 0.000 claims abstract description 46
- 238000004364 calculation method Methods 0.000 claims description 13
- 230000003111 delayed effect Effects 0.000 claims 3
- 239000013598 vector Substances 0.000 description 57
- 238000013139 quantization Methods 0.000 description 23
- 230000006835 compression Effects 0.000 description 21
- 238000007906 compression Methods 0.000 description 21
- 239000000872 buffer Substances 0.000 description 16
- 238000010586 diagram Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 7
- 238000006073 displacement reaction Methods 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 230000006837 decompression Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005562 fading Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012888 cubic function Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B66—HOISTING; LIFTING; HAULING
- B66C—CRANES; LOAD-ENGAGING ELEMENTS OR DEVICES FOR CRANES, CAPSTANS, WINCHES, OR TACKLES
- B66C13/00—Other constructional features or details
- B66C13/04—Auxiliary devices for controlling movements of suspended loads, or preventing cable slack
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/523—Motion estimation or motion compensation with sub-pixel accuracy
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B66—HOISTING; LIFTING; HAULING
- B66C—CRANES; LOAD-ENGAGING ELEMENTS OR DEVICES FOR CRANES, CAPSTANS, WINCHES, OR TACKLES
- B66C1/00—Load-engaging elements or devices attached to lifting or lowering gear of cranes or adapted for connection therewith for transmitting lifting forces to articles or groups of articles
- B66C1/10—Load-engaging elements or devices attached to lifting or lowering gear of cranes or adapted for connection therewith for transmitting lifting forces to articles or groups of articles by mechanical means
- B66C1/12—Slings comprising chains, wires, ropes, or bands; Nets
- B66C1/16—Slings with load-engaging platforms or frameworks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Mechanical Engineering (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Picture Signal Circuits (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Polarising Elements (AREA)
- Networks Using Active Elements (AREA)
- Control Of Motors That Do Not Use Commutators (AREA)
- Filters And Equalizers (AREA)
- Electric Double-Layer Capacitors Or The Like (AREA)
Description
【発明の属する技術分野】
近似双三次フィルタリングの技法およびツールを説明する。たとえば、ビデオエンコーダまたはビデオデコーダで、基準ビデオフレームにおける1/4ピクセル位置でピクセル値を計算するときに、近似双三次フィルタが使用される。
【0002】
【従来の技術】
ディジタルビデオは、大量のストレージおよび伝送容量を消費する。通常の生のディジタルビデオシーケンスには、毎秒15フレームまたは30フレームが含まれる。各フレームに、1万個または10万個のピクセル(ペルとも称する)が含まれる可能性がある。各ピクセルは、画像の小さい要素を表す。生の形では、コンピュータは、一般に24ビットを用いて1ピクセルを表す。たとえば、1つのピクセルに、ピクセルのグレイスケール成分を定義する8ビット輝度値(明度値とも称する)と、ピクセルの色成分を定義する2つの8ビットクロミナンス値(クロマ値とも称する)が含まれる場合がある。したがって、通常の生のディジタルビデオシーケンスのビット毎秒またはビットレートの数は、毎秒500万ビット以上になる可能性がある。
【0003】
多くのコンピュータおよびコンピュータネットワークには、生のディジタルビデオを処理するリソースが欠けている。この理由から、エンジニアは、圧縮(コーディングまたはエンコーディングとも称する)を使用して、ディジタルビデオのビットレートを下げる。圧縮は、ロスレス(lossless)とすることができ、この場合には、ビデオの品質は影響を受けないが、ビットレートの減少が、ビデオの複雑さによって制限される。あるいは、圧縮をロッシイ(lossy)とすることができ、この場合には、ビデオの品質に影響があるが、ビットレートの減少が、より劇的になる。圧縮解除では、圧縮の逆を行う。
【0004】
一般に、ビデオ圧縮技法には、イントラフレーム圧縮(intraframecompression)とインターフレーム圧縮(interframe compression)とが含まれる。イントラフレーム圧縮技法では、通常はIフレームまたはキーフレームと呼ばれる個々のフレームを圧縮する。インターフレーム圧縮技法では、通常は予測フレーム、Pフレーム、またはBフレームと呼ばれる、前のフレームおよび/または後のフレームを参照してフレームを圧縮する。
【0005】
Microsoft Corporation社のWindows(登録商標)Media Video、Version 8(「WMV8」)には、ビデオエンコーダおよびビデオデコーダが含まれる。WMV8エンコーダでは、イントラフレーム圧縮およびインターフレーム圧縮が使用され、WMV8デコーダでは、イントラフレーム圧縮解除およびインターフレーム圧縮解除が使用される。WMV8エンコーダのインターフレーム圧縮では、ブロックに基づく動き補償された予測コーディングと、その後の、残留誤差の変換コーディングが使用される。
【0006】
WMV8では、フレームが、3つのピクセルプレーンすなわち、輝度ピクセル値の輝度(Y)平面およびクロミナンスピクセル値の2つの色(U、V)平面として表される。Y平面の解像度は、水平および垂直でU平面およびV平面の解像度の2倍である。したがって、320ピクセル×240ピクセルのフレームは、320ピクセル×240ピクセルのY平面および160ピクセル×120ピクセルのU平面およびV平面を有する。
【0007】
WMV8エンコーダでは、予測フレームがピクセルの8×8ブロックに分割される。4つの8×8輝度ブロックおよび2つの同一位置の8×8クロミナンスブロック(一方はU色平面、他方はV色平面に関する)のグループによって、16×16マクロブロックとが形成される。したがって、16×16マクロブロックのそれぞれに、4つの8×8輝度ブロックと、2つの8×8クロミナンスブロックとが含まれる。
【0008】
予測フレームのマクロブロックについて、WMV8エンコーダでは、動き推定(motion estimation)が実行される。動き推定では、予測フレーム内でマクロブロックを検索し、基準フレームからのマクロブロックとマッチングすることによって、予測フレーム内のマクロブロックの動きを近似する。たとえば、図1では、WMV8エンコーダによって、予測フレーム(110)内のマクロブロック(115)の動きベクトルが計算される。この動きベクトルを計算するために、エンコーダは、基準フレーム(130)の検索領域(135)内を検索する。検索領域(135)内で、エンコーダは、よい一致を見つけるために、予測フレーム(110)からのマクロブロック(115)の輝度値を、基準フレーム(130)からのさまざまな候補ブロックの輝度値と比較する。WMV8エンコーダは、動きベクトル精度を切り替えることができ、整数ピクセル、1/2ピクセル、または1/4ピクセルの水平分解能と、整数ピクセルまたは1/2ピクセルの垂直分解能とを有する検索範囲および動きベクトルを使用することができる。サブピクセル精度の動きベクトルを用いると、WMV8エンコーダによって、ビデオシーケンス内のサブピクセル動きを近似することができる。
【0009】
動き補償(motion compensation)中に、WMV8エンコーダでは、予測フレームのマクロブロックの動きベクトルを使用して、基準フレームからマクロブロックの予測子(predictor)を判定する。動き予測されるマクロブロックのそれぞれについて、WMV8エンコーダでは、元のマクロブロックとその予測子の間の差(残差または誤差と称する)を計算する。WMV8エンコーダでは、残差をブロックに分割し、残差ブロックをロッシイ圧縮する。予測フレームの動き予測されたマクロブロックを再構成するために、WMV8エンコーダでは、残差を圧縮解除し、めいめいのマクロブロックの予測子に加算する。
【0010】
WMV8デコーダでも、予測フレームのマクロブロックの動きベクトルを使用して、基準フレームからマクロブロックの予測子を判定する。予測フレームの動き予測されたマクロブロックを再構成するために、WMV8デコーダでは、残差を圧縮解除し、マクロブロックの予測子に加算する。
【0011】
動き推定中または動き補償中に、動きベクトルがサブピクセル精度を有する(すなわち、1/2ピクセルまたは1/4ピクセル)ときに、WMV8エンコーダまたはWMV8デコーダでは、基準フレーム内のサブピクセル位置のピクセル値を判定しなければならない。WMV8エンコーダまたはWMV8デコーダでは、補間フィルタを使用して、サブピクセル位置の値を生成する。図2に、整数ピクセル値a、b、c、...、pの補間によって計算された値を有するサブピクセルサンプル位置H0、H1、H2を示す。
【0012】
1/2ピクセル動きベクトル精度を用いて動作するときに、3つの別個の1/2ピクセル位置H0、H1、H2の輝度ピクセル値について使用される補間フィルタは、次の通りである。
H0=(f+g+R2)>>1 (1)
H1=(f+j+R2)>>1 (2)
H2=(f+g+j+k+R1)>>2 (3)
【0013】
ここで、R1およびR2は、特定のフレームの丸めモードを示す1ビット丸め制御フラグによって制御される丸め制御値である。丸め制御フラグに0がセットされている場合には、R1=2かつR2=1である。丸め制御フラグに1がセットされている場合には、R1=R2=0である。丸め制御フラグの値は、Pフレームごとに1と0の間で交互に変える。各Iフレームでは、丸め制御フラグの値が0にリセットされる。したがって、丸め制御は、フレーム単位で動作する。
【0014】
式1、2、および3は、双一次補間(bilinear interpolation)の例である。双一次補間は、高速であり、ピクセル値が滑らかになる傾向がある。この平滑化は、望ましい効果(量子化雑音の知覚可能性の低下など)を有する場合があるが、有効なピクセル情報の消失につながる可能性もある。
【0015】
1/4ピクセル動きベクトル分解能の場合に、WMV8エンコーダまたはWMV8デコーダでは、まず、双三次フィルタ(bicubic filter)を使用して、1/2ピクセル位置での輝度ピクセル値を補間する。双三次補間は、双一次補間より低速であるが、エッジ値が保存される傾向があり、より少ない有効ピクセル情報の消失をもたらす。3つの別個の1/2ピクセル位置H0、H1、H2の双三次フィルタは、次の通りである。
H0=(−e+9f+9g−h+8)>>4 (4)
H1=(−b+9f+9j−n+8)>>4 (5)
H2=(−t0+9t1+9t2−t3+8)>>4 (6)
【0016】
ここで、t0、t1、t2、t3は、次のように計算される。
t0=(−a+9b+9c−d+8)>>4 (7)
t1=(−e+9f+9g−h+8)>>4 (8)
t2=(−i+9j+9k−l+8)>>4 (9)
t3=(−m+9n+9o−p+8)>>4 (10)
【0017】
式(4)から(10)は、入力値の範囲の外の出力をもたらすことができる。たとえば、8ビット入力(範囲0、...、255)について、一連の値、0 255 255 0によって、式(4)から(10)のどれにおいても、287の出力値が作られる。したがって、WMV8エンコーダまたはWMV8デコーダでは、有効な範囲内になるように、すべての式(4)から(10)の出力値をクランプ(または「クリッピング」)する。たとえば、8ビット出力値について、0未満の値は0に変更され、255を超える値は255に変更される。クランプは、範囲の問題に対処するが、計算の速度が落ちる。さらに、クランプは、精度の消失をもたらす。
【0018】
WMV8エンコーダまたはWMV8デコーダでは、その後、補間の後続ステージで、ある1/4ピクセル位置のピクセル値を計算する。これらの1/4ピクセル位置は、水平方向に、2つの1/2ピクセル位置の間または整数ピクセル位置と1/2ピクセル位置との間のいずれかに配置される。これらの1/4ピクセル位置に関して、WMV8エンコーダまたはWMV8デコーダでは、丸め制御なしで、2つの水平に隣接する1/2ピクセル/整数ピクセル位置を使用する双一次補間(すなわち(x+y+1)>>1)が使用される。
【0019】
輝度動きベクトルを計算したならば、WMV8エンコーダまたはWMV8デコーダでは、同一位置のクロミナンス動きベクトルを導出する。WMV8の色平面は、水平と垂直の両方で輝度平面の半分の大きさなので、輝度動きベクトル値を、適当なクロミナンス動きベクトル値にスケーリングしなければならない。WMV8では、この変換処理に、輝度動きベクトルを半分にすることと、結果のクロミナンス動きベクトルを1/2ピクセル精度に丸めることとが含まれる。したがって、1/2ピクセル精度を有する輝度動きベクトルは、1/4ピクセル精度を有するクロミナンス動きベクトルに変換されない。さらに、WMV8でのクロミナンス丸めは、ユーザによる修正または選択が可能ではない単一のモードで動作する。
【0020】
WMV8では、基準フレーム内のサブピクセル位置のピクセル値が、いくつかの状況でアンダーフローまたはオーバーフローを示す場合がある。たとえば、1/4ピクセル位置の輝度ピクセル値は、隣接する整数ピクセル位置の値が255であり、隣接する1/2ピクセル位置の値が287(0+9×255+9×255−0+8>>4=287)である場合に、271(0、...、255の範囲の外)になる可能性がある(255+287+1>>1=271)。この問題に対処するために、マクロブロックについて残差ブロックを予測子に加算した後に、WMV8エンコーダおよびWMV8デコーダでは、必要な場合に、範囲0、...、255内になるようにマクロブロックの再構成される値をクランプする。
【0021】
WMV8の他に、複数の国際標準規格が、ビデオの圧縮および圧縮解除に関係する。これらの標準規格には、国際電気通信連合[「ITU」]のMotionPicture Experts Group[「MPEG」]1、2、および4標準規格と、H.261標準規格、H.262標準規格、およびH.263標準規格が含まれる。WMV8と同様に、これらの標準規格では、イントラフレーム圧縮およびインターフレーム圧縮の組合せが使用されるが、これらの標準規格は、通常は、使用される圧縮技法の詳細においてWMV8と異なる。
【0022】
複数の標準規格(たとえばMPEG 4およびH.263)が、双一次フィルタおよび基本的な丸め制御を使用する1/2ピクセル動き推定および1/2ピクセル動き補償を提供する。さらに、H.263では、理論的には1/4ピクセル分解能(すなわち、1/2ピクセル輝度動きベクトルの分解能の半分)を有するクロミナンス動きベクトルが、1/2ピクセル精度またはフルピクセル精度のいずれかに丸められ、その結果、1/4ピクセル値がクロミナンス空間で許容されなくなる。標準規格の動き推定/補償に関する詳細については、各標準規格の仕様書自体を参照されたい。
【0023】
【発明が解決しようとする課題】
動き推定および動き補償は、効果的な圧縮技法であるが、さまざまな前の動き推定/補償技法(WMV8および上で述べた標準規格の)は、下記を含む複数の短所を有する。
【0024】
(1)基準フレーム内のサブピクセル位置でピクセル値を計算するときに、エンコーダおよびデコーダが、中間値の精度を不必要に失う。たとえば、WMV8で1/4ピクセル位置のピクセル値を計算するときに、1/2ピクセル位置の中間値が、より多数のビット深さが使用可能である可能性があるという事実にもかかわらず、4ビットだけ右シフトされる。さらに、WMV8エンコーダ/デコーダでは、1/4ピクセル位置の2ステージ補間中に中間値がクランプされ、これによって、計算速度が低下し、精度の不必要な消失がもたらされる。
【0025】
(2)1/4ピクセル動き推定よび動き補償のピクセル値の補間が、多くの場合に非効率的である。たとえば、WMV8では、1次元1/4ピクセル位置の計算が、1/2ピクセル位置に関するフィルタの使用とその後の双一次フィルタの使用を必要とする。
【0026】
(3)エンコーダおよびデコーダで、複数ステージ補間で作成される可能性がある丸め誤差の累積を考慮に入れることができない。丸め誤差は、たとえば、ピクセル値が、ビデオシーケンスのフレームからフレームへと繰り返して丸められるときに発生する。この丸め誤差によって、低品質低ビットレートビデオシーケンスの知覚可能なアーチファクトが引き起こされる可能性がある。たとえば、WMV8エンコーダおよびWMV8デコーダで、複数のステージで1/4ピクセル位置のピクセル値について補間するときに、丸め制御が使用されない。その代わりに、各ステージの結果が、補間の各ステージで同一の形で(丸め制御なしで)丸められる。
【0027】
(4)クロミナンス丸めが、1/4ピクセル精度で実行されず、クロミナンス動きベクトル丸めオプションに対する制御が与えられない。たとえば、WMV8エンコーダおよびWMV8デコーダは、すべてのクロミナンス動きベクトルを1/2ピクセル値に丸め、単一モードでのみ動作する。
【0028】
動き推定および動き補償のディジタルビデオに対するクリティカルな重要性を与えられれば、動き推定および動き補償がよく開発された分野であることは、驚くべきものではない。しかし、前の動き推定技法および動き補償技法の利益がどれほどであれ、それらは、下記の技法およびツールの長所を有しない。
【0029】
【課題を解決するための手段】
要約すると、この詳細な説明は、近似双三次フィルタリングのさまざまな技法およびツールを対象とする。たとえば、ビデオのコーディングおよびデコーディングの応用分野は、ビデオエンコーダおよびビデオデコーダで、基準ビデオフレーム内のサブピクセル位置のピクセル値を計算するときに、1つまたは複数の近似双三次フィルタが使用される。これによって、計算されたピクセル値を使用する動き予測の有効性が改善される。それと同時に、近似双三次フィルタリングは、計算に関し比較的効率的である。
【0030】
ビデオエンコーダまたはビデオデコーダなどのコンポーネントによって、近似双三次フィルタを使用して、ある位置の値が計算される。近似双三次フィルタは、実質的に双三次フィルタに似た形で動作し、これは望ましいことであるが、近似双三次フィルタは、計算を単純にするために、異なるフィルタ係数および/またはより低い分解能を有する。たとえば、近似双三次フィルタのフィルタ係数は、1/4サンプル位置でのより低い分解能のフィルタについて、64の合計(128ではなく)を有する。
【0031】
ビデオエンコーダまたはビデオデコーダで、近似双三次フィルタを使用して、基準ビデオフレーム内のさまざまなサブピクセル位置のピクセル値を計算することができる。サブピクセル位置は、たとえば、1次元または2次元で1/4ピクセル(または3/4ピクセル)シフトされた位置である。
【0032】
さまざまな技法およびツールを、組み合わせてまたは独立に使用することができる。追加の特徴および長所は、添付図面に関して進められる以下の詳細な説明から明白になる。
【0033】
【発明の実施の形態】
本明細書に記載の実施形態は、動き推定および動き補償でのサブピクセル補間の技法およびツールに関する。さまざまな実施形態は、補間の後のステージまでクランプおよび/またはビットシフト(精度の消失をもたらす可能性がある動作)を延期することによって、複数ステージ補間で精度を保つ技法およびツールに関する。他の実施形態は、複数ステージ補間の効率的なフィルタリング動作または丸め動作に関する。
【0034】
エンコーダまたはデコーダによって、基準フレームでのあるいは1つまたは複数のブロックまたはマクロブロックなどのフレームの一部での、サブピクセル補間を実行する。エンコーダ/デコーダによって、基準フレーム内のサブピクセル位置のピクセル値を計算する。エンコーダ/デコーダによって、その後、サブピクセル精度の動きベクトルを使用して、動き補償を実行することができる。
【0035】
いくつかの実施形態で、ビデオエンコーダまたはビデオデコーダによって、ビデオコーディングアプリケーションまたはビデオデコーディングアプリケーションでサブピクセル補間を実行する。その代わりに、別のエンコーダまたはデコーダ、あるいは別のタイプのコンポーネントによって、サブピクセル補間または以下で別のタイプのアプリケーションで説明する他の技法を実行する。
【0036】
基準フレームに対してサブピクセル補間を実行する代わりに、いくつかの実施形態で、エンコーダ/デコーダによって、フィールド、オブジェクトレイヤ、または他のイメージに対するサブピクセル補間を実行する。
【0037】
いくつかの実施形態では、サブピクセル補間は、YUV色空間で基準フレームの輝度平面および色平面のピクセル値を計算することによって行われる。代替案では、色空間が異なる(たとえば、YIQまたはRGB)。
【0038】
さまざまな技法およびツールは、組み合わせてまたは独立に使用することができる。異なる実施形態によって、1つまたは複数の本明細書に記載の技法およびツールが実施される。これらの技法の動作を、通常は、提示のために特定のシーケンシャルな順序で説明するが、この説明の形に、特に順序付けが必要でない限り、動作の順序の小さい再構成が含まれることを理解されたい。たとえば、シーケンシャルに説明される動作を、いくつかの場合に、再配置するか同時に実行することができる。さらに、説明を簡単にするために、流れ図に、通常は、特定の技法を他の技法と共に使用することができるさまざまな形を図示しない。
【0039】
いくつかの実施形態で、ビデオエンコーダおよびビデオデコーダで、ビットストリーム内のさまざまなフラグおよび信号を使用する。特定のフラグおよび信号を説明するが、この説明の形に、フラグおよび信号に関する異なる規約(たとえば1ではなく0)が含まれることを理解されたい。
【0040】
I.コンピューティング環境
図3に、複数の本明細書に記載の実施形態がその中で実施される、適するコンピューティング環境(300)を示す。この技法およびツールを、異なる汎用または特殊目的のコンピューティング環境で実施することができるので、コンピューティング環境(300)は、使用または機能性に関する制限を暗示することを意図されたものではない。
【0041】
図3を参照すると、コンピューティング環境(300)に、少なくとも1つの処理ユニット(310)およびメモリ(320)が含まれる。図3では、この最も基本的な構成(330)が、破線の中に含まれる。処理ユニット(310)は、コンピュータ実行可能命令を実行し、実際のプロセッサまたは仮想プロセッサとすることができる。マルチプロセッシングシステムでは、複数の処理ユニットがコンピュータ実行可能命令を実行して、処理能力を高める。メモリ(320)は、揮発性メモリ(たとえば、レジスタ、キャッシュ、RAM)、不揮発性メモリ(たとえば、ROM、EEPROM、フラッシュメモリなど)、またはこの2つの組合せとすることができる。メモリ(320)には、ビデオエンコーダおよび/またはビデオデコーダなどのエンコーダおよび/またはデコーダでサブピクセル補間技法を実施するソフトウェア(380)が格納される。
【0042】
コンピューティング環境は、追加の特徴を有する場合がある。たとえば、コンピューティング環境(300)に、ストレージ(340)、1つまたは複数の入力デバイス(350)、1つまたは複数の出力デバイス(360)、および1つまたは複数の通信接続(370)が含まれる。バス、コントローラ、またはネットワークなどの相互接続機構(図示せず)によって、コンピューティング環境(300)のコンポーネントが相互接続される。通常、オペレーティングシステムソフトウェア(図示せず)によって、コンピューティング環境(300)内で実行される他のソフトウェアのオペレーティング環境が提供され、コンピューティング環境(300)のコンポーネントのアクティビティが調整される。
【0043】
ストレージ(340)は、取外し可能または取外し不能とすることができ、ストレージ(340)には、磁気ディスク、磁気テープ、磁気カセット、CD−ROM、DVD、または、情報を格納でき、コンピューティング環境(300)内でアクセスできる他の任意の媒体が含まれる。ストレージ(340)には、サブピクセル補間技法を実施するソフトウェア(380)の命令が格納される。
【0044】
入力デバイス(350)は、キーボード、マウス、ペン、またはトラックボールなどの接触入力デバイス、音声入力デバイス、スキャニングデバイス、または、コンピューティング環境(300)に入力を提供する別のデバイスとすることができる。オーディオエンコードまたはビデオエンコードのために、入力デバイス(350)を、サウンドカード、ビデオカード、TVチューナカード、またはアナログ形式またはディジタル形式でオーディオ入力またはビデオ入力を受け入れる類似するデバイス、あるいは、オーディオサンプルまたはビデオサンプルをコンピューティング環境(300)に読み込むCD−ROMまたはCD−RWとすることができる。出力デバイス(360)は、ディスプレイ、プリンタ、スピーカ、CDライタ、または、コンピューティング環境(300)からの出力を提供する別のデバイスとすることができる。
【0045】
通信接続(370)によって、通信媒体を介する別のコンピューティングエンティティへの通信が可能になる。通信媒体は、コンピュータ実行可能命令、オーディオまたはビデオの入力または出力、あるいは他のデータなどの情報が、変調されたデータ信号で伝えられる。変調されたデータ信号とは、信号内で情報をエンコードする形で1つまたは複数の特性を設定されまたは変更された信号である。限定ではなく例として、通信媒体には、電気、光、RF、赤外線、音響、または他の搬送波を用いて実施される有線もしくは無線の技術が含まれる。
【0046】
技法およびツールを、コンピュータ可読媒体の全般的な文脈で説明することができる。コンピュータ可読媒体とは、コンピューティング環境内でアクセスできるすべての使用可能な媒体である。制限ではなく例として、コンピューティング環境(300)に関して、コンピュータ可読媒体に、メモリ(320)、ストレージ(340)、通信媒体、およびこれらの任意の組合せが含まれる。
【0047】
技法およびツールを、プログラムモジュールに含まれるものなどの、ターゲットの実際のプロセッサまたは仮想プロセッサ上のコンピューティング環境内で実行されるコンピュータ実行可能命令の全般的な文脈で説明することができる。一般に、プログラムモジュールには、特定のタスクを実行するか特定の抽象データ型を実施する、ルーチン、プログラム、ライブラリ、オブジェクト、クラス、コンポーネント、データ構造などが含まれる。プログラムモジュールの機能性を、望みに応じてさまざまな実施形態で、組み合わせるかプログラムモジュールの間で分割することができる。プログラムモジュールのコンピュータ実行可能命令を、ローカルコンピューティング環境または分散コンピューティング環境内で実行することができる。
【0048】
提示のために、この詳細な説明で、「決定」および「選択」などの用語を使用して、コンピューティング環境でのコンピュータ動作を説明する。これらの用語は、コンピュータによって実行される動作の高水準の抽象化であり、人間によって実行される動作と混同してはならない。これらの用語に対応する実際のコンピュータ動作は、実施形態に応じて変化する。
【0049】
II.一般化されたビデオエンコーダおよびビデオデコーダ
図4は、一般化されたビデオエンコーダ(400)のブロック図であり、図5は、一般化されたビデオデコーダ(500)のブロック図である。
【0050】
エンコーダおよびデコーダ内のモジュールの間に示された関係は、エンコーダおよびデコーダ内の情報の主な流れを示し、図を簡単にするために、他の関係は図示されていない。具体的に言うと、図4および図5には、通常は、ビデオシーケンス、フレーム、マクロブロック、ブロックなどに使用されるエンコーダ設定、モード、テーブルなどを示すサイド情報(side information)が示されていない。そのようなサイド情報は、通常はサイド情報のエントロピ符号化(entropy encoding)の後に、出力ビットストリーム内で送信される。出力ビットストリームのフォーマットは、Windows(登録商標)Media Videoフォーマットまたは別のフォーマットとすることができる。
【0051】
エンコーダ(400)およびデコーダ(500)は、ブロックベースであり、4:2:0マクロブロックフォーマットを使用し、各マクロブロックには、4つの8×8輝度ブロック(時には1つの16×16マクロブロックとして扱われる)と、2つの8×8クロミナンスブロック(たとえば、1つはUブロック、1つはVブロック)が含まれる。代替案では、エンコーダ(400)およびデコーダ(500)が、オブジェクトベースであり、異なるマクロブロックフォーマットまたはブロックフォーマットを使用するか、8×8ブロックおよび16×16マクロブロックと異なるサイズまたは構成のピクセルの組に対する操作を実行する。
【0052】
実施形態および所望の圧縮のタイプに応じて、エンコーダまたはデコーダのモジュールを、追加し、省略し、複数のモジュールに分割し、他のモジュールと組み合わせ、かつ/または類似するモジュールで置換することができる。代替実施形態では、異なるモジュールおよび/またはモジュールの他の構成を有するエンコーダまたはデコーダによって、本明細書に記載の技法の1つまたは複数が実行される。
【0053】
A.ビデオエンコーダ
図4は、一般的なビデオエンコーダシステム(400)のブロック図である。エンコーダシステム(400)は、現在のフレーム(405)を含むビデオフレームのシーケンスを受け取り、出力として圧縮ビデオ情報(495)を作る。ビデオエンコーダの特定の実施形態では、通常は、一般化されたエンコーダ(400)の変形形態または補足されたバージョンが使用される。
【0054】
エンコーダシステム(400)によって、予測フレームおよびキーフレームが圧縮される。提示のために、図4に、エンコーダシステム(400)を介するキーフレームのパスと、順方向予測フレームのパスを示す。エンコーダシステム(400)のコンポーネントの多くが、キーフレームと予測フレームの両方の圧縮に使用される。これらのコンポーネントによって実行される正確な動作を、圧縮される情報のタイプに応じて変更することができる。
【0055】
予測フレーム[インターコーディングされたフレーム、あるいは両方向予測の場合にpフレームまたはbフレームとも称する]は、あるフレームから他のフレームへの予測(または差)に関して表現される。予測残差は、予測されたものと元のフレームの間の差である。対照的に、キーフレーム[iフレーム、イントラコーディングされたフレームとも称する]は、他のフレームへの参照なしで圧縮される。
【0056】
現在のフレーム(405)が、順方向予測フレームである場合には、動き推定(motion estimator)(410)が、基準フレームに関して、現在のフレーム(405)のマクロブロックまたはピクセルの他の組の動きを推定し、基準フレームは、フレームストア(420)にバッファリングされた、再構成された前のフレーム(425)である。代替実施形態では、基準フレームが、後のフレームであるか、現在のフレームであるかが、両方向予測される。動き推定(410)は、サイド情報として、動きベクトルなどの動き情報(415)を出力する。動き補償(motion compensator)(430)が、再構成された前のフレーム(425)に動き情報(415)を適用して、動き補償された現在のフレーム(435)を形成する。しかし、予測は、ほとんどの場合に完全ではなく、動き補償された現在のフレーム(435)と元の現在のフレーム(405)との間の差が、予測残差(445)である。代替案では、動き推定および動き補償が、別のタイプの動き推定/補償を適用する。
【0057】
周波数変換(frequency transformer)(460)が、空間領域ビデオ情報を周波数領域(すなわちスペクトル)データに変換する。ブロックベースのビデオフレームについて、周波数変換(460)は、離散コサイン変換[「DCT」]またはDCTの変形形態を動き予測残差データのブロックに適用して、DCT係数のブロックを作る。代替案では、周波数変換(460)が、フーリエ変換などの別の普通の周波数変換を適用するか、ウェーブレット(wavelet)分析またはサブバンド(subband)分析を使用する。いくつかの実施形態で、周波数変換(460)が、キーフレームの空間予測残差のブロックに周波数変換を適用する。周波数変換(460)は、8×8、8×4、4×8、または他のサイズの周波数変換を適用することができる。
【0058】
その後、量子化(quantizer)(470)が、スペクトルデータ係数のブロックを量子化する。量子化は、フレームごとにまたは別の基準で変化するステップサイズを用いてスペクトルデータに均一のスカラ量子化を適用する。代替案では、量子化が、たとえば不均一量子化、ベクトル量子化、または非適応量子化などの別のタイプの量子化をスペクトルデータ係数に適用し、あるいは、周波数変換を使用しないエンコーダシステムでは、スペクトル領域データを直接に量子化する。適応量子化のほかに、エンコーダ(400)は、ドロッピング、適応フィルタリング、または他のレート制御の技法を使用することができる。
【0059】
再構成された現在のフレームが、後続の動き推定/補償に必要なときには、逆量子化(inverse quantizer)(476)が、量子化されたスペクトルデータ係数に対して逆量子化を実行する。その後、逆周波数変換(inverse frequency transformer)(466)が、周波数変換(460)の動作の逆を実行し、再構成された予測残差(予測フレームの場合)または再構成されたキーフレームを作る。現在のフレーム(405)が、キーフレームである場合には、再構成されたキーフレームが、再構成された現在のフレーム(図示せず)として採用される。現在のフレーム(405)が、予測フレームである場合には、再構成された予測残差を動き補償された現在のフレーム(435)に加算して、再構成された現在のフレームを形成する。フレームストア(420)は、次のフレームの予測に使用するために、再構成された現在のフレームをバッファリングする。いくつかの実施形態で、エンコーダが、再構成されたフレームにデブロッキングフィルタ(deblocking filter)を適用して、フレームのブロック内の不連続性を適応式に平滑化する。
【0060】
エントロピ符号化(entropy coder)(480)は、量子化(470)の出力ならびにあるサイド情報(たとえば、動き情報(415)、量子化ステップサイズなど)を圧縮する。通常のエントロピ符号化技法には、算術コーディング、差分コーディング、ハフマンコーディング、ランレングスコーディング、LZコーディング、辞書コーディング、および上記の組合せが含まれる。エントロピ符号化(480)は、通常は、異なる種類の情報(たとえば、DC係数、AC係数、異なる種類のサイド情報)に異なるコーディング技法を使用し、特定のコーディング技法内で複数のコードテーブルの中から選択することができる。
【0061】
エントロピ符号化(480)は、圧縮ビデオ情報(495)をバッファ(490)に入れる。バッファレベルインジケータが、ビットレート適応モジュールにフィードバックされる。圧縮ビデオ情報(495)は、一定のまたは比較的一定のビットレートでバッファ(490)から放出され、そのビットレートでの後続のストリーミングのために格納される。代替案では、エンコーダシステム(400)が、圧縮の直後に圧縮ビデオ情報をストリーミングする。
【0062】
バッファ(490)の前または後に、圧縮ビデオ情報(495)を、ネットワークを介する伝送のためにチャネルコーディングすることができる。チャネルコーディングでは、エラー検出および訂正データを圧縮ビデオ情報(495)に適用することができる。
【0063】
B.ビデオデコーダ
図5は、一般的なビデオデコーダシステム(500)のブロック図である。デコーダシステム(500)は、ビデオフレームの圧縮されたシーケンスに関する情報(595)を受け取り、再構成されたフレーム(505)を含む出力を作る。ビデオデコーダの特定の実施形態では、通常は、一般化されたデコーダ(500)の変形形態または補足された版が使用される。
【0064】
デコーダシステム(500)は、予測フレームおよびキーフレームを圧縮解除する。提示のために、図5に、デコーダシステム(500)を介するキーフレームのパスおよび順方向予測フレームのパスを示す。デコーダシステム(500)のコンポーネントの多くが、キーフレームおよび予測フレームの両方の圧縮解除に使用される。これらのコンポーネントによって実行される正確な動作を、圧縮解除される情報のタイプに応じて変更することができる。
【0065】
バッファ(590)が、圧縮ビデオシーケンスに関する情報(595)を受け取り、受け取った情報をエントロピ復号化(entropy decoder)(580)から使用可能にする。バッファ(590)は、通常は、経時的にかなり一定の速度で情報を受け取り、バッファ(590)には、帯域幅または伝送の短期間変動を平滑化するためにジッタバッファが含まれる。バッファ(590)に、再生バッファおよび他のバッファも含めることができる。代替案では、バッファ(590)が、変化する速度で情報を受け取る。バッファ(590)の前または後に、圧縮ビデオ情報を、チャネルデコードし、エラー検出および訂正のために処理することができる。
【0066】
エントロピ復号化(580)は、通常はエンコーダ内で実行されるエントロピ符号化の逆を適用することによって、エントロピ符号化された量子化されたデータならびにエントロピ符号化されたサイド情報(たとえば、動き情報(515)、量子化ステップサイズ)をデコードする。エントロピ復号化技法には、算術デコーディング、差分デコーディング、ハフマンデコーディング、ランレングスデコーディング、LZデコーディング、辞書デコーディング、および上記の組合せが含まれる。エントロピ復号化(580)は、頻繁に、異なる種類の情報(たとえば、DC係数、AC係数、異なる種類のサイド情報)に異なるデコーディング技法を使用し、特定のデコーディング技法内で複数のコードテーブルの中から選択することができる。
【0067】
再構成されるフレーム(505)が、順方向予測フレームである場合には、動き補償(530)が、動き情報(515)を基準フレーム(525)に適用して、再構成されるフレーム(505)の予測(535)を形成する。たとえば、動き補償(530)は、マクロブロック動きベクトルを使用して、基準フレーム(525)内のマクロブロックを見つける。フレームバッファ(520)に、基準フレームとして使用される、前に再構成されたフレームが格納される。代替案では、動き補償が、別のタイプの動き補償を適用する。動き補償による予測は、ほとんどの場合に完全ではなく、したがって、デコーダ(500)は、予測残差も再構成する。
【0068】
デコーダが、後続の動き補償のために、再構成されたフレームを必要とするときに、フレームストア(520)に、再構成されたフレームが、次のフレームの予測に使用するために格納される。いくつかの実施形態で、エンコーダは、再構成されたフレームにデブロッキングフィルタを適用して、フレームのブロック内の不連続性を適応式に平滑化する。
【0069】
逆量子化(570)が、エントロピ復号化されたデータを逆量子化する。一般に、逆量子化は、フレームごとにまたは別の基準で変化するステップサイズを用いてエントロピ復号化されたデータに均一のスカラ逆量子化を適用する。代替案では、逆量子化が、たとえば不均一逆量子化、ベクトル逆量子化、または非適応逆量子化などの別のタイプの逆量子化をデータに適用し、あるいは、逆周波数変換を使用しないデコーダシステムでは、空間領域データを直接に逆量子化する。
【0070】
逆周波数変換(560)は、量子化された周波数領域データをスペクトル領域ビデオ情報に変換する。ブロックベースビデオフレームについて、逆周波数変換(560)は、逆DCT[「IDCT」]またはIDCTの変形をDCT係数のブロックに適用し、動き予測残差データを作る。代替案では、逆周波数変換(560)が、逆フーリエ変換などの別の普通の逆周波数変換を適用するか、ウェーブレット分析またはサブバンド分析を使用する。いくつかの実施形態で、逆周波数変換(560)は、キーフレームの空間予測残差のブロックに逆周波数変換を適用する。逆周波数変換(560)は、8×8、8×4、4×8、または他のサイズの逆周波数変換を適用することができる。
【0071】
III.動き推定および動き補償
インターフレームコーディングでは、フレームの間の時間的冗長性を活用して、圧縮を達成する。時間的冗長性削減では、現在のフレームをコーディングするときに、予測子として、前にコーディングされたフレームを使用する。以下で説明する実施形態では、ビデオエンコーダで、より少ないビット数を使用して情報をコーディングするために、通常のビデオシーケンス内の時間的冗長性を活用する。ビデオエンコーダでは、基準フレーム(たとえば、前にコーディングされた、前のフレーム)に対する予測フレームのピクセルのブロック、マクロブロック、または他の組の動きをパラメータ化するのに動き推定を使用する。ビデオエンコーダ(ならびに対応するデコーダ)では、動き情報および基準フレームを使用して予測フレームを再構成するのに、動き補償を使用する。
【0072】
動き補償は、基準フレームを変位させることによってビデオフレームの予測(すなわち、予測フレーム)を生成する処理である。上で注記したように、予測は、基準フレームからのデータのブロック、マクロブロック、または他の組について形成される。また、通常は、変位が、直線をなし、予測されるタイル全体にわたって一定である。そのような変位は、X方向およびY方向に沿った変位またはシフトに対応する2つの成分を有する動きベクトルによって定義される。X(水平)およびY(垂直)の動きベクトル成分は、現在予測されつつあるタイルと、基準フレーム内の対応する位置との間の変位を表す。正の値は、現在の位置の下および右の位置を表す。負の値は、現在の位置の上および左の位置を表す。
【0073】
一実施形態では、ブロックが、ピクセルの8×8タイルであり、マクロブロックが、ピクセルの16×16タイルであり、動きベクトルが、1/4ピクセル精度で定義される。他の実施形態では、エンコーダおよびデコーダで、異なる分解能または任意の変化する動きベクトルを用いて、かつ/または動きベクトル以外の動き情報を使用して、本明細書に記載の技法の1つまたは複数を、異なるサイズのタイルまたは任意の変化するサイズのタイルに適用する。
【0074】
動きベクトル補償は、通常は、ピクセル変位に関して、しばしばサブピクセル精度を用いて、指定される。サブピクセル変位は、適当に定義された動き補償フィルタを使用して基準フレームをフィルタリングすることによって実現される。直線をなすサブピクセル動き補償の場合に、X成分およびY成分が、固定小数点数として表現される。これらの数の整数部分を、フルピクセルシフトと称し、仮数部分を、サブピクセルシフトと称する。サブピクセルシフトが0のときに、動きは、整数個のピクセルである。よりしばしば、これは、予測子を生成するための基準フレームからのブロックコピーとして実施される(理論上は、何らかの形のフィルタリングを潜在的に適用できるはずであるが)。その一方で、サブピクセルシフトが非0のときには、サブピクセルシフトに対応する1つまたは複数のフィルタを基準フレームの整数ピクセル位置に適用することによって、予測子が生成される。したがって、動き補償フィルタは、サブピクセルシフトによって決定される。
【0075】
フィルタリング動作としてサブピクセルシフトを実施するために、動き補償フィルタで、整数ピクセル位置の基準値に基づいて、小数ピクセル位置でデータ点を補間する。一般に、補間の質は、フィルタのサポートに伴って増加する。いくつかの実施形態では、分離可能な2タップおよび4タップ(各方向で)のフィルタが使用され、これらのフィルタは、双一次インターポーレータおよび双三次インターポーレータに対応する。
【0076】
いくつかの実施形態で、動き補償フィルタが、整数算術と、ビットシフトとして実施される除算とを使用する。丸め制御パラメータRは、0または1の値をとり、これによって、これらの除算の丸めの方向が決定される。この丸め制御パラメータは、定数をセットされる、外部からシグナリングされる、または過去のコーディングされた情報から暗黙のうちに導出することができる。
【0077】
図6に、いくつかの実施形態でサブピクセル動き推定およびサブピクセル動き補償中に使用される基準フレーム(600)内の整数ピクセル位置およびサブピクセル位置を示す。各方向の1/4ピクセル間隔で、基準フレーム(600)に、エンコーダまたはデコーダが特定の変位についてピクセル値を補間する可能性があるサブピクセル位置が含まれる。基準フレーム(600)の整数位置aからpは、図6では影付きの円として示され、整数位置の間で補間される1/4位置および1/2位置は、影なしの円として示されている。位置P0からP8は、表1に記載の、9個の代表的なサブピクセル位置を表す。
【0078】
【表1】
【0079】
P8で例示される3/4ピクセル位置は、1/4ピクセル位置の特別なケースとみなすことができ、これは、フルピクセル位置から1/4ピクセルだけシフトされている。他の3/4ピクセル位置は、可能であるが図示されていない。サブピクセル位置P0からP8は、後の補間フィルタの説明で参照する。代替実施形態では、エンコーダおよびデコーダが、追加のまたは異なるサブピクセル位置、たとえば各方向に1/4ピクセル以外の間隔で、値を補間する。
【0080】
A.近似双三次補間フィルタ
いくつかの実施形態のサブピクセル補間について、ビデオエンコーダおよびビデオデコーダで、下記のように定義される一次(linear)/双一次(bilinear)フィルタおよび/または三次(cubic)/双三次(bicubic)フィルタが使用される。
【0081】
一次インターポーレータは、補間される点に最も近い2つの格子点での既知の値を使用する、線形または一次の1次元の多項式である。補間される点での線形関数の値が、線形補間である。線形多項式の乗数は、式の線形系を解き、線形フィルタの係数を決定することによって計算される。線形補間フィルタは、2つのフィルタタップによって定義される。双一次インターポーレータは、2つの次元で分離可能な線形インターポーレータである。
【0082】
三次インターポーレータは、補間される点に最も近い4つの格子点での既知の値を使用する、立方または三次の多項式である。補間される点での三次関数の値が、三次補間である。三次多項式の乗数は、式の系を解き、三次フィルタの係数を決定することによって計算される。三次インターポーレータフィルタは、4つのフィルタタップによって定義される。双三次インターポーレータは、2つの次元で分離可能な三次インターポーレータである。
【0083】
一次および双一次という用語は、通常は、ビデオ圧縮およびビデオ圧縮解除の分野では交換可能に使用される。普通の2次元補間では、1次元で実行される補間動作が、他の次元に複製され、したがって、各フィルタリングステージを、双一次フィルタリングと称する。三次および双三次という用語は、同様に交換可能である。
【0084】
本明細書では、一次および双一次という用語は、1次元、2次元、または3次元以上でのフィルタリングを説明するのに交換可能に使用される。同様に、三次および双三次という用語は、1次元、2次元、または3次元以上でのフィルタリングを説明するのに交換可能に使用される。たとえば、式(11)から(13)では、三次フィルタのタイプが定義されるが、これらは、双三次フィルタと呼ばれる。というのは、基準ビデオフレームの2ステージ補間の一般的な応用例で、フィルタが、2ステージ補間の両方の次元について複製される動作で使用されるからである。より一般的には、フィルタリングの次元数は、文脈から既知である。
【0085】
いくつかの実施形態で、エンコーダおよびデコーダで、近似双三次フィルタを使用して、サブピクセル位置の値を補間する。たとえば、エンコーダおよびデコーダで、図6に示されたものなどの基準フレームの可能なシフト位置で下記のフィルタ(F1が双三次フィルタ、F2およびF3が近似双三次フィルタ)が使用される。
1/2ピクセルシフト F1:[−1 9 9 −1] (11)
1/4ピクセルシフト F2:[−4 53 18 −3] (12)
3/4ピクセルシフト F3:[−3 18 53 −4] (13)
【0086】
実際には、フィルタに、潜在的にフィルタ係数によって導入される拡大を補償するために、右シフトが含まれる(たとえば、F1では4ビット、F2およびF3では6ビット)。演算子>>は、右シフト演算子である。右シフト演算子によって、2進数のビットが右にシフトされ、最下位ビットが捨てられ、最上位ビットに0が追加される。この演算は、剰余が切り捨てられる、シフトされるビット数の2のべきによる単純な除算をもたらす(たとえば、3による右シフトは、23=8による除算をもたらす)。
【0087】
F2およびF3のフィルタ係数は、真の1/4ピクセル双三次インターポーレータ(4タップフィルタ)に粗く基づく。下記の式に、位置P0について真の1/4ピクセル双三次フィルタを適用した結果を示す。
(−7e+105f+35g−5h)>>7 (14)
【0088】
係数の値の合計が、128になり、フィルタリングの産物は、7ビットだけ右シフトされる。近似双三次フィルタF2およびF3は、性能に関して純粋な双三次フィルタに迫るが、次式に示されるように、より低い分解能を有する。
(−7e+105f+35g−5h)>>7
=(−3.5e+52.5f+17.5g−2.5h)>>6
≒(−4e+53f+18g−3h)>>6 (15)
【0089】
多くの場合に、純粋な双三次フィルタを使用することによって、複数ステージ補間での精度のビットの消失がもたらされ、したがって、近似双三次フィルタに関する正規化係数が、少なくとも1/2だけ減らされる(すなわち、右シフトが1ビット以上減らされる)。式(15)の近似双三次フィルタについて選択されたフィルタ係数は、周波数領域の挙動(たとえば、高周波数情報を保存するため)および経験的挙動(たとえば、あるビットレートに対する最小のひずみを達成するため)を考慮に入れた後の、真の双三次フィルタの丸めに基づく。具体的に言うと、フィルタF2およびF3には、まだ4つのフィルタ係数が含まれる(一般に、フィルタで使用されるフィルタ係数が少ないほど、実施が高速になるが、近接ピクセルの雑音に対処するために、十分なフィルタ係数を使用しなければならない)。フィルタ係数値は、合計が64になるように調節され、これによって、より高い分解能の双三次フィルタを近似しながら、16ビット算術を使用する実施形態が容易になる。双三次フィルタを近似しながら、合計が64になる他のフィルタ係数値を使用することもできる。実質的に純粋な双三次フィルタのように実行されるが、より少ないサポートおよび/またはより低い分解能を有するフィルタを、「近似」双三次フィルタと称する。フィルタが実質的に純粋な双三次フィルタに似て実行されるかどうかを客観的に測定する方法の1つが、近似フィルタが純粋な双三次フィルタによく相関する(すなわち、定義された閾値以内である)かどうかを検査することである。一実施形態では、相関が、フィルタのベクトルの間の角度のコサイン(できる限り1に近いことが望まれる)を測定することであり、閾値は0.95である。他の客観的または主観的な測定、他の相関測定値、および/または閾値を、使用することもできる。たとえば、近似双三次フィルタのフィルタ係数を選択し、その結果、それらの合計が、効率的なフーリエ変換または他の数学的操作を容易にする他の値になるようにすることができる。
【0090】
以下でより完全に説明するように、図7に、式(11)から(13)で概要を示された双三次フィルタに対応する場合のそれぞれの補間されたピクセルを計算するのに使用されるピクセル値と共に、整数ピクセル位置を示す。Pは、ピクセル値が計算されるサブピクセル位置を示す。I1、I2、I3、およびI4は、補間の次元に沿った整数ピクセル位置を表す。図7には、水平補間が示されているが、同一の演算および位置の配置が、垂直補間に適用される。
【0091】
代替実施形態では、エンコーダおよびデコーダで、他のおよび/または追加の補間フィルタが使用される。たとえば、エンコーダおよびデコーダで、双一次(すなわち2タップの)フィルタが、値の補間に使用される。たとえば、図6のサブピクセル位置を参照すると、P1、P5、およびP7の値を決定するのに使用される補間フィルタを、式(1)から(3)に示されたフィルタとすることができる。
【0092】
B.1次元補間
さまざまなサブピクセル位置について、いくつかの実施形態のエンコーダおよびデコーダでは、補間された値を1つの次元だけで計算する。図7に示されているように、下記の式によって、整数ピクセルの間で補間するときの、フィルタF1(1/2ピクセルシフト)、F2(1/4ピクセルシフト)、およびF3(3/4ピクセルシフト)の動作が示される。
F1:(−1I1+9I2+9I3−1I4+8−r)>>4 (16)
F2:(−4I1+53I2+18I3−3I4+32−r)>>6 (17)
F3:(−3I1+18I2+53I3−4I4+32−r)>>6 (18)
【0093】
ここで、値rによって、丸めが制御される。下記のように、値rは、2進フレームレベル丸め制御パラメータRと補間方向に依存する。
【0094】
【数1】
【0095】
1次元補間をさらに示すために、図6のP1およびP5によって、1つの次元だけでの補間を必要とする(すなわち、P1では水平方向、P5では垂直方向)、基準フレーム(600)内の1/2ピクセル位置が示されている。次式によって、P1およびP5について整数ピクセルの間で補間するときのフィルタF1(1/2ピクセルシフト)の動作が示される。
P1=(−1e+9f+9g−1h+8−r)>>4 (20)
P5=(−1b+9f+9j−1n+8−r)>>4 (21)
【0096】
同様に、図6のP0およびP2によって、1つの次元だけでの補間を必要とする、基準フレーム(600)内の1/4ピクセル位置が示される。次式によって、P0およびP2について整数ピクセルの間で補間するときのフィルタF2(1/4ピクセルシフト)の動作が示される。
P0=(−4e+53f+18g−3h+32−r)>>6 (22)
P2=(−4b+53f+18j−3n+32−r)>>6 (23)
【0097】
近似1/4ピクセル双三次フィルタF2を、わずかな修正だけを用いて使用して、3/4ピクセル位置を計算することもできる。たとえば、次式によって、P8について整数ピクセルの間で補間するときのフィルタF3(3/4ピクセルシフト)の動作が示される。
P8=(−3b+18f+53j−4n+32−r)>>6 (24)
【0098】
代替案では、エンコーダおよびデコーダで、1つの次元の1/2ピクセル、1/4ピクセル、または3/4ピクセルだけシフトされる位置について他のおよび/または追加の補間フィルタが使用される。たとえば、エンコーダおよびデコーダで、より多数またはより少数のフィルタ係数、異なるフィルタ係数、異なる丸め、または丸めなしのフィルタが使用される。
【0099】
C.多次元補間
いくつかの実施形態では、補間が、2次元でオフセットしたサブピクセル位置で実行される。たとえば、図6で、P3、P4、P6、およびP7が、水平と垂直の両方の次元で補間が行われる位置である。
【0100】
図8に示された補間方法(800)に対応する一実施形態では、2次元サブピクセル位置が、まず垂直方向に沿って、次に水平方向に沿って、補間される。以下でより完全に説明するように、補間は、上の式(16)から(18)で指定されたフィルタ、F1、F2、またはF3の1つまたは複数を使用して実行される。図8に示された実施形態では、丸めが、垂直フィルタリングの後と水平フィルタリングの後の両方で適用される。丸め規則のビットシフトによって、中間結果での16ビット算術によって許容される精度の維持が保証される。
【0101】
図8では、垂直フィルタリングがまず実行され、水平フィルタリングがそれに続く。垂直フィルタリングから開始することによって、いくつかのアーキテクチャで性能が改善される。他の実施形態では、フィルタリングの順序が異なる。たとえば、補間が、垂直方向の前に水平方向で実行される。あるいは、補間フィルタのさまざまな他の組合せが使用される(たとえば、複数の水平フィルタおよび/または複数の垂直フィルタ)。
【0102】
入力ピクセル値(811)および出力ピクセル値(838)は、8ビットのビット深さを有し、256値のダイナミックレンジを有する。中間値(820)は、16ビットのビット深さを有し、65536値のダイナミックレンジを有する。代替実施形態では、入力値、出力値、および中間値が、異なる(たとえばより大きい)ビット深さを有する。
【0103】
第1ステージ(810)で、適当な垂直フィルタ(FV)が、8ビット入力ピクセル値(811)に適用される(812)。適用される垂直フィルタは、選択されたサブピクセル位置が、1/4ピクセル、1/2ピクセル、または3/4ピクセルのどれだけシフトされるかに依存し、上で説明した双三次フィルタの1つの形をとることができる。
【0104】
垂直フィルタリングの後の丸め規則は、次式によって定義される。
(S+RV)>>shiftV (25)
【0105】
ここで、Sは、垂直にフィルタリングされた結果であり、RV=2shiftV−1−1+Rである。Rは、フレームごとに0と1の間で交互に変える丸め制御値である。したがって、丸め規則には、ステージで交互に変える(stage−alternating)丸め制御(813)およびビットシフト(814)が含まれる。
【0106】
右シフトによって、潜在的に分解能の消失が引き起こされ、したがって、右シフトの少なくとも一部が、補間の後のステージまで延期される。shiftVの右シフト値は、補間されるサブピクセル位置に依存する。具体的に言うと、P3、P4、P6、およびP7について、shiftV={5、3、3、1}である。シフトの量は、第1ステージフィルタ係数値に起因する拡大の補償に必要な量より小さい(たとえば、シフトは、近似双三次フィルタについて6ビット未満である)が、後続フィルタリングの中間結果が中間値のダイナミックレンジ内(たとえば、16ビットワードの場合に65536個の可能な値)にとどまることを保証するのに十分である。フルシフトと比較して、この短縮されたシフトでは、補間の第1ステージ(810)の後に、中間ピクセル値(820)の精度が保たれる。中間ピクセル値(820)は、yビットのダイナミックレンジを有し、yは、8ビットより大きい。第1ステージで実行されるシフトの量は、使用可能なビット深さおよび補間フィルタの係数に依存するものとすることができる。たとえば、本明細書に記載の例示的実施形態では、中間値が、16ビットのワード限界に制限される。
【0107】
図6の点P3と、0から255の範囲(8ビット)の入力値を検討されたい。近似双三次係数[−4 53 18 −3]を8ビット入力値に適用することからの中間値の範囲は、フィルタ係数からの拡大要因に起因して、−1785から18105までである(約14.3ビット、実施については15ビットまでに丸められる)。中間値に近似双三次フィルタ係数(追加の拡大を有する)を適用する後続の水平フィルタリングでは、16ビットダイナミックレンジの外の値が作られ、オーバーフローまたはアンダーフローが引き起こされる可能性がある。したがって、中間値は、後続水平フィルタリングで16ビットダイナミックレンジ内の値がもたらされることを保証するのに十分にシフトされる。P3について、最初のシフト量は、5ビットであり、シフトされた中間値のダイナミックレンジは、−55から565までである(約9.3ビット、実施については10ビットまでに丸められる)。シフトされた中間値に近似双三次フィルタ係数を適用することからの出力の範囲は、−7860から40500までになり、これは、16ビット未満のダイナミックレンジを有する。したがって、短縮されたシフトは、16ビットワード限界が完全に利用されるが、補間の第2ステージ(830)中にそれを超えないことが保証されるように計算される。
【0108】
第2ステージ(830)では、適当な水平フィルタ(FH)を適用して、垂直フィルタによって決定された値(820)からの2次元サブピクセル位置の値を補間する(832)。水平フィルタリングの後の丸め規則は、次の通りである。
(S+64−R)>>7 (26)
【0109】
ここで、Sは、水平フィルタリングされた結果であり、Rは、フレームごとに交互に変える丸め制御値である。第1ステージの丸め規則と同様に、第2ステージの丸め規則には、ステージで交互に変える丸め制御(833)およびビットシフト(834)を用いて丸めが含まれる。第1ステージの延期されたシフトのゆえに、第2ステージでのシフトの量は、通常は、選択された水平フィルタについて通常期待されるものより大きく、所望のダイナミックレンジを有する値を出力するように計算される。
【0110】
双三次フィルタリングのすべてのケースで、潜在的に、値が負の補間されたピクセル、または値が範囲の最大値(たとえば、8ビット出力では255)より大きい補間されたピクセルが作られる可能性がある。このような8ビット出力値の場合には、エンコーダおよびデコーダが、許容される範囲に収まるように出力値(836)をクリッピングする。具体的に言うと、アンダーフローが、0にセットされ、オーバーフローが、255にセットされる。クランプの後に、補間された8ビット値(838)が出力される。
【0111】
図8では、第2ステージのシフトが、7ビットである。したがって、9ビットを有するフィルタリングされた出力値が、保たれる。たとえば、P3の前の例を続けると、フィルタリングされた出力値の範囲は、−61から316までであり、これは、約8.6ビットのダイナミックレンジを有する(実施については9ビットまでに丸められる)。補間されたデータの有効範囲は、8ビットだけだが、ヘッドルームの余分の1ビットによって、オーバーフロー情報およびアンダーフロー情報が提供される。言い換えると、最上位ビット(すなわち「符号」ビット)がセットされている場合に、アンダーフローまたはオーバーフローがある。具体的にこの2つのどちらが発生したかは、残りの8つの「仮数」ビットを調べることによって導出される。
【0112】
図9から11に、上で説明し、図8に示した2次元補間をさらに示す。図9に、図6の基準フレーム(600)のサブピクセル位置P7(水平に1/2ピクセル、垂直に1/2ピクセル)を示す。2つの1/2ピクセル双三次補間フィルタを使用して、P7の値を補間する。第1ステージでは、中間値V1からV4を、下記の一般形を有する1/2ピクセル双一次フィルタを使用して、近接する整数ピクセル位置から計算する。
【0113】
VInter=(−1x1+9x2+9x3−1x4) (27)
したがって、
V1=(−1a+9e+9i−1m) (28)
V2=(−1b+9f+9j−1n) (29)
V3=(−1c+9g+9k−1o) (30)
V4=(−1d+9h+9l−1p) (31)
である。
【0114】
RVの適当な値を加算した後に、結果を1ビットだけ右シフトする。第2ステージでは、中間結果V1からV4が、1/2ピクセルフィルタによって使用されて、P7のピクセル値が計算される。具体的に言うと、下記の形を有する1/2ピクセルフィルタが使用される。
P7=(−1V1+9V2+9V3−1V4) (32)
【0115】
上で述べたように、第2ステージの結果は、9ビット値を得るために7ビットだけ右シフトされる。この9ビット値には、8つの仮数ビットおよび1つの符号ビットが含まれる。必要なクランプをすべて実行してオーバーフローまたはアンダーフローを補償した後に、最終的な8ビットの補間された値が出力される。
【0116】
図10に、図6の基準フレーム(600)のサブピクセル位置P4(水平に1/2ピクセル、垂直に1/4ピクセル)を示す。1/4ピクセルおよび1/2ピクセルの双三次補間フィルタを使用して、P4の値を補間する。第1ステージでは、中間値V1からV4を、下記の一般形を有する1/4ピクセル双三次フィルタを使用して、近接する整数ピクセル位置から計算する。
VInter=(−4x1+53x2+18x3−3x4) (33)
【0117】
このフィルタは、上でP7の計算に関して説明したものと同一の形で、基準フレーム(600)の整数ピクセル値に適用される。RVの適当な値を加算した後に、結果を3ビットだけ右シフトする。第2ステージでは、中間結果V1からV4が、1/2ピクセルフィルタによって使用されて、P4のピクセル値が計算される。具体的に言うと、下記の形を有する1/2ピクセルフィルタが使用される。
P4=(−1V1+9V2+9V3−1V4) (34)
【0118】
第2ステージの結果は、9ビット値を得るために7ビットだけ右シフトされ、必要なクランプがすべて実行され、最終的な8ビットの補間された値が出力される。
【0119】
図10には、サブピクセル位置P6(水平に1/4ピクセル、垂直に1/2ピクセル)も示されている。P6の値を補間するために、P4の補間の技法が、わずかな修正だけを用いて使用される。修正された技法では、第1ステージで1/2ピクセル双三次フィルタを使用して、中間値を決定する。中間ピクセル値の位置は、図10のV5からV8に示されている。第2ステージ中に、1/4ピクセル双三次フィルタでこの中間値を使用して、P6の値を計算する。具体的に言うと、下記の形を有する1/4ピクセル双三次フィルタが使用される。
P6=(−4V5+53V6+18V7−3V8) (35)
【0120】
第1ステージおよび第2ステージでのシフトの量は、P4を計算する技法と同一である(すなわち、第1ステージのシフトが3、第2ステージのシフトが7である)。
【0121】
図11に、図6の基準フレーム(600)のサブピクセル位置P3(水平に1/4ピクセル、垂直に1/4ピクセル)を示す。2つの1/4ピクセル双三次補間フィルタを使用して、P3の値を補間する。第1ステージでは、中間値V1からV4が、下記の一般形を有する1/4ピクセル双三次フィルタを使用して、近接する整数ピクセル位置から計算される。
VInter=(−4x1+53x2+18x3−3x4) (36)
【0122】
このフィルタは、P4を計算することに関して上で説明したものと同一の形で基準フレーム(600)の整数ピクセル値に適用される。RVの適当な値を加算した後に、その結果を5ビットだけ右シフトする。第2ステージでは、中間結果V1からV4が、もう1つの1/4ピクセルフィルタによって使用されて、P3のピクセル値が計算される。具体的に言うと、下記の形を有する1/4ピクセルフィルタが使用される。
P3=(−4V1+53V2+18V3−3V4) (37)
【0123】
第2ステージの結果が、9ビット値を得るために7ビットだけ右シフトされ、必要なクランプがすべて実行され、最終的な8ビットの補間された値が出力される。
【0124】
図9から11には示されていないが、1つまたは両方の次元で3/4ピクセルシフトを有するサブピクセル位置の値も、計算することができる。そのようなサブピクセル位置を計算するために、上で概要を示した方法を、1/4ピクセル双三次フィルタの代わりに適当な3/4ピクセル双三次フィルタを使用することによって修正することができる。
【0125】
他の実施形態では、双一次フィルタまたは双一次フィルタと双三次フィルタとの組合せを使用して、サブピクセルサンプル位置の値を補間する。双一次フィルタの使用によって、双三次フィルタの場合より係数によって導入される膨張(expansion)が減るので、一般に、実行されるシフトの量(第1ステージの後および全体の後)が減る。たとえば、双一次フィルタおよび16ビット中間値を使用する一実施形態では、第1ステージでシフトが実行されず、これによって16ビットワード限界の使用が最大になり、4ビットの右シフトが最終ステージの後で実行される。同様に、クランプを、最終ステージまで延期することができる。
【0126】
上で説明した方法の基礎となる原理の1つが、所望の「ワードサイズ」限界W内にとどまりながら、フィルタリングのすべてのステージで可能な最高の精度を使用することである。出力値が、Dビットのダイナミックレンジを有し、Lビットが、最終ステージで破棄される場合に、フィルタリングの最終ステージの出力は、D+L+1ビットまでを占めることができ、この1つの余分なビットは、アンダーフローおよびオーバーフローのシグナリングに使用される。逆方向に進んで、フィルタリングの最終ステージが、kビットの拡大をもたらす場合に、最終ステージの入力は、D+L−k以内でなければならない。したがって、Wビット表現で最大の精度を保つために、下記の関係が存在する。
D+L+1=W (38)
【0127】
さらに、最終ステージへの入力は、D+L−k=W−k−1ビットでなければならない。
【0128】
上の論理を、フィルタリングの終りから2番目のステージに再帰的に適用することができ、以下同様である。実際に、フラクショナルビットを使用して非2k範囲および拡大要因を表現することによって、上下の限界を狭めることができる。
【0129】
図12から図15は、上で組み合わせて説明したが、複数ステージ補間に別々に適用可能でもある、さまざまな技法を示す図である。図12から図15には、めいめいの複数ステージ補間(1200、1300、1400、1500)を、他の複数ステージ補間技法と共に使用することができるさまざまな形は示されていない。
【0130】
また、図12から図15のそれぞれに、2つのステージが示されているが、図12から図15に示された複数ステージ補間(1200、1300、1400、1500)技法に、より多くのステージを含めることができる。より一般的には、複数ステージ補間(1200、1300、1400、1500)技法を、複数の次元の任意のタイプの分離可能なフィルタならびにカスケード構造、トレリス構造、または格子構造で実施される任意のフィルタを用いて実施することができる。
【0131】
図12から図15に、複数ステージ補間で使用される一般化された入力値、出力値、およびフィルタを示す。第1ステージの入力値、最終ステージの出力値、および中間値のビット深さの特定の選択は、ターゲットのアーキテクチャまたはアプリケーションの技術的仕様に従って任意に拡張することができる。たとえば、入力値を、基準フレームの整数ピクセル位置の8ビットピクセル値とし、出力値を、基準フレームのサブピクセル位置の8ビットピクセル値とし、フィルタを、標準の双三次フィルタおよび近似双三次フィルタ(図6から図8に関して上で説明したもの)とすることができる。代替案では、入力値および/または出力値が、異なるビット深さのダイナミックレンジを有するか、または異なるフィルタが使用される。
【0132】
それぞれ図4および図5に関して説明したエンコーダまたはデコーダなどのコンポーネントが、複数ステージ補間(1200、1300、1400、1500)を実行することができる。代替案では、別のエンコーダまたはデコーダ、あるいは別のタイプのコンポーネントが、複数ステージ補間(1200、1300、1400、1500)を実行することができる。
【0133】
図12に、中間の補間された値に関する拡張されたダイナミックレンジ(ビット単位)を有する複数ステージ補間(1200)の図を示す。第1ステージ(1210)で、コンポーネントが、1つまたは複数のxビット範囲の入力値(1211)に第1フィルタF1を適用し(1212)、1つまたは複数のyビット範囲の中間値(1220)を作る。ここで、yはxより大きい。たとえば、yビット中間値は、8ビットより大きいダイナミックレンジを有するピクセル値であり、xビット入力値は、8ビットのダイナミックレンジを有する。
【0134】
詳細には図示されていない0または1個以上の中間ステージ(1222)のそれぞれで、コンポーネントが、yビット範囲の中間値(1220)にフィルタを適用する。中間ステージからの出力は、1つまたは複数のzビット範囲の中間値(1229)であり、ここで、zはxより大きい(図12から図15では、最終ステージが第2ステージである場合に、第1ステージから出力される中間値が、最終ステージへの入力中間値である)。
【0135】
最終ステージ(1230)で、コンポーネントが、1つまたは複数のzビット範囲の中間値(1229)に最終フィルタFLを適用する(1232)。最終的な出力は、xビット範囲の出力値(1234)である。複数ステージ補間(1200、1300、1400、1500)技法のそれぞれについて、必要な場合に、コンポーネントは、追加の出力値について複数ステージ補間(1200、1300、1400、1500)を繰り返す。繰り返される補間では、コンポーネントが、前の補間で計算されたある中間値を再利用することができる。
【0136】
図13に、スキップされたクランプを用いる複数ステージ補間技法(1300)の図を示す。クランプの延期によって、たとえば、コンポーネントがもはや範囲の上下界に対して各中間値を検査しないので、計算が高速になる。延期されたクランプによって、中間値の精度も保たれる。
【0137】
第1ステージ(1310)で、コンポーネントが、1つまたは複数のxビット範囲の入力値(1311)に第1フィルタF1を適用する(1312)。第1フィルタF1の適用の後に、クランプは実行されない。したがって、第1フィルタF1から出力される1つまたは複数の中間値(1320)が、xビットを超えるダイナミックレンジを有する場合がある。たとえば、入力値が、8ビット値であり、第1フィルタF1からの出力が、第1フィルタF1の係数によって導入される膨張係数(expansion factor)に起因して、9ビットまたはそれ以上のダイナミックレンジを有する。
【0138】
詳細には図示されていない0または1個以上の中間ステージ(1322)のそれぞれで、コンポーネントが、1つまたは複数のクランプされていない中間値(1320)にフィルタを適用する。クランプを、0または1個以上の中間ステージ(1322)でスキップすることもできる。0または1個以上の中間ステージ(1322)から出力された中間値(1329)が、最終ステージ(1330)に入力され、このステージで、コンポーネントが値(1329)に最終フィルタFLを適用する(1322)。最終フィルタFLからの最終的な出力が、クランプされ(1334)、xビット範囲の値(1336)が出力される。
【0139】
図14に、延期されたビットシフトを用いる複数ステージ補間(1400)の図を示す。第1ステージ(1410)で、コンポーネントが、1つまたは複数のxビット範囲の入力値(1411)に第1フィルタF1を適用する(1412)。第1フィルタF1の適用と共にまたはその後に、短縮されたシフト(1414)を実行する。短縮されたシフト(1414)は、xビット範囲の出力値を保証するのに必要なシフトより少なく(第1フィルタF1の係数の拡大要因に鑑みて)、したがって、第1フィルタF1に通常関連するシフトより少ない。したがって、短縮されたシフト(1414)によって、xビットより大きいダイナミックレンジ(yビットの)を有する1つまたは複数の中間値が作られる。たとえば、入力値が、8ビットのダイナミックレンジを有し、中間値が、8ビットを超えるダイナミックレンジを有する。
【0140】
詳細には図示されていない0または1個以上の中間ステージ(1422)のそれぞれで、コンポーネントが、1つまたは複数の中間値(1420)にフィルタを適用する。zビット(xビットより大きい)のダイナミックレンジを有する1つまたは複数の中間値(1429)が、0または1個以上の中間ステージ(1422)から出力され、最終ステージ(1430)で、コンポーネントが、値(1429)に最終フィルタFLを適用する(1432)。最終フィルタFLからの最終的な出力が、最終フィルタFLに通常関連するものより多い量だけシフトされ(1434)、これによって、出力値(1436)のダイナミックレンジが、指定されたビット深さに制限される。たとえば、出力値(1436)のダイナミックレンジ(ビット単位)が、xまたはx+1と等しい。一実施形態では、第1ステージおよびすべての中間ステージのシフトが、最終ステージまで、できる限り延期される。シフトが延期される量は、中間計算に使用可能なビット深さと、めいめいのフィルタの拡大要因に依存する可能性がある。
【0141】
図15に、ステージで交互に変える丸め制御を使用する複数ステージ補間技法(1500)を示す。補間技法(1500)の複数のステージは、丸め制御を適用して丸めを調整する形において交互に変える。これは、あるビデオシーケンス内のフレームからフレームへと丸め誤差が累積されるのを防ぐのに役立つ。たとえば、低品質ビデオシーケンスに、1次元(パン)または2次元(ズーム)の漸進的な動きが含まれる場合に、丸め誤差の累積によって、フレームからフレームへの漸進的な退色(color fading)がもたらされる可能性があり、これによって、知覚可能なアーチファクトが引き起こされる可能性がある。ステージで交互に変える丸め制御は、そのような退色を防ぐのに役立つ。
【0142】
数値の例が、右ビットシフトの前にステージで交互に変える丸め制御が適用される丸めを示すのに役立つ可能性がある。右ビットシフトは、本質的に、右シフトされる値の除算および切捨をもたらす。シフトの前に丸め値を加算することによって、シフトされる値が、必ず切り下げられる(切捨)のではなく、上または下に(最も近い整数に)丸められるようになる。丸め制御を使用することによって、限界の値について丸めの方向(上または下)が変更される。たとえば、複数ステージのそれぞれで、フィルタリングの出力が、右シフトの前に右シフトの「除数」の1/2を加算する(たとえば、5ビット右シフトの前に24=16を加算する、7ビット右シフトの前に26=64を加算する)ことによって調整されると仮定する。この加算の効果は、0.5またはそれ以上の小数成分を有する値が(ビットシフトに対応する除算の後に)(次に大きい整数に)切り上げられることである。そのような値は、そうでなければ右シフトによって(次に小さい整数に)切り捨てられる。加算にかかわらず、0.5未満の小数成分を有する値は(ビットシフトに対応する除算の後に)、まだ右シフトによって(次に小さい整数に)切り捨てられる。丸め制御によって、ある限界の値の丸めの方向が変更される。たとえば、複数ステージのそれぞれで、フィルタリングの出力が、右シフトの前に0または1(交互に変える丸め制御値)を減算することによって、さらに調整される(たとえば、2shiftV−1または2shiftV−1−1)。丸め制御調整の効果は、0.5の小数成分を有する(ビットシフトに対応する除算の後に)値の丸めの方向が変更されることである。1が減算される場合に、そのような限界の値が、切り下げられる。そうでない場合には、そのような限界の値が、切り上げられる。
【0143】
複数のステージのそれぞれで、複数ステージ補間の前に、0と1の間で交互に変える丸め制御値が使用され、したがって、異なるステージで、丸め制御値が適用される形が交互に変わる。代替案では、複数ステージ補間技法(1500)で、それ自体がステージからステージへ交互に変わる丸め制御値が使用される。
【0144】
図15の第1ステージ(1510)で、コンポーネントが、1つまたは複数のxビット範囲の入力値(1511)に第1フィルタF1を適用する(1512)。第1フィルタF1の適用と共にまたはその後に、丸め(1514)が、第1フィルタF1からの出力に対して実行される。丸め(1514)は、ステージで交互に変える丸め制御によって調整される。たとえば、第1ステージ(1510)で、ステージで交互に変える丸め制御によって、出力値が限界の値(そうでなければ出力値が下に丸められる)である場合に、出力値が最も近い整数に向けて上に丸められるようになる。1つまたは複数の丸められた中間値(1520)が、第1ステージから第2ステージ(1530)へ出力される。
【0145】
第2ステージ(1530)では、コンポーネントが、1つまたは複数の中間値(1520)に第2フィルタF2を適用する(1532)。丸め(1534)が、第2フィルタF2からの出力に対して実行される。第2フィルタF2の適用と共にまたはその後に、丸め(1534)が、ステージで交互に変える丸め制御を用いて実行され、この丸め制御によって、限界の値について第1ステージと反対の方向の丸めが行われるようになる。たとえば、第2ステージ(1530)で、ステージで交互に変える丸め制御によって、出力値が限界の値である場合に、出力値が、最も近い整数に向かって下に丸められるようになる。1つまたは複数の中間値(1536)が、第2ステージから出力され、0または1個以上の追加ステージ(1540)でこれらを使用することができる。0または1個以上の追加ステージ(1540)に、さらに、ステージで交互に変える丸め制御を含めることができる。
【0146】
交互に変える丸め制御は、連続するステージでの適用に制限されるのではなく、ステージのさまざまな他の組合せで適用することができる。さらに、第1方向を、複数のパラメータに依存するものとすることができる。たとえば、ビデオエンコーダまたはビデオデコーダで、第1方向を、前のフレームで使用されれた丸め制御または補間されるフレームのタイプ(たとえば、Iフレーム、Pフレーム、またはBフレーム)に依存するものとすることができる。他の実施形態では、第1方向に、臨時情報(casual information)(たとえば、過去にコーディング/デコーディングされた情報)から暗黙のうちに導出されるか、擬似乱数ジェネレータを使用して導出されるか、ビットストリームの一部としてシグナリングされる、定数をセットすることができる。ステージで交互に変える丸め制御は、双一次フィルタ、双三次フィルタ、および近似双三次フィルタを含む、さまざまな補間フィルタのどれかを使用して複数ステージ補間に適用することができる。
【0147】
D.クロミナンス動きベクトル
クロミナンス(クロマ)動きベクトルは、同一位置の輝度動きベクトルから暗黙のうちに導出されるので、その精度は、限られ、単純化のスコープが提供される。この単純化では、コーディングされるビデオの知覚される質を大きく落とさずに、エンコーダおよびデコーダでのクロミナンス値のサブピクセル補間の計算的複雑さを減らすことができる。さらに、エンコーダおよびデコーダを、クロミナンス動きベクトルの丸めおよび補間の異なるモードの間で切り替えることができる。たとえば、あるモードでは、より高い計算的複雑さと引き換えに、コーディングされるビデオの品質を際立たせる。別のモードでは、品質を多少犠牲にして、計算的単純さを際立たせる。
【0148】
一実施形態では、ビデオエンコーダおよびビデオデコーダで、シーケンスレベルの1ビットフィールド「FASTUVMC」を使用して、クロミナンス値のサブピクセル補間およびクロミナンス動きベクトルの丸めを制御する。したがって、ビデオエンコーダおよびビデオデコーダは、2つの異なるクロミナンス丸めモードすなわち、高速モードと基本モードの1つで選択的に動作する。
【0149】
図16に、複数のクロミナンス丸めおよび補間モードの間での選択の技法(1600)を示す。たとえば、それぞれ上で図4および図5に関して説明したものなどのビデオエンコーダまたはビデオデコーダが、この技法を実行する。
【0150】
ビデオエンコーダまたはビデオデコーダは、1ビットフラグFASTUVMCによって、高速クロミナンス動き補償モード(フラグ=1)または基本クロミナンス動き補償モード(フラグ=0)のどちらが示されるかを判定する(1610)。たとえば、このフラグは、エンコーダがコーディングされるビデオのビットストリームに書き込み、デコーダがビットストリームから読み取る、ユーザ設定に対応するシーケンスレベルのフィールドである。代替案では、エンコーダおよびデコーダが、より多くのビットを使用して、たとえば2つより多い使用可能なモードの間で選択するために、固定された長さまたは可変長さのコードを使用してクロミナンス丸めおよび/または補間モードをシグナリングする。あるいは、ユーザ設定に対応するシーケンスレベルのフィールではなく、切替情報が、ビットストリーム内の他所でシグナリングされ、かつ/または異なる判断基準に従ってセットされる。
【0151】
ビデオエンコーダまたはビデオデコーダは、基本モード(1620)または高速モード(1630)でクロミナンス動き補償を実行する。基本モード(1620)および高速モード(1630)の動きベクトルの丸めおよび補間の詳細は、一実施形態について以下に示す。代替案では、これらのモードが、異なる実施形態を有する。たとえば、以下で説明する高速モード(1630)実施形態で使用されるルックアップテーブルを、特定のハードウェアアーキテクチャの所望の性能レベルをもたらすために異なるマッピングに変更するか、または異なる精度の動きベクトルについて動作するように変更する。基本モード(1620)および高速モード(1630)の代わりにまたはこれに加えて、エンコーダまたはデコーダで、クロミナンス動きベクトルの丸めおよび補間の他のモードを使用することができる。
【0152】
一実施形態では、高速モードで(たとえば、クロミナンス丸めフラグ=1の場合)、1/4ピクセルオフセットにある(すなわち、1/4ピクセルオフセットおよび3/4ピクセルオフセット)クロミナンス動きベクトルが、最も近いフルピクセル位置に丸められ、1/2ピクセルオフセットにあるクロミナンス動きベクトルが、丸められないままにされ、双一次フィルタリングが、クロミナンス補間に使用される。このモードでは、エンコーダおよびデコーダの速度が高くなる。この最適化の動機は、(a)整数ピクセル位置、(b)1/2ピクセル位置、(c)少なくとも1つの座標(xまたはy)について1/4ピクセル位置、および(d)両方の座標について1/4ピクセル位置にあるピクセルオフセット補間の複雑さの間の大きな相違である。a:b:c:dの比率は、おおむね1:4:4.7:6.6である。この高速モードを適用することによって、(a)および(b)を優先することができ、したがって、デコーディング時間を削減することができる。これは、クロミナンス補間だけについて実行されるので、コーディングおよび品質(特に可視の品質)の消失は、どちらも無視してよい。
【0153】
この高速モードでは、丸めの最終的なレベルが、下記のようにクロミナンス動きベクトルに対して行われる。
【0154】
//RndTbl[-3]=-1,RndTbl[-2]=0,RndTbl[-1]=+1,RndTbl[0]=0
//RndTbl[1]=-1,RndTbl[2]=0,RndTbl[3]=+1
cmv_x=cmv_x+RndTbl[cmv_x%4]; (39)
cmv_y=cmv_y+RndTbl[cmv_y%4];
【0155】
ここで、cmv_xおよびcmv_yは、1/4ピクセル単位のクロミナンス動きベクトルのx座標およびy座標であり、%は、剰余(または余り)演算を表し、したがって、(x%a)=−(−x%a)と定義される(負の数の剰余は、対応する正の数の剰余の負数と等しい)。したがって、cmv_x(またはcmv_y)が、4によって割られるときに、クロミナンス動きベクトルが、整数オフセットを有する。cmv_x%4=±2のときに、クロミナンス動きベクトルが、1/2ピクセルオフセットを有する。cmv_x%4=±1または±3のときに、クロミナンス動きベクトルが、1/4ピクセルオフセットを有する。上の再マッピング動作からわかるように、1/4ピクセル位置は、クロミナンス動きベクトルを最も近い整数位置に丸めることによって禁止される(1/2ピクセル位置は変更されないままになる)。したがって、このモードによって、クロミナンス座標が整数ピクセル位置および1/2ピクセル位置に再マッピングされる。双一次フィルタリングを、さらなる高速化のためにこのモードのクロミナンス補間のすべてに使用することができる。この高速モード実施形態を、複数の丸めモードの間の選択と組み合わせて説明したが、その代わりに、高速モード実施形態を独立に(すなわち、唯一の可能なモードとして)使用することができる。
【0156】
図17は、このクロミナンス丸めの第1モードを示す表図(1700)である。第1行(1710)に、1/4ピクセル精度の輝度動きベクトル値が示されている。輝度動きベクトル値は、整数ピクセル位置からの小数オフセットに関して示されているが、これらを、各整数が1/4ピクセル増分を表す整数値(すなわち、0、1/4、1/2、3/4、1ではなく0、1、2、3、4)として表現することができる。第2行(1720)に、クロミナンス動きベクトル値が、高速モードでどのように丸められ、その結果、整数ピクセル精度および1/2ピクセル精度を有するようになるかが示されている。
【0157】
この実施形態の第2の基本モード(たとえば、クロミナンス丸めフラグ=0)では、1/4ピクセルオフセットにあり、丸め誤差を有しないクロミナンス動きベクトルは、1/4ピクセルオフセットのままである。他のサブピクセルオフセットにあるクロミナンス動きベクトルは、最も近いフルピクセル位置または1/2ピクセル位置に丸められる。このモードでは、デコーダの速度が、他のモードより遅くなる可能性があるが、クロミナンスピクセル値が計算される精度が、高くなる。したがって、この基本モードでは、クロミナンス座標が、整数ピクセル位置、1/2ピクセル位置、および1/4ピクセル位置に再マッピングされる。上で説明した双三次フィルタリングまたは双一次フィルタリングを、クロミナンス補間に使用することができる。
【0158】
図18は、このクロミナンス丸めの基本モードを示す表図である。第1行(1810)に、1/4ピクセル精度の輝度動きベクトル値が示されている。第2行(1820)に、上で説明した基本モードで対応するクロミナンス動きベクトル値がどのように丸められ、その結果、整数ピクセル精度、1/2ピクセル精度、および1/4ピクセル精度を有するようになるかが示されている。他の実施形態では、クロミナンス空間が、クロミナンス空間の他の分解能に丸められる。
【0159】
さまざまな実施形態に関して本発明の原理を説明し、図示したが、これらのさまざまな実施形態を、そのような原理から逸脱せずに配置および詳細においてを修正できることを諒解されたい。たとえば、上で説明した原理および技法は、ビデオエンコーダおよび/またはビデオデコーダでの使用に制限されない。そうではなく、上で説明した原理および技法は、値が部分的に1つまたは複数の中間値に基づいて計算されるか、分離可能なフィルタが複数の次元で使用される、すべてのコンピューティングの文脈で適用することができる。
【0160】
本明細書で説明したプログラム、処理、または方法が、他の形で示されない限り、特定のタイプのコンピューティング環境に関連せず、それに制限されないことを理解されたい。さまざまなタイプの汎用のまたは特殊化されたコンピューティング環境を、本明細書に記載の教示による動作と共に使用するか、そのような環境によって本明細書に記載の教示による動作を実行することができる。ソフトウェアで示された実施形態の要素を、ハードウェアで実施することができ、逆も同様である。
【0161】
本発明の原理を適用することができる多数の可能な実施形態に鑑みて、本発明として、請求項およびその同等物の範囲および趣旨に含まれるすべてのそのような実施形態を請求する。
【0162】
【発明の効果】
以上説明したように、本発明によれば、計算されたピクセル値を使用する動き予測の有効性が改善される。それと同時に、近似双三次フィルタリングにより、比較的効率的に計算を行うことができる。
【図面の簡単な説明】
【図1】従来技術によるビデオエンコーダでの動き推定を示す図である。
【図2】従来技術による、サブピクセル動き推定および補償での補間に関するサブピクセル位置を示す図である。
【図3】複数の本明細書に記載の実施形態をその中で実施することができる、適切なコンピューティング環境を示すブロック図である。
【図4】複数の本明細書に記載の実施形態で使用される一般化されたビデオエンコーダシステムを示すブロック図である。
【図5】複数の本明細書に記載の実施形態で使用される一般化されたビデオデコーダシステムを示すブロック図である。
【図6】サブピクセル動き推定およびサブピクセル動き補償中のピクセル値補間に関する位置を示す図である。
【図7】サブピクセル位置に関する補間されたピクセル値の計算に使用されるピクセル値を有する整数ピクセル位置を示す図である。
【図8】サブピクセル位置の値を補間する2ステージ補間技法を示す図である。
【図9】水平1/2垂直1/2サンプル位置と、そのサンプル位置の値を計算するのに使用されるサブピクセル位置での中間値とを示す図である。
【図10】水平1/4垂直1/2サンプル位置、水平1/2垂直1/4サンプル位置、およびそれらのサンプル位置の値を計算するのに使用されるサブピクセル位置での中間値を示す図である。
【図11】水平1/4垂直1/4サンプル位置と、そのサンプル位置の値を計算するのに使用されるサブピクセル位置での中間値を示す図である。
【図12】強化されたダイナミックレンジ(ビット単位)中間値を用いる複数ステージ補間技法を示す図である。
【図13】スキップされたクランプを用いる複数ステージ補間技法を示す図である。
【図14】延期されたビットシフトを用いる複数ステージ補間技法を示す図である。
【図15】ステージで交互に変える丸め制御を使用する複数ステージ補間技法を示す図である。
【図16】複数のクロミナンス丸めおよび補間モードの間での選択の技法を示す流れ図である。
【図17】第1のクロミナンス丸めモードを示す表図である。
【図18】第2のクロミナンス丸めモードを示す表図である。
【符号の説明】
400 ビデオエンコーダシステム
405 現在のフレーム
410 動き推定
415 動き情報
420 フレームストア
425 再構成された前のフレーム
430 動き補償
435 動き補償された現在のフレーム
445 予測残差
460 周波数変換
466 逆周波数変換
470 量子化
476 逆量子化
480 エントロピ符号化
490 バッファ
495 圧縮ビデオ情報
Claims (19)
- コンピュータシステムにおいて、コンピュータ実施される方法であって、
純粋な双三次フィルタのフィルタ係数より縮小されたフィルタ係数を有する近似双三次フィルタを使用するステップであって、前記純粋な双三次フィルタのフィルタ係数はターゲットのアーキテクチャの所望のビット深さに応じた第1の合計を有し、前記縮小されたフィルタ係数は前記第1の合計より少ない第2の合計を有し、前記縮小されたフィルタ係数は、第1ステージおよび第2ステージを有する複数ステージ補間により、1/4サンプル位置での値を計算するときに、前記縮小されたフィルタ係数を適用することによる拡大の少なくとも一部に対する遅延された補償が、前記所望のビット深さを超えることなく可能となるように縮小される、近似双三次フィルタを使用するステップであって、
前記第1ステージで、前記縮小されたフィルタ係数を整数ピクセル位置のピクセル値に適用し、前記第1ステージで前記縮小されたフィルタ係数を適用することによる拡大の一部を補償する量だけ右にビットシフトし、
前記第2ステージで、前記縮小されたフィルタ係数を前記第1ステージの計算結果に適用し、前記第2ステージで前記縮小されたフィルタ係数を適用することによる拡大と、前記第1ステージからの拡大の残りを補償する量だけ右にビットシフトするステップを含み、
前記第1ステージからの拡大の残りを補償する量は、前記第2ステージにおいて拡大した値が前記所望のビット深さを超えないように定義されることを特徴とするコンピュータ実施される方法。 - 前記拡大の一部を補償する量は、補間される1/4サンプル位置に依存することを特徴とする請求項1に記載の方法。
- 前記所望のビット深さは16ビットであることを特徴とする請求項1に記載の方法。
- 前記フィルタ係数はフーリエ変換を容易にすることを特徴とする請求項1ないし3のいずれかに記載の方法。
- 前記フィルタ係数は合計64であることを特徴とする請求項1ないし4のいずれかに記載の方法。
- 前記フィルタ係数は−4、53、18および−3であることを特徴とする請求項1ないし5のいずれかに記載の方法。
- 1または複数の追加の1/4サンプル位置のそれぞれについて前記計算を繰り返すステップをさらに備えることを特徴とする請求項1ないし6のいずれかに記載の方法。
- コンピュータシステムに、ビデオエンコーディング中に請求項1ないし7のいずれかに記載の方法を実行させるコンピュータ実行可能命令を記憶することを特徴とするコンピュータ可読媒体。
- コンピュータシステムに、ビデオデコーディング中に請求項1ないし7のいずれかに記載の方法を実行させるコンピュータ実行可能命令を記憶することを特徴とするコンピュータ可読媒体。
- コンピュータシステムにおいて、コンピュータ実施される方法であって、
双三次補間の第1ステージで、純粋な双三次フィルタのフィルタ係数より縮小されたフィルタ係数を有する近似双三次フィルタを使用して第1次元での基準ビデオフレームのサンプルをフィルタリングするステップであって、前記純粋な双三次フィルタのフィルタ係数はターゲットのアーキテクチャの所望のビット深さに応じた第1の合計を有し、前記縮小されたフィルタ係数は前記第1の合計より少ない第2の合計を有し、前記縮小されたフィルタ係数は、前記縮小されたフィルタ係数を適用することによる拡大の少なくとも一部に対する遅延された補償が、前記所望のビット深さを超えることなく可能となるように縮小され、前記フィルタリングは、整数ピクセル位置におけるピクセル値に前記縮小されたフィルタ係数を提供し、ビットシフトして前記第1ステージで前記縮小されたフィルタ係数を適用することによる拡大の一部を補償することを含み、前記第1ステージのためのフィルタリングは中間結果を生成し、前記第1ステージからの拡大の残りを補償する量は前記双三次補間の第2ステージにおいて拡大した値が前記所望のビット深さを超えないように定義される、フィルタリングするステップと、
前記第2ステージで、前記近似双三次フィルタを使用して第2次元で前記中間結果をフィルタリングするステップであって、前記縮小されたフィルタ係数を前記第1ステージにおける計算の中間結果に適用し、前記第1ステージからの拡大の残りおよび前記第2ステージで前記縮小されたフィルタ係数を適用することによる拡大を補償するためにビットシフトすることを含むステップと
を備えることを特徴とするコンピュータ実施される方法。 - 前記近似双三次フィルタのフィルタ係数は、前記基準ビデオフレームの8ビットサンプルに対し16ビット算術での延期されたビットシフトを可能にすることを特徴とする請求項10に記載の方法。
- 前記近似双三次フィルタのフィルタ係数は合計64であることを特徴とする請求項10または11に記載の方法。
- 前記近似双三次フィルタのフィルタ係数は−4、53、18および−3であることを特徴とする請求項10ないし12のいずれかに記載の方法。
- コンピュータシステムに、ビデオエンコーディング中に請求項10ないし13のいずれかに記載の方法を実行させるコンピュータ実行可能命令を記憶することを特徴とするコンピュータ可読媒体。
- コンピュータシステムに、ビデオデコーディング中に請求項10ないし13のいずれかに記載の方法を実行させるコンピュータ実行可能命令を記憶することを特徴とするコンピュータ可読媒体。
- 基準ビデオフレームに対する複数ステージ補間の第1ステージおよび第2ステージの各々で近似双三次フィルタを使用する手段であって、前記近似双三次フィルタは第1の合計を有する第1のフィルタ係数を有し、前記第1のフィルタ係数は純粋な双三次フィルタの第2のフィルタ係数より縮小されており、前記第2のフィルタ係数はターゲットのアーキテクチャの所望のビット深さに応じた第2の合計を有し、前記第1のフィルタ係数は第2の合計より少ない第1の合計を有し、前記第1のフィルタ係数は、前記第1のフィルタ係数を適用することによる拡大の少なくとも一部に対する遅延された補償が、前記所望のビット深さを超えることなく可能となるように縮小され、前記第1ステージおよび第2ステージの各々は前記第1のフィルタ係数による入力値の拡大を補償する右へのビットシフトを含み、前記第1ステージにおける整数ピクセル位置のピクセル値の拡大を補償する右へのビットシフトの一部が前記第2ステージまで延期されるように、かつ前記第1ステージの計算結果から拡大した値が前記所望のビット深さを超えないように前記右へのビットシフトが実行される、近似双三次フィルタを使用する手段と、
前記基準ビデオフレームに関して動き補償を実行する手段と
を備えたことを特徴とするシステム。 - 前記第1の合計は64であり、前記第2の合計は128であることを特徴とする請求項16に記載のシステム。
- 前記第1のフィルタ係数は−4、53、18および−3であることを特徴とする請求項16または17に記載のシステム。
- 前記所望のビット深さは16ビットであることを特徴とする請求項16に記載のシステム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US37186002P | 2002-04-10 | 2002-04-10 | |
US60/371,860 | 2002-04-10 | ||
US10/379,606 | 2003-03-04 | ||
US10/379,606 US7110459B2 (en) | 2002-04-10 | 2003-03-04 | Approximate bicubic filter |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003333603A JP2003333603A (ja) | 2003-11-21 |
JP4625240B2 true JP4625240B2 (ja) | 2011-02-02 |
Family
ID=28794436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003107078A Expired - Lifetime JP4625240B2 (ja) | 2002-04-10 | 2003-04-10 | コンピュータ実施される方法、システムおよびコンピュータ可読媒体 |
Country Status (9)
Country | Link |
---|---|
US (1) | US7110459B2 (ja) |
EP (1) | EP1359763B1 (ja) |
JP (1) | JP4625240B2 (ja) |
KR (1) | KR100681972B1 (ja) |
CN (1) | CN1238798C (ja) |
AT (1) | ATE350860T1 (ja) |
DE (1) | DE60310800T2 (ja) |
ES (1) | ES2278087T3 (ja) |
HK (1) | HK1060242A1 (ja) |
Families Citing this family (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7620109B2 (en) * | 2002-04-10 | 2009-11-17 | Microsoft Corporation | Sub-pixel interpolation in motion estimation and compensation |
JP4102973B2 (ja) * | 2002-04-24 | 2008-06-18 | 日本電気株式会社 | 動画像の符号化方法および復号化方法、これを用いた装置とプログラム |
US7336720B2 (en) * | 2002-09-27 | 2008-02-26 | Vanguard Software Solutions, Inc. | Real-time video coding/decoding |
US7869516B2 (en) * | 2003-03-31 | 2011-01-11 | Hewlett-Packard Development Company, L.P. | Motion estimation using bit-wise block comparisons for video compresssion |
US8824553B2 (en) * | 2003-05-12 | 2014-09-02 | Google Inc. | Video compression method |
EP1617672A1 (en) * | 2004-07-13 | 2006-01-18 | Matsushita Electric Industrial Co., Ltd. | Motion estimator/compensator including a 16-bit 1/8 pel interpolation filter |
US7512182B2 (en) * | 2004-08-30 | 2009-03-31 | General Instrument Corporation | Method and apparatus for performing motion compensated temporal filtering in video encoding |
FR2876860A1 (fr) * | 2004-10-20 | 2006-04-21 | Thomson Licensing Sa | Procede de codage hierarchique d'images video |
US20060285597A1 (en) * | 2005-06-20 | 2006-12-21 | Flextronics International Usa, Inc. | Reusing interpolated values in advanced video encoders |
EP2472507B1 (en) * | 2005-10-14 | 2016-02-10 | Samsung Display Co., Ltd. | Improved gamut mapping and subpixel rendering systems and methods |
CN1794821A (zh) * | 2006-01-11 | 2006-06-28 | 浙江大学 | 可分级视频压缩中插值的方法与装置 |
WO2007116551A1 (ja) * | 2006-03-30 | 2007-10-18 | Kabushiki Kaisha Toshiba | 画像符号化装置及び画像符号化方法並びに画像復号化装置及び画像復号化方法 |
WO2007114368A1 (ja) * | 2006-03-30 | 2007-10-11 | Kabushiki Kaisha Toshiba | 画像符号化装置及び方法並びに画像復号化装置及び方法 |
US8208553B2 (en) * | 2006-05-04 | 2012-06-26 | Altera Corporation | Methods and apparatus for quarter-pel refinement in a SIMD array processor |
EP2092752A2 (en) * | 2006-12-01 | 2009-08-26 | France Telecom | Adaptive interpolation method and system for motion compensated predictive video coding and decoding |
US7529404B2 (en) * | 2007-06-20 | 2009-05-05 | Ahdoot Ned M | Digital video filter and image processing |
US8023562B2 (en) * | 2007-09-07 | 2011-09-20 | Vanguard Software Solutions, Inc. | Real-time video coding/decoding |
US8638852B2 (en) | 2008-01-08 | 2014-01-28 | Qualcomm Incorporated | Video coding of filter coefficients based on horizontal and vertical symmetry |
GB0800277D0 (en) * | 2008-01-08 | 2008-02-13 | Imagination Tech Ltd | Video motion compensation |
US20090201380A1 (en) * | 2008-02-12 | 2009-08-13 | Decisive Analytics Corporation | Method and apparatus for streamlined wireless data transfer |
US8326075B2 (en) | 2008-09-11 | 2012-12-04 | Google Inc. | System and method for video encoding using adaptive loop filter |
US8131056B2 (en) * | 2008-09-30 | 2012-03-06 | International Business Machines Corporation | Constructing variability maps by correlating off-state leakage emission images to layout information |
JP5697301B2 (ja) * | 2008-10-01 | 2015-04-08 | 株式会社Nttドコモ | 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、動画像復号プログラム、及び動画像符号化・復号システム |
US8315434B2 (en) * | 2009-01-06 | 2012-11-20 | Avago Technologies Ecbu Ip (Singapore) Pte. Ltd. | Absolute tracking in a sub-pixel range |
US20100235314A1 (en) * | 2009-02-12 | 2010-09-16 | Decisive Analytics Corporation | Method and apparatus for analyzing and interrelating video data |
US8458105B2 (en) * | 2009-02-12 | 2013-06-04 | Decisive Analytics Corporation | Method and apparatus for analyzing and interrelating data |
WO2010126783A2 (en) * | 2009-04-30 | 2010-11-04 | Roman Gitlin | Method and apparatus for streamlined implementation of interpolation in multiple dimensions |
WO2011100347A2 (en) | 2010-02-09 | 2011-08-18 | Vanguard Software Solutions, Inc. | Video sequence encoding system and algorithms |
KR101682147B1 (ko) * | 2010-04-05 | 2016-12-05 | 삼성전자주식회사 | 변환 및 역변환에 기초한 보간 방법 및 장치 |
US9049454B2 (en) | 2011-01-19 | 2015-06-02 | Google Technology Holdings Llc. | High efficiency low complexity interpolation filters |
US20120224639A1 (en) * | 2011-03-03 | 2012-09-06 | General Instrument Corporation | Method for interpolating half pixels and quarter pixels |
US8437581B2 (en) | 2011-03-04 | 2013-05-07 | General Instrument Corporation | Method and system for interpolating fractional video pixels |
US20120230407A1 (en) | 2011-03-11 | 2012-09-13 | General Instrument Corporation | Interpolation Filter Selection Using Prediction Index |
US8780971B1 (en) | 2011-04-07 | 2014-07-15 | Google, Inc. | System and method of encoding using selectable loop filters |
US8780996B2 (en) | 2011-04-07 | 2014-07-15 | Google, Inc. | System and method for encoding and decoding video data |
US8781004B1 (en) | 2011-04-07 | 2014-07-15 | Google Inc. | System and method for encoding video using variable loop filter |
CN102811346B (zh) * | 2011-05-31 | 2015-09-02 | 富士通株式会社 | 编码模式选择方法和系统 |
EP2724534A2 (en) | 2011-06-24 | 2014-04-30 | Motorola Mobility LLC | Selection of phase offsets for interpolation filters for motion compensation |
JP5727673B2 (ja) | 2011-07-01 | 2015-06-03 | モトローラ モビリティ エルエルシーMotorola Mobility Llc | 時間予測のためのジョイントサブピクセル補間フィルタ |
US8885706B2 (en) | 2011-09-16 | 2014-11-11 | Google Inc. | Apparatus and methodology for a video codec system with noise reduction capability |
JP2013098933A (ja) * | 2011-11-04 | 2013-05-20 | Sony Corp | 画像処理装置および方法 |
US8693551B2 (en) | 2011-11-16 | 2014-04-08 | Vanguard Software Solutions, Inc. | Optimal angular intra prediction for block-based video coding |
US9131073B1 (en) | 2012-03-02 | 2015-09-08 | Google Inc. | Motion estimation aided noise reduction |
US9344729B1 (en) | 2012-07-11 | 2016-05-17 | Google Inc. | Selective prediction signal filtering |
US9185437B2 (en) | 2012-11-01 | 2015-11-10 | Microsoft Technology Licensing, Llc | Video data |
US20140119446A1 (en) * | 2012-11-01 | 2014-05-01 | Microsoft Corporation | Preserving rounding errors in video coding |
US9106922B2 (en) | 2012-12-19 | 2015-08-11 | Vanguard Software Solutions, Inc. | Motion estimation engine for video encoding |
KR20140123008A (ko) * | 2013-04-05 | 2014-10-21 | 삼성전자주식회사 | 휘도차를 보상하기 위한 인터 레이어 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치 |
US9762920B2 (en) * | 2013-06-07 | 2017-09-12 | Qualcomm Incorporated | Dynamic range control of intermediate data in resampling process |
US10015515B2 (en) * | 2013-06-21 | 2018-07-03 | Qualcomm Incorporated | Intra prediction from a predictive block |
TWI602144B (zh) * | 2013-10-02 | 2017-10-11 | 國立成功大學 | 包裝彩色圖框及原始景深圖框之方法、裝置及系統 |
US9774881B2 (en) | 2014-01-08 | 2017-09-26 | Microsoft Technology Licensing, Llc | Representing motion vectors in an encoded bitstream |
US9749642B2 (en) | 2014-01-08 | 2017-08-29 | Microsoft Technology Licensing, Llc | Selection of motion vector precision |
US9942560B2 (en) | 2014-01-08 | 2018-04-10 | Microsoft Technology Licensing, Llc | Encoding screen capture data |
US9883197B2 (en) | 2014-01-09 | 2018-01-30 | Qualcomm Incorporated | Intra prediction of chroma blocks using the same vector |
US10863200B2 (en) * | 2014-07-25 | 2020-12-08 | Intel Corporation | Techniques for performing a forward transformation by a video encoder using a forward transform matrix |
US10102613B2 (en) | 2014-09-25 | 2018-10-16 | Google Llc | Frequency-domain denoising |
JP6473608B2 (ja) | 2014-11-27 | 2019-02-20 | 三星ディスプレイ株式會社Samsung Display Co.,Ltd. | 画像処理装置、画像処理方法、及びプログラム |
WO2016147836A1 (ja) * | 2015-03-13 | 2016-09-22 | ソニー株式会社 | 画像処理装置および方法 |
US10009622B1 (en) | 2015-12-15 | 2018-06-26 | Google Llc | Video coding with degradation of residuals |
CN106127757B (zh) * | 2016-06-21 | 2018-10-23 | 鲁东大学 | 基于改进遗传算法的夜晚安防监控视频分割方法及装置 |
FR3087309B1 (fr) * | 2018-10-12 | 2021-08-06 | Ateme | Optimisation d'un sous-echantillonnage intervenant avant le codage d'images en compression |
US11102487B2 (en) * | 2019-08-30 | 2021-08-24 | Adobe Inc. | Image resampling for DCT based image encoding formats using memory efficient techniques |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0294958B1 (en) * | 1987-06-09 | 1995-08-23 | Sony Corporation | Motion compensated interpolation of digital television images |
US5103306A (en) * | 1990-03-28 | 1992-04-07 | Transitions Research Corporation | Digital image compression employing a resolution gradient |
US5594813A (en) * | 1992-02-19 | 1997-01-14 | Integrated Information Technology, Inc. | Programmable architecture and methods for motion estimation |
JPH06343172A (ja) * | 1993-06-01 | 1994-12-13 | Matsushita Electric Ind Co Ltd | 動きベクトル検出方法及び動きベクトル符号化方法 |
US5623311A (en) * | 1994-10-28 | 1997-04-22 | Matsushita Electric Corporation Of America | MPEG video decoder having a high bandwidth memory |
EP0710033A3 (en) * | 1994-10-28 | 1999-06-09 | Matsushita Electric Industrial Co., Ltd. | MPEG video decoder having a high bandwidth memory |
GB2301972B (en) * | 1995-06-06 | 1999-10-20 | Sony Uk Ltd | Video compression |
US6026182A (en) * | 1995-10-05 | 2000-02-15 | Microsoft Corporation | Feature segmentation |
US5929940A (en) * | 1995-10-25 | 1999-07-27 | U.S. Philips Corporation | Method and device for estimating motion between images, system for encoding segmented images |
US5991463A (en) * | 1995-11-08 | 1999-11-23 | Genesis Microchip Inc. | Source data interpolation method and apparatus |
US5787203A (en) * | 1996-01-19 | 1998-07-28 | Microsoft Corporation | Method and system for filtering compressed video images |
US5692063A (en) * | 1996-01-19 | 1997-11-25 | Microsoft Corporation | Method and system for unrestricted motion estimation for video |
US5799113A (en) * | 1996-01-19 | 1998-08-25 | Microsoft Corporation | Method for expanding contracted video images |
US6957350B1 (en) * | 1996-01-30 | 2005-10-18 | Dolby Laboratories Licensing Corporation | Encrypted and watermarked temporal and resolution layering in advanced television |
US5982438A (en) * | 1996-03-22 | 1999-11-09 | Microsoft Corporation | Overlapped motion compensation for object coding |
US6233017B1 (en) * | 1996-09-16 | 2001-05-15 | Microsoft Corporation | Multimedia compression system with adaptive block sizes |
US6130963A (en) * | 1996-11-22 | 2000-10-10 | C-Cube Semiconductor Ii, Inc. | Memory efficient decoding of video frame chroma |
US6377628B1 (en) * | 1996-12-18 | 2002-04-23 | Thomson Licensing S.A. | System for maintaining datastream continuity in the presence of disrupted source data |
US6005980A (en) | 1997-03-07 | 1999-12-21 | General Instrument Corporation | Motion estimation and compensation of video object planes for interlaced digital video |
US5844613A (en) * | 1997-03-17 | 1998-12-01 | Microsoft Corporation | Global motion estimator for motion video signal encoding |
US5973755A (en) * | 1997-04-04 | 1999-10-26 | Microsoft Corporation | Video encoder and decoder using bilinear motion compensation and lapped orthogonal transforms |
US6067322A (en) * | 1997-06-04 | 2000-05-23 | Microsoft Corporation | Half pixel motion estimation in motion video signal encoding |
ES2431802T3 (es) * | 1997-06-09 | 2013-11-28 | Hitachi, Ltd. | Procedimiento de decodificación de imágenes y decodificador de imágenes |
JPH1169345A (ja) * | 1997-06-11 | 1999-03-09 | Fujitsu Ltd | フレーム間予測動画像符号化装置及び復号装置並びにフレーム間予測動画像符号化方法及び復号方法 |
FR2766946B1 (fr) * | 1997-08-04 | 2000-08-11 | Thomson Multimedia Sa | Procede et dispositif de pretraitement pour estimation de mouvement |
US6281942B1 (en) * | 1997-08-11 | 2001-08-28 | Microsoft Corporation | Spatial and temporal filtering mechanism for digital motion video signals |
US6122017A (en) * | 1998-01-22 | 2000-09-19 | Hewlett-Packard Company | Method for providing motion-compensated multi-field enhancement of still images from video |
JP4026238B2 (ja) * | 1998-07-23 | 2007-12-26 | ソニー株式会社 | 画像復号装置及び画像復号方法 |
GB2343579A (en) | 1998-11-07 | 2000-05-10 | Ibm | Hybrid-linear-bicubic interpolation method and apparatus |
US6983018B1 (en) | 1998-11-30 | 2006-01-03 | Microsoft Corporation | Efficient motion vector coding for video compression |
US6418166B1 (en) * | 1998-11-30 | 2002-07-09 | Microsoft Corporation | Motion estimation and block matching pattern |
US6320593B1 (en) * | 1999-04-20 | 2001-11-20 | Agilent Technologies, Inc. | Method of fast bi-cubic interpolation of image information |
US7206453B2 (en) | 2001-05-03 | 2007-04-17 | Microsoft Corporation | Dynamic filtering for lossy compression |
US6950469B2 (en) | 2001-09-17 | 2005-09-27 | Nokia Corporation | Method for sub-pixel value interpolation |
CN101448162B (zh) | 2001-12-17 | 2013-01-02 | 微软公司 | 处理视频图像的方法 |
US7277587B2 (en) * | 2002-04-26 | 2007-10-02 | Sharp Laboratories Of America, Inc. | System and method for lossless video coding |
-
2003
- 2003-03-04 US US10/379,606 patent/US7110459B2/en active Active
- 2003-03-27 EP EP03007021A patent/EP1359763B1/en not_active Expired - Lifetime
- 2003-03-27 DE DE60310800T patent/DE60310800T2/de not_active Expired - Lifetime
- 2003-03-27 AT AT03007021T patent/ATE350860T1/de not_active IP Right Cessation
- 2003-03-27 ES ES03007021T patent/ES2278087T3/es not_active Expired - Lifetime
- 2003-04-09 KR KR1020030022411A patent/KR100681972B1/ko active IP Right Grant
- 2003-04-10 JP JP2003107078A patent/JP4625240B2/ja not_active Expired - Lifetime
- 2003-04-10 CN CNB031103774A patent/CN1238798C/zh not_active Expired - Lifetime
-
2004
- 2004-05-03 HK HK04103091A patent/HK1060242A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
EP1359763B1 (en) | 2007-01-03 |
HK1060242A1 (en) | 2004-07-30 |
CN1456992A (zh) | 2003-11-19 |
ES2278087T3 (es) | 2007-08-01 |
DE60310800T2 (de) | 2007-04-26 |
EP1359763A3 (en) | 2004-08-11 |
CN1238798C (zh) | 2006-01-25 |
JP2003333603A (ja) | 2003-11-21 |
US7110459B2 (en) | 2006-09-19 |
US20030194009A1 (en) | 2003-10-16 |
EP1359763A2 (en) | 2003-11-05 |
ATE350860T1 (de) | 2007-01-15 |
DE60310800D1 (de) | 2007-02-15 |
KR20030081115A (ko) | 2003-10-17 |
KR100681972B1 (ko) | 2007-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4625240B2 (ja) | コンピュータ実施される方法、システムおよびコンピュータ可読媒体 | |
JP4077354B2 (ja) | マルチステージ補間の丸め制御 | |
US7116831B2 (en) | Chrominance motion vector rounding | |
EP1353514B1 (en) | Sub-pixel interpolation in motion estimation and compensation | |
JP5590574B2 (ja) | 多重解像度ビデオ符号化および復号化のための再サンプリングおよび画像サイズ変更の演算 | |
US8107571B2 (en) | Parameterized filters and signaling techniques | |
US20030156646A1 (en) | Multi-resolution motion estimation and compensation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050729 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20051031 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20051109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051208 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061017 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20070116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20070116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070214 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070305 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20070921 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090907 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090910 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20100521 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100521 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101004 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4625240 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131112 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |