JP3641172B2 - ビデオ画像のシーケンス処理方法 - Google Patents

ビデオ画像のシーケンス処理方法 Download PDF

Info

Publication number
JP3641172B2
JP3641172B2 JP26623299A JP26623299A JP3641172B2 JP 3641172 B2 JP3641172 B2 JP 3641172B2 JP 26623299 A JP26623299 A JP 26623299A JP 26623299 A JP26623299 A JP 26623299A JP 3641172 B2 JP3641172 B2 JP 3641172B2
Authority
JP
Japan
Prior art keywords
frame
index
distortion
current image
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP26623299A
Other languages
English (en)
Other versions
JP2000125302A (ja
Inventor
スリラム・セスラマン
ラビ・クリシュナムョシ
Original Assignee
エルジー電子株式会社
サーノフ・コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エルジー電子株式会社, サーノフ・コーポレーション filed Critical エルジー電子株式会社
Publication of JP2000125302A publication Critical patent/JP2000125302A/ja
Application granted granted Critical
Publication of JP3641172B2 publication Critical patent/JP3641172B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • H04N19/69Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience involving reversible variable length codes [RVLC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/198Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including smoothing of a sequence of encoding parameters, e.g. by averaging, by choice of the maximum, minimum or median value
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【0001】
【発明の属する技術分野】
本発明はビデオ画像処理に関するもので、特に、ビデオ圧縮時、動き推定を行う必要なくフレームをスキップする方法に関するものである。
【0002】
本出願は弁理士登録番号SAR12728PROVとして1998年9月18日に出願された米国仮出願番号60/100,939の出願日付に対する権利を主張する。
【0003】
【従来の技術】
一般に、ビデオ圧縮処理時、画像が動き補償されたフレーム間の差を用いてエンコードされ、その際、画像データブロックが、現在エンコードされている画像における各ブロックと基準画像における選択されたブロックのピクセルとの間の差によりエンコードされるのが知られている。
【0004】
ここで、現在の画像の特定ブロックのため、基準画像から一つのブロックを選択する過程を動き推定と称する。
動き推定の目的は、現在の画像のブロックと最も整合されるブロックを基準画像から捜して、前記二つのブロックのピクセル間の差を小さくすることにより、現在の画像のブロックを相対的に小さいビット数を使用して圧縮されたビットストリームにエンコードすることにある。
【0005】
通常の動き推定アルゴリズムにおいて、現在の画像のブロックは、基準画像の既設定されたサーチ領域内で大きさ及び形状の同一であるほかのブロックと比較される。サーチ領域は、通常、各方向への特定ピクセル数(例えば、8)によるフレーム間動きに対して、現在の画像ブロックの該当位置に基づいて定義される。
【0006】
そして、各々の比較には、画像データの2ブロック間の差の量を決定する数学的歪み指数の計算が含まれる。ほかの歪み指数も使用できるが、2ブロック間の該当ピクセル間の差の絶対値の合に相当する絶対差の合計(sum of absolute difference;SAD)が通常の一つの歪み指数である。
【0007】
現在の画像データのブロックに“最適に”整合される基準画像データのブロックを確認する方法が多数知られている。その1方法として、“抑止(brute force)”消耗的接近(exhaustive approach)方法がある。この方法においては、サーチ領域に対して個別に比較し、最低歪み値(lowest distortion value)により最適整合を指定する。計算負荷を減らすため、ほかの方法として、一部だけ比較する、例えばログに基づいた技法(log-based scheme)又は階層技法(layered scheme)などが実行されこともある。
【0008】
前記両方の場合においても、結果は、現在の画像データのブロックに“最適に”整合するブロックを基準画像データブロックから選択することに左右される。選択された基準画像データのブロックは“最適整数−ピクセル位置(best integer-pixel location)”と言われる。なぜななら、これは、前記ブロック及び現在の画像データの該当ブロックの位置の距離がピクセルの整数値変位を示す整数であるX(水平)とY(垂直)を有する動きベクトルにより現わされるためである。最適整数−ピクセル位置の選択過程は、フル−ピクセル(full-pixel)動き推定又は整数−ピクセル(integer-pixel)動き推定と言及される。
【0009】
この際に、全体的にエンコード技法をより改善するため、ハーフ−ピクセル(half-pixel)動き推定を実施できる。このハーフ−ピクセル動き推定において、現在の画像データブロックは、最適整数−ピクセル位置選択のための整数−ピクセル動き推定を実施した後、最適整数−ピクセル位置の周囲のほかのハーフ−ピクセル位置に対応する基準画像データと比較される。各ハーフ−ピクセル位置に対する比較は補間された基準画像データに基づく。
【0010】
そして、動き推定技術の更にほかのいくつかの方法には他の技術に比べて少ない計算ですむものもあるが、いずれも動き推定にはなりの計算が要求される。
【0011】
一方、ビデオ圧縮処理の主目的は、ビデオ画像シーケンスを示すために使用されるビットを減らすとともに、その結果である圧縮されたビデオビットストリームの画像品質を、再生中、適切なレベルに維持することである。そして、多くのビデオ圧縮適用の更にほかの目的は、一例として、伝送帯域幅及び/又は再生処理制限を充足させるため、相対的均一なビットレートを維持することである。
【0012】
このようなビデオ圧縮処理はたびたびビットレートと再生品質との間のトレードオフを含む。トレードオフは、通常、圧縮されたビデオビットストリームにエンコードされる各画像の再生品質を選択的に減少させることにより、元のビデオの画像当たりの平均ビット数を減らすことを含む。その代わりに、又は付加的に、トレードオフは元のビデオシーケンスにおいて特定の画像をスキップすることにより、元の画像の一部のみを圧縮されたビデオビットストリームにエンコードすることを含むことができる。
【0013】
この従来のビデオ圧縮アルゴリズムは、例えば、元のビデオシーケンスの画像を一つ置きに一つずつスキップする画像スキップの規則的なパターンを指示する。また、ビデオエンコーダは、ビットレート要求を充足させるために必要な程度だけ、付加的画像を適宜スキップすることができる。ここで、付加的画像をスキップする決定は、通常、動きの補償されたフレーム間の差の歪み指数(例えば、SAD)に基づく。このことは動き推定が特定画像に対して実施された後にだけ成り立つ。
【0014】
この際に、現在のフレームをスキップしないように決定される場合、動き推定処理により得た動き補償されたフレーム間の差は、さらに画像データをエンコードするのに使用される(例えば、離散コサイン変換(DCT)処理、量子化、ラン長さエンコード及び可変長さエンコードのような技術を使用する正確なビデオ圧縮アルゴリズムに依存する)。反面、現在のフレームをスキップするように決定される場合は、動きの補償されたフレーム間の差は必要なく、処理はビデオシーケンスのつぎの画像に続けられる。
【0015】
【発明が解決しようとする課題】
本発明の目的は、ビデオシーケンスの特定画像に対して動き推定を実施する必要なく、動き補償された歪み指数を推定するビデオ画像のシーケンス処理方法を提供することにある。
【0016】
【課題を解決するための手段】
本発明の好ましい実施態様によると、推定された歪み指数は、ビデオエンコード中に動き推定を行わなずに画像をスキップするかどうかを決定するのに使用することができる。仮に、画像をスキップするように決定される場合、動き推定処理は省略され、それにより、ビデオ圧縮処理の計算負荷が減少する。一方、画像をエンコードするように決定される場合、動き推定処理は、つぎの圧縮処理に対する動き補償されたフレーム間の差を算出するために必要な程度に実行できる。本ビデオ圧縮技法において、動き推定処理は、その結果として得られるフレーム間の差が該当画像をエンコードするために必要なときにだけ実行される。
【0017】
本発明の一実施態様によると、本発明は、(a)ビデオシーケンス中の現在の画像フレームのピクセル値と基準画像フレームの該当ピクセル値との絶対差を求め、求めた各絶対差を平均し、この平均絶対差を現在の画像の生の歪み指数として算出する段階と、(b)ビデオシーケンスの以前の画像フレームの生の歪み指数から現在の画像フレームの生の歪み指数への百分率変化を歪み変化指数として求めるとともに、求めた歪み変化指数と予め定めたしきい値との大小比較に基づいて現在の画像の動き補償された歪み指数の推定値を算出する段階と、(c)動き補償された歪み指数の推定値に基づいて現在の画像のエンコードの実行の有無及びその方法を決定する段階と、(d)前記段階(c)に基づいて、ビデオ画像のシーケンスに対する圧縮されたビデオビットストリームを算出する段階とを含むことを特徴とするビデオ画像のシーケンス処理方法である。
【0018】
【発明の実施の形態】
本発明のそのほかの面、特徴及び利点はつぎの詳細な説明、添付した請求の範囲、及び添付図面により明らかになる。
以下、本発明の好ましい実施形態を添付図面に基づいて詳細に説明する。
【0019】
現在の画像に対する生の歪み指数の算出
図1は本発明の一実施形態で、画像に対する生(つまり、動きが補償されていない)歪み指数の算出アルゴリズムの擬似コードを示す。図1のようなアルゴリズムを使用して算出された特定の生の歪み指数は平均絶対差(mean absolute difference;MAD)である。
【0020】
この際に、図1のアルゴリズムは、各ピクセルがマルチビットの強度値で表されるグレースケール画像に対する適用として解釈できる。また、図1のアルゴリズムは、各ピクセルが二つ以上のほかのマルチビット要素(例えば、RGBフォーマットにおける赤色、緑色及び青色要素、又はYUVフォーマットにおける輝度(Y)及び2色(U、V)要素)により現れるカラー画像に容易に拡張できる。
【0021】
図1のアルゴリズムは、現在の画像のピクセルを相違した2類型、つまり基準画像の該当ピクセル値に十分に類似した輝度値を有するタイプIピクセルと、基準画像の該当ピクセル値とは全く異なるピクセル値を有するタイプIIピクセルとに区分する。このようなアルゴリズムにおいて、“該当”ピクセルとは現在の画像のピクセルと同一の位置(つまり、同一列及び行)を有する基準画像のピクセルである。
【0022】
ここで、基準画像と現在の画像の該当部分間に動きがないとき、現在の画像のその部分において、ピクセルは通常タイプIの特徴を有する。同様に、相対的空間均一部分(つまり、ピクセルが概略的に同一値を有する部分)間に動きがあれば、そのピクセルも通常タイプIの特徴を有するであろう。しかし、空間的非均一部分間に動きがあれば、現在の画像のピクセルと基準画像の該当ピクセルとの絶対差は相対的に大きく、前記現在の画像のピクセルの大部分は通常タイプIIの特徴を有するであろう。
【0023】
図において、変数n1及びn2はそれぞれ前記2タイプのピクセルに対するカウンタであり、変数dist1及びdist2はそれぞれ前記2タイプのピクセルに対する中間歪み指数(intermediate distortion measure)である。新たな各画像に対し、前記4変数は図1のライン1、2で0に初期化される。
【0024】
そして、現在の画像の各ピクセルに対し(ライン3)、現在のピクセル値と基準フレームの該当ピクセル値との間の絶対差(absolute difference )adが算出される(ライン4)。この際に、adが特定しきい値threshより小さいと、現在のピクセルはタイプIに決定され、dist1とn1はそれぞれadと1だけ増加する(dist1=dist1+ad、n1=n1+1)(ライン5)。反対の場合、現在のピクセルはタイプIIと決定され、dist2とn2がそれぞれadと1だけ増加する(dist2=dist2+ad、n2=n2+1)(ライン6)。重要エッジを求めるため、パラメータthreshに対する通常の値は約20である。その後、中間歪み指数dist1及びdist2はそれぞれライン8、9で正規化される(dist1/n1、dist2/n2)。
【0025】
仮に、ビデオ会議の場合、均一背景(例えば、均一に塗られた壁)の前にある話者の頭部のフレーム間で相対的動き(例えば、側面対側面動き(side-to-side motion ))があると、壁の一部が頭部に該当するピクセルで占められ、以前に頭部により占められていた壁の部分は新たに露出される。このような状況により、原フレーム間の差から、二つの相違した重要エッジ、つまり頭部により新たに占められた背景部分に該当するエッジ、及び頭部により新たに露出された前記背景部分に該当するエッジが得られる。この二つのエッジは二重画像効果(double-image effect)と言われる。
【0026】
一方、ライン10において、下記の式1により算出される生の歪み指数MADは、二重画像効果のために修整される平均絶対差である。
MAD=(dist1*n1+dist2*n2*factor+dist1*n2*(1-factor))/(n1+n2)・・1
式1において、重要エッジの二重カウンティングを避けるため、パラメータfactorに対する通常の値は0.5である。(dist1*n2*(1−factor))項は、タイプIIから除去されたピクセルをタイプIのピクセルのように取り扱うことにより、二重画像効果を修整して、類似領域の平均歪みレベルが再び加わるようにする。タイプIピクセルの歪みdist1は残り(residual)及びコード化雑音に対する推定値と見なされる。その推定値は動き補償により削除できないと推定される。また、タイプIIピクセルは、“完全に”動き補償された画像と比較するとき、ほぼ2倍の領域を占有し、factor項はこれを反映し、名目上0.5に選択される。この際、factor項は変化が許容され、このことは動き補償が通常完全でないためである。また、占められていなかった領域は動き補償されると推定される。しかし、ピクセルの一部(n2*(1−factor))はタイプIピクセルに類似したコード化雑音及び残りを有することが期待される。したがって、dist1*n2*(1−factor)項は前記占められていなかったタイプIIピクセルの歪みに対する推定値として使用される。
【0027】
生の歪み指数から推定された動き補償された歪み指数算出
図2は本発明の一実施形態で、画像に対して動き補償された歪み指数推定アルゴリズムの擬似コードを示す。図2のアルゴリズムを使用して推定された特定歪み指数は、動き補償された平均絶対差Sである。図2のアルゴリズムは、図1のアルゴリズムを使用して誘導された生の歪み指数MADから、歪み指数Sに対する推定値Seを導出する。前記推定された歪み指数Seは、ビデオエンコード中、各画像に対して動き推定を行う必要なくスキップするかどうかを決定するのに使用できる。
【0028】
図2のアルゴリズムによると、現在のフレームに対する生の歪み指数MAD(I)及び以前のフレームに対する生の歪み指数MAD(I−1)は、下記の式2に示すように、以前のフレームから現在のフレームへのMADの百分率変化指数Hを決定するため、使用される(ライン1)。また、以前のフレームから現在のフレームへの生の歪み指数MADの変化を特徴とするほかの適切な式も使用できる。
H=abs[(MAD(I)-MAD(I-1))*2]/[MAD(I)+MAD(I-1)]・・・・・2
【0029】
この百分率変化Hが第1しきい値T1より小さいと(H<T1)、現在のフレームに対する推定歪み指数Se(I)は以前のフレームに対して実際に動き補償された歪み指数S(I−1)と同一であると推定される(Se(I)=S(I−1))。反対に、百分率変化Hが第2しきい値T2より小さいと(H<T2)(ライン4)(ここで、T2はT1より大きい)、現在のフレームに対する推定歪み指数Se(I)は、下記の式3に示すように決定される(ライン5)。
Se(I)=S(I-1)+(K*MAD(I)-S(I-1)*(H-T1)/(T2-T1) 3
【0030】
式3において、因子kは好ましくは0と1との間で指定される特定パラメータである。通常、T1及びT2の値はそれぞれ0.1及び0.5である。
【0031】
一方、百分率変化Hが第2しきい値T2より大きいと(ライン6)、現在のフレームに対する推定歪み指数Se(I)は下記の式4により決定される(ライン7)。
Se(I)=k*MAD(I) 4
【0032】
図2の処理を支持する動機はつぎのようである。すなわち、生の歪み指数MAD(I)は現在のフレームと基準フレームとの間の動きが補償されなかったピクセル差の指数である。同様に、生の歪み指数MAD(I−1)は現在のフレームと基準フレームとの間の生のピクセル差の指数であり、現在のフレームに対する基準フレームと同一であるか、異なる。百分率変化Hは二つの生の歪み指数MAD(I)とMAD(I−1)との間の相対的変化指数であり、前記MAD(I)及びMAD(I−1)はその自体として前記画像及び該当基準画像の間の変化速度指数である。
【0033】
そして、動き補償は、フレーム間の歪み変化が殆ど又は全くないとき、画像データを非常に正しく予測する。前記の場合のように、百分率変化Hが小さいとき(例えば、H<T1であるとき)は、以前のフレームに対して実際の動き補償された歪み指数S(I−1)は、図2のライン3に示すように、現在のフレームに対して動き補償された歪み指数S(I)の良い推定値Se(I)となり得る。
【0034】
しかし、フレームからフレームへの歪みが変化するときは(例えば、形状内場面変化又はほかの非均一変化中)、動き補償は画像データをよく予測しえない。このような状況で、以前のフレームに対して実際の動き補償された歪み指数S(I−1)は現在のフレームに対して実際の動き補償された歪み指数S(I)の適合した指示とは必ずしもなることはできない。したがって、百分率変化Hが大きいとき(つまり、H>T2であるとき)、式4(ライン7)に示すように、現在のフレームに対する生の歪み指数MAD(I)から、現在のフレームに対して実際の動き補償された歪み指数S(I)を推定することがより安全であろう。この際に、因子kを0ないし1の間(例えば、好ましくは0.8)に選択することは、動き補償が通常歪み指数を一部指定された限度に減少させることを推定する。
【0035】
図2のライン5(式3)は、百分率変化Hが小さくも大きくもない状態(例えば、T1<H<T2>であるとき、前記二つの“極端の”場合間の線形補間法(を行う。このように、図2のアルゴリズムは、生の歪み指数MAD及びすべてのMAD値に対して推定される動き補償された歪み指数Seの間の連続関係、つまり区分的連続関数(piecewise-linear)を提供する。実験の結果は、図1及び図2のアルゴリズムが実際に動き補償された歪み指数Sの信頼し得る推定値Seを与えることを証明している。ここで、推定された歪み指数Seはほぼ常に実際の歪み指数Sの20%内にあり、通常は10〜15%にある。
【0036】
推定された歪み指数を使用して現在画像のスキップ可否決定
図1及び図2のアルゴリズムを使用して算出された推定歪み指数Seは、現在の画像のスキップ可否、つまりビデオエンコード処理途中、現在の画像を圧縮されたビデオビットストリームへのエンコードを避けるか否かを決定することに使用できる。本発明の一実施形態において、適応フレームスキップ技法は、ビデオコーダが伝送されたフレーム速度及び基準フレームの品質に対して制御を維持させる。大きな動きの場合、その技法はフレームの品質とフレーム速度とにスムースな性能低下を保障する。
【0037】
前記ビデオコーダは、つぎの2状態、すなわち固定状態及び遷移状態のいずれか1状態となり得る。固定状態では、特定フレーム速度を充足させるためのすべての試みが行われ、このことが可能でなければ、任意の最小フレーム速度を維持しようとする試みが行われる。最小フレーム速度の維持さえ不可能になるとき、前記コーダは遷移状態に転換され、ここで、大きなフレームスキップはバッファレベルが減少するまで許容され、その後、つぎのフレームが伝送できる。伝送の開始に加えて遷移状態は、通常、場面変化及び突発的な大きい動きの途中に発生する。コーダは短時間に遷移状態から固定状態に移動することが好ましい。
【0038】
この際に、ビデオ圧縮アルゴリズムによる圧縮処理のため、画像はつぎのように互いに異なる形態のフレームで現すことができる。
○ フレーム内圧縮技術のみを使用してエンコードされるイントラ(I)フレーム;
○ 以前のI又はPフレームによるフレーム間圧縮技術を使用してエンコードされ、その自体が一つ以上のほかのフレームをエンコードする基準フレームといて使用できる予測(P)フレーム;
○ 以前及び後続I又はPフレームによる両方向フレーム間圧縮技術を使用してエンコードされ、ほかのフレームエンコードには使用できない両方向(B)フレーム;及び
○ 単一オーバーヘッドデータセットを有する単一フレームでエンコードされる(H.263ビデオ圧縮アルゴリズムでのように)二つの画像(Pフレームと時間的に先行するBフレーム)に相応するPBフレーム。
【0039】
本発明の一実施形態において、遷移状態ではI及びPフレームのみが許容されるのに対して、固定状態ではBフレーム(H.263+、MPEG)及びPBフレーム(H.263)も許容される。固定状態において、BフレームとPBフレームはほかの2状況で二つの目的のために使用される。一番目、動きが大きいとき、Bフレームはフレーム速度を適正レベルまで増加させるために使用される。二番目、動きが小さいときは、B及び/又はPBフレームを使用することにより、より高い圧縮効率の完成が可能になる。このようなシステムは、基準フレームの速度及び品質に対する制御が要求される応用のために設計されたものである。この際に、調整されたパラメータはフレームに対する速度、フレームの適正歪みレベル及びフレーム速度を含む。また、B又はPBフレームをいつエンコードするかに対するインテリジェントモードの決定を実施し、保証された場合には、知能的にフレームをスキップすることにより、パラメータを維持しようとする試みが行われる。
【0040】
前記決定は、フレームがフレームバッファ内で判読されるとき、測定される速度及び歪みパラメータの推定値に基づき、H.263+ビデオコデック近似項モデル8(TMN 8, Study Group16, ITU-U, Q15-A-59文書, Release 0, 1997年6月)及び、MPEGとH.263に対して使用可能な特定速度制御構成に好適である。また、その方法は、エンコードされる流入フレーム(incoming frame)のため、最小記憶量が使用されることを保証する。そして、より多い記憶が必要であるが、フレーム速度及び基準フレーム品質に対するより良い制御を維持し得るようにするほかの方法も可能である。また、本発明の方法は、特に、動き推定のための計算的オーバーヘッドが最小であることを保証する。仮に、付加的計算を動き推定に使用し得ると、アルゴリズムの実施はより改善できる。
【0041】
前記方法は、動き補償以後、エンコードするための速度及びSAD(絶対差総計)に関連した2次速度歪みモデルに基づく。その2次速度歪みモデルは下記の式5で示される。
(R−H)/Se=X1/Q+X2/(Q**2) 5
【0042】
式5において、
R:現在のフレームをPフレームにエンコードするのに必要なビット数、通常、該当Pフレームの量子化器より高い量子化器を有する場合を除き、同一モデルをBフレームにも適用し得る。
H:オーバーヘッド(例えば、ヘッダー及び動き情報)をエンコードするのに必要なビット数。
Se:現在のフレームに対して動きが補償されたフレーム間SAD。
Q:以前のフレームに対する平均量子化器ステップサイズ。
X1、X2:方程式モデルのパラメータであり、フレーム間で循環的に更新される。
【0043】
このとき、エンコードされないフレームに対する動き推定は避けることが好ましいので、動き推定を実施する必要なく、図1及び図2のアルゴリズムを使用して算出されたSeは、動き補償された歪み指数Sのために式5で使用される。前記モデルは費用関数として絶対差総計を使用して記述されたが、本発明は適切なほかの費用関数を使用して実行することもできる。
【0044】
例えば、三つのフレームシーケンスA、C及びEがあり、ここで、時間的にフレームAが3フレームのなかで一番目のフレームであり、フレームEが最終フレームであるとする。つぎの論議はPBフレーム又は基準フレームの間で多くても一つのBフレームを有するコード化技法のためのものである。基準フレームの間で、一つ以上のBフレームを有するコーダに対する一般化は以降に記述する。その際に、フレームAが基準フレーム(つまり、IフレームあるいはPフレーム)にエンコードされると推定するとき、フレームC及びEをどのようにエンコードするかに対する決定を下さなければならない。つぎの二つの選択が可能である。
【0045】
(1)フレームCをBフレームに、フレームEを基準フレームにエンコードする。
(2)フレームC及びEをともにPBフレームにエンコードする。
(3)フレームCを基準フレームにエンコードし、フレームEのエンコード方法を決定するため処理を再開する。
(4)フレームCをスキップし、フレームEを基準フレームにエンコードする。
仮に、可能であれば、フレームC及びEをともにPBフレームにエンコードすることが好ましい。そして、動きが大きくバッファ占有度が余り高くない場合、フレームCは基準フレームにエンコードされる必要があり、このような場合、前記処理はフレームEのエンコード方法を決定するために再開される。また、動きが大きくバッファ占有度が非常に高い場合は、フレームCがスキップされる必要があり、このような場合、フレームEが基準フレームにエンコードされるべきである。つぎの論議は時間基準がフレームAにあることを仮定する。
【0046】
表記法
つぎの表記法は、本明細書で以降に詳細に説明されるアルゴリズムに使用される。
MAD:現在のフレームに対する生の歪み指数であり、ここで、歪み指数は平均絶対差に基づく。
S:現在のフレームに対して実際動き補償された指数であり、ここで、歪み指数は平均絶対差に基づく。
Se:現在のフレームに対して実際動き補償された歪み指数Sの推定値であり、ここで、歪み指数は生の平均絶対差MADに基づく。
R:現在のフレームをエンコードするのに必要なビット数であり、推定された歪み指数Se又は実際の歪み指数Sを使用して式5により算出される。
H:現在のフレームの残りを伝送するために使用されるビットを除くオーバーヘッドビット(例えば、動きベクトルに対し)であり、この情報が利用できなければ、Hは0と推定される。
Rp:一定ビットレート(constant bit rate;CBR)の場合において、一つのピクチャ間隔内チャネルに対するビット出力。
smin:つぎのフレームをエンコードするための最小スキップ(例えば、1/平均ターゲットフレーム速度)。
smax:固定状態のフレーム間で許容された最大スキップ。
skip:以前にエンコードされたフレームからスキップするためのフレーム数に該当するポインタ。
Bframeskip:潜在的Bフレームに記憶されるフレームに該当するポインタ。
Bmax:バッファの全体大きさ。
B:フレームskipをエンコードする前のフレームskipでのバッファ占有、一定ビットレートチャネルに対してB=Bp−(Rp* skip)であり、ここで、Bpは以前のフレームをエンコードした後のバッファ占有である。
【0047】
また、前記アルゴリズムはつぎのようなフラグに従う。
PCFD1:バッファ内に現在のフレームをPフレームとして伝送する十分な空間があるか否かを示し、ここでは、その決定は優先的に現在のフレームに対して動き推定を行う必要なしになされる。一実施形態において、(R(Se)+B<x*Bmax)であると(ここで、Rは推定された歪み指数Seに基づき、式5を使用して算出される)、バッファには空間があり、PCFD1は1である。反対の場合、バッファには十分な空間がなく、PCFD1は0である。x値の変化によって制限の密着度(tightness)が変わるが、一実施形態において、xは80%である。
【0048】
PC1:Rが動き推定を実施した後、式5を使用して算出され、実際の歪み指数Sに基づくことを除くと、PCFD1に類似する。
【0049】
PCFD2:基準フレームに関係した現在のフレームの動きが“大きいか”を示し、その決定は、優先的に現在のフレームに対して動き推定を実施する必要なくなされる。このような場合、動きの範囲は生の歪み指数MADに基づく。MADが特定しきい値レベルより大きいと、動きが大きいといい、PCFD2は1である。反対の場合、動きは大きくなく、PCFD2は0である。
【0050】
PC2:前記決定が、動き推定後、例えば、平均動きベクトル範囲を特定しきい値レベルに比較することによりなされることを除くと、PCFD2に類似する。
PBCFD:潜在的Bフレームに記憶された現在のフレーム及び以前のフレームがともにPBフレームにコード化できるか否かを示し、ここで、前記決定は優先的に現在のフレームに対して動き推定を実施する必要なしになされる。一実施形態において、(R(Se)+(Bフレームをエンコードするためのビット)+B<x*Bmax)であると、二つのフレームはともにPBフレームにエンコードされることができ、PBCFDは1である。反対の場合、前記二つのフレームはともにPBフレームにエンコードされることができなく、PBCFDは0である。
【0051】
Pmeet:以前に記憶されたフレームがPフレームとして伝送できるか否かを示す。仮に、伝送できれば、Pmeetは1である。
【0052】
図3ないし図7は本発明の一実施形態による、コード化すべきフレームの種類及びコード化方法決定アルゴリズムの擬似コードを提供する。前記アルゴリズムは七つのルーチン、つまり、開始、ループ1ないしループ5(LOOP1〜LOOP5)及び遷移(TRANSIENT)ルーチンを含む。開始ルーチンは、基準フレームをコーディングした後、固定状態処理中に要求され、遷移ルーチンは遷移中に要求される。前述したように、固定状態では、予め決められた特定フレーム速度を充足させるためのすべての試みが行われ、このことが可能でなければ、特定最小フレーム速度を維持しようとする試みが行われる。最小フレーム速度の維持さえ不可能になると、コーダは自動に遷移状態に転換され、ここで、大きいフレームスキップがバッファレベルが減少するまで許容され、その後、つぎのフレームが伝送できる。遷移状態は、通常、伝送の開始、場面変化及び突発的な大きい動き中に発生する。
【0053】
開始ルーチン
前記開始ルーチンの処理は、図3のラインA1において、現在のフレームポインタskipを最小スキップ値sminに初期化して開始する。例えば、一実施形態において、最小フレームスキップ値は2であり、これは、元のビデオシーケンスにおいて、画像を一つ置きに一つずつエンコードするための試みが行われるコード化技法に相当する。そして、生の歪み指数MADは図1のアルゴリズムを使用して現在のフレームskipに対して計算される。また、生の歪み指数MADから、動きの補償された推定歪み指数Seを算出するため、図2のアルゴリズムを使用した後、式5はSeを使用してRの値を求める。ここで、Rは現在のフレームをPフレームにエンコードするのに必要なビット数である。現在のフレームをPフレームにエンコードすることがバッファを過密にしなければ、フラグPCFD1は1にセットされる(つまり、真)。反対の場合、PCFD1はOにリセットされる(つまり、偽り)。
【0054】
仮に、PCFD1が、現在のフレームがPフレームに伝送できることを示す真であれば(ラインA2)、動き推定が現在のフレームに対して実施され、実際動き補償された歪み指数Sが算定され、式5において、ビット数Rの値がSeの代わりにSを使用して再び求められ、フラグPC1及びPC2に対する値が決定される(ラインA3)。ここで、フラグPC1は、動き補償された歪み指数Sに基づいて現在のフレームskipをPフレームにエンコードすることによるバッファの影響を示す。その際に、PCFD1のように、PC1はフレームskipがPフレームにエンコードできれば、1にセットされる。フラグPC2は、動き推定の結果が(例えば、フレームに対する平均動きベクトル大きさ)特定のしきい値より大きいことを示すか否かを示す。仮に、示せば、PC2は1にセットされる。
【0055】
仮に、バッファ内にフレームskipをPフレームにエンコードする十分な空間があり(ラインA4)、推定された動きが大きければ(ラインA5)、現在のフレームskipはPフレームにエンコードされた後、ビデオシーケンスにおいて、つぎのフレームエンコード方法を決定するため(ラインA6)、開始ルーチンの開始点に復帰する。そうではない場合、つまり、バッファにフレームskipをPフレームにエンコードする十分な空間がなければ(ラインA4及びA10)、フラグPmeetが0にリセットされた後、ループ2ルーチンに進行される(ラインA11)。同様に、生の歪み指数に基づいて推定されたバッファへの影響が、現在のフレームskipはPフレームに伝送できないことを示すと(ラインA2及びA13)、フラグPmeetは0にリセットされた後、ループ2ルーチンに進行される(ラインA14)。
【0056】
ループ1ルーチン
開始ルーチン部分で記述したように、ループ1ルーチンは、バッファに現在のフレームskip=sminをPフレームにエンコードする十分な空間はあるが、動きが大きくないときに要求される。このような環境下で、フレームsminは(1)Pフレームに従うBフレーム、又は(2)後に従うフレームと結合してPBフレームにエンコードされる。
【0057】
特に、ループ1ルーチンは,現在のフレームのsminを可能なBフレームに記憶することにより、開始される(図3のラインB1)。その後、パラメータskipは増加され(skip=smin+1)(ラインB2)、smin+1から2* smin−1までのフレームが連続的にチェックされる(ラインB3、B6、B7)。このことは、前記フレームのどのフレームがPフレームにエンコードできるかを確認するためである(ラインB4、B5)。これは、動き推定を行わなく、バッファに対する影響及び動きの大きさを推定することによりなされる(ラインB4)。仮に、バッファに十分な空間があり、動きが大きければ、現在のフレームskipはPフレームにエンコードされた後、ビデオシーケンス内のつぎのフレームのため、開始ルーチンの初期点に復帰する(ラインB5)。そして、sminが2であるとき、skip=3のみが前記“do while”ループ(ラインB3ないしB7)で評価される。
【0058】
仮に、前記条件がどのフレームにもあたらなけれ、skipを2* sminと同一に設定することにより、つぎのフレームが選択される(ラインB8)。その後、フレームskipをPフレームにエンコードするのに必要なビット数であるRが動き推定を実施する必要なしに推定され、フラグPBCFDがセットされる(ラインB9)。仮に、バッファ内に、フレームsmin及びskipをPBフレームにエンコードし得る十分な空間があると推定されると、PBCFDは1にセットされる。このような条件が満足されると、動き推定はフレームskipに対して実施され、smin及びskip=2* sminフレームはともにPBフレームにエンコードされる(ラインB10)。そうでない場合、つまり、前記フレームをPBフレームにエンコードする十分な空間がなければ、フレームsminはPフレームにエンコードされる(ラインB11)。両方の場合、前記処理が終わると、開始ルーチンに付記する(ラインB12)。
【0059】
ループ2ルーチン
前記開始ルーチン部分で記述したように、ループ2ルーチンは、バッファに現在のフレームskip=sminをPフレームに伝送する十分な空間がないときに要求される。その状況下で、フレームsminはエンコードされず、ループ2ルーチンはコード化されるつぎのフレームを選択し、選択されたつぎのフレームがどの方法でエンコードされるかを決定する。
【0060】
特に、パラメータskipは、ビデオシーケンスにおいて、つぎのフレームを指示するため、smin+1にセットされる(図4のラインC1)。そして、smin+1からsmin+floor(smin/2)までのフレームが連続的に分析され(ラインC2、C14、C15)る。このことは、前記フレームのなかでどれをエンコードできるかを確認するためである(ラインC3ないしC13)。ここで、前記“floor”は切断作業(truncation operation)である。前記分析された各フレームに対し、エンコードすべきビット数が生の歪み指数MADに基づいて計算され、フラグPCFD1及びPCFD2はそれぞれバッファ内の十分な空間の存在の有無及び動きの大小を示すように設定される(ラインC3)。また、フラグPCFD2は、実質的に動き推定を実施せず、生の歪み指数MADを特定しきい値レベルと比較することにより、設定される。その際に、MADが前記しきい値レベルより大きければ、動きが大きいものと見なされ、PCFD2は1にセットされる。
【0061】
仮に、バッファ内に、現在のフレームskipをPフレームにエンコードする空間があり、動きが大きければ(ラインC5)、動き推定が実施され、バッファ(PC1)及び動き(PC2)に対する影響が実際の歪み指数Sを使用して再び求められる(ラインC6)。また、バッファに依然として空間が十分であり(ラインC7)、動きが大きければ(ラインC8)、現在のフレームskipはPフレームにエンコードされた後、開始ルーチンに復帰する。
【0062】
そうでない場合、つまり、動き補償された結果が、バッファには十分な空間があることを示すが(ラインC7)、実際の動きが大きくないとき(ラインC8、C9)、現在のフレームskipがBフレームに記憶され、ポインタBframeskipはskipと同一に設定され、フラグPmeetは0にリセットされて、フレームskipをPフレームに伝送する十分な空間がバッファにないことを示した後、ループ3ルーチンに進む(ラインC9)。
【0063】
一方、動きが補償された結果が、バッファに十分な空間がないことを示すと(ラインC7、C11)、現在のフレームskipはBフレームに記憶され、ポインタBframeskipはskipと同一に設定され、フラグPmeetは0にリセットされて、フレームskipをPフレームに伝送する十分な空間がないことを示した後、ループ3ルーチンに進む(ラインC11)。また、動き補償されていないデータが、バッファ内に十分な空間はあるが(ラインC4)、推定された動きが大きくないことを示すと(ラインC5、C13)、現在のフレームskipはBフレームに記憶され、ポインタBframeskipはskipと同一に設定され、フラグPmeetは1にセットされて、バッファにフレームskipをPフレームに伝送する十分な空間があることを示した後、ループ3ルーチンに進む(ラインC13)。
【0064】
しかし、動き補償されていないデータが、バッファ内に十分な空間がないことを示すと(ラインC4、C14)、スキップ処理はつぎのフレームに続けられる(skip=skip+1)(ラインC14)。
【0065】
そして、前記smin+1からsmin+floor(smin/2)までのフレームの何のものもラインC4の条件を満足させ得なければ、フラグPmeetは0にリセットされて、最終フレームskip=smin+floor(smin/2)をPフレームに伝送する十分な空間がバッファにないことを示した後、ループ3ルーチンに進む(ラインC16)。
【0066】
ループ3ルーチン
ループ2ルーチン部分で指摘したように、ループ3ルーチンは、ループ2ルーチンにおいて、つぎにエンコードするフレームの種類及び/又はエンコード方法を最終的に決定することに失敗した場合、要求される。この場合、ループ3ルーチンはコード化されるつぎのフレームを選択し、つぎのフレームがどの方法でエンコードされるかを決定しようとする。
【0067】
特に、パラメータskipがsmin+floor(smin/2)+1に設定され(図5のラインD1)、そのsmin+floor(smin/2)+1から2* smin−1までが連続的に分析され(ラインD2、D5、D6)る。これは、どのフレームがエンコードできるかを確認するためである(ラインD3、D4)。そして、パラメータskipをsmin+floor(smin/2)+1に初期化することは、P及びBフレームが与えられたBskipにともに近接することを許容し、H.263PBフレームにおいて、PとBフレームが密接に結合されているときのコード化効率(coding efficiency )を向上させる。真(true)Bフレームがある場合、前記方法は変化される必要がある。
【0068】
また、分析された各フレームに対し、エンコードされるビット数Rは生の歪み指数MADから算出された推定歪み指数Seに基づいて計算され、フラグPCFD1及びPCFD2は、バッファ内の空間の存在の有無及び動きの大小をそれぞれ示すため、設定される(ラインD3)。仮に、前記2条件が充足されると、現在のフレームskipはPフレームにエンコードされた後、開始ルーチンに復帰する(ラインD4)。
【0069】
仮に、smin+floor(smin/2)+1から2* smin−1までのフレームのなかで、どのフレームもPフレームにエンコードされず、2* smin−1フレームに到達すると、skipはつぎのフレーム2* sminと同一に設定される(ラインD7)。その後、フレームskipをPフレームにエンコードするのに必要なビット数であるRが動き推定を実施せず、MADから推定され、フラグPBCFDが設定される(ラインD8)。仮に、潜在的Bフレームに記憶された(ループ2で)以前のフレームBframeskip及び現在のフレームskip=2* sminをPBフレームにエンコードする十分な空間がバッファにあると推定されると(ラインD9)、動き推定が現在のフレームskipに対して実施され、Bフレームに記憶された以前のフレームに対しても既に実施されていないと、動き推定が推定される(ラインD10)。その後、前記フレームはともにPBフレームにエンコードされた後、開始ルーチンに復帰する(ラインD11)。
【0070】
そうでない場合、すなわち、前記二つのフレームがともにPBフレームにエンコードできなく(ラインD9、D12)、Bフレームに記憶された(ループ2で)以前のフレームBframeskipがPフレームに伝送できれば(つまり、Pmeet=1)、以前のフレームBframeskipはPフレームにエンコードされた後、開始ルーチンに復帰する(ラインD12)。
【0071】
一方、前記以前のフレームがPフレームに伝送できないが(Pmeet=0)(ラインD12、D13)、動きが補償されていないデータが、バッファ内に空間があること(PCFD1=1)を示し、その動きが大きいと(PCFD2=1)、現在のフレームskip=2* sminはPフレームにエンコードされた後、開始ルーチンに復帰する(ラインD13)。そうでない場合、処理はループ4ルーチンに進行する(ラインD14)。
【0072】
ループ4ルーチン
ループ3ルーチン部分で指摘したように、ループ4ルーチンは、ループ3ルーチンにおいて、つぎにエンコードするフレームの種類及び/又はエンコード方法を最終的に決定することに失敗した場合、要求される。この場合、ループ4ルーチンはコード化されるつぎのフレームを選択し、つぎのフレームがどの方法でエンコードされるかを決定しようとする。
【0073】
特に、パラメータskipが2* smin+1に設定され(図6のラインE1)、その2* smin+1からsmax−1までのフレームが連続的に分析される(ラインE2、E6、E7)。このことは、前記フレームのどのフレームがエンコードできるかを確認するためである(ラインE3ないしE5)。そして、分析された各フレームに対し、エンコードされるビット数Rは推定歪み指数Seに基づいて計算される。ここで、推定歪み指数は生の歪み指数MADに基づき、フラグPBCFDが設定される(ラインE3)。
【0074】
この際に、Bフレームに記憶された(ループ2で)以前のフレームBframeskip及び現在のフレームskipをPBフレームにエンコードする十分な空間がバッファにあると推定されると(つまり、PBCFD=1)、動き推定が現在のフレームskipに対して実施され、必要な場合、Bフレームに記憶された以前のフレームBframeskipに対しても動き推定が実施される。その後、前記フレームはともにPBフレームにエンコードされた後、開始ルーチンに復帰する(ラインE4)。
【0075】
そうでない場合、つまり、前記二つのフレームがともにPBフレームにエンコードできず(PBCFD=0)(ラインE4、E5)、現在のフレームskipがPフレームにコード化されなければならないときは(PCFD1=PCFD2=1)、現在のフレームはPフレームにエンコードされた後、開始ルーチンに復帰する(ラインE5)。
【0076】
一方、2*smin+1からsmax−1までのフレームのどのフレームもPフレームにエンコードしないでsmax−1フレームに到達すると、処理はループ5ルーチンに進行する(ラインE8)。
【0077】
ループ5ルーチン
ループ4ルーチン部分で指摘したように、ループ5ルーチンは、ループ4ルーチンにおいて、つぎにエンコードするフレームの種類及び/又はエンコード方法を最終的に決定することに失敗した場合、要求される。この場合、ループ5ルーチンはコード化されるつぎのフレームを選択し、つぎのフレームがどの方法でエンコードされるかを決定しようとする。
【0078】
特に、パラメータskipがsmax+1に設定され(図6のラインF1)、そのsmax+1からsmin+smaxまでのフレームが連続的に分析され(ラインF2、F5、F6)る。このことは、前記フレームのどのフレームがエンコードできるかを確認するためである(ラインF3、F4)。
【0079】
そして、分析された各フレームに対し、エンコードされるビット数Rは推定歪み指数Seに基づいて計算される。ここで、推定歪み指数は順に生の歪み指数MADに基づき、フラグPBCFDが設定される(ラインF3)。その際に、Bフレームに記憶された(ループ2で)以前のフレームBframeskip及び現在のフレームskipをPBフレームにエンコードし得る十分な空間があると推定されると(つまり、PBCFD=1)、動き推定は現在のフレームskipに対して実施され、必要な場合、Bフレームに記憶された以前のフレームBframeskipに対しても動き推定が実施される。その後、前記フレームはともにPBフレームにエンコードされた後、開始ルーチンに復帰する(ラインF4)。
【0080】
一方、smax+1からsmin+smaxまでのフレームのなかで、どのフレームもPフレームにエンコードされずsmin+smaxフレームに到達すると、処理は遷移ルーチンに進行される(ラインF7)。
【0081】
遷移ルーチン
ループ5ルーチン部分で記述したように、遷移ルーチンは、ループ5ルーチンにおいて、つぎにエンコードするフレーム種類及び/又はエンコード方法を最終的に決定することに失敗した場合に要求される。この場合、処理は固定状態から遷移状態に切り替わる。その際に、遷移ルーチンは、処理が固定状態に復帰し得ると決定されるまでPフレームにエンコードすべき一つ以上のフレームを選択する。ほかの実施形態において、遷移ルーチンは少なくともいくつかのフレームをBフレームにエンコードすることができる。
【0082】
特に、現在のフレームskipに対し、生の歪み指数MAD及びエンコードすべきビット数Rは推定された歪み指数Seに基づいて計算され、フラグPCFD1が設定される(図7のラインG1)。このときに、バッファに現在のフレームskipをPフレームに伝送する十分な空間があると推定されると(つまり、PCFD=1)(ラインG2)、動き推定が現在のフレームskipに対して実施され、現在のフレームはPフレームにエンコードされる(ラインG3)。
【0083】
仮に、バッファ占有が特定しきい値限度B0より小さければ、処理は開始ルーチンの固定状態に復帰する(ラインG4)。そうでない場合、現在のフレームskipはビデオシーケンス内のつぎのフレームを選択するため、sminに設定された後、遷移ルーチンの開始に復帰して、つぎのフレームを処理する(ラインG5)。
【0084】
一方、現在のフレームskipがPフレームに伝送できなければ(ラインG2、G7)、現在のフレームskipが増加した後(skip=skip+1)、現在のフレームをエンコードしないで、つぎのフレームを処理するため、遷移ルーチンの開始に復帰する(ラインG7)。
【0085】
このような本発明は、方法及びその方法を実行する装置の形態として実施し得る。また、本発明は、フロッピーディスク、CD−ROM、ハードドライブ、そのほかに機械で判読可能な記憶媒体のような媒体に実装されるプログラムコードの形態で実施できる。ここで、プログラムコードがコンピュータのような機械に搭載されて実行されるとき、その機械は本発明を実施する装置となる。また、本発明はプログラムコードの形態でも実施できる。例えば、記憶媒体に記憶された後、機械に搭載され、及び/又は、機械により実行されるか、又は電線又はケーブルを経由するか、オプチカルファイバを通ずるか、又は電磁波を経るかなどのように、どの伝送媒体を経由しても伝送され、この際に、プログラムコードがコンピュータのような機械に搭載されて実行されると、その機械は本発明を実行する装置となるものである。一般的な用途の処理装置で実行されたとき、プログラムコードセグメントは特定論理回路に作用する特殊装置を提供するため、処理装置と結合する。
【0086】
【発明の効果】
以上説明したように、本発明によるビデオ画像のシーケンス処理方法によると、量子化器のステップ変化が一基準フレームからつぎの基準フレームまでの特定境界内に限定されるときのフレームスキッピング、PB決定及び品質制御に対する安全なアクセスを行うことができる。また、その技法は、固定状態動作中に使用者が定義した最小フレーム速度を維持し、高品質及び“適正”フレーム速度(最小フレーム速度より高い速度)でデータを伝送することができる。その技法は、動き又は複雑度が増加すると、品質及びフレーム速度のスムースに性能が低下する。この際に、Bフレームはフレーム速度及びコード化された品質の両方を向上させることに使用される。しかし、場面変化又は動きが非常に速やかに早いときは、フレーム速度と基準フレームの品質要求を充足させることができなくなり得る。このような状況で、処理は“追いつく”ため遷移状態となり、新たな固定状態に徐々に再進入することになる。本発明は最小付加的計算複雑度で十分であり、別の記憶(入力されるフレームを記憶するために要求されるもの以上)は不要である。
【図面の簡単な説明】
【図1】本発明の一実施形態で、画像に対する原(つまり、動きが補償されていない)歪み指数を算出するアルゴリズムの擬似コードを示す図である。
【図2】本発明の一実施形態で、画像に対して動き保証された歪み指数推定アルゴリズムの擬似コードを示す図である。
【図3】本発明の一実施形態で、コード化すべきフレームの種類及びコード化方法決定アルゴリズムの擬似コードを示す図である。
【図4】本発明の一実施形態で、コード化すべきフレームの種類及びコード化方法決定アルゴリズムの擬似コードを示す図である。
【図5】本発明の一実施形態で、コード化すべきフレームの種類及びコード化方法決定アルゴリズムの擬似コードを示す図である。
【図6】本発明の一実施形態で、コード化すべきフレームの種類及びコード化方法決定アルゴリズムの擬似コードを示す図である。
【図7】本発明の一実施形態で、コード化すべきフレームの種類及びコード化方法決定アルゴリズムの擬似コードを示す図である。

Claims (12)

  1. (a)ビデオシーケンス中の現在の画像フレームのピクセル値と基準画像フレームの該当ピクセル値との絶対差を求め、求めた各絶対差を平均し、この平均絶対差を現在の画像の生の歪み指数として算出する段階と、
    (b)ビデオシーケンスの以前の画像フレームの生の歪み指数から現在の画像フレームの生の歪み指数への百分率変化を歪み変化指数として求めるとともに、求めた歪み変化指数予め定めたしきい値T1,T2(T1<T2)とに基づいて、H<T1の場合は現在の画像の動き補償された歪み指数の推定値Se(I)を、以前の画像に対して動き補償された歪み指数の推定値S(I−1)と同一値とし、H>T2の場合は現在の画像の動き補償された歪み指数の推定値Se(I)を、現在の画像に対する歪み指数MAD(I)に因子k(0<k<1)を乗じた値とし、T1<H<T2の場合は現在の画像の動き補償された歪み指数の推定値Se(I)を、 Se(I)=S(I-1)+(k*MAD(I)-S(I-1))*(H-T1)/(T2-T1) として算出する段階と、
    (c)前記動き補償された歪み指数推定値により現在の画像をエンコードするかどうか及びそのエンコード方法を決定する段階と、
    (d)前記段階(c)の決定により、ビデオ画像のシーケンスに対して圧縮されたビデオビットストリームを算出する段階と
    を含むことを特徴とするビデオ画像のシーケンス処理方法。
  2. 請求項1において、
    前記段階(a)は、
    (1)現在の画像フレームのピクセル値と基準画像フレームの該当ピクセル値との絶対差が所定のしきい値より小さい場合はこの絶対差を現在の画像の第1中間歪み指数として算出するとともに、前記絶対差が前記所定のしきい値より大きい場合はこの絶対差を現在の画像の第2中間歪み指数として算出する段階と、
    (2)現在の画像と基準画像との間の相対的動きから発生する二重画像効果に対する修整を行う場合、二重画像相当領域内における前記第1中間歪み指数を有する第1のピクセルの数に前記第1中間歪み指数を乗じた値と、前記二重画像相当領域内における前記第2中間歪み指数を有する第2のピクセルの数に前記第2中間歪み指数を乗じた値の1/2と、前記二重画像相当領域内における前記第2のピクセルの数に前記第1中間歪み指数を乗じた値の1/2との和を求め、求めたこれらの値の和を、前記二重画像相当領域内における第1のピクセルの数と第2のピクセルの数との和で除算することにより、前記二重画像効果に対する修整を行うとともに、前記除算結果を前記生の歪み指数として出力する段階と
    を含むことを特徴とするビデオ画像のシーケンス処理方法。
  3. 請求項1において、
    前記動き補償された歪み指数の推定値は、連続関数の一つである区分的連続関数を使用して算出されることを特徴とするビデオ画像のシーケンス処理方法。
  4. 請求項1において、
    前記歪み変化指数が第1のしきい値レベルより小さいと、動き補償された歪み指数の推定値は、以前の画像フレームに対して実際の動き補償された歪み指数と同一であり、
    前記歪み変化指数が前記第1のしきい値レベルよりレベルが大の第2のしきい値レベルより大きいと、動き補償された歪み指数の推定値は、前記生の歪み指数とほぼ同一であり、
    そのほかの場合、前記動き補償された歪み指数の推定値は、以前の画像フレームに対して実際の動き補償された歪み指数と、この歪み指数と前記生の歪み指数との差に前記歪み変化指数と前記第1のしきい値との差を乗じた値を第1のしきい値と第2のしきい値の差で除算した一次補間値との和と同一であることを特徴とするビデオ画像のシーケンス処理方法。
  5. 請求項1において、
    前記段階(c)は、
    (1)前記動き補償された歪み指数を用いて、該当バッファに現在の画像をPフレームとして伝送する十分な空間があるか否かを決定する段階と、
    (2)現在の画像での動きが生の歪み指数による特定しきい値レベルより大きいか否かを決定する段階と、
    (3)前記段階(1)、(2)の結果によって、現在の画像をエンコードすべきかどうか及びその方法を決定する段階と
    を含むことを特徴とするビデオ画像のシーケンス処理方法。
  6. 請求項5において、
    前記段階(1)は、2次方程式速度歪みモデルにより現在の画像をPフレームにエンコードするのに必要なビット数を推定する段階を含むことを特徴とするビデオ画像のシーケンス処理方法。
  7. 請求項6において、
    前記2次方程式速度歪みモデルはつぎのように提示され、
    (R−H)/Se=X1/Q+X2/(Q**2)
    ここで、
    Rは現在の画像をエンコードするのに必要なビット数であり、
    Hは現在の画像に対するオーバーヘッドデータをエンコードするのに必要なビット数であり、
    Seは動き補償された歪み指数の推定値であり、
    Qは現在の画像に対する平均量子化器ステップサイズであり、X1、X2は2次方程式速度歪みモデルのパラメータである
    ことを特徴とするビデオ画像のシーケンス処理方法。
  8. 請求項1において、
    前記段階(c)は、
    (1)現在の画像をスキップするか、
    (2)現在の画像をBフレームにエンコードするか、
    (3)現在の画像をPBフレームの一部にエンコードするか、又は
    (4)現在の画像を基準フレームにエンコードするかを決定する段階
    を含むことを特徴とするビデオ画像のシーケンス処理方法。
  9. 請求項1において、
    前記シーケンス処理は固定状態又は遷移状態で行われ、前記固定状態では、現在の画像はスキップされるか、Pフレーム、Bフレーム又はPBフレームの一部にエンコードされ、前記遷移状態では、現在の画像はスキップされるか、Iフレーム又はPフレームにエンコードされることを特徴とするビデオ画像のシーケンス処理方法。
  10. 請求項9において、
    前記シーケンス処理は、該当バッファレベルが特定しきい値レベルより低いときは、自動的に遷移状態から固定状態に転換することを特徴とするビデオ画像のシーケンス処理方法。
  11. 請求項1において、
    前記段階(a)は、
    (1)現在の画像フレームのピクセル値と基準画像フレームの該当ピクセル値との絶対差が所定のしきい値より小さい場合はこの絶対差を現在の画像の第1中間歪み指数として算出するとともに、前記絶対差が前記所定のしきい値より大きい場合はこの絶対差を現在の画像の第2中間歪み指数として算出する段階と、
    (2)現在の画像と基準画像との間の相対的動きから発生する二重画像効果に対する修整を行う場合、二重画像相当領域内における前記第1中間歪み指数を有する第1のピクセルの数に前記第1中間歪み指数を乗じた値と、前記二重画像相当領域内における前記第2中間歪み指数を有する第2のピクセルの数に前記第2中間歪み指数を乗じた値の1/2と、前記二重画像相当領域内における前記第2のピクセルの数に前記第1中間歪み指数を乗じた値の1/2との和を求め、求めたこれらの値の和を、前記二重画像相当領域内における第1のピクセルの数と第2のピクセルの数との和で除算することにより、前記二重画像効果に対する修整を行うとともに、前記除算結果を前記生の歪み指数として出力する段階と
    前記段階(b)は、
    (1)区分的連続関数を使用し、前記歪み変化指数に基づいて動き補償された歪み指数の推定値を算出する段階を含み、
    ここで、前記歪み変化指数が第1のしきい値レベルより小さいと、動き補償された歪み指数の推定値は、以前の画像フレームに対して実際の動き補償された歪み指数と同一であり、
    前記歪み変化指数が前記第1のしきい値レベルよりレベルが大の第2のしきい値レベルより大きいと、動き補償された歪み指数の推定値は、前記生の歪み指数とほぼ同一であり、
    そのほかの場合、前記動き補償された歪み指数の推定値は、以前の画像フレームに対して実際の動き補償された歪み指数と、この歪み指数と前記生の歪み指数との差に前記歪み変化指数と前記第1のしきい値との差を乗じた値を第1のしきい値と第2のしきい値の差で除算した一次補間値との和と同一であり、
    前記段階(c)は、
    (1)2次方程式速度歪みモデルにより現在の画像をPフレームにエンコードするのに必要なビット数を推定することにより、動きが補償された歪み指数の推定値に基づいて現在の画像をPフレームに伝送する十分な空間が該当バッファにあるかどうかを決定する段階と、
    その際に、前記2次方程式速度歪みモデルはつぎのように与えられ、
    (R−H)/Se=X1/Q+X2/(Q**2)
    ここで、
    Rは現在の画像をエンコードするのに必要なビット数、
    Hは現在の画像に対するオーバーヘッドデータをエンコードするのに必要なビット数、
    Seは動き補償された歪み指数の推定値、
    Qは現在の画像に対する平均量子化器ステップサイズ、
    X1、X2は2次方程式速度歪みモデルのパラメータであり、
    (2)現在の画像の動きが生の歪み指数に基づいた特定しきい値レベルより大きいかどうかを決定する段階と、
    (3)前記段階(c)(1)及び(c)(2)の結果によって、現在の画像をエンコードするかどうか及びその方法を決定する段階とを含み、
    前記段階(c)は、(1)現在の画像をスキップするか、(2)現在の画像をBフレームにエンコードするか、(3)現在の画像をPBフレームの一部にエンコードするか、又は(4)現在の画像を基準フレームにエンコードするかを決定する段階を含み、
    前記シーケンス処理は固定状態又は遷移状態で行われ、
    前記固定状態では、現在の画像はスキップされるか、Pフレーム、Bフレーム又はPBフレームの一部にエンコードされ、
    前記遷移状態では、現在の画像はスキップされるか、Iフレーム又はPフレームにエンコードされ、
    該当バッファレベルが特定しきい値レベル以下であると、遷移状態から固定状態に自動的に転換されることを特徴とするビデオ画像のシーケンス処理方法。
  12. ビデオ画像のシーケンスを処理し得る命令を含む多数の命令が記憶されたコンピュータ判読可能な媒体を有する処理器を用いるビデオ画像のシーケンス処理方法において、
    (1)前記ビデオシーケンスにおいて、現在の画像フレームのピクセル値と基準画像フレームの該当ピクセル値との絶対差を求め、求めた各絶対差を平均し、この平均絶対差を現在の画像の生の歪み指数として算出する段階と、
    (2)ビデオシーケンスの以前の画像フレームの生の歪み指数から現在の画像フレームの生の歪み指数への百分率変化を歪み変化指数として求めるとともに、求めた歪み変化指数予め定めたしきい値T1,T2(T1<T2)とに基づいて、H<T1の場合は現在の画像の動き補償された歪み指数の推定値Se(I)を、以前の画像に対して動き補償された歪み指数の推定値S(I−1)と同一値とし、H>T2の場合は現在の画像の動き補償された歪み指数の推定値Se(I)を、現在の画像に対する歪み指数MAD(I)に因子k(0<k<1)を乗じた値とし、T1<H<T2の場合は現在の画像の動き補償された歪み指数の推定値Se(I)を、 Se(I)=S(I-1)+(k*MAD(I)-S(I-1))*(H-T1)/(T2-T1) として算出する段階と、
    (3)前記動き補償された歪み指数推定値により現在の画像をエンコードするかどうか及びそのエンコード方法を決定する段階と、
    (4)前記段階(3)の決定により、ビデオ画像のシーケンスに対して圧縮されたビデオビットストリームを算出する段階と
    を含むことを特徴とするビデオ画像のシーケンス処理方法。
JP26623299A 1998-09-18 1999-09-20 ビデオ画像のシーケンス処理方法 Expired - Fee Related JP3641172B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US10093998P 1998-09-18 1998-09-18
US25594699A 1999-02-23 1999-02-23
US60/100939 1999-02-23
US09/255946 1999-02-23

Publications (2)

Publication Number Publication Date
JP2000125302A JP2000125302A (ja) 2000-04-28
JP3641172B2 true JP3641172B2 (ja) 2005-04-20

Family

ID=26797724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26623299A Expired - Fee Related JP3641172B2 (ja) 1998-09-18 1999-09-20 ビデオ画像のシーケンス処理方法

Country Status (3)

Country Link
JP (1) JP3641172B2 (ja)
KR (1) KR100323683B1 (ja)
WO (1) WO2000018134A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7616690B2 (en) 2000-10-31 2009-11-10 Imec Method and apparatus for adaptive encoding framed data sequences
EP1202579A1 (en) * 2000-10-31 2002-05-02 Interuniversitair Microelektronica Centrum Vzw A method and apparatus for adaptive encoding framed data sequences
EP1204279A3 (en) * 2000-10-31 2002-05-15 Interuniversitair Microelektronica Centrum Vzw A method and apparatus for adaptive encoding framed data sequences
US6671324B2 (en) * 2001-04-16 2003-12-30 Mitsubishi Electric Research Laboratories, Inc. Estimating total average distortion in a video with variable frameskip
KR100739133B1 (ko) * 2001-04-17 2007-07-13 엘지전자 주식회사 디지털 비디오 코딩시 b프레임 코딩 방법
US8693537B2 (en) * 2005-03-01 2014-04-08 Qualcomm Incorporated Region-of-interest coding with background skipping for video telephony
US8514933B2 (en) 2005-03-01 2013-08-20 Qualcomm Incorporated Adaptive frame skipping techniques for rate controlled video encoding
US8768084B2 (en) * 2005-03-01 2014-07-01 Qualcomm Incorporated Region-of-interest coding in video telephony using RHO domain bit allocation
US7724972B2 (en) * 2005-03-01 2010-05-25 Qualcomm Incorporated Quality metric-biased region-of-interest coding for video telephony
JP4874720B2 (ja) 2006-06-21 2012-02-15 Hoya株式会社 保持機構
KR20120072202A (ko) 2010-12-23 2012-07-03 한국전자통신연구원 움직임 추정 장치 및 방법
CN102271269B (zh) * 2011-08-15 2014-01-08 清华大学 一种双目立体视频帧率转换方法及装置
DE102015121148A1 (de) * 2015-12-04 2017-06-08 Technische Universität München Reduzieren der Übertragungszeit von Bildern
CN110832858B (zh) * 2017-07-03 2023-10-13 Vid拓展公司 用于视频编解码的设备、方法
KR102308373B1 (ko) 2021-06-08 2021-10-06 주식회사 스누아이랩 얼굴인식을 위한 비디오 디블러링장치 및 그 장치의 구동방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2068751C (en) * 1991-05-24 1998-05-19 Tokumichi Murakami Image coding system
GB2306831B (en) * 1995-10-30 2000-05-24 Sony Uk Ltd Video data compression

Also Published As

Publication number Publication date
WO2000018134A1 (en) 2000-03-30
KR20000023277A (ko) 2000-04-25
JP2000125302A (ja) 2000-04-28
KR100323683B1 (ko) 2002-02-07

Similar Documents

Publication Publication Date Title
JP4435480B2 (ja) 改善されたダイレクトモードのブロック予測方法
JP3641172B2 (ja) ビデオ画像のシーケンス処理方法
KR101062646B1 (ko) 선택적 비디오 프레임 레이트 상향 변환
EP2250813B1 (en) Method and apparatus for predictive frame selection supporting enhanced efficiency and subjective quality
JP4702059B2 (ja) 動画像を符号化する方法及び装置
JP2002330443A (ja) ディジタル動画システムにおける画像の位置変化を効率的に推定する方法
JP2003533142A (ja) ビデオ情報を符号化し復号化する方法、動き補償ビデオ符号器及び対応する復号器
EP1551186A1 (en) Video coding apparatus with resolution converter
JP3593929B2 (ja) 動画像符号化方法及び動画像符号化装置
JP2000201354A (ja) 動画像符号化装置
JPH08102938A (ja) 画像符号化装置
JP2000197049A (ja) 動画像可変ビットレート符号化装置および方法
US6950465B1 (en) Video coding by adaptively controlling the interval between successive predictive-coded frames according to magnitude of motion
JP3982615B2 (ja) 符号化動画像データの方式変換装置
JP3757088B2 (ja) 動画像符号化装置および方法
JPH1093975A (ja) 動画像符号化装置における動き補償フレーム間予測方法
JP4694664B2 (ja) 画像圧縮方法
JP4644097B2 (ja) 動画像符号化プログラム、プログラム記憶媒体、および符号化装置。
JP3480067B2 (ja) 画像符号化装置及び方法
KR100390167B1 (ko) 화상 부호화방법 및 화상 부호화장치
JP2007259484A (ja) 動画像符号化方法と装置及び復号化方法と装置
JP2000350209A (ja) リアルタイム動映像符号化のための高速動き推定方法及びその装置
JP2008124707A (ja) 動画像符号化装置
JP2001258039A (ja) 可変画像レート符号化装置、可変画像レート復号化装置、可変画像レート符号化方法、及び可変画像レート復号化方法
KR100504772B1 (ko) 부호화알고리즘선택방법

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20020924

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050120

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080128

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090128

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees