JP2000083257A - ビデオエンコ―ダの運動推定器における場面の変化の検知 - Google Patents

ビデオエンコ―ダの運動推定器における場面の変化の検知

Info

Publication number
JP2000083257A
JP2000083257A JP11223009A JP22300999A JP2000083257A JP 2000083257 A JP2000083257 A JP 2000083257A JP 11223009 A JP11223009 A JP 11223009A JP 22300999 A JP22300999 A JP 22300999A JP 2000083257 A JP2000083257 A JP 2000083257A
Authority
JP
Japan
Prior art keywords
picture
motion
pictures
macroblocks
motion estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11223009A
Other languages
English (en)
Inventor
Danilo Pau
パウ ダニロ
Daniele Bagni
バーニ ダニエーレ
Luca Pezzoni
ペッツオーニ ルカ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
STMicroelectronics SRL
Original Assignee
STMicroelectronics SRL
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by STMicroelectronics SRL filed Critical STMicroelectronics SRL
Publication of JP2000083257A publication Critical patent/JP2000083257A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/786Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using motion, e.g. object motion or camera motion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

(57)【要約】 【課題】 ビデオ画像を処理する場合の運動推定を改良
する技術を提供する。 【解決手段】 時間的冗長性を除去するための運動推定
を包含するピクチャからなるビデオシーケンスに関する
デジタルデータの圧縮及びコーディングは、場面の変化
に先行するピクチャに対して前方運動推定のみを使用し
且つ与えられたシーケンスの場面の変化に続くピクチャ
に対して後方運動推定のみを使用してピクチャの予測計
算を行うために場面の変化の発生を認識する能力から著
しい利点が得られる。本発明方法によれば、2つの別々
のインデックスをチェックすることによって場面の変化
を信頼性を持って検知される。ノイズのあるピクチャ、
ズーム動作及び一方又は他方のインデックスに影響を与
える可能性のあるその他の状況においての偶発的な検知
が防止される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ビデオ圧縮器及び
コーダー用のビデオ画像を処理する運動推定システムに
関するものである。
【0002】
【従来の技術】運動推定の基礎的な概念は以下のような
ものである。ピクチャのあるフィールドの1組のピクセ
ルは、先行するものを移動させることによって得られた
引続くピクチャの同一のフィールドの位置に配置させる
ことが可能であるというものである。勿論、これらのオ
ブジェクトの置換えは、ビデオカメラに対して以前は見
えなかった部分及びそれらの形状の変化(例えば、ズー
ム等)を顕示させる場合がある。
【0003】画像のこれらの部分を識別し且つ関連付け
するのに適した一群のアルゴリズムは、通常、「運動推
定(motion estimation)」と呼ばれ
る。このような関連付けは、冗長な時間的情報を除去す
ることによって差分画像の部分を計算することを可能と
し、DCT、量子化及びエントロピーコーディングによ
ってその後の圧縮プロセスをより効果的なものとさせ
る。このような方法はスタンダードのMPEG−2にお
いて典型的な例が見出される。ビデオMPEG−2コー
ダーの典型的なブロック図を図1に示してある。
【0004】このようなシステムは以下の機能的ブロッ
クから構成されている。
【0005】1)フィールド序列器 このブロックはMPEGスタンダードによって要求され
るコーディング順番でフィールドを出力する1個又は複
数個のフィールドメモリから構成されている。例えば、
入力シーケンスがIBBPBBP等である場合には、出
力順はIPBBPBB...である。
【0006】I (イントラコード化ピクチャ)時間的
冗長性を包含するフィールド及び/又はセミフィール
ド; P (予測ピクチャ)は、先行するI及びP(前にコー
ド/デコード化)に関する時間的冗長性が除去されてい
るフィールド及び/又はセミフィールド; B (双方向予測ピクチャ)は、先行するI及び後に続
くP(又は先行するP及び後に続くP)に関する時間的
冗長性が除去されているフィールド及び/又はセミフィ
ールド(両方の場合において、I及びPピクチャは既に
コード/デコード化されているものと考えねばならな
い)。
【0007】フォーマット4:2:0における各フレー
ムバッファは以下のメモリ空間を占有する。
【0008】 スタンダードPAL ルミナンス(Y)に対する 720×576×8=3,317,760ビッ ト クロミナンス(U)に対する360×288×8= 829,440ビッ ト クロミナンス(V)に対する360×288×8= 829,440ビッ ト −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− Y+U+V全体 =4,976,640ビッ ト スタンダードNTSC ルミナンス(Y)に対する 720×480×8=2,764,800ビッ ト クロミナンス(U)に対する360×240×8= 619,200ビッ ト クロミナンス(V)に対する360×240×8= 619,200ビッ ト −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− Y+U+V全体 =4,147,200ビッ ト 2)運動推定器 これは、P及びBピクチャから時間的冗長性を取除くブ
ロックである。
【0009】3)DCT これはMPEG−2スタンダードに従って余弦離散変換
を実施するブロックである。
【0010】Iピクチャ及びエラーピクチャP及びBは
ピクセルY,U,Vの8×8ブロックに分割されてお
り、それに関してDCT変換が実施される。
【0011】4)量子化器Q DCT変換から得られる8×8ブロックは、次いで、D
CT係数の大きさを多かれ少なかれ劇的に減少させるた
めに量子化マトリクスによって除算される。このような
場合には、人間の視力に対して感度がより低い最も高い
周波数に関連する情報が除去される傾向となる。その結
果は再配置され且つ引続くブロックへ送られる。
【0012】5)可変調コーディング(VLC) 量子化器から出力されるコード化ワードは多かれ少なか
れ多数のヌル係数を有する傾向があり、その後にヌルで
ない値が続く。最初のヌルでない値に先行するヌル値が
カウントされ且つそのカウント値はコード化ワードの第
一部分を構成し、その第二部分はヌルでない係数を表わ
す。
【0013】これらの対構成とされた値は他のものより
もより蓋然性のある値を取る傾向がある。最も蓋然性の
あるものは比較的短いワード(2,3又は4ビットから
構成されている)でコード化され、一方最も蓋然性のな
いものはより長いワードでコード化される。統計的に
は、出力ビットの数は、このような方法が実施されない
場合におけるものよりもより少ない。
【0014】6)マルチプレクサ及びバッファ 可変長コーダー、量子化マトリクス、運動ベクトル及び
その他の構文上の要素によって発生されたデータは、M
PEG−2スタンダードによって意図されている最終的
なシンタックス即ち構文を構成するために組立てられ
る。その結果得られるビットストリームはメモリバッフ
ァ内に格納され、その制限寸法はMPEG−2スタンダ
ードによって画定され且つオーバーフローさせることは
不可能である。量子化器ブロックQは、システムがこの
ようなメモリバッファの充填限界に対してどれ程離れて
いるかという及び運動推定及びDCT変換プロセスの上
流側において取られる8×8ソースブロックのエネルギ
に依存して、DCT8×8ブロックの分割を多かれ少な
かれ劇的なものとさせることによって、このような限界
の側面を取扱う。
【0015】7)逆可変長コーディング(I−VLC) 上に特定した可変長コーディング機能は、逆の順番で実
行される。
【0016】8)逆量子化(IQ) I−VLCブロックによって出力されたワードは8×8
ブロック構造に再配置され、それはその先のコーディン
グのために使用したものと同一の量子化マトリクスによ
って乗算される。
【0017】9)逆DCT(I−DCT) DCT変換関数が逆にされ且つ逆量子化プロセスによっ
て出力された8×8ブロックへ適用される。このことは
空間周波数のドメインからピクセルドメインへ通過する
ことを可能とさせる。
【0018】10)運動補償及び格納 I−DCTの出力において、ブロックが存在する場合が
あり、即ち、 ※後のP及びBピクチャからそれに関する時間的冗長性
を除去するために夫々のメモリバッファ内に格納せねば
ならないデコードしたIピクチャ(又はセミピクチ
ャ); ※運動推定フェーズ期間中に前に除去した情報に対して
加算されねばならないデコードした予測エラーピクチャ
(セミピクチャ)P又はB。Pピクチャの場合には、専
用のメモリバッファ内に格納されるこのような結果的に
得られる和が引続くPピクチャ及びBピクチャに対する
運動推定プロセス期間中に使用される。これらのフィー
ルドメモリは、通常、ブロックを再配置させるために使
用されるフィールドメモリとは別個のものである。
【0019】11)ディスプレイユニット このユニットはピクチャを4:2:0フォーマットから
4:2:2フォーマットへ変換し且つイメージを表示す
るためのインターレースしたフォーマットを発生する。
【0020】上述したコーダーを実現するアーキテクチ
ュアおいて図1に示した機能的ブロックの順番付けを図
2に示してある。顕著な特徴は、フィールド再配置ブロ
ック(1)と、既に再生されたP及びIピクチャを格納
するためのブロック(10)と、MPEG−2コーディ
ングによって発生されたビットストリームを格納するた
めのブロック(6)とがコーダーのコアの集積回路外部
のメモリ装置内において集積化されているという事実で
ある。デコーダーは集積化された制御器によって適宜管
理される単一のインターフェースを介して該外部メモリ
(DRAM)へアクセスする。
【0021】更に、予備処理ブロックがクロミナンスを
フィルタし且つサブサンプリング(subsampli
ng)することによって、受取った画像を4:2:2フ
ォーマットから4:2:0フォーマットへ変換する。後
処理ブロックが画像のデコーディング及び表示フェーズ
期間中に逆の機能を実行する。
【0022】コーディングフェーズは、更に、運動推定
を動作可能なものとさせるために基準ピクチャを発生す
るためのデコーディングステップを使用する。例えば、
第一Iピクチャがコード化され、従ってそれはデコード
され、格納され(10節において説明したように)且つ
後のP及びBピクチャをコード化するために使用される
予測エラーを計算するために使用される。
【0023】コーディングプロセスによって前に発生さ
れたデータストリームのプレイバックフェーズは逆機能
的ブロック(I−VLC,I−Q,I−DCT等)のみ
を使用し、直接的機能的ブロックを使用することはな
い。この観点から、画像の爾後的な表示のために実施さ
れるコーディング及びデコーディングは集積化アーキテ
クチュア内において非同時的なプロセスであるというこ
とが可能である。運動アルゴリズム推定の範囲は、シー
ケンスにおける画像/セミフィールドを予測し、それら
を、先行するか又は将来の画像/セミフィールドから発
生する予測子と呼ばれる全体的なピクセルブロックの構
成要素として得ることである。
【0024】MPEG2スタンダードは以下の3つのタ
イプのピクチャ/セミフィールドを有している。
【0025】※Iピクチャ(イントラコード化ピクチ
ャ)は、運動推定に対して提供されることのないピクチ
ャであり、従って、それらは時間的冗長性を包含してお
り且つ他の2つのタイプのピクチャコーディングに対し
て基本的なものである。
【0026】※Pピクチャ(予測ピクチャ)は、それら
の先行するI又はPピクチャに関しての運動推定を介し
て時間的冗長性が除去されているピクチャである。
【0027】※Bピクチャ(双方向予測ピクチャ)は、
それらに先行し及び/又は将来のI及びBピクチャに関
しての運動推定を介して時間的強調性が除去されている
ピクチャである。
【0028】全数探索運動推定値によれば、プロセスは
以下の通りである。
【0029】あるピクチャの2つのフィールド、即ち時
刻tにおけるQ1及び時刻t+(kp)×Tにおけるそ
の後のフィールドQ2について検討する(同じことがセ
ミフィールドに対しても適用される)。項kpは先行す
るIと後続のPの間(又は2つのPの間)に存在するB
フィールドの数に依存する定数であり、Tはフィールド
期間(PALスタンダードの場合には1/25秒であ
り、NTSCスタンダードの場合には1/30秒であ
る)である。Q1及びQ2はルミナンス及びクロミナン
ス成分によって構成されている。N個の行とM個の列か
らなるマトリクスとして表わすことの可能な例えばルミ
ナンス等のよりエネルギが高く、従ってより豊富な情報
成分に対してのみ運動推定を適用するものと仮定する。
各々がR個の行とS個の列とからなるマクロブロックと
呼ばれる部分にQ1及びQ2を分割する。N/R及びM
/Sの除算結果は、2つの整数でなければならないが、
それらは必ずしも等しいものである必要はない。
【0030】Nb2(i,j)をフィールドQ2に属す
る基準マクロブロックとして定義され且つその左上部分
における第一ピクセルがi番目の行とj番目の列との間
の交差点に存在するマクロブロックであるとする。対
(i,j)はi及びjが、夫々、R及びSの整数の倍数
であるという事実によって特性付けられる。
【0031】図2aはどのようにして該基準マクロブロ
ックがQ2ピクチャ上に位置決めされるかを示してお
り、その場合に水平の点線矢印はQ2上の種々のマクロ
ブロックを識別するために使用されるスキャニングの順
番を表わしている。
【0032】Q1フィールド上にMB2(i,j)を投
影させ、MB1(i,j)を得るものと仮定する。Q1
上において、その中心が(i,j)にあり且つkがマク
ロブロックのインデックスであるとしてマクロブロック
MBk[e,f]からなるサーチウインドウを定義す
る。k番目のマクロブロックは、例えば、 −p≦(e−i)≦+p −q≦(f−j)≦+q のようにして座標(e,f)によって識別される。イン
デックスe及びfは整数である。該マクロブロックの各
々はMB2(i,j)の可能性のある予測子である。
【0033】種々の運動推定アルゴリズムは、サーチウ
インドウにおいて予測子がサーチされ且つ選択される態
様に依存して互いに異なる。あるコスト機能を最小とさ
せる予測子が全体の組の可能性のある予測子の中から選
択される。このような機能は選択した運動推定アルゴリ
ズムに従って変化する場合があり、例えば、MPEG2
スタンダードの場合においては、基準マクロブロックに
関してL1ノルマを最小とする予測子をサーチする。こ
のようなノルマはMB2(i,j)及びMbk(e,
f)に夫々属する同名ピクセルの間の差の絶対値の和に
等しい。R×S値は各和に貢献し、その結果的な値は歪
みと呼ばれる。
【0034】従って、MB2(i,j)に最も類似する
予測子が、運動推定ステップの終りにおいて卓越する予
測子の座標によって識別される。卓越する予測子の位置
とMB2(i,j)との間の差から発生する成分によっ
て構成されるベクトルは運動ベクトルと呼称され且つど
のようにしてMB2(i,j)が先行するフィールド内
の同様のマクロブロックの移動によって派生するかを記
述する。
【0035】Bフィールド又はセミフィールド 1つのピクチャの3つのフィールド、即ち時刻tにおけ
るQBn-1、時刻t+(kB)×TにおけるQBkBと、
時刻t+(kP)×TにおけるQBnについて検討する
(尚、同一のことはセミフィールドに対しても適用可能
である)。尚、k P及びkBはBフィールド(又はセミフ
ィールド)の予め選択した数に依存する。Tはフィール
ド期間(PALスタンダードの場合には1/25秒であ
り、NTSCスタンダードの場合には1/30秒であ
る)である。QTn-1、QBkB、QT nは、ルミナンス
成分及びクロミナンス成分によって構成される。N個の
行とM個の列とからなるマトリクスとして表現すること
の可能な例えばルミナンス等の最もエネルギが高く、従
って情報が豊富な成分に対してのみ運動推定を適用する
ものと仮定する。QPn-1,QPkb,QPnを、各々が
R個の行とS個の列とからなるマクロブロックと呼ばれ
る部分に分割する。N/R及びM/Sの除算結果は2つ
の整数でなければならないが、必ずしも等しいものであ
る必要はない。
【0036】MB2(i,j)をフィールドQ2に属す
るものであって、その左上部分における第一ピクセルが
i番目の行とj番目の列との間の交差点にある基準マク
ロブロックとして定義されるマクロブロックであるとす
る。対(i,j)は、i及びjが夫々R及びSの整数倍
数であるという事実によって特性付けられる。
【0037】MB2(i,j)をQPn-1フィールド上
へ投影し、MB1(i,j)を得、且つQBn上へ投影
してMB3(i,j)を得るものと仮定する。QBn-1
上に、その中心が(i,j)にあり且つマクロブロック
MB1k[e,j]を包含するサーチウインドウを定義
し、且つQBn上に、その寸法は異なるものとすること
が可能であり、又はいずれの場合においても、予め定め
たものとすることが可能であり、kがマクロブロックイ
ンデックスであるとしてMB3k[e,f]によって構
成される同様のサーチウインドウを定義するものとす
る。QBn-1上のk番目のマクロブロックは以下のよう
にして、即ち、 −p1≦(e−i)≦+p1 −q1≦(f−j)
≦+q1 であるような座標(e,f)によって識別され、一方Q
nフィールド上のk番目のマクロブロックは、以下の
ようにして、即ち、 −p3≦(e−i)≦+p3 −q3≦(f−j)
≦+q3 であるような座標(e,f)によって識別され、尚イン
デックスe及びfは整数である。該マクロブロックの各
々はMB2(i,j)の予測子であると言われる。
【0038】従って、この場合には、MB2(i,j)
に対して2つのタイプの予測子が存在しており、即ち、
「前方」として呼称される推定されるべきブロック(I
又はP)を包含するものに時間的に先行するフィールド
上において得られたもの、及び「後方」として呼称され
る推定されるべきブロック(I又はP)を包含するもの
に時間的に追従するフィールド上において得られるもの
である。2つの組の可能な予測子、即ち使用中の運動推
定アルゴリズムのタイプに依存する組に属する予測子の
中で、2つの予測子、即ち1つが前方で且つ1つが後方
であるものが選択され、それはハードウエア構成のある
コスト機能を最小とさせる。
【0039】この機能は選択される運動推定のタイプに
依存して変化する場合があり、例えば、MPEG2スタ
ンダードを選択する場合には、基準マックロブロックに
関してL1ノルマを最小とさせる予測子をサーチすべき
である。このようなノルマはMB3k(e,j)上への
MB2(i,j)及びMB1k(e,f)に属する同名
ピクセル間の差の絶対値の和に等しく、夫々、R×S値
が各和に貢献し、その結果は歪みと呼ばれる。
【0040】従って、ある数の前方歪み値が得られ、そ
れらの中で、フィールドQPn-1上の卓越する位置
(ef,ff)を識別することによって最も低いものが選
択され、且つある数の後方歪み値が得られ、その中で、
QBnフィールド上の新たな卓越する位置(eb,fb
を識別することによって最も低い値が選択される。
【0041】更に、MB2(i,j)と2つの卓越する
予測子の線形補間によって得られた理論的マクロブロッ
クとの間の歪み値が計算される。従って、MB2(i,
j)は、3つのタイプのマクロブロック、即ち前方予測
子(ef,ff)、後方予測子(eb,fb)又は両方の平
均を使用して最終的に推定することが可能である。卓越
する予測子の位置とMB2(i,j)の位置との間の差
成分によって構成されるベクトルは運動ベクトルとして
定義され且つ、どのようにしてMB2(i,j)が先行
するフィールド及び/又は引続くフィールドにおいてそ
れと同様のマクロブロックの移動から派生するものであ
るかを記述する。
【0042】全数検索運動推定器及び階層的反復的運動
推定器は本願出願人と同一の名称で先の欧州特許出願第
98830163.6号に記載されている。
【0043】公知の運動推定器は、あるシーケンスの最
初から該シーケンスの最後までのピクチャを線形な態様
で考慮することによって運動推定を実施する。該シーケ
ンス期間中に、ピクチャの幾つかの点において、場面の
変化が発生する。公知の推定器によって実施される運動
推定プロセスは、いずれの場合においても、それらが今
や異なる場面に属するものであっても、先行するピクチ
ャ及び/又は引続くピクチャに関してのピクチャの予測
を行うことを試み、従って、推定中のピクチャに対して
殆ど相関を有するものではない。そのために、予測され
たピクチャは、不可避的に、異なる場面に属するピクセ
ルからなるブロックを包含する。
【0044】このことは、深刻な欠点を構成しており、
且つ複数個のビデオ画像からなるシーケンス期間中に場
面の変化が発生する場合に公知の運動推定器から得るこ
との可能な性能を低下させる。
【0045】
【発明が解決しようとする課題】本発明は、以上の点に
鑑みなされたものであって、上述した如き従来技術の欠
点を解消し、ビデオ圧縮器及びコーダー用のビデオ画像
を処理する場合の運動推定の改良した技術を提供するこ
とを目的とする。
【0046】
【課題を解決するための手段】本発明によれば、ビデオ
ピクチャのコーディングシステム用の運動推定アルゴリ
ズムが提供され、その場合に、基準フィールド(イント
ラコード化ピクチャ)が発生され且つ逐次的なP及び/
又はBピクチャ(Pは予測ピクチャであり且つBは双方
向予測ピクチャである)をコーディングする場合の予測
エラーを動的に計算するために使用すべく格納され、そ
れから、Pピクチャの場合には先行するI又はPピクチ
ャに関して、又はBピクチャの場合には先行する及び/
又は引続くI又はPピクチャに関しての運動推定を介し
て時間的な冗長性が除去される。本発明方法は、シーケ
ンスにおいて時間的にある数のピクチャに関するあるパ
ラメータをモニタすることによって発生した場面の変化
を識別すること、及び場面の変化に先行する画像に対し
ては前方運動推定のみを使用し且つ2つのイントラピク
チャの間の場面の変化に続くピクチャに対しては後方推
定のみを使用すべく制限するために発生した場面の変化
のアサーション(活性)信号を使用することに基づいて
いる。
【0047】
【発明の実施の形態】運動推定アルゴリズムは、予測さ
れるべき画像に属する各マクロブロックに対して1つ又
はそれ以上の予測子及び1つ及びそれ以上の運動ベクト
ルを識別し、従って運動フィールドを発生する。本発明
方法を説明する場合に、P又はIタイプの2つの逐次的
なフィールド(従って、M+2に等しいフィールドの総
数が考慮される)の間の時間的距離(以前に、Mに等し
く固定されている)に等しい数の1組のフィールドを参
照する。2つの逐次的なピクチャの間の時間的距離をフ
ィールド期間に等しいものであるとし、且つM+2個の
ピクチャの全てについて既に運動推定しておりそれらの
夫々の運動フィールドを得ているものと仮定する。
【0048】このピクチャのシーケンスにおいて場面の
変化が発生しなかったと仮定すると、推定は図2bに示
したように行われる。然しながら、例えばQB1及びQ
B2の間において場面の変化が発生した場合には、推定
は図2cに示したように効果的に発生すべきである。従
って、ピクチャQB1はQBnが属する場面に関するもの
であるから、QB1はQPn-1によってのみ予測されねば
ならなず、且つ別の場面に属するQBnによって予測さ
れるものであってはならない。同一のことがQB2及び
QBM-1についても成立し、それはQPnに関してのみ予
測されねばならず且つQPn-1に関して予測されるもの
であってはならない。このことは、QPnに対して適用
することは不可能であり、それは逐次的な及び/又は先
行するピクチャの予測に対する基礎をなすものであり且
つQPn-1に関して予測されるものではないので、全て
がイントラ(intra)としてコード化されたマクロ
ブロックを有するものでなければならず、従ってIピク
チャとなる。
【0049】従って、場面の変化の精密な識別が正確な
ピクチャ予測を行うために極めて重要なものである。本
発明方法は、近くのマクロブロックに属する運動ベクト
ルの間に存在する相関を利用する。シーケンスにおい
て、場面の変化が存在しない場合には、運動推定アルゴ
リズムが順番付けした運動フィールドを発生する。何故
ならば、それらは、種々のピクチャの間のオブジェクト
の実際の移動を決定するからである。
【0050】それによって、オブジェクトを形成するピ
クセルの全てのマクロブロックは同一の方向にシフト
し、従って、同一の運動ベクトルを有する。然しなが
ら、場面の変化が発生すると、運動推定アルゴリズムは
相関することのない運動フィールドを発生する。何故な
らば、それらはオブジェクトの実際の運動を決定するも
のではないからである。該アルゴリズムは他の場面に属
するものであって且つそれらを全く包含していない蓋然
性があるピクチャに関してのピクチャ内に包含される全
ての要素の移動を決定することを試みる。従って、オブ
ジェクトを構成するピクセルの全てのマクロブロックは
相関していない運動ベクトルを有しており、各ベクトル
は他のものとは異なる方向と値とを有している。
【0051】この状態は不満足な運動推定を発生し且つ
多くのマクロブロックはイントラ(Iピクチャ)として
コード化される。運動推定のアルゴリズムによって見つ
けられた移動ベクトルの「有効性」を決定するために、
「平滑性」と呼ばれるピクチャ運動フィールドの配置の
インデックスが導入される。この平滑性インデックスは
次式によって定義される。
【0052】
【数2】 尚、 ※mv_MB(.,.)はマクロブロックB
M(.,.)と関連する運動ベクトルであり; ※和のインデックスXは、周辺のものを除いて考慮中の
ピクチャの全てのマクロブロックに対して延長されるも
のであることを意味しており; ※△x及び△yは図2dに示したように、実際のマクロ
ブロックMB(i,j)とマクロブロックM
B(.,.)のうちの1つとの間の運動ベクトル座標の
差であり; ※インデックスh(h=1,2,3,4)は、MB
(i,j)と4個のMbh(.,.)のうちの各々との
間の△x及び△yが計算されることを意味し; ※Nbは周辺のものを除いて該ピクチャ内に含まれるマ
クロブロックの数である。
【0053】場面の変化は以下の2つのファクタを結合
させることによって図3の手法に従って決定される。即
ち、 ※処理中のフィールド又はピクチャの多数のマクロブロ
ックはイントラとしてコード化され且つあるスレッシュ
ホールド数より大きいものが統計的考察によって決定さ
れ; ※両方とも最後のピクチャの平均平滑性インデックスを
参照する2つのスレッシュホールドに関する平滑性イン
デックスの変化、これらのスレッシュホールドも統計的
考察から派生される。
【0054】これら2つの条件が同時的に発生すると、
場面の変化を信頼性をもって決定することが可能であ
り、それにより、場面の変化が存在する場合にも効果的
な運動推定の維持を確保することが可能である。少なく
とも2つの別個のインデックスを組み合わせて使用する
ことが場面の変化の偶発的な認識を防止する上で効果的
なものであることが判明した。
【0055】場面の変化が発生しない場合であっても、
例えば、ノイズによって影響されたピクチャの場合にお
いては多数のマクロブロックがイントラとしてコード化
される場合があり、且つ、そのような状況の場合におい
ては、イントラとしてコード化されたマクロブロックの
数の他に平滑性インデックスを使用することは効果的な
判別を与える。同様に、ズームの場合においては、平滑
性インデックスが増加するがイントラとしてコード化さ
れたマクロブロックの数はそれ程顕著に増加するもので
はない。
【0056】図4は2つの場面の変化と1つのズームを
有する卓球遊戯シーケンスに対する平滑性インデックス
を示している。2つの場面の変化は矢印で示した2つの
点に一致しており、平滑性インデックスは顕著なピーク
を有しており、一方それは該シーケンスの残部に対して
はほぼ一定に留まっている。ズームはフレーム番号6と
一致しており、その点において平滑性インデックスがイ
ンクリメント即ち増加しており、それはあたかも場面の
変化があったかのように誤って解釈される可能性があ
る。然しながら、イントラとしてコード化されるマクロ
ブロックの数は低い値に留まるので、このような誤った
解釈は回避される。
【0057】図4から、最後のピクチャの平均平滑性値
に基づいて上述した平滑性スレッシュホールドの計算を
行うことが如何に重要なものであるかを理解することが
可能である。番号10から番号52へのフレームはこの
シーケンスの他のフレームのものより一層高い平均平滑
性インデックスを有している。
【0058】場面の変化を決定するアルゴリズムは以下
の通りである。
【0059】※ピクチャの外側クラウン(冠部分)のも
のを除いて該ピクチャの全てのマクロブロックの間にお
いての局所的平滑性インデックス(=local_sm
ooth)の計算 ※イントラ(intra)としてコード化されたマクロ
ブロックの数(=number_of_intra)の
計算 ※最後の4個(1例として)のピクチャの平均平滑性イ
ンデックス(=average_smooth)の計算 ※スレッシュホールド1(threshold1)=a
verage_smooth×α ※スレッシュホールド2(threshold2)=a
verage_smooth×β ※スレッシュホールド3(threshold3)=n
umber_of_intra×χ 尚、α,β,χは数値係数である。
【0060】※number_of_intra>th
reshold3及びlocal_smooth>th
reshold1又はlocal_smooth<th
reshold2が成立する場合には、場面の変化があ
り、そうでない場合には、場面の変化は存在しない。
【0061】本発明方法の有用性は、例えば、前述した
欧州特許出願第98830163.6号に記載されてい
る反復的階層的推定器及び階層的推定器における処理の
逐次的ステップを実施する運動推定アルゴリズムの場合
に増加する。実際に、中間に存在する場面の変化の識別
はステップノイズ推定アルゴリズムの中間点において実
施することが可能であり、且つその結果は全体的な最適
化のための運動推定アルゴリズムの逐次的ステップを条
件付けするために使用することが可能である。本発明
は、特に反復的階層的推定器にとって適している。何故
ならば、それは特に、首尾一貫した運動ベクトルフィー
ルドを発生し、且つ隣接するマクロブロックに関連する
変換ベクトルの間のこのような増強された相関は、本発
明方法が場面の変化を時期を得てより信頼性を持って検
知することを可能とさせる。
【0062】以上、本発明の具体的実施の態様について
詳細に説明したが、本発明は、これら具体例にのみ制限
されるべきものではなく、本発明の技術的範囲を逸脱す
ることなしに種々の変形が可能であることは勿論であ
る。
【図面の簡単な説明】
【図1】 本発明の対象である「運動推定器」と呼ばれ
るブロックを包含するMPEG−2 MP@MLビデオ
コーダーの機能的概略図。
【図2】 図1のMPEG−2 MP@MLコーダーの
アーキテクチュアを示した概略ブロック図。
【図2a】 あるQ2ピクチャ上でとられたマクロブロ
ックの位置を示しており水平の点線矢印がスキャニング
の順番を表わしている概略図。
【図2b】 ある数のピクチャに関して実施される運動
推定の通常のメカニズムを示した概略図。
【図2c】 QB1ピクチャとQB2ピクチャとの間で場
面の変化が発生したことを考慮に入れた本発明に従う運
動推定の修正したメカニズムを示した概略図。
【図2d】 平滑性インデックスを確立する上で考慮に
入れられるマクロブロック(周辺のものではない)の相
対的位置を示した概略図。
【図3】 本発明に基づいて場面の変化を検知するため
の手順を示した概略図。
【図4】 卓球遊戯期間中におけるピクチャの典型的シ
ーケンスに対する平滑性インデックスを示したグラフ
図。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ダニエーレ バーニ イタリア国, 22056 オルギアーテ モ ルゴラ, ビア プロメッシ スポシ 4 (72)発明者 ルカ ペッツオーニ イタリア国, 20032 コルマーノ, ビ ア クレリチ 2

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 ビデオピクチャのコーディングシステム
    用の逐次的ピクチャフィールドからの運動推定方法にお
    いて、逐次的ピクチャ(予測ピクチャ、双方向予測ピク
    チャ)をコード化するために使用される予測エラーを動
    的に計算するために格納され且つ使用される基準ピクチ
    ャ(イントラコード化ピクチャ)を使用してピクチャを
    デコーディングし、前記ピクチャが分割されるピクセル
    のマクロブロックによって実施される先行するI又はP
    ピクチャ(予測ピクチャ)又は先行するI又はPピクチ
    ャ及び/又は後続するI又はPピクチャ(双方向予測ピ
    クチャ)に関しての運動予測を介して時間的冗長性が取
    除かれる運動推定方法において、 周辺マクロブロックを除いてピクチャの細分化の全ての
    マクロブロックの運動ベクトルを解析することによって
    各ピクチャの運動フィールドの平滑性インデックスを定
    義し且つ計算し、 ある予め確立した数の最後に処置したピクチャに対する
    平均平滑性インデックスを計算し、 イントロマクロブロックとしてコード化されているもの
    と同一のピクチャに属するマクロブロックの数をモニタ
    し、 あるスレッシュホールド数と比較してより高いイントラ
    としてコード化されているのと同一のピクチャに属する
    マクロブロックの数及び/又は前記予め確立されている
    数の最後に処理したピクチャの平滑性インデックスの平
    均値に基づいて上部及び底部スレッシュホールドと比較
    して2つの逐次的ピクチャの平滑性インデックスの変化
    の結合から場面の変化を識別し、 前記場面の変化の識別を使用して前記場面の変化より先
    行するピクチャに対して前方運動推定のみを使用し且つ
    前記場面の変化に続くピクチャに対する後方運動推定の
    みを使用してピクチャの予測計算を行わせる、ことを特
    徴とする方法。
  2. 【請求項2】 請求項1において、前記平滑性インデッ
    クスが、 【数1】 尚、 ※mv_MB(.,.)はマクロブロックM
    B(.,.)と関連する運動ベクトルである; ※和のインデックスXは、その和が周辺のものを除いて
    処理中のピクチャの全てのマクロブロックに対して拡張
    されることを意味する; ※△x及び△yは実際のマクロブロックMB(i,j)
    と該マクロブロックMB(.,.)のうちの1つとの間
    の運動ベクトル座標の差である; ※インデックスh(h=1,2,3,4)は前記マクロ
    ブロックのうちの前記他の1つを識別する; ※Nbは周辺のものを除いたピクチャ内に包含されるマ
    クロブロックの総数である、 ことを特徴とする方法。
  3. 【請求項3】 逐次的なピクチャの同名のフィールドか
    らの運動推定システムを有するMPEGエンコーダにお
    いて、実施される運動推定のアルゴリズムが請求項1の
    方法に従って介在する場面の変化の識別によって条件付
    けされることを特徴とするMPEGエンコーダ。
JP11223009A 1998-08-06 1999-08-05 ビデオエンコ―ダの運動推定器における場面の変化の検知 Pending JP2000083257A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP98830484.6 1998-08-06
EP98830484A EP0979011A1 (en) 1998-08-06 1998-08-06 Detection of a change of scene in a motion estimator of a video encoder

Publications (1)

Publication Number Publication Date
JP2000083257A true JP2000083257A (ja) 2000-03-21

Family

ID=8236748

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11223009A Pending JP2000083257A (ja) 1998-08-06 1999-08-05 ビデオエンコ―ダの運動推定器における場面の変化の検知

Country Status (3)

Country Link
US (1) US6480543B1 (ja)
EP (1) EP0979011A1 (ja)
JP (1) JP2000083257A (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6014182A (en) * 1997-10-10 2000-01-11 Faroudja Laboratories, Inc. Film source video detection
EP1134981A1 (en) * 2000-03-17 2001-09-19 STMicroelectronics S.r.l. Automatic setting of optimal search window dimensions for motion estimation
FR2821998A1 (fr) * 2001-03-06 2002-09-13 Koninkl Philips Electronics Nv Procede de codage d'images numeriques base sur la dissimulation d'erreurs
FI110745B (fi) * 2001-11-13 2003-03-14 Hantro Products Oy Menetelmä ja laite peräkkäisten kuvien koodaamiseksi
KR100693669B1 (ko) * 2003-03-03 2007-03-09 엘지전자 주식회사 피일드 매크로 블록의 레퍼런스 픽쳐 결정 방법
FR2853793B1 (fr) * 2003-04-09 2005-05-27 France Telecom Procede et dispositif de detection d'un changement de plan dans une sequence video, programme d'ordinateur et procede d'indexation correspondants
GB2417630B (en) * 2004-08-27 2010-03-10 Tandberg Television Asa Control of frame types in video compression
CN100452878C (zh) * 2005-03-28 2009-01-14 腾讯科技(深圳)有限公司 一种视频编码中的运动图像处理方法
US8218811B2 (en) 2007-09-28 2012-07-10 Uti Limited Partnership Method and system for video interaction based on motion swarms
EP2224745B1 (en) * 2009-02-27 2019-11-06 STMicroelectronics Srl Temporal scalability in case of scene changes
US8891626B1 (en) 2011-04-05 2014-11-18 Google Inc. Center of motion for encoding motion fields
CN103797795B (zh) 2011-07-01 2017-07-28 谷歌技术控股有限责任公司 用于运动矢量预测的方法和设备
US9185428B2 (en) 2011-11-04 2015-11-10 Google Technology Holdings LLC Motion vector scaling for non-uniform motion vector grid
US8908767B1 (en) 2012-02-09 2014-12-09 Google Inc. Temporal motion vector prediction
US9172970B1 (en) 2012-05-29 2015-10-27 Google Inc. Inter frame candidate selection for a video encoder
US11317101B2 (en) 2012-06-12 2022-04-26 Google Inc. Inter frame candidate selection for a video encoder
US9503746B2 (en) 2012-10-08 2016-11-22 Google Inc. Determine reference motion vectors
US9485515B2 (en) 2013-08-23 2016-11-01 Google Inc. Video coding using reference motion vectors
US9313493B1 (en) 2013-06-27 2016-04-12 Google Inc. Advanced motion estimation

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5594504A (en) * 1994-07-06 1997-01-14 Lucent Technologies Inc. Predictive video coding using a motion vector updating routine
JP3711571B2 (ja) * 1994-09-29 2005-11-02 ソニー株式会社 画像符号化装置及び画像符号化方法
US5774593A (en) * 1995-07-24 1998-06-30 University Of Washington Automatic scene decomposition and optimization of MPEG compressed video
JP2827997B2 (ja) * 1995-12-28 1998-11-25 日本電気株式会社 画像信号のアダマール変換符号化装置および復号装置
US5724100A (en) * 1996-02-26 1998-03-03 David Sarnoff Research Center, Inc. Method and apparatus for detecting scene-cuts in a block-based video coding system

Also Published As

Publication number Publication date
EP0979011A1 (en) 2000-02-09
US6480543B1 (en) 2002-11-12

Similar Documents

Publication Publication Date Title
JP3297293B2 (ja) 動画像復号方法および動画像復号装置
KR100987765B1 (ko) 동영상 부호화기에서의 예측 수행 방법 및 장치
US8023562B2 (en) Real-time video coding/decoding
JP2000083257A (ja) ビデオエンコ―ダの運動推定器における場面の変化の検知
EP1078531A1 (en) Method and apparatus for encoding video information
CA2218865A1 (en) Hybrid hierarchical/full-search mpeg encoder motion estimation
KR20040069210A (ko) 코딩 정보 및 로컬 공간 특징을 이용한 디지털 비디오신호들의 후처리에서의 선명도 향상
US20070092007A1 (en) Methods and systems for video data processing employing frame/field region predictions in motion estimation
US6873657B2 (en) Method of and system for improving temporal consistency in sharpness enhancement for a video signal
Ismaeil et al. Efficient motion estimation using spatial and temporal motion vector prediction
US7881366B2 (en) Moving picture encoder
Paul et al. Video coding with dynamic background
US7433407B2 (en) Method for hierarchical motion estimation
JP2000165884A (ja) フィ―ルド/フレ―ムに対する決定ステップ及び運動ベクトルdctを有するビデオピクチャ圧縮及びコ―ディング
US6697430B1 (en) MPEG encoder
JP4518599B2 (ja) 運動推定フェーズにおける3:2プルダウンの検知及び最適化したビデオ圧縮エンコーダ
JP4169767B2 (ja) 符号化方法
KR100617177B1 (ko) 움직임 추정 방법
JP2007110672A (ja) 符号化方法
Choi et al. Adaptive image quantization using total variation classification
JP2002064748A (ja) 動画像内のテロップ領域検出装置
JPH07264594A (ja) 動画像の動き補償予測符号化方法
JP2005175891A (ja) 記録装置
Mishra et al. Performance analysis of block matching criterion in video data on embedded processor using VHDL
JP2009153227A (ja) 画像処理装置およびそれを用いた撮像装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091110

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100205

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100210

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100310

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100315

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100407

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100412

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100706