JP2008507914A - 時間的なビデオ圧縮における運動ベクトル予測のための方法および装置 - Google Patents

時間的なビデオ圧縮における運動ベクトル予測のための方法および装置 Download PDF

Info

Publication number
JP2008507914A
JP2008507914A JP2007522724A JP2007522724A JP2008507914A JP 2008507914 A JP2008507914 A JP 2008507914A JP 2007522724 A JP2007522724 A JP 2007522724A JP 2007522724 A JP2007522724 A JP 2007522724A JP 2008507914 A JP2008507914 A JP 2008507914A
Authority
JP
Japan
Prior art keywords
motion vector
motion
video frame
vectors
motion vectors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007522724A
Other languages
English (en)
Other versions
JP4699460B2 (ja
Inventor
ルオ、エドワード
シ、ファン
オグズ、セイフラー
ラビーンドラン、ビジャヤラクシュミ・アール.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2008507914A publication Critical patent/JP2008507914A/ja
Application granted granted Critical
Publication of JP4699460B2 publication Critical patent/JP4699460B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection
    • H04N5/145Movement estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

関連する運動ベクトルを持たないブロックを含む一組の近隣ブロックを持つ現在のブロックに対して、運動ベクトル予測のための方法が開示される。方法は、関連する運動ベクトルを持たない近隣ブロックの組中の各ブロックに対して候補運動ベクトルを引き出し、関連する運動ベクトルを持たない近隣ブロックの組中の各ブロックに対して候補運動ベクトルを使用して、現在のブロックのための現在の運動ベクトルを予測する。方法を行うための装置がまた開示される。
【選択図】 図6

Description

米国特許法第119条の下の優先権主張
特許の本出願は、2004年7月20日に申請され、この譲受人に譲渡され、ここに引用文献として明らかに組み込まれた仮出願番号60/589,818、題名「Method and Apparatus for Motion Vector Prediction in Temporal Video Compression]に対して優先権を主張する。
本発明は、一般にビデオ圧縮に係り、特に、時間的なビデオ圧縮における運動ベクトル予測の方法と装置に関する。
運動推定は、ビデオシーケンスの時間的な冗長度が利用されるビデオコーディングシステムにおいて重大な特徴である。運動推定は、以前に復号されたフレーム中のブロックに基づいて予測されるフレームの中で、現在のマクロブロック(あるいはブロック)を推定する過程である。一般に、その過程は、ひずみを最小化する尺度に基づいた現在のブロックと一致するブロックを求めて予測されたフレームを探索することを必要とする。例えば、現在使用される尺度は、絶対差(SAD)の合計および平方差(SSD)の合計を含んでいる。典型的には、その探索は、運動ベクトル予測を使用して派生した最初の当て推量(参照フレーム中の位置)に基づいて始まる。
ビデオコーデックが運動ベクトル予測に多数の参照フレームおよび多数のマクロブロック・タイプを組込むところで、運動ベクトル予測過程は非常に広範囲な計算を導入する。実験は、運動推定が合計の符号化時間の60%(1つの参照フレーム)から90%(5つの参照フレーム)を消費することができることを示した。レートひずみを維持しながら運動推定の計算の複雑さを縮小することは、挑戦的なトピックである。現在、関連する研究は、より正確な運動ベクトル予報値を得こと、および処理時間を縮小するかあるいはピクセル探索ステップをスキップさえするために、ゼロブロックを検知することにより早い終結を適用することに集中する。予測された運動ベクトルの正確さは、合計の運動推定時間の制御に批判的である。ISO/EEC MPEG&ITU−T VCEG(ISO/IEC JTC1/SC29/WG11およびITU−T SG16 Q.6)JVT−I050、9THミーティング、2003年9月(JVT標準)の共同のビデオチーム(JVT)によって提案されるようなH.264ビデオコーデックにおける運動ベクトル予測のための標準において、様々な方法がより多くの運動ベクトル候補の導入により運動ベクトルの予測を改善するために使用される。
例えば、図1で示されるように、現在のブロック102の左、上および右上の隣接したブロックは現在のブロックの運動ベクトルを予測するために使用される:
pred mv=median(mv A,mv B,mv C)
ここにpred mvは中央予報値として定義され、mv A,mv B,mv CはそれぞれブロックA104、B106、C108の運動ベクトルである。7つの予測間モードの運動関係をよりよく利用するために、1つの提案が、JVT標準中の提案されたサーチ順序ではなくモード1から7までの階層的サーチ順序を適用する。現在のブロックの運動ベクトルを予測するために候補と見なされる現在のブロックの上部層の運動ベクトルは、図2の中で示される。他の提案は、対応する近隣のブロックおよびすべての参照フレームの運動ベクトルの考慮により、時間的なシーケンスの中でより多くの運動ベクトル候補を使用する。図3および図4で例証されるように、前および他の参照フレームの対応する運動ベクトルは、予測候補として同様に使用される。図4の多数の参照フレームモデルでは、参照フレーム中の運動ベクトルが現在のフレームからのその時間的距離によって基準化されることが注目されるべきである。
運動ベクトル予測の精度は、運動推定における早い終了、速いサーチ方法および速いモード決定(例えば、モードをスキップする)のように、計算上の削減ステップを制御することにおいて重大な役割を奏する。
ここに記述された実施例は、運動ベクトル予測のための4つのアプローチ、およびレートひずみ検知で改善された性能を達成するこれらのアプローチを組込む方式を供給する。ここに記述された方法と装置は、運動ベクトル予測の正確さを改善する。一実施例では、現在のブロックのすべての非偶発のブロックの運動ベクトルは、オリジナルのビデオフレームのより低い解像度バージョンからのより空間の相関関係情報の利用により、運動ベクトル予報値を計算することに組み入れられる。他の実施例では、カラー情報の使用により、より正確な運動ベクトルを予測するために、色光度成分が輝度成分に統合される。また他の実施例では、システムは、ビデオストリーム送信システムにおけるMPEG2メタデータストリームに存在するかもしれない運動ベクトル情報を考慮に入れる。さらに他の実施例では、運動ベクトル処理技術は、技術の正確さを改善するため誤りの運動ベクトルを除去する(即ち、平滑する)ように適用される。
他の目的、特徴および利点は、次の詳細な説明から当業者に明白になるだろう。しかしながら、詳細な説明および特定の例は、好ましい実施例を示すが限定ではなく例示の方法で与えられる。実施例の範囲内の多くの変更および修正がそれの精神から逸脱することなく行なわれ、そのような修正をすべて含んでいるべきである。
発明は、添付の図面を参照することにより、より容易に理解される。
図において同様な数字は同様な素子を指す。
運動ベクトル予測の精度は、早い終結、速いサーチ方法および高速モード決定(例えば、モードをスキップする。)のように次の計算削減ステップの制御における重要な役割を演じる。方法は、ビデオコーデック中の運動ベクトルの生成を改善する4つの新方式を提案する。一実施例では、マクロブロック間の空間の相関を利用して、ビデオフレームはより低い解像度バージョン・ビデオフレームを作成するために最初にダウンサンプルされ、また、運動推定がこのより低い解像度ビデオフレームで行なわれる。従って、「より粗い」運動ベクトルと呼ばれた運動ベクトルの組が得られる。より粗い運動ベクトルはオリジナルのビデオフレームに写像される。したがって、より粗い運動ベクトル(より低い解像度ビデオフレームに由来した)および偶発の運動ベクトルを含む、すべての近隣ブロックの運動ベクトルは、運動ベクトル候補として利用することができる。他の実施例では、アップストリームのMPEG-2符号器からのビデオコーデックに供給されたメタデータ情報(それは対応するブロックの運動ベクトルを予測するのに使用することができる各マクロブロックのMPEG-2運動ベクトル情報を含んでいる)が使用される。さらに他の実施例では、輝度成分が完全にカラー情報を利用することへの運動ベクトルの計算に組み入れられる。さらに他の実施例では、運動ベクトル平滑化技術が誤って予測された運動ベクトルを修正し、雑音を削除することを試みるように適用される。
1. 非偶発の運動ベクトル
図5は、図6の流れ図の中で示されるような予測のプロセス600において、現在のフレーム500の現在のブロック502の運動ベクトルを予測するために、非偶発の運動ベクトルの使用を示す。JVT標準とは対照的に、以前に注意されたように、3つの偶発のブロックだけが予測に使用される場合、一実施例において、現在のブロック502に近隣のブロック504−518のすべては、ステップ602およびステップ604で示されるように、フレームがイントラ・フレーム(Iフレーム)以外のフレームシーケンスにおいてすべてのフレームの運動ベクトル予測に対する候補として使用されてもよい。運動ベクトル予測がフレームのこれらのタイプに必要とされないので、予測はIフレームについて行なわれない。しかしながら、他のすべてのフレームについては、以下のステップで記述されるように、すべての近隣ブロックに対する運動ベクトルは、「より粗い」運動ベクトルの生成によって利用可能になる。したがって、ビデオフレームがIフレームでないとき、ビデオフレームはより低い解像度フレーム702を作成するためにダウンサンプルされ、偶発の運動ベクトルが利用可能であるか否かが決定される。例として図5を参照すると、ブロック512(D)、ブロック518(E)、ブロック516(F)およびブロック514(G)が走査順序にしたがってまだ処理されていないので、偶発の運動ベクトルはブロック504(A)、ブロック506(B)、ブロック508(C)およびブロック510(H)のためにのみ利用可能である。したがって、図7で示されるように、演算はステップ604を継続し、そこでビデオフレーム500がより低い解像度フレーム702を作成するためにダウンサンプルされる。その後、運動推定は、ステップ608においてより低い解像度ビデオフレーム702で行なわれ、一組の「より粗い」運動ベクトルとして参照される一組の運動ベクトルを引き出し、その後、ステップ610においてかつ図7で例証されるようにオリジナルのビデオフレームに写像される。
したがって、より粗い運動ベクトルが使用されてもよいとともに、偶発の運動ベクトルが利用可能でない場合でさえ、運動ベクトル予測はステップ612で行なわれてもよい。例えば、一実施例では、図5を参照して、現在のブロック502の予測は偶発の運動ベクトルに対して現在の標準中のパターンを使用して行なわれ、ブロック510(H)、ブロック506(B)およびブロック508(C)だけが予測のために使用されるが、非偶発のブロック(即ち、より粗い運動ベクトル)から由来するような付加的なベクトルも使用される。特に、ブロック510(H)、ブロック506(B)およびブロック508(C)のための3つの運動ベクトルに対する値の組は以下のように決定される:
1.Ηが利用可能でない場合(画像の外部に位置する)、そのMVは(0,0)に設定される。
2.Cが利用可能でない場合、そのMVはAに設定される。
3.BとCの両方が利用可能でない場合、両方のMVが(0,0)に設定される。
これらの運動ベクトルは、中央の予報値のためにブロック512(D)、ブロック518(E)、ブロック516(F)およびブロック514(G)からのより粗い運動ベクトルと結合される。
他の実施例では、使用された参照ブロックはすべてのブロック(即ち、ブロック504(A)、ブロック506(B)、ブロック508(C)、ブロック512(D)、ブロック518(E)、ブロック516の(F)、ブロック514(G)、およびブロック510(H))を含むだろう。そのとき、中央の予報値は次のように計算される:
pred mv=mediam(mv A,mv B,mv C,mv D,mv E,mv F,mv G,mv H,mv Prev Current)
ここに、mv Prev Currentは前の参照フレーム中の対応するブロックの運動ベクトルとして定義される。
2. MPEG2前段のメタデータからの運動ベクトル情報
図8はビデオ伝送システム800のデータフローを示し、ここにビデオコーデック806に供給されたビデオデータソースがMPEG2復号器802からの復号されたMPEG2ビデオストリームから送信される。一実施例では、オリジナルソース・ビデオデータはすべてMPEG2ストリームとして送信され、次に復号される。復号された生ビデオデータは、さらに処理され、プリプロセッサ804によって4分の1VGA(QVGA)サイズに縮尺され、H.264のような新しいフォーマットへ符号化するためにビデオコーデック806に提示される。ビデオコーデック806は、さらにフレームサイズ、フレーム率、マクロブロック・タイプおよび各マクロブロックの運動ベクトルのようなMPEG2メタデータを受信する。MPEG2運動ベクトルは、一実施例において、符号化処理の間に対応するマクロブロックの運動ベクトル予測候補としてビデオコーデック806によってこのように使用される。一実施例中で、マクロブロックのサイズが16×16のブロック・サイズである場合、MPEG2の運動ベクトルもまたすべてのサブレイヤ・ブロックのための上層の運動ベクトルと見なされる。
一実施例では、前のフォーマットから新しいフォーマットへメタデータを使用する概念は、完全に符号化する(transcoding)シナリオにのみ当てはまり、そこでは入力フォーマット復号からの符号化パラメータおよび側面の情報がビデオコーデック806のような目標符号器において利用可能である。さらに、運動ベクトルがPおよびBフレームの両方のための前フレームから予測されるので、直ちに連続する将来のフレームのためのメタデータから運動ベクトルを予測することのみが適切である。図9で示されるように、時間t−1でシーケンス中の運動ベクトルは時間tで対応するブロックシーケンスの運動ベクトルを予測するためにのみ使用される。一実施例では、現在のフレームの参照フレーム番号は、前の参照フレームのメタデータに関連した運動ベクトルを見つけるために使用される。
3. 色運動推定
MPEG−4およびH.264のような現在のビデオコーデック標準において、両方の色光度成分(CbとCr)の運動ベクトルは、対応する輝度成分(Y)に由来する。そして色光度成分はレートひずみ(RD)中で省略され、輝度成分が十分な情報および付加的でないオーバヘッドを提供することができるという仮定による運動ベクトル予測の処理は、色光度を予測することを必要としない。しかしながら、低輝度あるいは詳細なカラー情報を持っているビデオシーケンスについては、色光度成分はより正確な運動ベクトル予測に役立つ。したがって、一実施例では、運動推定は輝度成分および色光度成分の両方を使用する。例えば、クロマ情報が豊富なカラー情報を備えたオブジェクトを持っているビデオフレーム中で取り出される時、オブジェクトの運動は予測するのがより難しくなる。したがって、色運動予測を使用する予測されたビデオフレームは、ルーマ成分の運動予測のみで予測されたものより少数のアーティファクトを持っていそうである。
図10を見ると、色光度成分が輝度成分と比較された水平および垂直座標に半分サンプリングされる。フレーム符号化だけが考慮されなら、色光度成分の運動ベクトルは次のように計算される:
MV X=l/2* MV
MV Y=l/2* MV
ここに、(MV X,MV Y)はルーマ運動ベクトルであり、(MV X,MV Y)はクロマ運動ベクトルである。一実施例では、クロマ運動ベクトルは、運動ベクトル予測およびRD最適化に組み入れられるクロマ運動ベクトルのために絶対差(SAD)の合計を計算するのに使用される。ルーマのみに関するRD最適化方程式は次のとおりである:
L=R+λD
したがって、運動予測はこのラグランジュの費用関数の最小化として見ることができる。ここで、ひずみDは輝度成分のSADとして測定された予測誤差を表わし、Rはビット数であり、ラグランジュ乗算器は量子化パラメータ(QP)と対応付けられ、その値はRDトレードオフを制御する。色光度成分を考えれば、次の費用関数が導入される:
L=R+λ(W*D+W* D
∈(1,2),W∈(0,1)
ここに、DおよびDはルーマおよびクロマ成分の中のひずみをそれぞれ表わし、WおよびWは、特定のビデオシーケンスに適応性のある実験的な加重パラメータである。一実施例において、クロマ成分がより少ない情報を持つので、そのSAD計算は単に整数の価値のある運動ベクトルのみを使用し、したがって、補間は必要ではない。
4. 運動ベクトルの平滑化
符号化されたビデオシーケンスのビデオ捕捉および伝送中に遭遇するどんな雑音あるいは失われたフレームも、通常プレイバック中に、シーケンスの品質の削減に至る。さらに、運動ベクトル予測処理と一致することの阻害は、さらに運動ベクトル予測における誤りを導入する。ベクトル中央のフィルタリング(VMF)は、ビデオシーケンスの詳細を保存している間、運動ベクトル予測精度を改善し、かつ雑音を縮小するために、他の有効なアプローチとして適用されてもよい。VMFの後ろの根本概念は、自然なビデオシーケンスの近隣の運動ベクトルが互いと常に相関しているということである。図11で例証されるように、3つのタイプの運動ベクトルフィールドが、滑らかな領域の運動ベクトルフィールド1110、運動ベクトルフィールド1120におけるアウトライアー運動ベクトル1122、および運動ベクトルフィールド1130における他の運動ベクトルの方向と反対の方向を持っている、複数の運動ベクトル1132(a)-(c)によって定義されたオブジェクト端を示す運動ベクトルフィールド1130を含む、運動ベクトル予測処理の後に現われてもよい。
一実施例では、3×3のブロック・サイズが中央の演算を行なうために選択されている。図11の参照を続けると、「間違った」(あるいはアウトライアー)運動ベクトルはアウトライアー運動ベクトルフィールド1120で修正することができる。しかしながら、運動ベクトルフィールド1130中でのように、オブジェクト境界がブロックの内側で生じる場合、VMFは使用することができない。一実施例では、端検出とオブジェクトの区分化方法はこの状況に取り組むために使用されてもよい。
提案された運動ベクトル予測方法の各々は独立して、または組み合わせられて使用することができる。例えば一実施例では、完全に符号化する間、入力ビデオビット列において利用可能な運動ベクトルデータが抽出され、ビデオコーデック806のような目標符号器中で使用するために保存される。このデータは入ってくるビデオフレームに関係する。運動ベクトルデータは目標符号器へのソースフレームインプットに再写像される。単一参照フレームが使用される処理では、前のNフレームに関する運動ベクトルデータはこれらのNフレームに関する運動軌跡を見つけるためにモデル化することができる。その後、運動ベクトル平滑化が適用されることができ、アウトライアーを削除し、かつ軌跡の正確さを改善する。軌跡の推定は符号化されるべきブロックの運動ベクトルのより正確な推定をもたらす。さらに、入力ビデオビット列から抽出された運動ベクトルデータは真実の運動ベクトルかもしれないし、そうでないかもしれない。これらの運動ベクトルの正確さは、典型的にはアップストリームのソース符号器で使用される運動サーチアルゴリズムに依存する。これらの運動ベクトルに基づき各復号されたフレームの運動フィールドを引き出すこと、および適切な運動ベクトル平滑化技術を適用することは、アウトライアーを除去するのを支援するだろう。運動ベクトルの正確さを確認することができない場合、空間の近隣
あるいは配列された近隣の運動ベクトルに基づいたもののような他の方法が適用され得る。
十分な情報が提案された方法の2つ以上を可能にするのに利用可能な場合、運動ベクトル推定を引き出すことの次の優先順位が提案されている:
1.メタデータまたは前処理関数から利用可能な追加情報に基づいた各方法(例えば、0−1からの範囲を使用して)の正確さを順位付ける。例えば、デインターレーシングまたは逆テレビ映画が前処理の一部として使用された場合、運動ベクトルデータは適切に写像される必要がある。運動ベクトル平滑化の結果が曖昧な場合、この方法の正確さは貧弱である。抽出された運動ベクトル、運動ベクトル平滑化運動ベクトルおよびあらかじめ処理されかつ再写像された運動ベクトルが接近している場合、運動ベクトルのこの推定の正確さは高い。さらに、クロマ運動推定については、正確さはソース内容中のルーマ情報に関するクロマ情報の割合に依存する。可能な場合、すべての参照フレームからの非偶発および偶発の運動ベクトルが使用されるべきである。
2.その順位付けに基づいた各方法に重みを適用する。
3.方法を選択するために非線形の選択算法を適用する。
ビデオコーデックへの上記追加は、運動ベクトル予測処理の正確さを改善することを試みる。計算は各方法の実施を含むが、運動ベクトル予測の正確さの改良は、画素探索ステップ、SAD計算およびRD最適化で計算を減少するだろう。したがって、合計の符号化時間は減少され、よりよいビデオ品質が達成されるだろう。
図12に、無線システムにおけるアクセス端末1202xおよびアクセス・ポイント1204xのブロック図を示す。ここで検討される「アクセス端末」は、音声および/またはデータの接続性をユーザに提供するデバイスを指す。アクセス端末はラップトップ・コンピュータまたはデスクトップ・コンピュータのような計算用デバイスに接続されるかもしれないし、または、携帯情報端末のような自蔵デバイスであるかもしれない。アクセス端末は加入者ユニット、移動局、移動体、遠隔局、遠隔端末、ユーザ端末、ユーザエージェント、またはユーザ機器を指すこともできる。アクセス端末は、加入者局、無線デバイス、携帯電話、PCS電話、コードレス電話、セッション開始プロトコル(SIP)電話、無線ローカルループ(WLL)局、携帯情報端末(PDA)、無線接続能力を有するハンドヘルドデバイス、または無線モデムに接続された他の処理デバイスであるかもしれない。ここで検討される「アクセス・ポイント」は、1つ以上のセクタを通して無線経由インタフェースでアクセス端末と通信するアクセス網におけるデバイスを指す。アクセス・ポイントは、受信した無線インタフェースフレームをIPパケットに変換することによって、アクセス端末とIP網を含むかもしれない残りのアクセス網の間のルータとして動作する。また、アクセス・ポイントは無線インタフェースに対する属性管理を調整する。
逆方向リンクに関して、アクセス端末1202xにおいて、送信(TX)データプロセッサ1214はデータバッファ1212からトラヒックデータを受信し、各データパケットを、選択した符号化および変調方式に基づいて処理(例えば符号化、インタリーブ、およびシンボルマップ)し、データシンボルを出力する。データシンボルはデータの変調シンボルであり、パイロットシンボルはパイロット(先験的に知られている)用の変調シンボルである。変調器1216は、逆方向リンク用のデータシンボル、パイロットシンボル、および場合により信号を受信し、変調および/またはシステムで特定される他の処理を実行(例えばOFDM)し、また出力チップのストリームを出力する。送信機ユニット(TMTR)1218は、出力チップストリームを処理(例えば、アナログへ変換、フィルタリング、増幅、および周波数アップコンバージョン)し、アンテナ1220から送信される変調信号を発生する。
アクセス・ポイント1204xにおいて、アクセスの端末の1202xおよびアクセス・ポイント1204xと交信中の他の端末によって送信された変調信号がアンテナ1252によって受信される。受信機ユニット(RCVR)1254はアンテナ1252からの受信信号を処理(例えば、調整およびディジタル化)し、受信サンプルを出力する。復調器(Demod)1256は処理する受信サンプルを処理(例えば復調および検出)し、検出データシンボルを出力する。これは、端末からアクセス・ポイント1204xへ送信されたデータシンボルの雑音を含む推定値である。受信(RX)データプロセッサ1258は、各端末に対して検出するデータシンボルを処理(例えばシンボル逆写像、デインターリーブおよび復号)し、その端末に対する復号データを出力する。
順方向リンクに関して、アクセス・ポイント1204xにおいて、トラヒックデータはデータシンボルを発生させるためのTXデータ処理装置1260によって処理される。変調器1262は、順方向リンクのためのデータシンボル、パイロットシンボル、および信号を受信し、変調および/または、他の適切な処理を実行(例えば、OFDM)し、出力チップストリームを出力する。これは、さらに送信機ユニット1264により調整され、アンテナ1252から送信される。順方向リンクの信号は、アクセス・ポイント1204xへ逆方向リンクで送信するすべての端末に対する制御器1270で生成される電力制御命令を含むかもしれない。アクセス端末1202xにおいて、アクセス・ポイント1204xによって送信された変調信号はアンテナ1220で受信され、受信機ユニット1222で調整およびディジタル化され、検出データシンボルを得るために復調器1224で処理される。RXデータプロセッサ1226は、検出したデータシンボルを処理し、端末に対する復号データおよび順方向リンクの信号を出力する。制御器1230は、電力制御命令を受信し、データ送信およびアクセス・ポイント1204xへの逆方向リンクでの送信電力を制御する。制御器1230および1270は、アクセス端末1202xおよびアクセス・ポイント1204xの動作をそれぞれ指示する。記憶ユニット1232および1272は、それぞれ制御器1230および1270によって用いられるプログラムコードおよびデータを格納する。
開示された実施例は次の技術:符号分割多元接続(CDMA)システム、複数キャリアCDMA(MC-CDMA)、広帯域CDMA(W-CDMA)、高速下り回線パケット接続(HSPDA)、時分割多元接続(TDMA)、周波数時分割多元接続(FDMA)システム、及び直交周波数時分割多元接続(OFDMA)システムのいずれにも、または組合せて適用される。
ここに開示された実施例に関連して記述された方法またはアルゴリズムのステップは直接ハードウェアにおいて、プロセッサによって実行されるソフトウェア・モジュールにおいて、またはその2つの組合せにおいて具体化される。ソフトウェア・モジュールはRAMメモリ、フラッシュ・メモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバブル・ディスク、CD-ROM、または他の形の当技術分野において知られている記憶媒体に常駐される。典型的な記憶媒体はそのようなプロセッサが記憶媒体から情報を読取り、記憶媒体へ情報を書込むことができるようにプロセッサと接続される。これに代るものでは、記憶媒体はプロセッサに一体化してもよい。プロセッサ及び記憶媒体はASICに常駐してもよい。ASICはユーザ端末に常駐してもよい。これに代るものでは、プロセッサ及び記憶媒体はユーザ端末に個別部品として常駐してもよい。
ここに述べた方法は、当業者に既知の様々な通信ハードウェア、プロセッサ及びシステム上で実施されることは注目すべきである。例えば、ここに述べたようにクライアントが操作する一般的な要求は、そのクライアントが内容及び情報を表示するディスプレイ、クライアントの操作を制御するプロセッサ、及びクライアントの操作に関係するデータ及びプログラムを記憶するメモリを持っていることである。一実施例では、クライアントはセルラー電話である。別の実施例では、クライアントは通信機能を持つ携帯用コンピュータである。さらに別の実施例では、クライアントは通信機能を持つパソコンである。その上、GPS受信器のようなハードウェアは様々な実施例を実施するためにクライアントにおいて必要に応じて組込まれる。
ここに開示された実施例に関連して記述された実例となる様々な論理ブロック、モジュール、及び回路はここに述べられた機能を実行するために設計された一般用途プロセッサ、ディジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲートアレイ(FPGA)または他のプログラマブル論理デバイス、個別ゲートまたはトランジスタ論理、個別ハードウェア部品、またはその組合せによって実施または実行される。一般用途プロセッサはマイクロプロセッサであるが、これに代るもので、そのプロセッサはあらゆる従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械でもよい。プロセッサはまた計算デバイスの組合せ、例えば、DSPとマイクロプロセッサの組合せ、複数のマイクロプロセッサ、DSPコアと連動する一以上のマイクロプロセッサ、または他のそのような構成として実施される。
上で述べた実施例は典型的な実施例である。当業者はここに開示された発明概念から逸脱することなく上述の実施例の多くの使用を行い、且つそこから出発することができる。これらの実施例への様々な修正は当業者には明白であり、ここに定義された一般的な原理は本発明の精神または範囲から逸脱することなく他の実施例、例えば、即時通信サービス或いはあらゆる一般的な無線データ通信アプリケーションに適用される。このように、本発明はここに示された実施例に限定されることを意図するものではないが、ここに開示された原理及び新規な特徴と合致する最も広い範囲を与えられるべきである。用語「典型的な(exemplary)」は「例(example)、事例(instance)、または例示(illustration)として役立つ」ことを意味するものとして専らここでは使用される。「典型的な」としてここに述べた実施例は他の実施例に対して好ましい、或いは有利であると必ずしも解釈されない。従って、発明はただ次の請求項の範囲によって定義されるべきである。
ある隣接したブロックを使用する先行技術の運動ベクトル予測方式を示す。 階層的探索方式を使用する運動ベクトル予測方式を示す。 前の参照フレームからの運動ベクトルを使用する運動ベクトル予測方式を示す。 前の参照フレームからの運動ベクトルを使用する運動ベクトル予測方式を示す。 運動ベクトルの予測のための非偶発参照ブロックの位置を示す。 運動ベクトルの予測のための非偶発参照ブロックの使用を示す流れ図である。 ダウンサンプルされたビデオフレームからのより粗い運動ベクトルの生成を示す図である。 ビデオ伝送システムにおけるデータフローを示す。 次のフレーム中の対応するブロックの運動ベクトルを予測するメタデータの使用を示す。 カラー画像中のルーマとクロマの成分を示す。 運動ベクトル予測の後に3つの典型的な運動ベクトルフィールド配列を示す。 無線システムのアクセス端末およびアクセス・ポイントのブロック図である。

Claims (28)

  1. 複数のエリアを含むビデオフレームにおいて、1つのエリアに対する運動ベクトル予測方法であって、
    ビデオフレーム中の複数のエリアの他のエリアに対する候補運動ベクトルを生成し、他のエリアはビデオフレームの1つのエリアに隣接していて、関連する運動ベクトルを欠いており、
    ビデオフレームの1つのエリアに対する現在の運動ベクトルを予測するために候補運動ベクトルを使用することを含む方法。
  2. ビデオフレーム中の複数のエリアの他のエリアに対する候補運動ベクトルを生成することが、
    以前に復号された運動ベクトルの運動推定、色光度および輝度検出、運動ベクトル平滑化および置換から成るグループから選択された少なくとも1つの運動ベクトル処理技術を使用して運動ベクトル処理を行ない、
    使用された運動ベクトル処理技術の各々の順位を付け、
    その順位に基づいて使用された運動ベクトル処理技術の各々に重みを適用し、
    候補運動ベクトルの作成のために使用された運動ベクトル処理技術のうちの1つを選択する非線形選択算法を適用することを含む請求項1の方法。
  3. 運動推定運動ベクトル処理技術が、
    ビデオフレームをダウンサンプリングし、より低い解像度のビデオフレームを作成し、
    より低い解像度のビデオフレームから一組の運動ベクトルを作成し、
    運動ベクトルの組からビデオフレーム中の複数のエリアの少なくとも1つのエリアへ各運動ベクトルを写像することを含む請求項2の方法。
  4. より低い解像度のビデオフレームが一組のブロックを含み、より低い解像度のビデオフレームから運動ベクトルの組を作成することが、より低い解像度のビデオフレームのブロックの組の運動推定を行い、一組のより粗い運動ベクトルを作成することを含む請求項3の方法。
  5. 色光度および輝度検出運動ベクトル処理技術が、
    クロマ運動ベクトルを引き出すこと、
    クロマ運動ベクトルのための絶対差(SAD)の合計を計算すること、
    運動ベクトル予測処理においてクロマ運動ベクトルに対するSAD値を組み入れることを含む請求項2の方法。
  6. 前に復号された運動ベクトルの置換の運動ベクトル処理技術が、
    第1のコーデックを使用して符号化されたビデオストリームを受信すること、
    符号化されたビデオストリームを復号して、関連する運動ベクトルを欠くビデオフレームの複数のエリアにおいて、他のエリアと関連した少なくとも第1の運動ベクトルを抽出すること、
    復号されたビデオストリームを第2のコーデックを使用して第2の符号化されたビデオストリームへ符号化し、第2の符号化されたビデオストリーム中のビデオフレームのための候補運動ベクトルとして第1の運動ベクトルを使用することを含む請求項2の方法。
  7. 運動ベクトル平滑化運動ベクトル処理技術が、
    複数の運動ベクトルを含む運動ベクトルフィールドを作ること、
    複数の運動ベクトル中の運動ベクトルが、運動ベクトルをその近隣の運動ベクトルと比較することによりアウトライアー運動ベクトルであるかどうかを決定すること、
    アウトライアー運動ベクトルを削除することを含む請求項2の方法。
  8. コンピュータに現在のブロックの運動ベクトル予測の方法を実行させるために、そこに記憶された命令を有するコンピュータ可読媒体であって、現在のブロックが関連する運動ベクトルを持っていないブロックを含む一組の近隣のブロックを持ち、方法が、
    関連する運動ベクトルを持っていない近隣のブロックの組において各ブロックの候補運動ベクトルを引き出すこと、
    現在のブロックのための現在の運動ベクトルを予測するために、関連する運動ベクトルを持っていない近隣のブロックの組の中で各ブロックに対する候補運動ベクトルを使用することを含むコンピュータ可読媒体。
  9. ビデオフレーム中の複数のエリアの他のエリアに対する候補運動ベクトルを生成することが、
    以前に復号された運動ベクトルの運動推定、色光度および輝度検出、運動ベクトル平滑化および置換から成るグループから選択された少なくとも1つの運動ベクトル処理技術を使用して運動ベクトル処理を行ない、
    使用された運動ベクトル処理技術の各々の順位を付け、
    その順位に基づいて使用された運動ベクトル処理技術の各々に重みを適用し、
    候補運動ベクトルの作成のために使用された運動ベクトル処理技術のうちの1つを選択する非線形選択算法を適用することを含む請求項8のコンピュータ可読媒体。
  10. 運動推定運動ベクトル処理技術が、
    ビデオフレームをダウンサンプリングし、より低い解像度のビデオフレームを作成し、
    より低い解像度のビデオフレームから一組の運動ベクトルを作成し、
    運動ベクトルの組からビデオフレーム中の複数のエリアの少なくとも1つのエリアへ各運動ベクトルを写像することを含む請求項9のコンピュータ可読媒体。
  11. より低い解像度のビデオフレームが一組のブロックを含み、より低い解像度のビデオフレームから運動ベクトルの組を作成することが、より低い解像度のビデオフレームのブロックの組の運動推定を行い、一組のより粗い運動ベクトルを作成することを含む請求項10のコンピュータ可読媒体。
  12. 色光度および輝度検出運動ベクトル処理技術が、
    クロマ運動ベクトルを引き出すこと、
    クロマ運動ベクトルのための絶対差(SAD)の合計を計算すること、
    運動ベクトル予測処理においてクロマ運動ベクトルに対するSAD値を組み入れることを含む請求項9のコンピュータ可読媒体。
  13. 前に復号された運動ベクトルの置換の運動ベクトル処理技術が、
    第1のコーデックを使用して符号化されたビデオストリームを受信すること、
    符号化されたビデオストリームを復号して、関連する運動ベクトルを欠くビデオフレームの複数のエリアにおいて、他のエリアと関連した少なくとも第1の運動ベクトルを抽出すること、
    復号されたビデオストリームを第2のコーデックを使用して第2の符号化されたビデオストリームへ符号化し、第2の符号化されたビデオストリーム中のビデオフレームのための候補運動ベクトルとして第1の運動ベクトルを使用することを含む請求項9のコンピュータ可読媒体。
  14. 運動ベクトル平滑化運動ベクトル処理技術が、
    複数の運動ベクトルを含む運動ベクトルフィールドを作ること、
    複数の運動ベクトル中の運動ベクトルが、運動ベクトルをその近隣の運動ベクトルと比較することによりアウトライアー運動ベクトルであるかどうかを決定すること、
    アウトライアー運動ベクトルを削除することを含む請求項9のコンピュータ可読媒体。
  15. 現在のブロックが関連する運動ベクトルを持っていないブロックを含む一組の近隣のブロックを持ち、現在のブロックの運動ベクトルを予測する装置であって、
    関連する運動ベクトルを持っていない近隣のブロックの組において各ブロックの候補運動ベクトルを引き出す手段と、
    現在のブロックのための現在の運動ベクトルを予測するために、関連する運動ベクトルを持っていない近隣のブロックの組の中で各ブロックに対する候補運動ベクトルを使用する手段とを含む装置。
  16. ビデオフレーム中の複数のエリアの他のエリアに対する候補運動ベクトルを生成する手段が、
    以前に復号された運動ベクトルの運動推定、色光度および輝度検出、運動ベクトル平滑化および置換から成るグループから選択された少なくとも1つの運動ベクトル処理技術を使用して運動ベクトル処理を行なう手段と、
    使用された運動ベクトル処理技術の各々の順位を付ける手段と、
    その順位に基づいて使用された運動ベクトル処理技術の各々に重みを適用する手段と、
    候補運動ベクトルの作成のために使用された運動ベクトル処理技術のうちの1つを選択する非線形選択算法を適用する手段とを含む請求項15の装置。
  17. 現在のブロックが現在のフレーム内に含まれており、運動推定運動ベクトル処理技術のための手段が、
    現在のフレームをダウンサンプリングし、より低い解像度のフレームを作成する手段と、
    より低い解像度のフレームから一組の運動ベクトルを作成する手段と、
    運動ベクトルの組から、関連する運動ベクトルを持っていない近隣のブロックのビデオフレームの組の各ブロックの複数のエリアの少なくとも1つのエリアへ、各運動ベクトルを写像する手段とを含む請求項16の装置。
  18. より低い解像度のビデオフレームが一組のブロックを含み、より低い解像度のビデオフレームから運動ベクトルの組を作成することが、より低い解像度のビデオフレームのブロックの組の運動推定を行い、一組のより粗い運動ベクトルを作成する手段を含む請求項17の装置。
  19. 色光度および輝度検出運動ベクトル処理技術のための手段が、
    クロマ運動ベクトルを引き出す手段と、
    クロマ運動ベクトルのための絶対差(SAD)の合計を計算する手段と、
    運動ベクトル予測処理においてクロマ運動ベクトルに対するSAD値を組み入れる手段とを含む請求項16の装置。
  20. 前に復号された運動ベクトルの置換の運動ベクトル処理技術のための手段が、
    第1のコーデックを使用して符号化されたビデオストリームを受信する手段と、
    符号化されたビデオストリームを復号して、関連する運動ベクトルを欠くビデオフレームの複数のエリアにおいて、他のエリアと関連した少なくとも第1の運動ベクトルを抽出する手段と、
    復号されたビデオストリームを第2のコーデックを使用して第2の符号化されたビデオストリームへ符号化し、第2の符号化されたビデオストリーム中のビデオフレームのための候補運動ベクトルとして第1の運動ベクトルを使用する手段とを含む請求項16の装置。
  21. 運動ベクトル平滑化運動ベクトル処理技術のための手段が、
    複数の運動ベクトルを含む運動ベクトルフィールドを作る手段と、
    複数の運動ベクトル中の運動ベクトルが、運動ベクトルをその近隣の運動ベクトルと比較することによりアウトライアー運動ベクトルであるかどうかを決定する手段と、
    アウトライアー運動ベクトルを削除する手段とを含む請求項16の装置。
  22. ビデオフレームの現在のブロック中の1つのエリアに関する運動ベクトル予測の方法を実施するように構成された少なくとも1つのプロセッサであって、ビデオフレームが関連する運動ベクトルを持たないブロックを含んでいる近隣ブロックの複数のエリアの組を持つ現在のブロックを含み、
    ビデオフレーム中の複数のエリアの他のエリアのための候補運動ベクトルを生成し、他のエリアがビデオフレームの1つのエリアに隣接していて、関連する運動ベクトルを欠いており、
    候補運動ベクトルを使用してビデオフレームの1つのエリアのための現在の運動ベクトルを予測する少なくとも1つのプロセッサ。
  23. ビデオフレーム中の複数のエリアの他のエリアのための候補運動ベクトルを生成することが、
    運動推定、色光度および輝度検出、運動ベクトル平滑化および以前に復号された運動ベクトルの置換から成るグループから選択された少なくとも1つの運動ベクトル処理技術を使用して、運動ベクトル処理を行なうこと、
    使用された運動ベクトル処理技術の各々の順位付けを行なうこと、
    その順位に基づいた使用された運動ベクトル処理技術の各々に重みを適用すること、
    候補運動ベクトルの作成のために使用された運動ベクトル処理技術のうちの1つを選択する非線形選択算法を適用することを含む、請求項22の少なくとも1つのプロセッサ。
  24. 現在のブロックが現在のフレーム内に含まれており、運動推定運動ベクトル処理技術が、
    ビデオフレームをダウンサンプリングし、かつより低い解像度のビデオフレームを作成すること、
    より低い解像度のビデオフレームから一組の運動ベクトルを作成すること、
    運動ベクトルの組からビデオフレーム中の複数のエリアの少なくとも1つのエリアへ各運動ベクトルを写像することを含む、請求項23の少なくとも1つのプロセッサ。
  25. より低い解像度のビデオフレームが一組のブロックを含んでおり、より低い解像度のビデオフレームから運動ベクトルの組を作成することが、より低い解像度のビデオフレームのブロックの組の運動推定を行い、一組のより粗い運動ベクトルを作成することを含む、請求項24の少なくとも1つのプロセッサ。
  26. 色光度および輝度検出運動ベクトル処理技術が、
    クロマ運動ベクトルを引き出すこと、
    クロマ運動ベクトルのために絶対差(SAD)の合計を計算すること、
    運動ベクトル予測処理においてクロマ運動ベクトルに対してSAD値を組み入れることを含む、請求項23の少なくとも1つのプロセッサ。
  27. 以前に復号された運動ベクトルの置換の運動ベクトル処理技術が、
    第1のコーデックを使用して符号化されたビデオストリームを受信すること、
    符号化されたビデオストリームを復号して、関連する運動ベクトルを欠くビデオフレームの複数のエリアにおいて、他のエリアと関連する少なくとも1つの第1の運動ベクトルを抽出すること、
    復号されたビデオストリームを第2のコーデックを使用して第2の符号化されたビデオストリームへ符号化し、第2の符号化されたビデオストリーム中のビデオフレームのための候補運動ベクトルとして第1の運動ベクトルを使用することを含む、請求項23の少なくとも1つのプロセッサ。
  28. 運動ベクトル平滑化運動ベクトル処理技術が、
    複数の運動ベクトルを含む運動ベクトルフィールドを作ること、
    複数の運動ベクトル中の運動ベクトルが、運動ベクトルをその近隣の運動ベクトルと比較することによりアウトライアー運動ベクトルであるかどうかを決定すること、
    アウトライアー運動ベクトルを削除することを含む、請求項23の少なくとも1つのプロセッサ。
JP2007522724A 2004-07-20 2005-07-20 時間的なビデオ圧縮における運動ベクトル予測のための方法および装置 Expired - Fee Related JP4699460B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US58981804P 2004-07-20 2004-07-20
US60/589,818 2004-07-20
PCT/US2005/025812 WO2006012383A2 (en) 2004-07-20 2005-07-20 Method and apparatus for motion vector prediction in temporal video compression

Publications (2)

Publication Number Publication Date
JP2008507914A true JP2008507914A (ja) 2008-03-13
JP4699460B2 JP4699460B2 (ja) 2011-06-08

Family

ID=35045051

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007522724A Expired - Fee Related JP4699460B2 (ja) 2004-07-20 2005-07-20 時間的なビデオ圧縮における運動ベクトル予測のための方法および装置

Country Status (9)

Country Link
US (1) US7978770B2 (ja)
EP (1) EP1784985B1 (ja)
JP (1) JP4699460B2 (ja)
KR (1) KR100907847B1 (ja)
CN (2) CN101023676B (ja)
AR (1) AR049593A1 (ja)
CA (1) CA2574590C (ja)
TW (1) TWI401957B (ja)
WO (1) WO2006012383A2 (ja)

Families Citing this family (94)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7924921B2 (en) * 2003-09-07 2011-04-12 Microsoft Corporation Signaling coding and display options in entry point headers
US8213779B2 (en) * 2003-09-07 2012-07-03 Microsoft Corporation Trick mode elementary stream and receiver system
TWI254571B (en) * 2004-12-07 2006-05-01 Sunplus Technology Co Ltd Method for fast multiple reference frame motion estimation
TWI308841B (en) * 2005-01-24 2009-04-11 Via Tech Inc Method and system for reducing the bandwidth access in video encoding
EP1952268A4 (en) * 2005-11-04 2012-01-04 Univ Singapore METHOD AND SYSTEM FOR DETERMINING PRE-ARRANGED NUMBERS OF PROCESSOR CYCLES REQUIRED FOR ANY SEGMENTS OF A MEDIA FILE FOR PLAYING THE MEDIA FILE
CN1794821A (zh) * 2006-01-11 2006-06-28 浙江大学 可分级视频压缩中插值的方法与装置
JP5224459B2 (ja) * 2006-02-02 2013-07-03 トムソン ライセンシング 動き補償予測のための適応重み選択を行う方法および装置
US8213509B2 (en) 2006-10-06 2012-07-03 Calos Fund Limited Liability Company Video coding on parallel processing systems
US8451897B2 (en) * 2006-12-04 2013-05-28 Atmel Corporation Highly parallel pipelined hardware architecture for integer and sub-pixel motion estimation
KR101383540B1 (ko) 2007-01-03 2014-04-09 삼성전자주식회사 복수의 움직임 벡터 프리딕터들을 사용하여 움직임 벡터를추정하는 방법, 장치, 인코더, 디코더 및 복호화 방법
US8144778B2 (en) * 2007-02-22 2012-03-27 Sigma Designs, Inc. Motion compensated frame rate conversion system and method
KR100955396B1 (ko) * 2007-06-15 2010-04-29 성균관대학교산학협력단 양-예측 부호화 방법 및 장치, 양-예측 복호화 방법 및장치 및 기록매체
WO2008153262A1 (en) 2007-06-15 2008-12-18 Sungkyunkwan University Foundation For Corporate Collaboration Bi-prediction coding method and apparatus, bi-prediction decoding method and apparatus, and recording midium
EP2206342A2 (en) * 2007-09-10 2010-07-14 Nxp B.V. Method and apparatus for motion estimation and motion compensation in video image data
JP2009089332A (ja) * 2007-10-03 2009-04-23 Sony Corp 動き予測方法及び動き予測装置
US8228992B2 (en) * 2007-10-12 2012-07-24 Broadcom Corporation Method and system for power-aware motion estimation for video processing
KR101835342B1 (ko) 2007-10-16 2018-03-07 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
FR2925815B1 (fr) * 2007-12-19 2010-02-12 Ateme Sa Procede et dispositif d'estimation de mouvement hierarchique symetrique d'objets d'images video successives dans un codeur video
KR100939917B1 (ko) 2008-03-07 2010-02-03 에스케이 텔레콤주식회사 움직임 예측을 통한 부호화 시스템 및 움직임 예측을 통한부호화 방법
US8379152B2 (en) * 2008-03-31 2013-02-19 Sharp Laboratories Of America, Inc. Systems and methods for increasing the temporal resolution of video data
TW201028964A (en) * 2009-01-23 2010-08-01 Ind Tech Res Inst Depth calculating method for two dimension video and apparatus thereof
US20100309987A1 (en) * 2009-06-05 2010-12-09 Apple Inc. Image acquisition and encoding system
US8917769B2 (en) 2009-07-03 2014-12-23 Intel Corporation Methods and systems to estimate motion based on reconstructed reference frames at a video decoder
US9654792B2 (en) 2009-07-03 2017-05-16 Intel Corporation Methods and systems for motion vector derivation at a video decoder
US8462852B2 (en) 2009-10-20 2013-06-11 Intel Corporation Methods and apparatus for adaptively choosing a search range for motion estimation
US20110026596A1 (en) * 2009-07-28 2011-02-03 Wei Hong Method and System for Block-Based Motion Estimation for Motion-Compensated Frame Rate Conversion
KR101452859B1 (ko) * 2009-08-13 2014-10-23 삼성전자주식회사 움직임 벡터를 부호화 및 복호화하는 방법 및 장치
WO2011021914A2 (ko) 2009-08-21 2011-02-24 에스케이텔레콤 주식회사 적응적 움직임 벡터 해상도를 이용한 영상 부호화/복호화 방법 및 장치
KR101356613B1 (ko) * 2009-08-21 2014-02-06 에스케이텔레콤 주식회사 적응적 움직임 벡터 해상도를 이용한 영상 부호화/복호화 방법 및 장치
TWI566586B (zh) * 2009-10-20 2017-01-11 湯姆生特許公司 一序列形象的現時區塊之寫碼方法和重建方法
TWI419519B (zh) * 2009-12-22 2013-12-11 Ind Tech Res Inst 適用於多媒體串流的網路封包傳送系統與方法
KR101522850B1 (ko) 2010-01-14 2015-05-26 삼성전자주식회사 움직임 벡터를 부호화, 복호화하는 방법 및 장치
US9036692B2 (en) * 2010-01-18 2015-05-19 Mediatek Inc. Motion prediction method
US8594199B2 (en) * 2010-03-08 2013-11-26 Qualcomm Incorporated Apparatus and method for motion vector filtering based on local image segmentation and lattice maps
WO2011131089A1 (en) * 2010-04-22 2011-10-27 Mediatek Inc. Motion prediction method
KR101106634B1 (ko) 2010-05-12 2012-01-20 전남대학교산학협력단 움직임 벡터 스무딩 장치 및 방법
US9300970B2 (en) * 2010-07-09 2016-03-29 Samsung Electronics Co., Ltd. Methods and apparatuses for encoding and decoding motion vector
WO2012011432A1 (ja) * 2010-07-20 2012-01-26 株式会社エヌ・ティ・ティ・ドコモ 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法、及び、画像予測復号プログラム
CN102377992B (zh) * 2010-08-06 2014-06-04 华为技术有限公司 运动矢量的预测值的获取方法和装置
HRP20231669T1 (hr) 2010-09-02 2024-03-15 Lg Electronics, Inc. Inter predikcija
EP2625858A4 (en) * 2010-10-06 2015-01-14 Intel Corp SYSTEM AND METHOD FOR MOVING VECTOR REMOVAL WITH LOW COMPLEXITY
KR101366648B1 (ko) * 2010-10-28 2014-02-27 경희대학교 산학협력단 영상 정보 복호화 장치
US8611415B1 (en) * 2010-11-15 2013-12-17 Google Inc. System and method for coding using improved motion estimation
JP5721851B2 (ja) 2010-12-21 2015-05-20 インテル・コーポレーション Dmvd処理のシステムおよび方法の改善
US8891626B1 (en) 2011-04-05 2014-11-18 Google Inc. Center of motion for encoding motion fields
WO2012167711A1 (en) 2011-06-10 2012-12-13 Mediatek Inc. Method and apparatus of scalable video coding
JP2014523708A (ja) 2011-07-01 2014-09-11 モトローラ モビリティ エルエルシー 動きベクトル予測設計の簡易化
EP2754131B1 (en) 2011-09-08 2022-10-26 Nautilus, Inc. System and method for visualizing synthetic objects withinreal-world video clip
CN103907346B (zh) * 2011-10-11 2017-05-24 联发科技股份有限公司 运动矢量预测子及视差矢量导出方法及其装置
KR101616010B1 (ko) 2011-11-04 2016-05-17 구글 테크놀로지 홀딩스 엘엘씨 비균일 움직임 벡터 그리드에 대한 움직임 벡터 스케일링
KR20130050405A (ko) * 2011-11-07 2013-05-16 오수미 인터 모드에서의 시간 후보자 결정방법
TWI523497B (zh) * 2011-11-10 2016-02-21 Sony Corp Image processing apparatus and method
US9596466B2 (en) 2011-12-23 2017-03-14 Electronics And Telecommunications Research Institute Method and apparatus for setting reference picture index of temporal merging candidate
US8908767B1 (en) 2012-02-09 2014-12-09 Google Inc. Temporal motion vector prediction
US9460495B2 (en) * 2012-04-06 2016-10-04 Microsoft Technology Licensing, Llc Joint video stabilization and rolling shutter correction on a generic platform
US9491458B2 (en) * 2012-04-12 2016-11-08 Qualcomm Incorporated Scalable video coding prediction with non-causal information
US9420285B2 (en) 2012-04-12 2016-08-16 Qualcomm Incorporated Inter-layer mode derivation for prediction in scalable video coding
US9172970B1 (en) 2012-05-29 2015-10-27 Google Inc. Inter frame candidate selection for a video encoder
US11317101B2 (en) 2012-06-12 2022-04-26 Google Inc. Inter frame candidate selection for a video encoder
US9288484B1 (en) 2012-08-30 2016-03-15 Google Inc. Sparse coding dictionary priming
US9503746B2 (en) 2012-10-08 2016-11-22 Google Inc. Determine reference motion vectors
US9485515B2 (en) 2013-08-23 2016-11-01 Google Inc. Video coding using reference motion vectors
US10785498B2 (en) * 2012-11-27 2020-09-22 Squid Design Systems Pvt Ltd System and method of mapping multiple reference frame motion estimation on multi-core DSP architecture
US10205962B2 (en) 2013-03-15 2019-02-12 Raymond Zenkich System and method for non-uniform video coding
US9300906B2 (en) 2013-03-29 2016-03-29 Google Inc. Pull frame interpolation
US9313493B1 (en) 2013-06-27 2016-04-12 Google Inc. Advanced motion estimation
JP6359101B2 (ja) 2013-10-14 2018-07-18 マイクロソフト テクノロジー ライセンシング,エルエルシー ビデオ及び画像の符号化及び復号のためのイントラブロックコピー予測モードの特徴
US11109036B2 (en) 2013-10-14 2021-08-31 Microsoft Technology Licensing, Llc Encoder-side options for intra block copy prediction mode for video and image coding
US10506254B2 (en) 2013-10-14 2019-12-10 Microsoft Technology Licensing, Llc Features of base color index map mode for video and image coding and decoding
US10390034B2 (en) 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
KR102258427B1 (ko) 2014-01-03 2021-06-01 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 비디오 및 이미지 코딩/디코딩에서의 블록 벡터 예측
CN103747264B (zh) * 2014-01-03 2017-10-17 华为技术有限公司 预测运动矢量的方法、编码设备和解码设备
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
US10542274B2 (en) 2014-02-21 2020-01-21 Microsoft Technology Licensing, Llc Dictionary encoding and decoding of screen content
WO2015131323A1 (en) 2014-03-04 2015-09-11 Microsoft Technology Licensing, Llc Block flipping and skip mode in intra block copy prediction
EP3149945A1 (en) 2014-05-30 2017-04-05 Paofit Holdings Pte Ltd Systems and methods for motion-vector-aided video interpolation using real-time smooth video playback speed variation
EP4354856A2 (en) 2014-06-19 2024-04-17 Microsoft Technology Licensing, LLC Unified intra block copy and inter prediction modes
US9286653B2 (en) 2014-08-06 2016-03-15 Google Inc. System and method for increasing the bit depth of images
US9153017B1 (en) 2014-08-15 2015-10-06 Google Inc. System and method for optimized chroma subsampling
US10554965B2 (en) 2014-08-18 2020-02-04 Google Llc Motion-compensated partitioning
CA3171803A1 (en) 2014-09-30 2016-04-07 Microsoft Technology Licensing, Llc Rules for intra-picture prediction modes when wavefront parallel processing is enabled
US9591325B2 (en) * 2015-01-27 2017-03-07 Microsoft Technology Licensing, Llc Special case handling for merged chroma blocks in intra block copy prediction mode
US10659783B2 (en) 2015-06-09 2020-05-19 Microsoft Technology Licensing, Llc Robust encoding/decoding of escape-coded pixels in palette mode
US9704298B2 (en) 2015-06-23 2017-07-11 Paofit Holdings Pte Ltd. Systems and methods for generating 360 degree mixed reality environments
US10397600B1 (en) 2016-01-29 2019-08-27 Google Llc Dynamic reference motion vector coding mode
US10462457B2 (en) 2016-01-29 2019-10-29 Google Llc Dynamic reference motion vector coding mode
US10419777B2 (en) 2016-12-22 2019-09-17 Google Llc Non-causal overlapped block prediction in variable block size video coding
US20180184107A1 (en) * 2016-12-28 2018-06-28 Novatek Microelectronics Corp. Motion estimation method and motion estimation apparatus
CN109089119B (zh) 2017-06-13 2021-08-13 浙江大学 一种运动矢量预测的方法及设备
KR102476204B1 (ko) * 2017-10-19 2022-12-08 삼성전자주식회사 멀티 코덱 인코더 및 이를 포함하는 멀티 코덱 인코딩 시스템
US10986349B2 (en) 2017-12-29 2021-04-20 Microsoft Technology Licensing, Llc Constraints on locations of reference blocks for intra block copy prediction
CN110933426B (zh) * 2018-09-20 2022-03-01 杭州海康威视数字技术股份有限公司 一种解码、编码方法及其设备
WO2020142468A1 (en) * 2018-12-31 2020-07-09 Beijing Dajia Internet Information Technology Co., Ltd. Picture resolution dependent configurations for video coding
US20230097592A1 (en) * 2021-09-30 2023-03-30 Waymo Llc Systems, Methods, and Apparatus for Aligning Image Frames

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6483928B1 (en) * 1999-03-18 2002-11-19 Stmicroelectronics S.R.L. Spatio-temporal recursive motion estimation with 1/2 macroblock and 1/4 pixel undersampling
WO2003055228A1 (fr) * 2001-12-19 2003-07-03 Thomson Licensing S.A. Procede d'estimation du mouvement dominant dans une sequence d'images
JP2003219423A (ja) * 2002-01-21 2003-07-31 Nec Corp 動画像符号列変換方法、動画像符号列変換装置及びコンピュータプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0181069B1 (ko) * 1995-11-08 1999-05-01 배순훈 움직임 추정장치
EP0897247A3 (de) * 1997-08-14 2001-02-07 Philips Patentverwaltung GmbH Verfahren zur Berechnung von Bewegungsvektoren
US6567469B1 (en) * 2000-03-23 2003-05-20 Koninklijke Philips Electronics N.V. Motion estimation algorithm suitable for H.261 videoconferencing applications
JP4574090B2 (ja) * 2001-09-21 2010-11-04 三菱電機株式会社 動画データ変換装置および動画データ変換プログラム
US7173971B2 (en) * 2002-11-20 2007-02-06 Ub Video Inc. Trailing artifact avoidance system and method
CN1181691C (zh) * 2003-01-24 2004-12-22 杭州国芯科技有限公司 视频运动估计方法
US20050286777A1 (en) * 2004-06-27 2005-12-29 Roger Kumar Encoding and decoding images

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6483928B1 (en) * 1999-03-18 2002-11-19 Stmicroelectronics S.R.L. Spatio-temporal recursive motion estimation with 1/2 macroblock and 1/4 pixel undersampling
WO2003055228A1 (fr) * 2001-12-19 2003-07-03 Thomson Licensing S.A. Procede d'estimation du mouvement dominant dans une sequence d'images
JP2003219423A (ja) * 2002-01-21 2003-07-31 Nec Corp 動画像符号列変換方法、動画像符号列変換装置及びコンピュータプログラム

Also Published As

Publication number Publication date
KR100907847B1 (ko) 2009-07-14
US20060018381A1 (en) 2006-01-26
AR049593A1 (es) 2006-08-16
CA2574590A1 (en) 2006-02-02
CN102695054A (zh) 2012-09-26
JP4699460B2 (ja) 2011-06-08
CN101023676A (zh) 2007-08-22
TW200627966A (en) 2006-08-01
EP1784985A2 (en) 2007-05-16
CN101023676B (zh) 2012-06-27
TWI401957B (zh) 2013-07-11
CA2574590C (en) 2013-02-19
WO2006012383A2 (en) 2006-02-02
KR20070040398A (ko) 2007-04-16
CN102695054B (zh) 2015-01-28
US7978770B2 (en) 2011-07-12
WO2006012383A3 (en) 2006-06-15
EP1784985B1 (en) 2017-05-10

Similar Documents

Publication Publication Date Title
JP4699460B2 (ja) 時間的なビデオ圧縮における運動ベクトル予測のための方法および装置
US8553776B2 (en) Method and apparatus for motion vector assignment
RU2377737C2 (ru) Способ и устройство для преобразования с повышением частоты кадров с помощью кодера (ea-fruc) для сжатия видеоизображения
US20070211800A1 (en) Method and Apparatus for Frame Rate Up Conversion with Multiple Reference Frames and Variable Block Sizes
JP4369090B2 (ja) ビデオ情報を符号化し復号化する方法、動き補償ビデオ符号器及び対応する復号器
JP5081305B2 (ja) フレーム間予測符号化の方法および装置
Zheng et al. Error-concealment algorithm for H. 26L using first-order plane estimation
Suzuki et al. An improved low delay inter frame coding using template matching averaging

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100209

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100510

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100517

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100609

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100616

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100803

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110302

R150 Certificate of patent or registration of utility model

Ref document number: 4699460

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees