JP4593556B2 - 映像符号化方法及びデバイス - Google Patents

映像符号化方法及びデバイス Download PDF

Info

Publication number
JP4593556B2
JP4593556B2 JP2006500860A JP2006500860A JP4593556B2 JP 4593556 B2 JP4593556 B2 JP 4593556B2 JP 2006500860 A JP2006500860 A JP 2006500860A JP 2006500860 A JP2006500860 A JP 2006500860A JP 4593556 B2 JP4593556 B2 JP 4593556B2
Authority
JP
Japan
Prior art keywords
encoder
frame
long
reference block
term reference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2006500860A
Other languages
English (en)
Other versions
JP2006518560A (ja
Inventor
コスマン,パメラ
レオンタリス,アザナシオス
シェルラパ,ビジャイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of California
Original Assignee
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of California filed Critical University of California
Publication of JP2006518560A publication Critical patent/JP2006518560A/ja
Application granted granted Critical
Publication of JP4593556B2 publication Critical patent/JP4593556B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • H04N19/68Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience involving the insertion of resynchronisation markers into the bitstream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/156Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/43Hardware specially adapted for motion estimation or compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明の分野は、画像及び映像の符号化である。本発明の他の分野は、画像及び映像のディジタル通信及びディジタル記憶を含む。
画像データのディジタル通信及び記憶は、画像の単一フレームを正確に記述するために必要な莫大な量のディジタルデータのため、困難なタスクである。映像の場合、データの量は、急速に多くなる。画像符号化は、画像データを圧縮することにより、例えば、1つの画像を表わすのに必要なデータの量を低減することにより管理可能な画像データの通信および/または記憶を実行しようとする。例えば、通信リソースは、帯域幅が限定されている。このことは、無線通信媒体においては、とりわけ本質的なことである。画像データ符号化においては、トレードオフがある。例えば、データのサイズの低減は、許容可能な尺度を超えて、画像品質を劣化させるべきではない。また、計算コスト及び計算速度は、特に、計算資源及び電力資源を節約して使わなければならないデバイスにおいては、管理しなければならない。映像符号化/圧縮アプローチの最新の例は、MPEG−4やH.264を含む。具体的には、後者は、特に、パケットネットワークを介した映像伝送用に設計されている。
多くのデバイスは、1つ以上の通信媒体へアクセスする。ラップトップ、携帯情報端末(PDA)、ワークステーションまたはビデオ会議システム等のデバイスは、多数のネットワークにアクセスする。例えば、1つのデバイスは、いくつかの異なる種類の有線及び無線ネットワークにアクセスしてもよい。
多くの映像圧縮アルゴリズムは、今日、実質的な圧縮を実現するために、動き補償を利用している。動き補償の基本的なアイデアは、次の通りである。マクロブロックは、画像データの1ブロック、例えば、1つの画像における16×16画素の正方形領域を表わす。符号化すべき現在のフレームのマクロブロックは、最も似ているものを探すために、基準フレームにおけるマクロブロックのいくつかのセットと比較される。該基準フレームは、典型的には、該画像の直前のフレームである。類似性は、一般に、画素の絶対値の差の合計によって、あるいは、画素間の二乗差によって測定される。最もよくマッチしたブロックの位置は、運動ベクトルと呼ばれるオフセットベクトルを与えることによって指定することができ、該運動ベクトルは、符号化すべき該現在のマクロブロックと、該基準フレームにおける該最もよくマッチしたマクロブロックとの水平方向及び垂直方向の位置の差を示す。該符号化すべき現在のマクロブロックは、この運動ベクトルを用いるだけで表わすことができる。復号器は、この運動ベクトルを受信したときに、該基準フレームから参照ブロックを取り出して、該現在のブロックを表わすための位置に貼り込むことができる。該参照ブロック及び現在のブロックが十分類似している場合、この直接置換は、適切な品質を実現できるであろう。十分でない場合には、該符号器は、該参照ブロックを該現在のブロックにより類似するように、該参照ブロックをどのように変更するかを示すいくつかの追加情報にのっとって任意に送信することができる。
いずれの場合においても、これは、INTERコーディングと呼ばれる。上記符号器が、現在のマクロブロックに対して良好なマッチを見つけられない場合には、該符号器は、他のどの過去のブロックも参照することなく、該マクロブロックを自動的に符号化するように選択する。これはINTRAコーディングと呼ばれる。INTERコーディングとINTRAコーディングとの間の選択は、映像符号化規格MPEG、MPEG−2、MPEG−4、[T.Sikora,“The MPEG−4 Video Standard Verification Model,”IEEE Transactions on Circuits and Systems for Video Technology,vol.7,no.1,pp.19−31,February 1997.],H.263[G.Cote,B.Erol,M.Gallant and F.Kossentini,“H.263+:Video Coding at Low Bit Rates,”IEEE Trans.Circ.and Systems for Video Techn,vol.8,no.7,pp849−865,Nov.1998]及び最新のH.264で提供された基本的なアプローチである。
INTERコーディングは、INTRAコーディングよりも少ないビットを要する傾向があるが、エラーを伝播させる可能性がある。INTRAコーディングは、直前のフレームに対する参照を実行しないので、直前のフレームに存在するエラーを伝播させることはない。INTERコーディングとINTRAコーディングとの間の選択は、より少ないビットを使用し、かつエラーに対して強くするという競合する目的を満たすことを含む。
INTERコーディングとINTRAコーディングとの間の聡明な選択を実行することは、当該技術における論点である。この問題を論じている1つの論文は、R.Zhang,S.L.Regunathan,and K.Rose,“Video Coding with Optimal Inter/Intra−Mode Switching for Packet Loss Resilience,”(IEEE Journal on Selected Areas in Communications,vol.18,no.6 pp.966−76,June 2000)である。この論文は、歪みを評価する際に2つの要因、すなわち、チャネルエラー確率及び符号化されるブロックの隠蔽性を考慮するROPE(recursive optimal per pixel estimate)と呼ばれる歪み評価法を提供している。そして、(マクロブロック等の)所定のブロックのためのINTERコーディングとINTRAコーディングとの間の選択は、(ROPEによって評価されるような)歪みを低減することと、小数のビットのみを符号化に用いること(特に、目標のレート制約内にとどまること)との競合する目的のバランスを失わせることによってなされる。レート制約は、INTERコーディングに有利であり、エラー制約は、INTRAコーディングに有利であり、エラーを隠蔽する能力は、INTERコーディングに有利である。
映像データを伝送するのに使用される接続が、品質の変化にあった場合、結果として生じる映像復号は、非常に悪い結果を生じる可能性がある。上記参照フレームが、悪い品質の参照を提供する場合、該復号結果は、急速に悪くなる。このことを取り扱う、提案されている一つの方法は、多数のフレームを保持することである。しかし、これは、復号を重荷にし、かつ非常に複雑にする可能性がある。
上記多数の参照フレームアプローチに関する多くの実例がある。[例えば、N.Vasconcelos and A.L.ippman,“Library−based Image Coding,”IEEE International Conference on Acoustics,Speech,and Signal Processing,vol.v,pp.V/489−V/492,1994;T.Wiegand,X.Zhang,and B.Girod,“Long term Memory Motion−Compensated Prediction,”IEEE Trans.Circ.and Systems for Video Techn,vol.9,no.1,pp.70−84,Feb.1999を参照]1つの実施例において、映像のフレームNのブロックを符号化する場合、上記符号器は、フレームN−1、N−2、N−3及びN−4の中で、最も可能性のあるマッチングブロックを探す。すなわち、直前の4つのフレームを、マッチングのために探すことができる。そして、該符号器は、上記復号器に、どの参照フレームが最良のマッチングを示したかを知らせることができる。例えば、2ビットを、4つのフレームのうちのどれが最良のマッチングを示すかを説明するために割当てることができ、通常の運動ベクトルが、符号化すべき現在のブロックと、指定された参照フレームにおける最良のマッチングブロックの位置との間のオフセットを与えるために提供される。
T.Fukuhara,K.Asai,and T.Murakami,“Very Low Bit−Rate Video Coding with Block Partitioning and Adaptive Selection of Two Time−Differential Frame Memories,”IEEE Trans.Circ.and Systems for Video Techn,vol.7,no.1,pp.212−220,Feb.1997においては、2つの時間の異なるフレームのみが用いられ、それに伴って、比較的大きくない計算の複雑性の増加を必要とする。この二重フレームバッファは、2つの参照フレームのみがある多フレームバッファの特別なケースである。例えば、1つの短期参照フレーム(直前のフレーム)と1つの長期参照フレーム(より以前からのフレーム)とすることができる。Fukuhara等においては、多くのハイブリッドコーデックと同様に、一方のフレームは直前のものであり、第2のフレームは、予め定義されたルールに従って定期的に更新されたより以前の参照フレームを含んでいた。多数の参照フレームが、計算負荷及び記憶装置の複雑性の増加を犠牲にして、再現されたPSNR(ピーク信号対雑音比)の著しい増加をもたらすことができることが分かってきている。動き評価は、ハイブリッド映像コーディングシステムにおける主要なパフォーマンスボトルネックであり、総符号化時間の80〜90%を占めている。従って、1つでも追加フレームバッファを付加することは、符号化時間を倍加させる可能性がある。記憶装置の必要条件についても同様であり、参照フレームの数が大きくなった場合、該増加も線型であり、かつ著しい。
ABC(常時最良接続)アプローチは、デバイスが多数の接続にアクセスする場合に用いられるアプローチである。ラップトップまたはPDA等のデバイスは、異なるレートで作動するいくつかの異なる種類の無線または有線ネットワークにアクセスすることが可能である。例えば、該デバイスは、イーサネット接続(10Mbps)、無線LAN(11Mbps)、HDR(400〜500Mbps)、1xRTT(64kbps)及びGPRS(16kbps)を用いて通信することができる。該デバイスは、常に、ユーザが、彼のユーザプロファイルにおいて、他のどのネットワークも選択しないとの仮定で、該デバイスが特定の時間にアクセスすることができる最良の接続を用いて作動することになる。該最良の接続は、最高のデータレートを有するものとなる場合もあるが、他の要因(例えば、誤り率、遅延等)がさらに関連する。該最良の接続が使用できなくなった場合、または、該最良の接続が、もはや最良の接続ではないポイントまで劣化した場合には、上記デバイスは、他の接続、すなわち新たな最良の接続にシームレスで切り替わることが求められる。多くの場合、これは、低速での接続となる。また、該デバイスは、どの接続が使用可能であるかを理解するために、定期的に全ての接続を調べることを求められる。高速接続が使用不能になった後、再び使用可能になった場合には、該デバイスは、可用性を見つけて、該ネットワークを使用することに戻るように切り替わることを求められる。
二重で、可能な限り多数のフレームアプローチが本発明によって用いられる。本発明の実施形態は、INTERコーディングを実施するために、あるいは、INTRAフレームコーディングを実施するために、直前の参照フレーム以外のフレームである長期参照フレームを用いる決断を決定することを含む。他の実施形態は、長期及び短期の参照ブロックの使用と、INTERコーディングブロックとINTRAコーディングの2種類のコーディングの間の決定とを含む。
本発明の実施形態によれば、長期フレームは、高品質のフレームである。該高品質フレームは、特定の条件下で、参照フレームとして使用することができる。
本発明は、映像、データ等の画像を符号化する方法、デバイス及びシステムに注力する。また、本発明は、データを復号する方法、デバイス及びシステムにも注力する。本発明は、通信媒体を利用する多くの種類のシステムに有用となるであろう。本発明は、例えば、ピアツーピア方式の通信やサーバクライアント方式の通信に用いることができ、および、例えば、画像データを格納するのに用いることもできる。本発明の特定の例示的な実施形態は、ビデオ会議システム及び方法である。本発明の実施形態は、映像接続が、相当量によりレートを変化させることができる状況に特に適している。
本発明の実施形態を説明する際、該論考は、フレームの処理に焦点を当てることとする。これは、本発明の共通の実施である。しかし、標準などの場合、処理及び比較は、ブロックの基準に対して実施される。ブロックサイズは、一般に、本発明の目的に対して任意である。共通の実施は、上述した標準の場合のように、マクロブロックを使用する。本願明細書で用いる場合、フレームは、マクロブロック等の複数のブロックに分割することができる。しかし、フレームサイズに対しては、特定の制限はなく、本発明の実施形態は、該標準のフレームサイズを利用してもよい。
本発明は、上述した多くの標準の変更例として適用することができる。本発明は、該標準のいずれかで計算されるように、動き補償ベクトルを利用してもよく、また、ベクトル計算に、他の方法を用いてもよい。本発明により、公知の標準が改善されると共に、本発明の実施形態は、一般的な標準フレームワーク及び公知のハードウェア実施を利用する。
二重で可能な限り多数のフレームアプローチが、本発明により用いられる。本発明の実施形態は、INTERコーディングを実施するために、あるいは、INTRAフレームコーディングを実施するために、直前の参照フレーム以外のフレームである長期参照フレームを用いる決断を決定することを含む。他の実施形態は、長期及び短期の参照ブロックの使用と、INTERコーディングブロックとINTRAコーディングの2種類のコーディングの間の決定とを含む。ROPEは、INTRAコーディング及び短期参照ブロックのためのモーメントを計算するのに用いられ、また、修正したROPEは、長期参照ブロックのためのモーメントを計算するのに用いられ、この場合、直前のブロックの成分は、任意の変数として処理される。
本発明の実施形態によれば、長期フレームは、高品質のフレームである。該高品質フレームは、特定の条件下で、参照フレームとして用いることができる。該条件は、例えば、映像が、それを介して受信されている接続の品質の変化を含んでもよい。該高品質フレームは、例えば、より高品質の接続の時間からの過去のフレームであってもよい。別の例示的な実施形態においては、高品質フレームは、予想される通信品質の変化よりも進んで保持される。このことは、不十分な品質の事前の警告または予測の結果であってもよく、あるいは、例えば、高品質フレームが使用可能であることを保障するために、定期的に実施してもよい。例えば、高品質参照フレームは、先行及び後続のフレームから、割当てられたビットレートの典型的な共用を奪うことにより、先行及び後続のフレームを犠牲にして、臨時に符号化することができる。追加的な実施形態においては、フレームは、静的及び動的な部分に分離される。例えば、背景部と前景部を識別してもよい。背景部のための高品質参照フレームは、その静的性質のため、かなりの時間周期で用いることができ、前景部は、最新のまたは最新に近い受信フレームによって動き補償される。
本発明の実施形態は、二重のまたは多数のフレーム保持実施形態と、単一の参照フレーム保持実施形態とを含む。例えば、二重フレーム実施形態は、(符号化すべき現在のフレームにおける)各ブロックを、過去の高品質参照フレーム及び最新の(短期)参照フレームと比較してもよく、かつよりよい結果をもたらすフレームを判断することにより、動き補償を実施してもよい。過去の高品質フレームは、長期参照フレームバッファ内に維持され、最新の参照フレームは、最新参照フレームバッファ内に維持される。最新の参照フレームが、過去の参照フレームよりもより高品質である場合には、該最新の参照フレームは、過去の高品質参照フレームとして該長期参照バッファ内に保持され、該直前の過去の高品質参照フレームは廃棄される。例示的な単一フレームの実施形態においては、単一の参照フレームバッファが維持される。高品質長期参照フレームは、それが古くなるまで、例えば、符号化すべき現在のフレームに対する類似性があるしきい値以下に低下するまで、該単一の参照フレームバッファに維持され、直前のフレームを参照フレームとして用いることを始める決断がなされる。
本発明の二重または多数フレームの実施形態における符号器の複雑性は、高品質フレームがベンチマークとして保持されるため、複雑性は、従来技術よりも小さい。従って、例えば、上記長期高品質フレームが尺度に合う限り、非常に多くの比較を実行する必要はない。加えて、最新のフレームと比較される該長期フレームの検査を、時々または定期的に実施してもよい。本発明の上記単一フレームの実施形態は、複雑性の低い符号器を提供し、追加的な符号器の複雑性を必要としない。
本発明の好適な実施形態の方法は、過去のより高レートの接続からのデータを用いて、長期動き補償を実施する。我々は、映像符号器が、例えば、常時最良接続(ABC)ネットワークを用いて伝送し、かつ現在の最良の接続が悪くなるため、ユーザがより低いレートの接続に切り替えなければならない状況を考える。フレームは、高レートチェネルを介して伝送され、フレームN+1で始まり、ユーザは、今、低レート接続を有しているため、該フレームは1からNまで高品質であると考える。MPEG−2またはH.263等の標準的な映像符号器の場合、低速接続が続いている間の映像品質は低くなる。(低速で伝送しなければならない)フレームN+1は、(高品質を有している)フレームNからINTERコーディングを用いることができるため、フレームN+1の品質は、ブロックマッチング動き補償は、高品質参照フレームを用いてなされるという事実から恩恵を受けることになる。しかし、フレームN+1は、レートがカットされているため、概して、フレームNよりも低品質となる。
フレームN+2を符号化する場合、ここで、フレームN+1を用いてINTERコーディングが行われ、そのため、品質がさらに低下する。低レート、低品質伝送に対応して、新たな定常状態が実現されるまで、品質が迅速に低下すると予想される。このシナリオにおいて、本発明の実施形態は、二重フレーム動き補償アプローチを用い、この場合、上記長期フレームバッファは、例えば、良好な接続が機能しなくなる前、および悪い接続が該良好な接続と代わる前のフレームN、つまり高品質、高速接続からの最新のフレームを含む。そのため、フレームMを符号化する場合、この場合M>N+1であるが、動き補償に使用可能な2つのフレーム、すなわち、短期フレームM−1(低品質の直前のフレーム)及び長期フレームN(高品質のより過去のフレーム)を有することになる。
多くのビデオ会議用途の場合のような、符号化すべきシーンが非常に静的である状況を考える。上記デバイスが、例えば、10Mbpsの無線LAN接続から、16kbpsのGPRS接続に切り替わった場合、該シーンの背景は、全く一定のままである可能性がある。長期の超高品質の過去から動き補償を用いると、現在のフレームに対して非常に正確なマッチがもたらされる可能性がある。一方、動き補償に対して、短期の過去のみを用いると、16kbpsというのは、非常に低速であり、低品質の映像を生成することになるため、悪い結果が生じる可能性がある。また、過去の高品質フレームが有利になるという別の理由もある。過去の高品質フレームが有利になる他の可能な状況は、一定の接続または変化する接続のいずれかによって発生する可能性がある。例えば、人または対象物がシーンを離れて、その後、該シーンに戻ってくるビデオ会議用途を考えてみる。直前のフレームのみを、符号化のための基準として用いることは、高品質情報をもたらさない。実際に、該人または対象物が、該シーンに戻ってくる非常に初期のフレームにおいては、それらに対して少しも高品質または低品質の参照情報を有していない。高品質の過去のフレームを保持している場合には、該人または対象物が、たとえ最初に該シーンに戻ってきても、高品質の参照情報を有することになる。そのため、これは、たとえ、シーンが静的でない場合であっても、上記長期の過去からの高品質の参照フレームが有用となる場合である。また、この種の利点は、ビデオ会議中の人が、ちょっとの間、席を立ち、そのため、数フレームの間、その人たちの顔が見えなくなり、その後、その人たちが近くに戻ってくる場合にも生じるであろう。直前のフレームのみを参照情報のために用いた場合、その人たちが戻ってきた場合には、当初、その人たちの顔のための参照はないであろう。
過去のより高いレートの接続の使用に対する変更及び追加的実施形態は、例えば、接続品質の変化に関する事前の警告または予報がある状況を含む。デバイスが、いくつかの事前の警告を有する場合、あるいは、現在の最良の接続の差し迫った障害、および低レート接続への切替えの必要性の差し迫った障害を予測することが可能な場合を考える。上記符号器が、上記長期フレームバッファのために、特定の高品質フレームを良好に利用することができることが分かっていれば、送信者は、実際に、切替えを実行する前に、特定の高品質を有する1つのフレームを符号化することができる。すなわち、直前及び後続のフレームから、それらのビットレートの通常の共用を奪うことにより、該符号器は、例えば、特定の高品質フレームを生成する、より十分な量子化を用いることができる。低速接続への切替えが実行されると、該符号器は、この特定のフレームを、二重フレーム動き補償における長期フレームバッファとして使用することができる。
別の変更例においては、高品質フレームは、時々または定期的に符号化される。このようにする一つの理由は、接続の品質の変化を防ぐためである。他の場合においては、このことは、接続の品質の変化に関係がない場合でも有用である。10番目のフレームに余分なビットを与え(それにより、次の10フレームに使用されるより高品質の長期参照フレームを生成する)ために、単一のユーザに、(例えば)9つのフレームのためにより小数のビットを使用させることを考える。このことは、必要な帯域幅の増加を伴うことなく、全体的により高品質の映像を生成するのに用いることができる。追加的な実施形態は、低トラフィックの間、または、追加ビットレートが使用可能な場合に、高品質フレームを符号化することを含む。また、このことは、例えば、高品質フレームのためのビットレートを割当てるサーバによって制御することができる。例えば、多数のユーザが帯域幅を共用している場合、サーバによって実施されるスケジューラは、該ユーザ(クライアント)間で、該帯域幅の一部を循環させてもよい。各クライアントは、定期的に、余分な帯域幅のバーストを割当てられる。該余分な帯域幅は、参照フレームとして使用される高品質フレームを符号化するのに用いられる。別の実施形態は、いくつかの先行するまたは後続のフレームから、高品質参照フレームを生成するためのビットの割り当てを奪うことにより、それら自体の帯域幅の割当を用いることにより補償するクライアントまたはピアユーザに関する。
また、本発明の実施形態は、データの静的及び動的部分を認識し、かつそのような認識に基づいて符号化を調節してもよい。符号化及び伝送すべき映像が、静的であるまたはそれに近い背景部と、動く前景部とからなる状況を想定する。これは、例えば、ビデオ電話及びビデオ会議用途の場合に生じる可能性がある。符号化すべき現在のフレームを、背景領域と前景領域とに分割することができる場合、(静的と仮定する)該背景は、長期の過去の高品質フレームを用いて動き補償することができ、かつ(非静的と仮定する)前景は、最新のフレームを用いて動き補償することができる。加えて、前景等のデータの動的部分は、高品質の長期フレームへの参照から恩恵を受けることが可能な場合がある。例えば、対象物または人が立ち去った後、シーンに戻ってくる映像の場合は、動的情報が、長期の高品質フレームから恩恵を受けることが可能である場合を示す。
本発明の追加的な実施形態は、上述した実施形態のいずれかまたは以下に記載する実施形態と共に、単一フレームの長期予測を用いる。二重フレームコンセプトを適用する代わりに、発明者等は、長期の過去のフレームが古くなるときまで、動き補償のために、高品質を有する単一フレームで長期の過去フレームを用いる(すなわち、該フレームが、現在のフレームと異なるため、予測のために、直前の悪い品質のフレームを用いたほうが好ましい)。上記二重フレームバッファコンセプトとは異なり、これは、上記符号器において、いかなる追加的な複雑性も必要としない。
本発明の追加的な実施形態は、復号器の隠蔽に関する。映像信号が圧縮されて、信頼できないチャネルを介して伝送される場合には、エラーを処理するいくつかの戦略を用いなければならない。一つの戦略は、該復号器によって用いることができる後処理法のファミリーであるエラー隠蔽である。受信したフレームの一部が破損している場合、該符号器の後処理法は、ビューアからこれを隠蔽しようとする。様々な代替法、すなわち、空間領域補間、周波数領域における推定、適切なブロックを参照フレームに配置することを含む時相隠蔽が存在する。本発明の実施形態において、発明者等は、上記符号器が、標準的な処理手順に従って符号化する、すなわち、直前のフレームが参照フレームとして用いられると仮定する。しかし、該復号器は、追加的な参照フレーム(長期の過去の高品質フレーム)及び直前のフレームを利用することができる。損失がある場合にのみ隠蔽する代わりに、該復号器は、過去の高品質の参照フレームを用いることにより、高品質のブロックと交換することができる、受信する非常に悪い品質のマクロブロックがある場合に、隠蔽を用いてもよい。これは、隠蔽というよりは、改善と呼ぶことができるが、時相隠蔽に対する変形と考えることもできる。本質において、該品質がかなり悪い場合には、実際には、ブロックが失われていなくても、ブロックが失われていると考えるように選択してもよく、また、高品質の過去フレームが、該失われたブロックを置換するために用いられるロス隠蔽アプローチを呼び出すことができる。
また、本発明の実施形態は、上記の符号化決定及びフレームワークの様々な組合せを含む。次に、いくつかの特定の好適な実施形態を詳細に論じ、また、様々な追加的な発明の特徴が当業者に理解されるであろう。
図1A及び図1Bは、本発明の実施のための例示的なシステムを示す。図1A及び図1Bのシステムは、本発明の上記実施形態のいずれかを用いてもよい。図1Aは、符号器を示す。図1Bは、復号器を示す。該符号器において、長期フレーム推定メモリ10は、モード選択に用いられる長期フレームに対する推定を格納する。それらの推定は、修正されたROPEアルゴリズムによって決定される。追加的な記憶装置12を構成する別のメモリは、長期メモリ10に格納されたものよりも古いフレーム推定を格納するのに用いることができる。追加的な記憶装置12は、フィードバックが用いられる、本発明の実施形態において用いられる。短期フレーム推定は、短期フレーム推定メモリ14に格納される。
レート/符号器制御論理16は、上記フレーム推定を用いて、歪みを計算し、レート歪みの最適化を実行する。また、該レート/符号器制御論理は、量子化パラメータ(QP)選択、動き補償及び再復号制御を制御する。スイッチ18は、イメージ画素(INTRAコーディング)または異なるイメージ画素(INTERコーディング)のいずれかを、離散コサイン変換器(DCT)20へ送るために、該レート/符号器制御論理によって制御される。量子化器22は、該レート/符号器制御論理16によって選択されたQPを考慮して、DCT20により出力された画像DCT係数を量子化し、量子化指数(係数)を出力する。該量子化指数を考慮して、逆量子化器24は、該QPを用いて、該画像DCT係数を再構成する。逆DCT26は、該DCT係数(例えば、8×8ブロックのDCT係数)を受け入れて、それらをイメージ画素または画素の差値に変換する。
INTERコーディングの場合、スイッチ28は、動き補償器30からの動き補償を用いて得られる予測を付加する。スイッチ28は、INTRAコーディングの場合、開いたままである。動き補償器30は、予測、短期フレームメモリ32(短期参照ブロックバッファの一形態)からの格納された短期フレーム、及び長期フレームメモリ34(長期参照ブロックバッファの一形態)からの格納された長期フレームを用いて、該現在のフレームに対して、動き推定を実行する。同様に、該動き補償器は、直前のステージで得られた運動ベクトルを用いて、動き補償を実行してもよい。また、該動き補償器は、フィードバックが使用可能なフレームであって、その参照フレームが、(本発明のフィードバック実施形態において)現在、フィードバックが利用可能なフレームの再復号化に用いられる追加的な過去の再復号化フレームを格納するメモリ36に緩衝記憶されているフレームのために、再復号化も実行する。そして、追加的な記憶装置12内の格納推定は、該再復号化されたものと等しく、従って、36に格納されたフレームと等しい。それは、ここでは、モード選択に用いられると共に、再復号化のため36で用いられるため、別々に示されている。
上記符号器(図1B)において、逆量子化器38は、量子化指数を受取り、上記QPを用いて、上記DCT係数を再構成する。該逆量子化器は、該符号器の逆量子化器24に関して等しい。逆DCT40は、該DCT係数を受け入れて、それらをイメージ画素または異なる画素値に変換する。該逆DCTは、該符号器の逆DCT26と等しい。スイッチ42は、予測を付加し、あるいは付加せず、また、上記符号器のスイッチ28と等価である。短期フレームメモリ44は、直前に再構成されたフレームを格納する。運動ベクトル復号器46は、受取った運動ベクトルを復号し、動き補償器48は、46によって供給される運動ベクトルと、短期フレームメモリ44及び再構成された長期フレームを格納する長期フレームメモリ50によって供給される参照とを用いて、動き補償を実行する。
次に、本発明の好適な追加的特定の方法を論じ、該方法は、図1A及び図1Bのシステムまたは他のシステムに用いることができる。図1A及び図1Bのシステム10において映像を符号化する方法は、高品質フレームを用いる。映像データは、フレームに分割される。それらのフレームは、背景及び前景等の領域に分割してもよい。このことは、上記符号器が、該映像データに関する情報を有している場合に有用となる。また、該映像データは、符号化演算をより単純にするブロックまたはマクロブロック等のユニットに分割してもよい。また、フレームは、全体として処理してもよい。該符号器は、上記復号器において予想される歪みを判断する。このことは、チャネルエラー確率及び過去の符号化モードの履歴に基づいてもよい。該符号器は、高品質の過去フレームを用いて、符号化されるフレームを改良する。
また、上記符号器は、データチャネル品質の変化を認識し、かつ符号化される画像または画像領域の内容の変化を格納してもよい。フィードバックは、上記復号器で予想される歪みの更新バージョンを格納するのに用いることができる。そして、該符号器により予想される復号器における歪み、該符号器におけるフレームバッファの数、該符号器におけるフレームバッファのサイズ、該復号器からのフィードバック、データチャネル品質を変化させることに関する履歴、および該フレームバッファに格納されているものの内容及び伝送された画像の(マクロブロック等の)符号化される各フレームまたは領域を判断するための画像または領域品質の変化の履歴を用いて、どのフレームバッファが参照バッファとして機能するかの判断が行われる。該判断は、圧縮比または映像品質またはある尺度のバランスのうちの一つを最大化するために行われる。
INTERコーディングとINTRAコーディングとの切替えは、本発明の実施形態において実施される決断である。発明者等は、パケットイレーザチャネルを介して作動するハイブリッド映像符号器におけるモード決断を実行できるROPEを利用する。
発明者等は、映像ビットストリームが、パケットイレーザチャネルを介して伝送されると仮定する。各フレームは、ブロック群(GOB)に分割される。各GOBは、マクロブロック(MBs)の単一の水平方向のスライスを含み、単一のパケットとして伝送される。各パケットは、再同期マーカにより、個別に受信し、復号することができる。従って、単一のパケットの損失は、MBsの1つのスライスを消してしまうが、該フレームの残りは無傷のままである。
各単一の画素に対するイレーザ確率でもある、パケットイレーザの確率をpとする。該イレーザが上記復号器により検知された場合、エラー隠蔽が適用される。該復号器は、該失われたマクロブロック上のGOBにおける3つの最も近いマクロブロックの運動ベクトル(MV)の中央をMVとして用いて、失われたマクロブロックを、直前のフレームからの1つと置き換える。上記GOBがすでに失われている(または、最も近いMBsが全てINTRAコーディングされており、そのため、運動ベクトルを有していない)場合には、全て0(0,0)のMVが用いられ、該失われたマクロブロックは、直前のフレームからの同じ場所に配置されたものと置換される。
Figure 0004593556
Figure 0004593556
である。
Figure 0004593556
Figure 0004593556
となる。
Figure 0004593556
Figure 0004593556
Figure 0004593556
で示される。
これらの再帰は、上記復号器における予想ひずみを計算するために、上記符号器において実行される。該符号器は、その符号化決断時に、各MBに対する符号化モードを最適に選択するために、この結果を利用することができる。
ROPEは、最適モードスイッチングに対する圧縮及び伝送エラーにより、上記予想ひずみを考慮する。上記符号器は、与えられたビットレート及びパケット損失レートに対する最適な方法で、マクロブロック基準で、INTRAコーディングとINTERコーディングの間で切り替わる。目的は、ビットレート制約Rにしたがって、全ひずみDを最少化することである。ラグランジュ乗数λを用いて、ROPEアルゴリズムは、トータルコストJ=D+λRを最少化する。このコストに寄与する個々のMBは、加法的であり、それに伴って、マクロブロック基準に関して最少化することができる。従って、各MBに対する符号化モードは、
min JMB=min (DMB+λRMB) (8)
mode mode
を最少化することにより選択される。ただし、MBのひずみDMBは、個々の画素のひずみ寄与の合計である。レート制御は、λを、J.Choi and D.Park,“A Stable Feedback Control of the Butter State Using the Controlled Lagrange Multiplier Method”,IEEE Trans.Image Proc.,vol.3,pp.546−58、1994年9月の場合のように変更することによって実現される。
本発明の実施形態は、レートひずみフレームワーク内での最適モードスイッチングと共に、二重フレームバッファを用いる。二重フレームバッファの基本的な利用は、以下の通りである。フレームnを符号化すると共に、上記符号器及び復号器は、共に、2つの参照フレームをメモリ内に維持する。上記短期参照フレームは、フレームn−1である。上記長期参照フレームは、例えば、フレームn−kであり、ただし、kは変化してもよいが、常に1よりも大きい。次に、該長期参照フレームがどのように選択されるかを説明する。
発明者等がジャンプアップデートと呼ぶ1つのアプローチにおいては、上記長期参照フレームは、フレームn−2からフレームn−N−1まで変化する。フレームnを符号化する際、該長期参照フレームがn−N−1である場合、上記符号器が、フレームn+1を符号化することに移ると、該短期参照フレームは、フレームnへ1つだけ前にスライドし、該長期参照フレームは、フレームn−1へNだけ前にジャンプすることになる。そして、該長期参照フレームは、N個のフレームにわたって静的のままであり、その後再び前にジャンプする。発明者等は、Nをジャンプアップデートパラメータと呼んでいる。
他のアプローチは、上記長期フレームバッファが、現在のバッファから固定された時相距離を有するフレームを含むように、該長期フレームバッファを継続的にアップデートすることである。そのため、該バッファは、常に、各フレームnに対するn−Dフレームを含む。発明者等は、Dを継続アップデートパラメータと呼んでいる。
ジャンプアップデート及び継続アップデートは、共に、より一般的な(N,D)アップデート戦略の特別なケースとみることができ、この場合、上記長期参照フレームは、符号化される現在のフレームから戻った距離Dにおけるフレームとなるように、量Nだけ前にジャンプし、その後、N個のフレームにわたって静的のままであり、再び前にジャンプする。一般的な(N,D)アップデートの場合、フレームkは、フレームk−Dと同様に新しいまたはフレームk−N−D+1と同様に古いLTフレームを有してもよい。ジャンプアップデートに関する発明者等の定義において、Nは、各シーケンスに対して自由に選択することができ、かつD=2とすることができる(アップデートが行われるとき、該LTフレームは、Nだけ前にジャンプして、フレームn−2になる)。継続アップデートにおいて、Dは、各シーケンスに対して自由に選択することができ、かつNは1に固定することができる。最も一般的なアップデート戦略は、固定されたNまたはDを有せず、むしろ上記長期フレームバッファは、どんなにフレームが最も有用であっても、必要な場合に、不定期に更新される。別のケースにおいては、(N,D)は、固定されたままであると共に、1つのシーケンスを符号化する。次に、該選択が符号化モードの間でどのように実行されるかを説明する。
各マクロブロックは、3つの符号かモード、すなわち、INTRAコーディング、上記短期バッファ(INTER−ST−コーディング)を用いたINTERコーディング、及び上記長期バッファ(INTER−LT−コーディング)を用いたINTERコーディングのうちの1つで符号化することができる。これら3つの間での選択は、修正したROPEアルゴリズムを用いて実行される。符号化モードが、一旦、選択されると、ビットストリームを符号化する構文は、単一のフレームバッファの標準的なケースとほとんど同じになる。INTERコーディングが選択された場合、該修正は、単に、単一のビットが、該短期または長期フレームの使用を示すために送信されることである。
Figure 0004593556
Figure 0004593556
Figure 0004593556
Figure 0004593556
エラー隠蔽が、上記長期フレームではなく、直前のフレームn−1を用いてなお行われていることに注意する。これは、上記3つのMBsが、INTER−STコーディングまたはINTER−LTコーディングされているか、あるいはこれら2つのある組合せでコーディングされているかに関係なく行われる。上記運動ベクトルは、高度に相関していなくてもよい。上位のGOBも失われている場合には、直前のフレームからの同じ位置に配置されたブロックを用いて該MBを隠蔽する。
隣接する相関関係のない運動ベクトルの存在は、運動ベクトル符号化効率に負の影響を与える。それら隣接する運動ベクトルからの運動ベクトルの正確でない予測により、ビットレートロスがある。さらに、圧縮効率は、上記フレームバッファを指定するために、各INTERコーディングされたMBに対して1ビットを用いるため、低減される。それにもかかわらず、実験結果は、レート歪みの最適化が、それら追加的なビットをモデル化し、かつなお、優れた圧縮性能をもたらすことが可能であることを示している。
Figure 0004593556
この計算の場合、発明者等は、ハーフ画素格子上の3種類の画素、すなわち、実際の(元の)画素位置(整数指数画素と呼ばれ、それらは補間する必要がない)と一致する画素と、2つの整数指数画素(水平方向または垂直方向のいずれか)の間に存在する画素と、4つの整数指数画素の間に対角線上に存在する画素との間で異ならせている。発明者等は、双線形補間を用いるため、該補間された値は、2つまたは4つの隣接する整数指数画素の単純な平均である。整数指数画素の場合、上記再帰等式は、従来のROPEアルゴリズムの等式と同じであり、該推定は最適である。
水平方向または垂直方向に補間された画素の場合、補間された画素領域上のjが、元の画素領域における画素k及びkを用いて補間された画素に対応すると仮定する。該第1のモーメントは、計算しやすい。
Figure 0004593556
しかし、該第2のモーメントの式は、
Figure 0004593556
である。
該最後の項は、その水平方向/垂直方向の大きさが、該画像の画素の数に等しい行列の相関を計算することを必要とする。このことは、小サイズの画像に対して、あるいは、十分な計算リソースを用いて、実施することができる。しかし、これは、典型的な計算リソースを用いた典型的なサイズの画像に対しては、計算的に好ましくない。コサイン不等式を用いることがほぼ好ましい。
Figure 0004593556
対角線上に補間された画素の場合、補間された画素格子上のjが、元の画素領域における補間画素k、k、k及びkの結果であると仮定する。該第1のモーメントは、
Figure 0004593556
のように正確に計算することができる。
該第2のモーメントの正確な式は、
Figure 0004593556
である。
上記水平/垂直のケースと同様の近似を適用して、
Figure 0004593556
を得て、この上限を用いて、該第2のモーメントを近似する。
本発明の一実施形態は、修正されたH.263+映像コーデックである。これは、実験でテストされている。発明者等は、現在のH.263+映像コーデックを2つの方法で修正した。単一フレーム(SF)動き補償の場合、発明者等は、モード切替え判断にROPEアルゴリズムを用いた。結果として生じるビットストリームは、H.263+規格に完全に準拠している。第二に、発明者等は、H.263+映像コーデックを修正して、1つの追加的な(長期)フレームバッファを用いる。このフレームバッファは、上記言及したFukuhara等の場合のように、更新パラメータNに従って定期的に更新された。上記単一フレームの場合も二重フレームの場合も、発明者等は、整数及びハーフ画素運動ベクトルのパフォーマンスを測定した。該ハーフ画素ベクトルが用いられて、上述した近似を用いてモデル化される。
発明者等の実験は、上記長期フレームバッファの追加が、上記符号器の圧縮を有効に改善し、かつビットストリームを、パケットドロップに対してより強くさせたことを示した。しかし、あるシーケンスの場合には、効果は小さく、また、該効果は、更新パラメータNに依存する。固定されたNは、全てのシーケンスに対して最適なわけではない。最適化は、特定のシーケンスのための特定の更新パラメータNを選択することを含む。
本発明の複数フレーム符号化の実施形態は、レートスイッチングネットワークに適用される。長期または高品質参照フレームを用いることができる。例えば、無線ネットワークが、著しいネットワーク容量の変化にたびたびあうことを考える。そのような変化をもたらす例示的な事例は、ABCアプローチ等のサービスを利用している間のネットワークのハンドオフである。この文脈における長期または高品質フレームを用いた二重フレーム符号化は、該ネットワークがハンドオフし、ネットワーク容量における突然で激しい変化を静めた直後に送信されたフレームの品質を著しく改善することができる。
好適な実施形態において、長期過去フレームは、高帯域幅から低帯域幅へのネットワークスイッチングの直前に符号化された最後のフレームとなるように割り当てられる。このことを図2に示し、この場合、10Mbpsから10〜20kbpsの変化の接続が発生する。現在のフレームnは、高レート接続からの長期フレームn−Dを用いて符号化される。予測フレームにおける各マクロブロック(MB)の場合、直前のフレーム及び長期過去フレームに対して、サーチが実施されて、より良好なマッチングブロックが選択される。
次に、修正された実際的な実施形態を考えて、図2の方法を、MPEG−4符号化で作動するABCネットワークに適用する。ABCのようなサービスの下で作動する映像符号器は、帯域幅の大きな変化に対して強くなければならない。該ABCネットワークは、最小限の損失で、パケットのタイムリーな配信を提供すると仮定する。帯域幅の大きな変動を阻止するために、各フレームの量子化パラメータは、規格に準拠した符号器とは対照的に、その全レンジ(1〜31)にわたって変化することができ、これは、該量子化パラメータの値の変化を、直前の値の25%に制限する。
発明者等は、標準的なMPEG−4符号器を変更することにより、複数フレーム帯域幅スイッチングの実施形態をシミュレートした。該MPEG−4符号器は、A.Vetro,H.Sun,Y.Wang,“MPEG−4 Rate Control for Multiple Video Objects”,IEEE Transactions on Circuits and Systems for Video Technology,Vol.9,No.1,pp.186−99,1999年2月に記載されているレート制御法を用いる。発明者等は、各フレームを、該MPEG−4符号器に対する単一のオブジェクトとみなした。発明者等は、上記長期フレームに対して、追加的なメモリを割り当てた。追加ビットが、該符号器にどのフレームを参照するかを知らせるために、INTERコーディングされたMBごとに送信される。該INTRAリフレッシュ期間を100に設定した。該INTRAリフレッシュ期間を減らすと、上記二重フレーム符号器のパフォーマンスが高まった。しかし、頻繁なINTRAリフレッシュは、GPRS(General Packet Radio Service)システムに使用できるビットレートを越えるであろう高いビットレートをもたらす。
発明者等は、静的及び動的な背景及びシーン変化を用いて、異なる種類の映像シーケンスをテストした。該テストシーケンスのフォーマットは、QCIF(Quarter Common Interchange Format)とした。フレームレートは、10フレーム/秒とした。異なる低帯域幅ネットワークへのスイッチングの効果を調べるため、発明者等は、1Mbpsから、10kbps(GPRS)〜150kbps(1xRTT CDMA)の低帯域幅ネットワークへのスイッチングをシミュレートした。発明者等は、本発明の二重フレームバッファ符号器、及び比較のために従来のMPEG−4符号器を用いて、様々なシーケンスを符号化した。発明者等は、上記高品質フレームを、該二重フレーム符号器のための上記長期過去フレームとして用いるように維持することが、復号されたシーケンスのPSNRによって量子化された場合の低帯域幅接続への切替え後に、数百フレームまでに対して良好な映像品質をもたらすことを見いだした。この方法は、該二重参照フレームを保持するための(該符号器及び復号器における)小さなメモリコストと、最良のマッチブロックのための第2の参照フレームをサーチするための復号器の複雑性の小さなコストとを要する。
ある場合においては、帯域幅の差し迫った切替えは、例えば、前もって警告または予測することにより、予期することができる。このことは、より高い帯域幅にある間に長期フレームを符号化する機会を与える。
別の実施形態において、長期フレームは、(例えば、帯域幅またはチャネル/ネットワーク状況の変化がない場合であっても)定期的にまたは時節使用され、高品質フレームを該長期フレームとして生成するために、特別な帯域幅が割り当てられる。このことは、時節または定期的に、例えば、Nフレームごとに、高品質の長期参照フレームを得る積極的なアプローチである。
特別なビットは、該ビットが、符号化される通常の品質よりも高い品質を有することになるように、高品質の参照フレームを生成するために割り当てられる。そして、この長期高品質参照フレームは、延長期間の高品質マッチングブロックのソースとして作用することができる。一つの実施例において、該延長期間は、状況の変化が発生した場合、Nフレームを越えてもよい。
上記特別なビットの割当は、スケジューラによって生じることができる。例えば、スケジューラによって割り当てられるシステムリソースを用いる多くのユーザがいるとする。発明者等が考えるシステムは、400kbpsのレートを有するHDR(high data rate)等の共用無線媒体である。スケジューラSは、k人のユーザの間で該ネットワークからの使用可能な帯域幅Bを等しく分割する。各ユーザは、B/kの帯域幅を有する。スケジューラSは、全帯域幅のうちのある部分bを確保して、残りを全てのユーザで分ける。該確保された部分bも各ユーザに割り当てられ、該ユーザ間でラウンドロビン方式で巡回させる。各ユーザは、k−1のタイムスロットの間、帯域幅(B−b)/kを有し、かつ1つの時間スロットの間、帯域幅b+(B−b)/kを有する。図3A及び図3Bは、2つのスケジューラを示し、この場合、該帯域幅は高さで表わされ、水平軸は時間である。図3AのスケジューラSは一様であるが、スケジューラSにおける該スケジューラが追加的な帯域幅を与えた場合の図3Bにおけるユーザiの場合は高い。このことは、ユーザiに割り当てられた特別な帯域幅を表わす厚く黒いバーによって示されている。この特別な帯域幅は、異なる時間において、該システムにおける他のk−1のユーザに割り当てられる。全てのユーザに対する平均的な帯域幅は、どの時刻においても同じままである。Sによって割り当てられた該特別な周期的帯域幅は、複数の、例えば、二重の動き補償スキームにおける長期フレームとして用いられる高品質フレームを生成するのに用いられる。
他の実施形態はスケジューラを用いないが、ある程度の余分な遅延を映像において許容できる場合には、固定された平均的な帯域幅を有するユーザが、(前後のフレームに対してより少ないビットで)1つのフレームに対して特別なビットを使用することを可能にする。該フレームのための特別なビットは、該フレームの送信のためのより多くの時間に単純に変化する。圧縮性能と遅延とのトレードオフがあってもよい。上記スケジューラの実施形態においては、特別な帯域幅が定期的に与えられるため、高品質フレームに対して余分な遅延が発生しないように、該スケジューラを作動させることが可能である。しかし、均等に割り当てられたSシステムの帯域幅に対して等しくなる全平均帯域幅を強要する可能性がある。
特定の実施形態を変更したMPEG−4符号器は、選択するための3つのモードの符号化、すなわち、INTRAコーディング、上記短期参照フレームを用いるINTERコーディング及び上記長期参照フレームを用いるINTERコーディングを有する。各マクロブロック(MB)に対しては、まず、次のように、INTRAコーディング及びINTERコーディングから選択することにより選択する。発明者等は、該短期または長期フレームにおける最良のマッチングMBと、符号化すべき現在のMBとの間のひずみdminを計算する。発明者等は、該現在のMBの標準偏差σを計算する。INTRAコーディングは、σ<dmin−512である場合に選択され、そうでない場合には、INTERコーディングが選択される。該短期及び長期高品質フレームからのINTERコーディングの選択は、動き補償されたMBと、符号化すべき該現在のMBとの間のひずみに基づいてなされる。低ひずみをもたらす参照フレームが選択される。
別の実施形態は、上記復号器からのフィードバックの利用を含む。実例として、該符号器は、受信したパケットの肯定応答を示す、該復号器からのフィードバックを受取ることができる。iを現在のフレームの指数とする。固定された遅延dを伴うフィードバックを用いると、該符号器は、該復号器の(i−d)番目の復元フレームの完全な知識を有することができる。発明者等は、過去のフレームの該復号器のバージョンと同じになるように、該過去のフレームを復号するために、該フィードバック情報を用いるという該符号器のプロセスを説明するために、再復号(re−decode)という用語を用いることにする。該符号器が、どのGOBsが完全に受信され、かつどのGOBsがドロップしたかを知っている場合、該符号器は、エラー隠蔽を含めて、該復号器の動作を厳密にシミュレートすることができる。再復号されたフレームは、該復号器バージョンと等しい符号器におけるものであり、発明者等は、該フィードバック情報を該符号器のためにまだ使用することができない該符号器におけるフレームを説明するために、推定という用語を用い、そのため、該符号器は、該復号器バージョンを推定するように強いられる。フィードバック情報の場合、中間フレームにおける画素値の推定は、なお、INTRAコーディングされたMB、INTER−STコーディングされたMB及びINTER−LTコーディングされたMBのための上記等式を用いて実行される。しかし、それらの等式によって要求される過去の復号器フレームに関する情報は、肯定応答された及び否定応答された再復号フレームを用いて再初期化することができる。そして、該符号器は、より多くの信頼度で画素推定を再計算し、最後のdフレームに対する可能性のあるエラーを追跡することができる。実際の予測剰余またはイントラ係数は、ROPE推定アルゴリズムに与えられ、この場合、上記参照フレームは、再帰的に計算されるROPE推定または再復号されたフレームのいずれかである。
実施例を図4に示す。ここで、ジャンプ更新パラメータ及びフィードバック遅延は、それぞれ、N=2及びd=5である。ジャンプ更新パラメータN=2は、フレーム0が、フレーム2及びフレーム3のための長期参照となり、フレーム2が、フレーム4及びフレーム5のための長期参照となり、フレーム4が、フレーム6及びフレーム7のために用いられることを意味する。
符号化フレーム7のスタート時においてd=5であるため、フレーム2が再復号され、この新たに再復号されたフレームは、フレーム3、4、5及び6の推定を更新するのに直ちに用いることができる。符号化フレーム7の場合、該長期フレームはフレーム4であり、該短期フレームはフレーム6であり、これら2つのフレームの新しい推定は、上記符号器によって、フレーム7に対するパケットドロップによる予測ひずみを計算するのに用いられる。
代替のアプローチは、(i−d)フレームである最も近い正確に分かっているフレームを含ませるために、上記長期フレームバッファを前に移動させることである。フィードバック情報は、上記STフレームの推定を改善し、かつゼロへの上記LTフレームの推定誤差を低減する。発明者等は、上記符号器及び復号器の長期フレームバッファが常に同一の復元を含むことを保証する。遅延dの場合には、D=d及びN>1を用いた通常の(N,D)更新戦略、または、D=d及びN=1を用いた継続的更新戦略のいずれかを用いることができる。N=2及びd=5の場合の実施例を図5に示す。図5において、フレーム12は、現在、符号化中である。そのLTフレームは、再復号されているフレーム7である。しかし、再符号化フレーム7は、それぞれそのST及びLTフレームである、フレーム1及びフレーム6の再符号化バージョンを必要とする。ここで、8、9、10及び11の推定を得ることができる。フレーム8の場合、再復号化された7及び再復号された3が必要となる。9の場合、推定された8(ST)及び再復号された3(LT)が必要となる。10の場合、推定された9及び再復号された5が必要となる。同様に、11は、推定された10及び再復号された5を必要とする。
上記送信機及び受信機における上記長期フレームバッファを同期させることにより、パケットドロップの累積によって引き起こされるドリフトエラーを完全になくすことができる。INTER−LT符号化されたマクロブロックは、それらが届いた場合に、上記符号器及び復号器において同じ方法で復元されることになる。通常、このことは、INTRAコーディングされたマクロブロックを送信することによってのみ保証される。しかし、ここで、フィードバック信号は、圧縮効率を大幅に犠牲にすることなく、上記長期フレームバッファを、追加的なエラー強さとして用いることを可能にする。
ひずみ推定を単に改善して、モード選択を改善するためにフィードバックを用いる代わりに、上記符号器における上記LTフレームを再復号するためにこの情報を用いて動き推定を改善してもよく、また、より実際的な参照フレームを用いてもよい。実験は、このことが様々な条件の下で非常に良好に実行することを示している。
本発明の特定の実施形態を示しかつ説明してきたが、当業者には、他の変更例、置換え及び代替例が明白であることを理解すべきである。そのような変更例、置換え及び代替例は、本発明の趣旨及び範囲を逸脱することなく実行することができ、それは添付クレームから判断すべきである。
本発明の種々の特徴を添付クレームに記載する。
本発明の実施形態に係る例示的なシステムを示すブロック図である。 本発明の実施形態に係る例示的なシステムを示すブロック図である。 レートスイッチングシナリオにおける、本発明の例示的な長期参照フレーム符号化法を示す概略図である。 図3Aは、スケジューラを概略的に示す。図3Bは、スケジューラを概略的に示し、該スケジューラは、高品質の参照フレームの生成のために、追加的な帯域幅をユーザに割当てる。 本発明の実施形態に係る、フィードバックを伴う長期参照フレーム符号化法を概略的に示す。 本発明の実施形態に係る、フィードバックを伴う長期参照フレーム符号化法を概略的に示す。

Claims (14)

  1. 少なくとも一つの短期参照ブロックを格納する短期参照ブロックバッファと、少なくとも一つの長期参照ブロックを格納する少なくとも一つの長期参照ブロックバッファと、を含むメモリと、
    少なくとも参照ブロックに関して、少なくとも画像ブロックの特徴を表すベクトルを符号化する符号化器と、を備え、
    前記符号化器は、符号化するときに調べた1つ以上の要因に基づいて、該符号化器により使用される接続が、低品質に変化することが予想される場合、前記短期参照ブロックバッファ内の前記少なくとも一つの短期参照ブロック及び前記長期参照バッファ内の前記少なくとも一つの長期参照ブロックを選択するように構成され、
    前記要因は、少なくともデータチャネル品質の変化の履歴を含み、さらに必要に応じて、符号化される各少なくとも一つのブロックのために前記少なくとも一つの長期参照ブロックと前記少なくとも一つの短期参照ブロックとの間で選択的に選ばれる画像領域品質の変化の履歴によって決定される前記符号化器の復号器におけるひずみの予想、前記符号化器におけるフレームバッファの数、前記符号化器におけるフレームバッファのサイズ、前記復号器からのフィードバックの中から選択される1つ以上を含むことを特徴とする映像符号化器。
  2. 前記符号化器は、背景データを符号化するために、前記少なくとも一つの長期参照ブロックを選択的に選び、かつ前景データを符号化するために、より最新の参照ブロックを選択的に選ぶことを特徴とする請求項1に記載の符号化器。
  3. 前記より最新の参照ブロックが、直前の参照ブロックを含むことを特徴とする請求項2に記載の符号化器。
  4. 前記少なくとも一つの長期参照ブロックが、前記直前の参照ブロックの直前に先行するブロックを少なくとも含むことを特徴とする請求項3に記載の符号化器。
  5. 前記符号化するときに調べた1つ以上の要因が、さらに、前記少なくとも一つの長期参照バッファを更新するときを判断するために用いられることを特徴とする請求項1に記載の符号化器。
  6. 前記符号化器が、複数の長期参照ブロックバッファを備えることを特徴とする請求項4に記載の符号化器。
  7. 前記より最新の参照ブロックが、前記直前の参照ブロックを含むことを特徴とする請求項6に記載の符号化器。
  8. 前記符号化器が、前記少なくとも一つの長期参照ブロックのために、かつ一部の画素格子上の、
    実際の画素位置と一致する画素を含む元の画素位置と、
    2つの元の画素位置の間に位置する画素を含む、水平方向にまたは垂直方向に補間された画素位置と、及び、
    対角線状に補間された画素位置とを判断することにより、一部の画素の正確な符号化を実施することを特徴とする請求項1に記載の符号化器。
  9. 前記水平方向にまたは垂直方向に補間された画素位置及び前記対角線状に補間された画素位置の第1のモーメントが直接計算され、
    前記水平方向にまたは垂直方向に補間された画素位置及び前記対角線状に補間された画素位置の第2のモーメントが計算されるように構成したことを特徴とする請求項8に記載の符号化器。
  10. 前記符号化器が、INTERコーディングとINTRAコーディングの2種類との間で選択し、前記2種類のINTERコーディングが、前記少なくとも一つの短期参照ブロック(ST)及び前記少なくとも一つの長期参照ブロック(LT)を用いた符号化を含み、
    前記符号化器が、前のブロックの要素を任意の変数として処理するROPEを用いて、前記INTRAコーディング及び前記STブロックのためのモーメントを計算し、かつ、
    前記符号化器が、前のブロックの要素を任意の変数として処理するROPEを用いて、前記LTブロックのためのモーメントを計算することを特徴とする請求項1に記載の符号化器。
  11. 前記LTブロックが更新され、かつ前記符号化器が、復号器フィードバックを受け、かつ、前記フィードバックを利用して、前記LTブロックを更新するときを判断することを特徴とする請求項10に記載の符号化器。
  12. 前記符号化器が、前記長期参照バッファを同期させるために前記フィードバックを利用することを特徴とする請求項11に記載の符号化器。
  13. 前記少なくとも一つの長期参照ブロックが長期参照フレームを含み、前記符号化器が、一ブロックずつフレームを符号化することを特徴とする請求項1に記載の符号化器。
  14. 前記メモリは、少なくとも一つの短期参照ブロックを格納する前記短期参照ブロックバッファ短期メモリと、少なくとも一つの長期参照ブロックを格納する前記少なくとも一つの短期参照ブロックバッファを定義する長期メモリと、
    を備えることを特徴とする請求項1に記載の符号化器。
JP2006500860A 2003-01-09 2004-01-09 映像符号化方法及びデバイス Expired - Lifetime JP4593556B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US43889403P 2003-01-09 2003-01-09
US51746703P 2003-11-05 2003-11-05
PCT/US2004/000446 WO2004064373A2 (en) 2003-01-09 2004-01-09 Video encoding methods and devices

Publications (2)

Publication Number Publication Date
JP2006518560A JP2006518560A (ja) 2006-08-10
JP4593556B2 true JP4593556B2 (ja) 2010-12-08

Family

ID=32718021

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006500860A Expired - Lifetime JP4593556B2 (ja) 2003-01-09 2004-01-09 映像符号化方法及びデバイス

Country Status (4)

Country Link
US (1) US8040949B2 (ja)
EP (1) EP1582064A4 (ja)
JP (1) JP4593556B2 (ja)
WO (1) WO2004064373A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140017000A (ko) * 2011-07-01 2014-02-10 애플 인크. 카메라와 배경 모션에 기반한 기준 프레임 버퍼의 적응적 구성

Families Citing this family (99)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8824553B2 (en) 2003-05-12 2014-09-02 Google Inc. Video compression method
TW200525902A (en) 2003-12-25 2005-08-01 Nec Corp Moving image encoding method and apparatus
KR101200924B1 (ko) * 2004-08-31 2012-11-14 톰슨 라이센싱 다수의 기준 화상에 대한 고속 움직임 추정
EP1845735A4 (en) * 2004-12-28 2009-07-15 Nec Corp CODING PROCESS FOR MOBILE PICTURES AND DEVICE AND COMPUTER PROGRAM THEREWITH
EP1936996A3 (en) * 2005-04-28 2011-07-27 Apple Inc. Video processing in a multi-participant video conference
US20060256772A1 (en) * 2005-05-12 2006-11-16 Yahoo! Inc. Selecting a network for routing real-time audio
JP4574444B2 (ja) 2005-05-27 2010-11-04 キヤノン株式会社 画像復号装置及び方法、画像符号化装置及び方法、コンピュータプログラム及び記憶媒体
US20070030894A1 (en) * 2005-08-03 2007-02-08 Nokia Corporation Method, device, and module for improved encoding mode control in video encoding
KR100712532B1 (ko) * 2005-09-10 2007-04-30 삼성전자주식회사 단일표현과 다중표현 전환을 이용한 동영상 변환부호화장치 및 방법
US20070199011A1 (en) * 2006-02-17 2007-08-23 Sony Corporation System and method for high quality AVC encoding
US7912129B2 (en) * 2006-03-16 2011-03-22 Sony Corporation Uni-modal based fast half-pel and fast quarter-pel refinement for video encoding
FR2903270B1 (fr) * 2006-06-30 2008-08-29 Canon Kk Procede et dispositif de codage d'une sequence d'images, systeme de telecommunication comportant un tel dispositif et programme mettant en oeuvre un tel procede
BRPI0715952A2 (pt) * 2006-08-28 2013-07-30 Thomson Licensing mÉtodo e aparelho para determinar a distorÇço esperada em blocos de vÍdeo decodificados
US8711929B2 (en) * 2006-11-01 2014-04-29 Skyfire Labs, Inc. Network-based dynamic encoding
US9247260B1 (en) 2006-11-01 2016-01-26 Opera Software Ireland Limited Hybrid bitmap-mode encoding
WO2008092104A2 (en) * 2007-01-25 2008-07-31 Skyfire Labs, Inc. Dynamic client-server video tiling streaming
US8494049B2 (en) * 2007-04-09 2013-07-23 Cisco Technology, Inc. Long term reference frame management with error video feedback for compressed video communication
JP4924228B2 (ja) * 2007-06-19 2012-04-25 ソニー株式会社 画像処理装置、画像処理方法、およびプログラム
WO2009032255A2 (en) * 2007-09-04 2009-03-12 The Regents Of The University Of California Hierarchical motion vector processing method, software and devices
US20090067495A1 (en) * 2007-09-11 2009-03-12 The Hong Kong University Of Science And Technology Rate distortion optimization for inter mode generation for error resilient video coding
US8401083B2 (en) * 2007-09-18 2013-03-19 Ubiquity Holdings, Inc Extreme video compression over a fixed bandwidth channel
US8660175B2 (en) 2007-12-10 2014-02-25 Qualcomm Incorporated Selective display of interpolated or extrapolated video units
JP4871305B2 (ja) * 2008-01-10 2012-02-08 Kddi株式会社 動画像の圧縮符号化装置
KR101480001B1 (ko) 2008-02-26 2015-01-09 삼성디스플레이 주식회사 유기 발광 표시 장치 및 그 구동 방법
US8861598B2 (en) * 2008-03-19 2014-10-14 Cisco Technology, Inc. Video compression using search techniques of long-term reference memory
US20090304086A1 (en) * 2008-06-06 2009-12-10 Apple Inc. Method and system for video coder and decoder joint optimization
FR2932938B1 (fr) * 2008-06-19 2012-11-16 Canon Kk Procede et dispositif de transmission de donnees
JP4978575B2 (ja) * 2008-06-25 2012-07-18 富士通株式会社 シンクライアントシステムにおける画像符号化方法及び画像符号化プログラム
US8270307B2 (en) * 2008-09-05 2012-09-18 Cisco Technology, Inc. Network-adaptive preemptive repair in real-time video
US8326075B2 (en) 2008-09-11 2012-12-04 Google Inc. System and method for video encoding using adaptive loop filter
US8385404B2 (en) * 2008-09-11 2013-02-26 Google Inc. System and method for video encoding using constructed reference frame
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US8340180B2 (en) * 2009-03-20 2012-12-25 Cisco Technology, Inc. Camera coupled reference frame
JP5522174B2 (ja) * 2009-08-21 2014-06-18 日本電気株式会社 動画像符号化装置
FR2954036B1 (fr) * 2009-12-11 2012-01-13 Thales Sa Procede et systeme pour la determination de parametres de codage sur des flux a resolution variable
US9106933B1 (en) 2010-05-18 2015-08-11 Google Inc. Apparatus and method for encoding video using different second-stage transform
US8503528B2 (en) 2010-09-15 2013-08-06 Google Inc. System and method for encoding video using temporal filter
WO2012050832A1 (en) 2010-09-28 2012-04-19 Google Inc. Systems and methods utilizing efficient video compression techniques for providing static image data
US8976856B2 (en) 2010-09-30 2015-03-10 Apple Inc. Optimized deblocking filters
US9532059B2 (en) 2010-10-05 2016-12-27 Google Technology Holdings LLC Method and apparatus for spatial scalability for video coding
DK2630797T3 (da) * 2010-10-20 2019-08-26 Guangdong Oppo Mobile Telecommunications Corp Ltd Fejlrobust rateforvrængningsoptimering til billed- og videokodning
US8842723B2 (en) * 2011-01-03 2014-09-23 Apple Inc. Video coding system using implied reference frames
US9210442B2 (en) 2011-01-12 2015-12-08 Google Technology Holdings LLC Efficient transform unit representation
US9380319B2 (en) * 2011-02-04 2016-06-28 Google Technology Holdings LLC Implicit transform unit representation
US8938001B1 (en) 2011-04-05 2015-01-20 Google Inc. Apparatus and method for coding using combinations
US8780996B2 (en) 2011-04-07 2014-07-15 Google, Inc. System and method for encoding and decoding video data
US9154799B2 (en) 2011-04-07 2015-10-06 Google Inc. Encoding and decoding motion via image segmentation
US8781004B1 (en) 2011-04-07 2014-07-15 Google Inc. System and method for encoding video using variable loop filter
US8780971B1 (en) 2011-04-07 2014-07-15 Google, Inc. System and method of encoding using selectable loop filters
US8989256B2 (en) 2011-05-25 2015-03-24 Google Inc. Method and apparatus for using segmentation-based coding of prediction information
US9414086B2 (en) * 2011-06-04 2016-08-09 Apple Inc. Partial frame utilization in video codecs
US8891616B1 (en) 2011-07-27 2014-11-18 Google Inc. Method and apparatus for entropy encoding based on encoding cost
PL2749027T3 (pl) 2011-08-25 2020-10-19 Sun Patent Trust Sposoby i urządzenia do kodowania i dekodowania wideo z użyciem zaktualizowanego opisu bufora
GB2495467B (en) * 2011-09-02 2017-12-13 Skype Video coding
GB2495469B (en) * 2011-09-02 2017-12-13 Skype Video coding
ES2685431T3 (es) 2011-09-07 2018-10-09 Sun Patent Trust Procedimiento de decodificación de imágenes y aparato de decodificación de imágenes
US8885706B2 (en) 2011-09-16 2014-11-11 Google Inc. Apparatus and methodology for a video codec system with noise reduction capability
ES2844148T3 (es) 2011-09-19 2021-07-21 Sun Patent Trust Procedimiento de descodificación de imágenes, dispositivo de descodificación de imágenes
CN104025598B (zh) 2011-10-19 2017-11-14 太阳专利托管公司 图像编码方法、图像编码装置
US9247257B1 (en) 2011-11-30 2016-01-26 Google Inc. Segmentation based entropy encoding and decoding
JP5727398B2 (ja) * 2012-01-26 2015-06-03 日本電信電話株式会社 動画像符号化方法,動画像符号化装置および動画像符号化プログラム
US10536726B2 (en) * 2012-02-24 2020-01-14 Apple Inc. Pixel patch collection for prediction in video coding system
US9094681B1 (en) 2012-02-28 2015-07-28 Google Inc. Adaptive segmentation
US9131073B1 (en) 2012-03-02 2015-09-08 Google Inc. Motion estimation aided noise reduction
US11039138B1 (en) 2012-03-08 2021-06-15 Google Llc Adaptive coding of prediction modes using probability distributions
US9451288B2 (en) 2012-06-08 2016-09-20 Apple Inc. Inferred key frames for fast initiation of video coding sessions
US9332309B2 (en) 2012-06-08 2016-05-03 Apple Inc. Sync frame recovery in real time video transmission system
US8819525B1 (en) 2012-06-14 2014-08-26 Google Inc. Error concealment guided robustness
US9774856B1 (en) 2012-07-02 2017-09-26 Google Inc. Adaptive stochastic entropy coding
US9344729B1 (en) 2012-07-11 2016-05-17 Google Inc. Selective prediction signal filtering
US9332276B1 (en) 2012-08-09 2016-05-03 Google Inc. Variable-sized super block based direct prediction mode
US9380298B1 (en) 2012-08-10 2016-06-28 Google Inc. Object-based intra-prediction
US9491487B2 (en) * 2012-09-25 2016-11-08 Apple Inc. Error resilient management of picture order count in predictive coding systems
US9264737B2 (en) 2012-10-01 2016-02-16 Apple Inc. Error resilient transmission of random access frames and global coding parameters
US9219915B1 (en) 2013-01-17 2015-12-22 Google Inc. Selection of transform size in video coding
US9967559B1 (en) 2013-02-11 2018-05-08 Google Llc Motion vector dependent spatial transformation in video coding
US9544597B1 (en) 2013-02-11 2017-01-10 Google Inc. Hybrid transform in video encoding and decoding
US9509998B1 (en) 2013-04-04 2016-11-29 Google Inc. Conditional predictive multi-symbol run-length coding
US9674530B1 (en) 2013-04-30 2017-06-06 Google Inc. Hybrid transforms in video coding
WO2014190468A1 (en) 2013-05-27 2014-12-04 Microsoft Corporation Video encoder for images
US9756331B1 (en) 2013-06-17 2017-09-05 Google Inc. Advance coded reference prediction
US9392288B2 (en) 2013-10-17 2016-07-12 Google Inc. Video coding using scatter-based scan tables
US9179151B2 (en) 2013-10-18 2015-11-03 Google Inc. Spatial proximity context entropy coding
EP3120556B1 (en) 2014-03-17 2021-01-13 Microsoft Technology Licensing, LLC Encoder-side decisions for screen content encoding
US10102613B2 (en) 2014-09-25 2018-10-16 Google Llc Frequency-domain denoising
US9565451B1 (en) 2014-10-31 2017-02-07 Google Inc. Prediction dependent transform coding
CN106416254B (zh) 2015-02-06 2019-08-02 微软技术许可有限责任公司 在媒体编码期间跳过评估阶段
US10136132B2 (en) 2015-07-21 2018-11-20 Microsoft Technology Licensing, Llc Adaptive skip or zero block detection combined with transform size decision
EP3319317B1 (en) 2015-07-30 2021-04-28 Huawei Technologies Co., Ltd. Video encoding and decoding method and device
US9769499B2 (en) 2015-08-11 2017-09-19 Google Inc. Super-transform video coding
US10277905B2 (en) 2015-09-14 2019-04-30 Google Llc Transform selection for non-baseband signal coding
US9807423B1 (en) 2015-11-24 2017-10-31 Google Inc. Hybrid transform scheme for video coding
CN105578196B (zh) * 2015-12-25 2020-10-09 广东中星微电子有限公司 视频图像处理方法及设备
US10453221B2 (en) * 2017-04-10 2019-10-22 Intel Corporation Region based processing
US20180343098A1 (en) * 2017-05-24 2018-11-29 Qualcomm Incorporated Techniques and apparatuses for controlling negative acknowledgement (nack) transmissions for video communications
US11032567B2 (en) * 2018-07-20 2021-06-08 Intel Corporation Automatic adaptive long term reference frame selection for video process and video coding
EP3888368A4 (en) * 2018-11-27 2022-03-02 OP Solutions, LLC ADAPTIVE TIME REFERENCE IMAGE CROSS-REFERENCE FILTER NOT AVAILABLE TO RELATED APPLICATIONS
US11122297B2 (en) 2019-05-03 2021-09-14 Google Llc Using border-aligned block functions for image compression
CN117746470A (zh) * 2022-12-16 2024-03-22 行吟信息科技(武汉)有限公司 人脸区域识别方法、装置、电子设备及存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5398079A (en) * 1993-01-27 1995-03-14 General Instrument Corporation Half-pixel interpolation for a motion compensated digital video system
US5638128A (en) * 1994-11-08 1997-06-10 General Instrument Corporation Of Delaware Pixel interpolation filters for video decompression processor
JPH0955941A (ja) * 1995-08-16 1997-02-25 Sony Corp 画像符号化方法、画像符号化装置、及び画像符号化データの記録装置
JP3347954B2 (ja) * 1995-11-02 2002-11-20 三菱電機株式会社 動画像符号化装置及び動画像復号化装置
US6249318B1 (en) * 1997-09-12 2001-06-19 8×8, Inc. Video coding/decoding arrangement and method therefor
US6807231B1 (en) * 1997-09-12 2004-10-19 8×8, Inc. Multi-hypothesis motion-compensated video image predictor
EP1089569A1 (en) * 1999-04-19 2001-04-04 Sony Corporation Image encoding device and its method
JP2001103392A (ja) 1999-09-29 2001-04-13 Nec Ic Microcomput Syst Ltd 画像枠生成回路及びそれを用いたデジタルテレビシステム
JP2001275118A (ja) * 2000-03-28 2001-10-05 Matsushita Electric Ind Co Ltd 画像通信装置
GB2381403B (en) 2000-05-10 2004-12-01 Picturetel Corp Video coding using multiple buffers

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140017000A (ko) * 2011-07-01 2014-02-10 애플 인크. 카메라와 배경 모션에 기반한 기준 프레임 버퍼의 적응적 구성
US9232233B2 (en) 2011-07-01 2016-01-05 Apple Inc. Adaptive configuration of reference frame buffer based on camera and background motion
KR101627399B1 (ko) * 2011-07-01 2016-06-03 애플 인크. 카메라와 배경 모션에 기반한 기준 프레임 버퍼의 적응적 구성

Also Published As

Publication number Publication date
WO2004064373A2 (en) 2004-07-29
US20060098738A1 (en) 2006-05-11
JP2006518560A (ja) 2006-08-10
WO2004064373A3 (en) 2005-01-20
EP1582064A4 (en) 2009-07-29
EP1582064A2 (en) 2005-10-05
US8040949B2 (en) 2011-10-18

Similar Documents

Publication Publication Date Title
JP4593556B2 (ja) 映像符号化方法及びデバイス
CN100499788C (zh) 视频编码设备
KR100468726B1 (ko) 실시간 가변 비트율 제어를 수행하는 부호화 장치 및 방법
US8428136B2 (en) Dynamic image encoding method and device and program using the same
EP1429564A1 (en) Moving picture encoding/transmission system, moving picture encoding/transmission method, and encoding apparatus, decoding apparatus, encoding method, decoding method, and program usable for the same
US20110150074A1 (en) Two-pass encoder
US9036699B2 (en) Video coding
CA2600750A1 (en) Content adaptive multimedia processing
EP2730086A1 (en) Rate -distortion optimized video encoding mode selection based on low complexity error propagation tracking
JP2007523525A (ja) 回転マッチングを使用して動きを予測する映像符号化装置及び方法
WO2012175721A1 (en) Low complexity mode selection
EP2712481A1 (en) Mode decision with perceptual - based intra switching
KR101959490B1 (ko) 비디오 비트율 제어 방법 및 그 장치
KR100856392B1 (ko) 현재 영상의 복원영역을 참조하는 동영상 부호화/복호화장치 및 그 방법
KR20050105550A (ko) 평균 히스토그램 오차 방식을 이용한 h.263/mpeg비디오 인코더 및 그 제어 방법
Liu et al. MPEG video transcoding with joint temporal-spatial rate control
KR20090037288A (ko) 동영상 부호화 데이터율 제어를 위한 실시간 장면 전환검출 방법, 이를 이용한 영상통화 품질 향상 방법, 및영상통화 시스템
KR20060063604A (ko) 영상 신호의 인코딩 및 디코딩 방법
Tiwari et al. Delay constrained multiplexing of video streams using dual-frame video coding
KR20040039809A (ko) 동영상 부호화기 및 이를 이용한 부호화 방법
Momcilovic et al. Adaptive motion estimation algorithm for H. 264/AVC
KR101307469B1 (ko) 비디오 인코더, 비디오 디코더, 비디오 인코딩 방법 및 비디오 디코딩 방법
Pereira Analysis for Video Coding: Moving It from the Encoder to the Decoder
Bonuccelli et al. „Video Transcoding Techniques in Mobile Systems “
Slowack et al. Refining WZ rate estimation in DVC with feedback channel constraints

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090915

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091214

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100216

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100513

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100727

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100831

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100915

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130924

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4593556

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term