JP5841940B2 - 画像のハイブリッド開ループ/閉ループ圧縮 - Google Patents

画像のハイブリッド開ループ/閉ループ圧縮 Download PDF

Info

Publication number
JP5841940B2
JP5841940B2 JP2012519020A JP2012519020A JP5841940B2 JP 5841940 B2 JP5841940 B2 JP 5841940B2 JP 2012519020 A JP2012519020 A JP 2012519020A JP 2012519020 A JP2012519020 A JP 2012519020A JP 5841940 B2 JP5841940 B2 JP 5841940B2
Authority
JP
Japan
Prior art keywords
block
predictor
prediction
value
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012519020A
Other languages
English (en)
Other versions
JP2012533201A (ja
Inventor
デイヴィーズ,トーマス
バーレット,ジェームズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
British Broadcasting Corp
Original Assignee
British Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/EP2009/058879 external-priority patent/WO2011003479A1/en
Priority claimed from PCT/EP2009/058880 external-priority patent/WO2011003480A1/en
Application filed by British Broadcasting Corp filed Critical British Broadcasting Corp
Publication of JP2012533201A publication Critical patent/JP2012533201A/ja
Application granted granted Critical
Publication of JP5841940B2 publication Critical patent/JP5841940B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/43Hardware specially adapted for motion estimation or compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

画像の圧縮
本発明は、画像の圧縮符号化に関し、詳細には動画系列における画像の符号化に関する。ここでは、画像という用語は、フィールドおよびフレームを含むものとして使用される。
差分パルス符号変調(DPCM)として知られている、画像圧縮における初期の考えは、画素値ではなくて、その画素値とその画素についての予測値との間の差を伝送することであった。この差分手法により、画像における空間的な冗長度を利用することができ、画像の動画系列における空間的かつ時間的な冗長度を利用することができる。
よく知られているMPEG圧縮方式へとビデオ圧縮技法が開発されるにつれて、時間領域における差分技法を使用することに注意が向けられた。連続した画像におけるブロック間の移動ベクトルを確定する正確な動き測定技法を使用する場合、画像間の差を非常に小さくすることができ、非常に効率的に符号化することができる。空間的な冗長度を利用するには、空間変換技法が好ましく、画像の動き予測がされた(インター符号化された)領域と動き予測なしの(イントラ符号化された)領域の両方に適用された。
したがって、よく認められたビデオ符号器は、動き補償予測、DCTまたは他の空間変換、量子化、および、可変長符号化またはエントロピー符号化を含んでいた。
MPEGおよび他の符号化組織では、符号化効率を上げ、HDTVおよびさらに高い画像解像度への符号化機能を拡張するための努力が続いている。
MPEG−4 Part 10/AVC/H.264に含まれる1つの技法は、空間変換をイントラ画像予測で補足することである。復号器では、既に復号化され復元された各ブロックからのデータを使用して、現在のブロックに対して空間予測を実現することができる。符号器では、このイントラ予測は、もちろんローカルな復号器を介して利用可能になる。
このさらなる空間予測は、特に、エッジのディテール、および斜め縞など指向性の強いテクスチャに対して、著しく性能を向上させることが分かってきた。
しかし、実験によれば、性能の向上はブロックのサイズが小さい場合に最大となり、ブロックサイズが増大するにつれて性能が低下することが分かってきた。まずこれが問題であるが、それというのも、小さいブロックサイズに対しては変換符号化利得が相対的に低く、効率的な変換符号化には大きいブロックサイズが必要となるからである。第2に、より高い精細度への動きには、必然的にさらに大きいブロックサイズが必要となる。いくつかの例を挙げれば、4×4のブロックサイズでは、イントラ予測が良好に機能することが分かってきた。8×8のブロックに移動すると、変換符号化利得が約1dBになる可能性があるが、空間予測がより複雑になり、その効果が低下する。HD解像度以上では、16×16ブロック以上の変換が必要になる(恐らくUHDTVでは64×64までになる)。
動き補償予測には同様の対立点が存在する。すなわち、ブロックサイズが大きくなると、符号化される動きベクトルは少なくなければならず、残りについてはより大きい変換を使用することが可能になる。しかし、恐らくは何らかの小さい対象またはブロック領域内の対象の一部分の動きが原因で、大きいブロックのある部分では予測性能が低下することになる可能性が増す。
本発明は、効果的な予測に必要となる小さいブロックサイズと、(特に精細度が増す場合の)効果的な変換符号化利得に必要となる大きいブロックサイズとの間のこうした対立点に対処するものである。
したがって、本発明は、圧縮符号化の一方法における一態様にあり、入力画像値と画像予測値の間の差を形成するステップと、この差を変換するステップとを含み、画像予測が、下流側の復号器での正確な復元を可能にする予測値に限定されているプレディクタPと、下流側の復号器での正確な復元を可能にする予測値に限定されていない空間プレディクタPとの組合せによって形成される。
空間プレディクタPは、現行ブロック内の各画素にアクセスすることができ、その結果、効果的な変換符号化にとって十分大きいブロック内で、効果的なイントラ画像空間予測が可能になる。
空間プレディクタPと下流側の復号器での正確な復元を可能にする予測値に限定されているプレディクタPとの組合せにより、雑音の増大を制御できるようになることがある。この組合せは、以下のように、プレディクタPおよびプレディクタPのそれぞれの出力の加重和を含んでもよい。
P=(1−c)P+cP
ここで、cはゼロから1の間で可変の重み付け因子である。
cは、雑音増大の制御および予測の確度を最適化するように選んでもよいが、総合的な予測は、この例では重みが変化しない。
因子c、または、より一般的には、プレディクタPとプレディクタPの相対的な重み付けは、画像の内容で変化することがある。
しばしば、プレディクタPは、たとえば、前述のH.264空間プレディクタなどの空間プレディクタになる。他の構成では、プレディクタPは、MPEG規格においてよく知られている動き補償予測などの時間プレディクタである。
他の態様では、本発明は、これまでに概説したように符号化されたビットストリームの圧縮復号化の一方法にあり、画像の差を表すビットストリームを受け取るステップと、プレディクタPの予測値を正確に復元するステップと、プレディクタPの予測値を正確にではなく復元するステップと、復元された予測値の組合せを使用して、画像の差と加算するステップとを含む。
しかもさらなる態様では、本発明は、画像情報を受け取り、この画像情報を空間ブロックに分割するブロックスプリッタと、ブロック上で動作して、そのブロックについてのブロック予測値を提供するブロックプレディクタと、画像情報および予測値を受け取り、差分値を形成する減算器手段と、空間変換を実行して変換係数を提供するブロック変換と、この変換係数に対して近似値を生成するための量子化ユニットと、変換係数を符号化して、符号化されたビットストリームにするためのエントロピー符号化ユニットと、変換係数を復元するための逆量子化ユニットと、変換係数に逆空間変換を実行して局所的に復号化された画像値を提供する逆ブロック変換と、この局所的に復号化された画像値上で動作して、ローカル復号器予測値を提供するローカル復号器プレディクタとを備えるビデオ圧縮符号器であって、前記減算器手段が受け取った予測値が、ブロック予測値とローカル復号器予測値の組合せを含むビデオ圧縮符号器にある。
この態様では、本発明はまた、各ブロックにおいて系統づけられた変換済みの画像の差を表す圧縮符号化されたビットストリームを受け取る入力部と、再スケーリング化された変換係数を提供する逆量子化ユニットと、この変換係数に逆空間変換を実行して、復号化された画像値を提供する逆ブロック変換器と、この復号化された画像値上で動作して、前記画像の差と加算するための予測値を提供するプレディクタとを備えるビデオ圧縮復号器であって、このプレディクタが、特定のブロックの完全に外側で動作して、そのブロック内での画像の差と加算するためのクローズド予測値を提供するクローズドプレディクタと、特定のブロックの少なくとも部分的に内部で動作して、そのブロック内での画像の差と加算するためのオープン予測値を提供するオープンプレディクタとを備え、この予測値が、クローズド予測値とオープン予測値の組合せを含むビデオ圧縮復号器にある。
しかもさらなる態様では、本発明は、画像情報を受け取り、この画像情報を空間ブロックに分割するブロックスプリッタ手段と、ブロック上で動作して、そのブロックについてのブロック予測値を提供するブロックプレディクタ手段と、画像情報および予測値を受け取り、画像の差分値を形成する減算器手段と、この画像の差分値に空間変換を実行して変換係数を提供するブロック変換手段と、変換係数を近似するための量子化手段と、変換係数を復元するための逆量子化手段と、変換係数に逆空間変換を実行して、局所的に復号化された画像値を提供する逆ブロック変換手段と、この局所的に復号化された画像値上で動作して、ローカル復号器予測値を提供するローカル復号器プレディクタ手段とを符号器内に備えるビデオ圧縮システムであって、前記減算器手段が受け取った予測値が、ブロック予測値とローカル復号器予測値の可変の組合せを含み、ビデオ圧縮システムはさらに、量子化された変換係数を表し前記組合せの変動を記録するパラメータを含む圧縮符号化されたビットストリームを出力するための手段を符号器内に備え、前記圧縮符号化されたビットストリームを受け取ることと、変換係数に逆空間変換を実行して、復号化された画像値を提供する逆ブロック変換手段と、変換係数を復元するための逆量子化手段と、復号化された画像値上で動作して、前記画像の差と加算するための予測値を提供するプレディクタ手段とを復号器内にさらに含み、このプレディクタ手段が、特定のブロックの完全に外側で動作して、そのブロック内での画像の差と加算するためのクローズド予測値を提供するクローズドプレディクタと、特定のブロックの少なくとも部分的に内部で動作して、そのブロック内での画像の差と加算するためのオープン予測値を提供するオープンプレディクタとを備え、この予測値が、クローズド予測値とオープン予測値の可変の組合せを含み、この組合せが、ビットストリーム内の前記パラメータに従って予測手段によって変化するビデオ圧縮システムにある。
ここで、画像予測値Pは次式で形成されることが適切である。
P=(1−c)P+cP
ここで、Pはブロック予測値であり、Pはローカル復号器予測値であり、cはゼロから1の間で可変の重み付け因子である。
他の態様では、本発明は、圧縮符号化の一方法にあり、入力画像値と画像予測値の間の差を形成するステップと、この差を変換するステップとを含み、画像予測が、下流側の復号器での正確な復元を可能にする予測値に限定されている閉ループプレディクタ(CLP)と、下流側の復号器での正確な復元を可能にする予測値に限定されていない開ループプレディクタ(OLP)との組合せによって形成され、開ループプレディクタおよび変換は、同じ時間領域または空間領域にある。
この組合せは、CLPおよびOLPのそれぞれの出力の重み付けされた合計を含むことが適切であり、CLPおよびOLPの相対的な重み付けは、画像の内容で変化してもよい。画像予測Pは次式で形成される。
P=(1−c)P+cP
ここで、cはゼロから1の間で可変の重み付け因子であり、PはCLPの予測値であり、PはOLPの予測値である。
一変形形態では、CLPは空間プレディクタであり、OLPは空間プレディクタである。CLPは、同じ画像内の、隣接していて前に符号化されたブロックから、あるブロックを予測してもよい。OLPは、同じ変換ブロック内の隣接する画素の平均または他の組合せをとる、画素ごとの空間プレディクタでもよい。空間変換は、ブロック変換、離散コサイン変換(DCT)、離散サイン変換(DST)、ウェーブレット変換、ブロック化ウェーブレット変換、重複直交変換(LOT)、ブロック化LOT、または前述したもののいずれかに近いものからなる群から選択されてもよい。空間プレディクタは、動き補償予測の後に、すなわち動き補償された予測残差に実行してもよい。
他の変形形態では、CLPは、前に符号化された画像からの動き補償予測(または、複数の動き補償予測の組合せ)であり、OLPは空間プレディクタである。CLPは、ブロックベースの動き補償予測でもよい。OLPは、同じ変換ブロック内の隣接する画素の平均または他の組合せ平均をとる、画素ごとの空間プレディクタでもよい。空間変換は、ブロック変換、離散コサイン変換(DCT)、離散サイン変換(DST)、ウェーブレット変換、ブロック化ウェーブレット変換、重複直交変換(LOT)、ブロック化LOT、または前述したもののいずれかに近いものからなる群から選択されてもよい。
さらに他の変形形態では、CLPは空間プレディクタであり、OLPは、前に符号化された画像からの動き補償予測(または、複数の動き補償予測の組合せ)である。OLPは、ブロックベースの動き補償予測でもよい。CLPは、同じ画像内の前に符号化されたブロックからの空間プレディクタでもよい。時間変換は、ブロック変換、離散コサイン変換(DCT)、離散サイン変換(DST)、ウェーブレット変換、ブロック化ウェーブレット変換、重複直交変換(LOT)、ブロック化LOT、または前述したもののいずれかに近いものからなる群から選択される。
しかもさらなる変形形態では、CLPおよびOLPは、前に符号化された画像からの動き補償予測(または、複数の動き補償予測の組合せ)である。OLPは、ブロックベースの動き補償予測でもよい。CLPは、ブロックベースの動き補償予測でもよい。時間変換は、ブロック変換、離散コサイン変換(DCT)、離散サイン変換(DST)、ウェーブレット変換、ブロック化ウェーブレット変換、重複直交変換(LOT)、ブロック化LOT、または前述したもののいずれかに近いものからなる群から選択されてもよい。
組合せ因子cは、たとえば、ブロックごと、またはフレームごと、または画像のグループ(GOP)ごとに変化してもよい。組合せ因子は、何らかの(1つまたは複数の)所定のパターンに従って、変換ブロック内で変化してもよい。組合せ因子は、追加のメタデータに含まれてもよく、符号化データと一緒に運搬してもよい。符号化データと一緒に運搬されるインデックスまたはフラグにより、選ばれたパターンを符号化してもよい。
2つのプレディクタの利得を合計すると1になることがある。
他の態様では、本発明は、これまでに説明してきた主張のいずれか1つに従って符号化されたビットストリームの圧縮復号化の一方法にあり、画像の差を表すビットストリームを受け取るステップと、プレディクタPの予測値を正確に復元するステップと、プレディクタPの予測値を正確にではなく復元するステップと、復元された予測値の組合せを使用して、画像の差と加算するステップとを含む。
1組のフレーム、たとえば、Fの前の全てのフレームが符号化されている4つのフレームF、FN+1、FN+2、FN+3を考える。
(k=N、N+1、N+2、N+3)内の各ブロックについて、ある1つのブロックは、2つの動きベクトルを有することもでき、この1つのベクトルは、Fの前のフレームからの閉ループプレディクタを表し、もう一方のブロックは、たとえばちょうど前のフレームからの、セット内の各フレームからの開ループプレディクタを表す。動きベクトルの両方のセットが送信されることになる。
可能なら復元されたデータを使用して、また不可能ならば元のデータを使用して各フレームに動き補償を実行することもでき、各ブロックは、それぞれの種類の1つの動きベクトルを有し、混合予測を使用する。
次いで、たとえば4ポイントDCTまたはアダマール変換などの時間変換を4つのフレームに適用することもでき、さらに、各ブロックに適用されている任意の空間変換に適用することもできる。ブロック係数は、量子化され符号化されることになる。
復号器では、4つのフレーム全てが一緒に変換されたので、その全てが直ちに復号化されることになる。逆変換(空間および時間)の後に、これにより4つの残留フレームが生じる。与えられた動きベクトルを使用すると、復元されたデータを使用して動き補償を加えることができる。開ループ予測が常に前のフレームからの場合、各フレームが順番に処理されるなら、復元されたデータが常に利用可能である。
用語「前」および「後」が使用されてきたが、各フレームの順序は、アプリケーション内での実際の時間順である必要はなく、何らかの時間の並べ換えをして、後の参照ならびに前の参照が利用可能になるようにしてもよかったことに留意されたい。したがって、これらの用語はまた、符号化順序においても前または後を意味することができる。
次に、添付図面を参照しながら、一例として本発明を説明する。
既知の空間予測技法を示す図である。 符号器のブロック図である。 空間予測を示す図である。 符号器のブロック図である。 マルチパス符号化技法を示すブロック図である。 マルチパス符号化技法を示すブロック図である。
既に述べたように、MPEG Part 10/AVC/H.264(これより、便宜上H.264と呼ぶ)は、以前のMPEG規格への追加仕様を含み、これによりブロックのイントラ予測が可能になる。ブロックの上部に沿った左側へのデータは、既に復号化され復元されているが、これを使用して、ここで差動的に符号化できる現在のブロックに対して予測を実行することができる。図1には、起こり得る8つの方向予測が示してあり、4×4のブロックに対して使用することができる(前に復元されたサンプルには影がついている)。これらの方向予測に加えて、ブロックのエッジにおける画素の平均値からDCを予測することができ、合計で9つのモードが生じる。16×16および8×8のブロックに対しては、他の予測が利用可能である。
H.264イントラ予測ツールにより、空間予測符号化と変換符号化を組み合わせることの利点が示された。エッジのディテール、および斜め縞など指向性の強いテクスチャに対して、これは特に効果的であった。
しかし、良好な予測を行うのに必要な小さいブロックと、良好な変換符号化利得を得るのに必要な大きいブロックとの間の固有の対立点には、1つの問題がある。
ブロックサイズが増大した空間予測符号化における効率の低下は、現在の画素と予測の基となる画素との間の距離が(少なくとも、ラスタ走査されたブロックの端部に向けて)増大することから生じるものと理解することができる。この距離が増大するにつれて、画素間の相関が低下し、差動符号化効率も低下する。
同様に、動き補償予測により、MPEG−1以降のビデオ圧縮規格の不可欠な部分が形成された。重要な問題は、ブロックサイズと予測確度の間のトレードオフである。ブロックサイズが大きくなると符号化すべき動きベクトルの数が少なくて済むが、予測確度が低下する。それというのも、小さい対象または大きいブロック内の対象の各部分が、そのブロックの残りに対して差動的に移動しうるからである。したがって、あるブロックから他のブロックへの遷移を変換することが困難にならないよう、ブロック変換は一般に予測ブロック内全体に実行されるので、変換ブロックサイズが制約される。H.264では、非常に広範囲の動きブロックパーティションの中から選択することにより、これらのトレードオフが実現されうる。
望ましいことは、変換によって可能になる場合よりも細かい粒度で予測することである。しかし、ブロック内では、復号器に利用可能なサンプルは、復号化され復元されたサンプルである。符号器で使用されるサンプルは元のサンプルであり、後続の量子化によって異なるものになる。この意味では、予測は開ループであり、符号器が使用する予測値が復号器で正確に復元できるよう符号器内のローカル復号器が保証する場合に設けられる閉ループとは対照的である。この差により、著しく雑音が増大することもある。
復元雑音がどのように増大する可能性があるのか理解するために、P(x,...,xr−1)がサンプルx(k=0,...,r−1)からのサンプルxの予測を表すものとする。したがって、予測残差yが次式で与えられる。
=x−P(x,...,xr−1
L=T−1QTは、シーケンスyを変換し、量子化し、逆量子化し、また逆変換するプロセスを表すものとする。差し当たり、Lの効果は、分散値がσ の雑音源nをyに付加することであると仮定することができる。すなわち、
=L(y)=y+n
復元に際しては、復号器は以下のように形成する。
=Y+P(X,...,Xr−1
Yrでの雑音nに加えて、前に復元された値Xのそれぞれに雑音が加わることにより、予測が異なることになり、したがってこの雑音が増大する可能性がある。具体的には、良好なプレディクタPは通常、DCにおいて利得が1なので、1−Pはゼロを意味し、逆フィルタは極を有する、すなわちDCにおいて無限利得を有することになる。したがって、雑音は際限なく増大する可能性がある。閉ループプレディクタは、符号器においても復元された値Xを使用するが、この問題が生じることはない。
したがって、変換符号器とともに閉ループプレディクタを使用すると、予測の確度(ブロックが大きい場合)または変換の効率(ブロックが小さい場合)のいずれかに制限が生じるという問題があり、開ループプレディクタでは、雑音利得に際限がなくなる可能性がある。
ここで、この問題に対するソリューションを説明する。
数学的には、PおよびPを2つのプレディクタと定義する。符号器において、Pは閉ループに加えられて、前に符号化され復元された係数から単独で構成される予測を生成することになり、Pは開ループに加えられ、すなわち、元の符号化されていない係数から予測値を生成するように加えられることになる。もちろん、復号器においては、両方の予測は、復元された係数を使用しなければならない。
の一例により、隣接する各ブロック内での画素によって、あるブロック内での画素を予測することができるはずである。Pの一例により、同じブロック内に存在しているかどうかを問わず、すぐ側に隣接する各画素から、ある画素を予測することができるはずである。
次いで、新規に組み合わせたプレディクタPを次式から生成することができる。
P=(1−c)P+cP
この場合、因子cはPに該当する。この因子cは、それがゼロと1の間にある場合、復号器内の開ループプレディクタが寄与する雑音における減衰係数または漏れ係数として働き、これにより、雑音の増大が制御される。さらに、組み合わせたプレディクタは、閉ループプレディクタの相補的な寄与があるので、優れたプレディクタのままであるが、相補的な閉ループプレディクタがない場合、因子cが小さくなるにつれて予測の有効性が低下するはずである。具体的には、両方のプレディクタがDCを排除する場合、組み合わせたプレディクタもDCを排除することになる。
符号器アーキテクチャの一例が図2に示してある。入力ビデオがブロックスプリッタBで受け取られ、このスプリッタが入力データを各ブロックに分割する。ブロック情報が、ブロック格納装置BSと減算器(200)に供給される。ブロック格納装置BSは、開ループプレディクタPにデータを供給する。このプレディクタは、ブロック内で動作して、現在の画素に対する予測値を提供する。予測値は、一例では、水平左側、斜め上部左側、および現在の画素の垂直上側での3つの画素それぞれの算術平均の形をとる。さらなる隣接画素または様々な隣接画素を利用し、様々な隣接画素に異なる重み付けを加えることにより、予測値を他の様々な方式で形成できることが理解されよう。
からの予測値は、利得因子cを用いる乗算器(204)を介して、ネガディブ入力として減算器(200)に供給される。パラメータcは通常、ゼロから1の間で変化してもよい。この利得制御は、cが1未満であるとき、普通なら開ループプレディクタを使用することに関連するはずである雑音増大の問題に対処する。
減算器(200)からの出力は、第2の減算器(204)を通って、従来型のDCTまたは他の空間変換ブロックTに入る。変換装置Tは、受け取った画像の差に演算を実行して、一般的に従来型の量子化装置ブロックQに変換係数を提供する。量子化された変換係数は、ブロックECにおいて可変長符号化または他のエントロピー符号化を受けて、符号器の出力ビットストリームを提供する。
閉ループ予測を実現するために、局所的に復号化されたブロック格納装置LDBSが、前に復元されたデータ値のみを使用して、ちょうど復号器において復元されるように復元された値を含むように維持される。好都合なことに、閉ループ空間予測は、既知のH.264空間プレディクタまたは動き補償プレディクタの形をとってもよい。
閉ループ空間予測値が、(1−c)の利得制御因子を用いる乗算器を介して、ネガディブ入力として減算器に引き渡される。
逆量子化ブロックQ−1、逆変換ブロックT−1、および、同じ比率で、ただしLBDS自体からの前に復号化された復元値のみを使用して予測を付加することにより、LDBSからの値が構成される。
ブロック動作に際しては、フィードフォワードプレディクタPはまた、ブロックがラスタ順で走査されている場合にはブロックの上部左側において、利用可能であれば復元されたサンプルを使用できることに留意されたい。したがって、Pに入力されたサンプルはまた、Pに入力される。これは、予測には、可能な限り復元されたサンプルが使用されることを意味する。
したがって、図3を参照すると、現在の4×4のブロック上の行および左の列における各画素(図ではXの印がついている)は、図に網掛けで示してある(現在のブロックの外側の)局所的に復号化された画素から、完全にまたはほとんど予測することができる。その結果、符号器と復号器での予測をブロックごとに同期することによって、より一層雑音の増大を制限することになるはずである。
このブロックの上部左側では符号器と復号器の間での発散がほとんどまたは全くないので、そこでは低度の漏れが必要となることがあり、したがって、これらの領域でより良好な予測が使用可能になる。すなわち、パラメータcは、画像内容に従った任意の変化に加えて、ブロック内の現在の画素の位置で変化してもよい。画素の位置でのこの変化は、必ずしもビットストリーム内で信号伝送する必要はなく、たとえば、工業標準または事実上の標準の一部分を形成してもよい。
この手法では、予測生成および差分生成についての係数の順序は、ラスタ順ではなく、ブロックごとになり、次のブロックに移動する前に各ブロック内で係数を走査する。ブロック内でのラスタ走査を使用することもできるが、たとえば、図3に示すような同心の「L」形で走査して、他の走査パターンがよりよい結果を生み出すこともある。
ここで予測全体には重み付け因子がないので、このアーキテクチャでは、スプリアス周波数成分を発生させることなく、ブロック全体にわたって漏れの程度を変化させることが可能になる。
cが固定の場合、有効値は約0.5であることが分かった。
パラメータcは、使用されているブロックサイズ、選択されている量子化パラメータ、および2つの予測の相対的な成功に応じて、互いの異なる画像内容について最適化してもよい。ブロックサイズが小さくて、量子化のレベルが低いと、一般に符号器の開ループ予測と復号器の開ループ予測との間の相違は少なくなり、したがって、ビットストリーム内での符号化を介して、または管理標準に従って、cの値全体をこれらの環境において1に近づけるように調整することもできる。
このシステムは、あらゆる範囲のプレディクタと容易に組み合わせることができるので、特に魅力的である。たとえば、Pは、H.264で既に定義されている方向性プレディクタとすることもでき、Pは、方向性をもつ画素ごとのプレディクタとすることもできる。あるいは、Pは、動き補償された時間プレディクタとすることもできる。
または、ウェーブレット符号化においては、ある形態の階層符号化を実行することもでき、ローパス係数により、各レベルで閉ループ予測が実現される。
さらなる変形形態では、固定数のcがとり得る値を事前に決定することもでき、符号器は、特定のブロックもしくはブロックのセットについて使用するための最適値を選択することができ、または閉ループプレディクタを使用するようにのみ選択することもできる。各ブロックまたはブロックのセットの変換係数に付随するメタデータを送信して、開ループ予測が使用されたかどうか、またcのうちどの値が利用されたかを示す。
たとえば、場合により1/4、1/2、3/4および1など、cのうちのゼロ以外のとり得る4つの値を使用してもよい。15/32、25/32、10/32および22/32の値は、良好に機能することが示された。符号器は、通常、何らかの速度ひずみ最適化法により、使用すべき最適値を選択するはずである。
しかもさらなる変形形態では、値cを固定してもよいが、開ループ予測は、複数の実現可能なプレディクタの間で変化してもよい。各ブロックまたはブロックのセットの変換係数に付随するメタデータを送信して、開ループ予測が使用されたかどうか、またそうであれば、いずれが使用されたかを示す。
たとえば、4つの異なる方向性空間プレディクタ、すなわち、水平プレディクタ、垂直プレディクタ、およびこれらの垂直および水平のプレディクタに対して45度の角度の2つの斜めプレディクタを使用してもよい。
既存のビデオ規格での構成可能な選択肢を符号化するためのよく知られた方法により、個々のブロックまたはブロックのセットについて予測法を構成するためのメタデータを符号化してもよい。たとえば、符号器は、開ループプレディクタの有無を示すフラグをまず符号化する。開ループプレディクタが存在する場合、選ばれた選択肢を複数のビットで符号化することもできる。典型的なスキームによって2の選択肢が可能になり、N=2の場合の以下の擬似コードと同様に、Nビットで符号化される。
EncodeBit (using_open_loop);
if (1==using_open_loop) {
EncodeBit (combined_pred_mode & 0x01);
EncodeBit ((combined_pred_mode & 0x02)>>1);
}
あるいは、1つのブロックのメタデータと、前に符号化されたブロックのメタデータとの間には、何らかの相関が存在することもある。その場合、符号器は、H.264でのイントラ予測モードを符号化するために使用されるスキームと同様のスキームに従ってもよい。開ループが追加の予測モードとして使用されていない場合を考慮してもよく、2+1の選択肢がある。次いで、この予測が使用されているかどうかを示すフラッグが符号化される。使用されていない場合、N=2の場合の以下の擬似コードで示すようにNビットを使用して、残りの2個のモードを符号化することができる。
predicted_mode = get_mode_prediction ( );
EncodeBit (combined_pred_mode==predicted_mode);
if (combined_pred_mode<predicted_mode) {
EncodeBit (combined_pred_mode & 0x01);
EncodeBit ((combined_pred_mode & 0x02)>>1);
}
else if (combined_pred_mode>predicted_mode) {
combined_pred_mode = combined_pred_mode-1;
EncodeBit (combined_pred_mode & 0x01);
EncodeBit ((combined_pred_mode & 0x02)>>1);
}
復号器のアーキテクチャが図4に示してある。復号器では、ビットストリームは、エントロピー復号化ブロックEDが受け取り、逆量子化ブロックQ−1および逆変換ブロックT−1を通過する。逆変換ブロックの出力が、復号化されたブロック格納装置DBSの入力に送られる。復号化されたブロック格納装置からの復号化されたデータは、閉ループプレディクタPおよび開ループプレディクタPの入力に送られる。Pの出力は、利得制御因子cを用いる乗算器(404)を介して、加算器(402)に送られる。プレディクタPの出力は、利得制御因子(1−c)を用いる乗算器(408)を介して、加算器(406)に送られる。開ループプレディクタPと利得制御因子cの両方が、符号器が送出するメタデータに応じて選択可能でもよい。2つの加算器は、重み付けされた予測出力を、逆変換ブロックから出力される値に加算するように働く。復元されると、この値は、後続の値の予測に使用するためにDBSに送られる。
もちろん、DBSへの入力はまた、復号器からのビデオ出力になる。
最適なプレディクタは、適応型手段によって選択することができる。たとえば、プレディクタは、平均平方エラーを最小化する線形最適化技法により、または、局所勾配を決定および外挿することによって選んでもよい。方法が何であれ、基本的な違いは、プレディクタの選択が現在の画素の隣接部における値の連続関数である連続適応型技法と、プレディクタが切り替わる不連続技法との間にある。
任意の適応型技法で開ループを動作させると、適応型プレディクタ自体は、符号器と復号器の間で異なることもある。不連続適応型技法は特に危険であると思われるが、それというのも、非常に様々なプレディクタが選ばれる可能性もあるからである。連続システムでは、所与の同様の値、同様のプレディクタが選ばれるはずである。
連続適応の一例として、画素が走査されて自己相関R(k)を有するシーケンスx(n)を生成する場合に、MMSEプレディクタ
Figure 0005841940
は、TVの線形方程式
Figure 0005841940
のシステムを満足させる係数aを有することを示すことができる。
したがって、信号の回転スナップショットをとり、このシステムを解決することにより、適応型システムを得ることができる。これを近似する(また、所与の定常統計が与えられている場合に、それに収束する)ことになる、より扱いやすい適応法は、LMSまたはRLSアルゴリズムを使用することになる。
この場合、基本的なサンプルと自己相関関数の両方は、符号器と復号器の間で異なることになり、それにより様々なフィルタが使用されることになる。しかし、予測がはるかに良好である場合、このことは重要ではないだろう。白色雑音の程度を想定することにより、たとえば、測定された自己相関R(k)に小さいデルタインパルスを加えることにより、またはLMS/RLSアルゴリズムにおいてフィードバック信号に人口雑音を直接加えることにより、適応をより安定に行うこともできる。
前述のアーキテクチャは、符号化されていない元のサンプルを使用する予測を必要とする。予測プロセスからの雑音付加の原因となっているのがこれである。しかし、圧縮システムでは、符号器は、ビットストリームを生成するのに都合のよい任意のサンプルを使用することができる。すなわち、指定する必要があるのは復号器プロセスだけである。したがって、符号器は、予測に使用されるサンプルが、復元のために復号器が使用するサンプルにより近くなるように、その予測に使用されるサンプルを修正してもよい。開ループプレディクタを使用する場合、各サンプルが同一になることは保証できないが、複数のパスがある程度の収束をもたらさなければならない。
これを実行する方法は、2つ(以上)の符号器を連結し、その結果、第1の符号器によって符号化され、局所的に復号化されたデータを、この予測が利用することである。この場合には、フィードバックの要素が符号化プロセスに再挿入された。ブロック図が、図5および図6に示してある。ここで、第1の符号器は、前述のように初期符号化を実行する。次いで、やはり前述したように、復号器は、第1のパスの復号された信号を生成し、次いで、この信号が第2の符号器に送られる。もちろん、第1および第2の符号器は別々に描いてあるが、通常これらは、1つのハードウェアまたはソフトウェアの符号器の、第1のパスおよび第2のパスを構成する。
2つの基本的な変形形態を考えることができる。図5に示した第1の変形形態では、第2の符号器のプレディクタのみが局所的に復号化されたバージョンを使用するが、予測される画素は、元の画素のままである(第1のパスの符号化および復号化による補償遅延を伴う)。図6に示した第2の変形形態では、予測と予測される画素の両方が、局所的に復号化されたバージョンを使用することになる。符号器と復号器の予測符号化プロセス間でより良好な収束を実現するために、これら任意の数のステージを連結してもよい。
ほんの一例として本発明を説明してきたこと、および添付の特許請求の範囲に記載の範囲から逸脱することなく多種多様な修正形態が可能であることが理解されよう。説明した例が別々の特徴および選択肢を含む限り、こうした特徴および選択肢の全ての実際的な組合せが、本明細書において開示されているものとみなすべきである。具体的には、本明細書に添付の請求項のうちのいずれか一項の主題は、他の全ての請求項の主題と組み合わせて開示されているものとみなすべきである。

Claims (15)

  1. 各ブロックにおいて系統づけられた変換済みの画像の差を表す圧縮符号化されたビットストリームを受け取る入力部と、
    再スケーリング化された変換係数を提供する逆量子化ユニットと、
    前記変換係数に逆空間変換を実行して復号化された画像値を提供する逆ブロック変換と、
    前記復号化された画像値上で動作して、前記画像の差と加算するための予測値を提供するプレディクタと、
    を備えるビデオ圧縮復号器であって、
    前記プレディクタが、特定のブロックの完全に外側で動作して、そのブロック内での画像の差と加算するためのクローズド予測値を提供するクローズドプレディクタと、特定のブロックの少なくとも部分的に内部で動作して、そのブロック内での画像の差と加算するためのオープン予測値を提供するオープンプレディクタとを備え、
    前記予測値が、前記クローズド予測値と前記オープン予測値の組合せを含む、
    ビデオ圧縮復号器。
  2. 前記組合せが変化し、前記符号化されたビットストリーム内のパラメータ値が、前記組合せの変化を制御する、請求項1に記載の復号器。
  3. 入力画像値と画像予測値の間の差を形成するステップと、変換における(in a transform)前記差を変換する(transforming)ステップとを含む圧縮符号化の方法であって、画像予測Pが、クローズドプレディクタPと、オープンプレディクタPとの組合せによって形成され、
    前記クローズドプレディクタPが、完全に特定のブロックの外側で動作して、当該ブロック内の画像差と加算するためのクローズド予測値を提供し、
    前記オープンプレディクタPが、少なくとも部分的に、特定のブロックの内部で動作して、当該ブロック内の画像差と加算するためのオープン予測値を提供し、
    前記画像予測Pが、前記クローズド予測値と前記オープン予測値の組み合わせを含む、
    方法。
  4. 前記画像予測Pが、式P=aP+bP(ここで、aおよびbは合計1であることが好ましい)の前記プレディクタPおよび前記プレディクタPのそれぞれの出力の重み付けされた合計を含む、請求項3に記載の方法。
  5. 前記プレディクタPと前記プレディクタPの相対的な重み付けが画像内容で変化する、請求項3または請求項4に記載の方法。
  6. 前記画像予測Pが、P=(1−c)P+cP(ここで、cはゼロから1の間で可変の選択可能な重み付け因子である)として形成される、請求項3から5のいずれか一項に記載の方法。
  7. 前記予測Pまたは前記予測Pが選択可能であり、選択可能な予測を示すメタデータがビットストリームで信号伝送されることが好ましい、請求項1から6のいずれか一項に記載の方法。
  8. ビットストリームを圧縮復号化する方法であって、
    画像の差を表すビットストリームを受け取るステップと、
    クローズドプレディクタPの予測値を復元するステップであって、当該プレディクタが、完全に、特定のブロックの外側で動作して、当該ブロックの中の画像差と加算するためのクローズド予測値を提供するものと、
    オープンプレディクタPの予測値を復元するステップであって、当該プレディクタが、少なくとも部分的に、特定のブロックの内側で動作して、当該ブロックの中の画像差と加算するためのオープン予測値を提供するものと、
    前記復元された予測値の重み付けされた組合せを使用して、前記画像の差と加算するステップと
    を含む方法。
  9. 前記復元された予測値の組合せの方式が、前記ビットストリーム内で表されるパラメータの制御下で変化する、請求項8に記載の方法。
  10. 前記オープンプレディクタPが、同じ変換ブロック内の隣接する画素の平均または他の組合せ平均をとる、画素ごとの空間プレディクタである、請求項3に記載の方法。
  11. 前記重み付け因子が、ブロックごと、またはフレームごと、または画像のグループ(GOP)ごとに変化する、請求項6に記載の方法。
  12. 前記重み付け因子が、何らかの(1つまたは複数の)所定のパターンに従って、変換ブロック内で変化し、符号化されたデータと一緒に運搬されるインデックスまたはフラグにより、選ばれたパターンが符号化される、請求項4に記載の方法。
  13. 請求項3から12のいずれか一項に記載の方法をプログラム可能な装置に実行させる命令を含む、コンピュータプログラム。
  14. 画像情報を受け取り、前記画像情報を空間ブロックに分割するブロックスプリッタと、
    クローズドプレディクタと、オープンプレディクタとを備えるプレディクタであって、
    当該クローズドプレディクタが、完全に特定のブロックの外側で動作して、当該ブロック内の画像差と加算するためのクローズド予測値を提供し、当該オープンプレディクタが、少なくとも部分的に、特定のブロックの内部で動作して、当該ブロック内の画像差と加算するためのオープン予測値を提供する、ものと、
    画像情報および前記クローズド予測値と、前記オープン予測値の組み合わせを受け取り、差分値を形成する減算器手段と、
    空間変換を実行して変換係数を提供するブロック変換と、
    前記変換係数に対して近似値を生成するための量子化ユニットと、
    変換係数を符号化して、符号化されたビットストリームにするためのエントロピー符号化ユニットと、
    を含む、ビデオ圧縮符号器。
  15. 前記組合せが、重み付けされた合計を含む、請求項14に記載の符号器。
JP2012519020A 2009-07-10 2010-07-09 画像のハイブリッド開ループ/閉ループ圧縮 Expired - Fee Related JP5841940B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
PCT/EP2009/058879 WO2011003479A1 (en) 2009-07-10 2009-07-10 Hybrid open-loop/closed-loop intra prediction
EPPCT/EP2009/058879 2009-07-10
PCT/EP2009/058880 WO2011003480A1 (en) 2009-07-10 2009-07-10 Hybrid open-loop/closed-loop compression of pictures
EPPCT/EP2009/058880 2009-07-10
PCT/EP2010/059945 WO2011004027A2 (en) 2009-07-10 2010-07-09 Compression of pictures

Publications (2)

Publication Number Publication Date
JP2012533201A JP2012533201A (ja) 2012-12-20
JP5841940B2 true JP5841940B2 (ja) 2016-01-13

Family

ID=43429605

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012519020A Expired - Fee Related JP5841940B2 (ja) 2009-07-10 2010-07-09 画像のハイブリッド開ループ/閉ループ圧縮

Country Status (4)

Country Link
US (2) US9451272B2 (ja)
JP (1) JP5841940B2 (ja)
CA (1) CA2767617C (ja)
WO (1) WO2011004027A2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101619972B1 (ko) 2008-10-02 2016-05-11 한국전자통신연구원 이산 여현 변환/이산 정현 변환을 선택적으로 이용하는 부호화/복호화 장치 및 방법
GB2486726B (en) 2010-12-23 2017-11-29 British Broadcasting Corp Compression of pictures
RU2719340C2 (ru) 2011-10-18 2020-04-17 Кт Корпорейшен Способ декодирования видеосигнала
WO2015057438A1 (en) * 2013-10-14 2015-04-23 Mediatek Singapore Pte. Ltd. Method of residue differential pulse-code modulation for hevc range extension
EP3459244A4 (en) * 2016-01-12 2020-03-04 Telefonaktiebolaget LM Ericsson (publ) VIDEO CODING WITH HYBRID INTRAPREDICTION

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2127151A1 (en) 1993-09-21 1995-03-22 Atul Puri Spatially scalable video encoding and decoding
JPH10145795A (ja) * 1996-11-15 1998-05-29 Nippon Telegr & Teleph Corp <Ntt> 動画像符号化方法、復号方法、動画像符号化装置および動画像復号装置
US6212236B1 (en) * 1997-03-26 2001-04-03 Matsushita Electric Industrial Co., Ltd. Image decoding apparatus
US8085845B2 (en) 2003-08-26 2011-12-27 Thomson Licensing Method and apparatus for encoding hybrid intra-inter coded blocks
US8311113B2 (en) * 2004-11-12 2012-11-13 Broadcom Corporation Method and system for using motion prediction to equalize video quality across intra-coded frames
KR100704626B1 (ko) * 2005-02-07 2007-04-09 삼성전자주식회사 다 계층 기반의 모션 벡터를 압축하는 방법 및 장치
US8457200B2 (en) * 2006-07-07 2013-06-04 Telefonaktiebolaget Lm Ericsson (Publ) Video data management
US8422555B2 (en) * 2006-07-11 2013-04-16 Nokia Corporation Scalable video coding
JP4834590B2 (ja) * 2007-03-28 2011-12-14 株式会社東芝 動画像復号化装置及び動画像復号化方法
EP2191652B1 (en) * 2007-09-02 2017-02-08 Lg Electronics Inc. A method and an apparatus for processing a video signal

Also Published As

Publication number Publication date
US9451272B2 (en) 2016-09-20
CA2767617A1 (en) 2011-01-13
US20120163450A1 (en) 2012-06-28
JP2012533201A (ja) 2012-12-20
CA2767617C (en) 2018-03-20
WO2011004027A3 (en) 2011-03-10
WO2011004027A2 (en) 2011-01-13
US20160353132A1 (en) 2016-12-01

Similar Documents

Publication Publication Date Title
KR100723403B1 (ko) 컬러 성분간 단일 부호화 모드를 이용한 예측영상 생성 방법 및 장치와, 그를 이용한 영상 및 비디오 부호화/복호화방법 및 장치
KR100750136B1 (ko) 영상의 부호화, 복호화 방법 및 장치
JP4922391B2 (ja) 多階層基盤のビデオエンコーディング方法および装置
JP6114782B2 (ja) 画像の圧縮
US20160353132A1 (en) Hybrid open-loop/closed-loop compression of pictures
KR101700410B1 (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
JP2011166592A (ja) 画像符号化装置及び画像復号装置
JP6708211B2 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体
WO2012176387A1 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
KR101562343B1 (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
Ammous et al. Improved Hierarchical lossless video coding
KR102111437B1 (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
KR101934840B1 (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
EP2452496B1 (en) Hybrid open-loop/closed-loop compression of pictures
KR101810198B1 (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
WO2011003480A1 (en) Hybrid open-loop/closed-loop compression of pictures
KR101700411B1 (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
Liu et al. Coding mode analysis of MPEG-2 to H. 264/AVC transcoding for digital TV applications
Zhou et al. The motion vector reuse algorithm to improve dual-stream video encoder
Li et al. Hybrid bit-stream rewriting from scalable video coding to H. 264/AVC
WO2011003479A1 (en) Hybrid open-loop/closed-loop intra prediction

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130704

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140815

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150326

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151026

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151116

R150 Certificate of patent or registration of utility model

Ref document number: 5841940

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees