JP2012533201A - 画像のハイブリッド開ループ/閉ループ圧縮 - Google Patents
画像のハイブリッド開ループ/閉ループ圧縮 Download PDFInfo
- Publication number
- JP2012533201A JP2012533201A JP2012519020A JP2012519020A JP2012533201A JP 2012533201 A JP2012533201 A JP 2012533201A JP 2012519020 A JP2012519020 A JP 2012519020A JP 2012519020 A JP2012519020 A JP 2012519020A JP 2012533201 A JP2012533201 A JP 2012533201A
- Authority
- JP
- Japan
- Prior art keywords
- predictor
- block
- prediction
- value
- transform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/177—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/43—Hardware specially adapted for motion estimation or compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/625—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本発明は、画像の圧縮符号化に関し、詳細には動画系列における画像の符号化に関する。ここでは、画像という用語は、フィールドおよびフレームを含むものとして使用される。
MPEGおよび他の符号化組織では、符号化効率を上げ、HDTVおよびさらに高い画像解像度への符号化機能を拡張するための努力が続いている。
しかし、実験によれば、性能の向上はブロックのサイズが小さい場合に最大となり、ブロックサイズが増大するにつれて性能が低下することが分かってきた。まずこれが問題であるが、それというのも、小さいブロックサイズに対しては変換符号化利得が相対的に低く、効率的な変換符号化には大きいブロックサイズが必要となるからである。第2に、より高い精細度への動きには、必然的にさらに大きいブロックサイズが必要となる。いくつかの例を挙げれば、4×4のブロックサイズでは、イントラ予測が良好に機能することが分かってきた。8×8のブロックに移動すると、変換符号化利得が約1dBになる可能性があるが、空間予測がより複雑になり、その効果が低下する。HD解像度以上では、16×16ブロック以上の変換が必要になる(恐らくUHDTVでは64×64までになる)。
ここで、cはゼロから1の間で可変の重み付け因子である。
cは、雑音増大の制御および予測の確度を最適化するように選んでもよいが、総合的な予測は、この例では重みが変化しない。
しばしば、プレディクタPcは、たとえば、前述のH.264空間プレディクタなどの空間プレディクタになる。他の構成では、プレディクタPcは、MPEG規格においてよく知られている動き補償予測などの時間プレディクタである。
P=(1−c)Pc+cPo
ここで、Poはブロック予測値であり、Pcはローカル復号器予測値であり、cはゼロから1の間で可変の重み付け因子である。
ここで、cはゼロから1の間で可変の重み付け因子であり、PcはCLPの予測値であり、PoはOLPの予測値である。
他の態様では、本発明は、これまでに説明してきた主張のいずれか1つに従って符号化されたビットストリームの圧縮復号化の一方法にあり、画像の差を表すビットストリームを受け取るステップと、プレディクタPcの予測値を正確に復元するステップと、プレディクタPoの予測値を正確にではなく復元するステップと、復元された予測値の組合せを使用して、画像の差と加算するステップとを含む。
Fk(k=N、N+1、N+2、N+3)内の各ブロックについて、ある1つのブロックは、2つの動きベクトルを有することもでき、この1つのベクトルは、FNの前のフレームからの閉ループプレディクタを表し、もう一方のブロックは、たとえばちょうど前のフレームからの、セット内の各フレームからの開ループプレディクタを表す。動きベクトルの両方のセットが送信されることになる。
ブロックサイズが増大した空間予測符号化における効率の低下は、現在の画素と予測の基となる画素との間の距離が(少なくとも、ラスタ走査されたブロックの端部に向けて)増大することから生じるものと理解することができる。この距離が増大するにつれて、画素間の相関が低下し、差動符号化効率も低下する。
L=T1Q−1QTは、シーケンスyrを変換し、量子化し、逆量子化し、また逆変換するプロセスを表すものとする。差し当たり、Lの効果は、分散値がσn 2の雑音源nrをyrに付加することであると仮定することができる。すなわち、
Yr=L(yr)=yr+nr
復元に際しては、復号器は以下のように形成する。
Yrでの雑音nに加えて、前に復元された値Xのそれぞれに雑音が加わることにより、予測が異なることになり、したがってこの雑音が増大する可能性がある。具体的には、良好なプレディクタPは通常、DCにおいて利得が1なので、1−Pはゼロを意味し、逆フィルタは極を有する、すなわちDCにおいて無限利得を有することになる。したがって、雑音は際限なく増大する可能性がある。閉ループプレディクタは、符号器においても復元された値X0を使用するが、この問題が生じることはない。
数学的には、PcおよびPoを2つのプレディクタと定義する。符号器において、Pcは閉ループに加えられて、前に符号化され復元された係数から単独で構成される予測を生成することになり、Poは開ループに加えられ、すなわち、元の符号化されていない係数から予測値を生成するように加えられることになる。もちろん、復号器においては、両方の予測は、復元された係数を使用しなければならない。
P=(1−c)Pc+cPo
この場合、因子cはPoに該当する。この因子cは、それがゼロと1の間にある場合、復号器内の開ループプレディクタが寄与する雑音における減衰係数または漏れ係数として働き、これにより、雑音の増大が制御される。さらに、組み合わせたプレディクタは、閉ループプレディクタの相補的な寄与があるので、優れたプレディクタのままであるが、相補的な閉ループプレディクタがない場合、因子cが小さくなるにつれて予測の有効性が低下するはずである。具体的には、両方のプレディクタがDCを排除する場合、組み合わせたプレディクタもDCを排除することになる。
逆量子化ブロックQ−1、逆変換ブロックT−1、および、同じ比率で、ただしLBDS自体からの前に復号化された復元値のみを使用して予測を付加することにより、LDBSからの値が構成される。
パラメータcは、使用されているブロックサイズ、選択されている量子化パラメータ、および2つの予測の相対的な成功に応じて、互いの異なる画像内容について最適化してもよい。ブロックサイズが小さくて、量子化のレベルが低いと、一般に符号器の開ループ予測と復号器の開ループ予測との間の相違は少なくなり、したがって、ビットストリーム内での符号化を介して、または管理標準に従って、cの値全体をこれらの環境において1に近づけるように調整することもできる。
さらなる変形形態では、固定数のcがとり得る値を事前に決定することもでき、符号器は、特定のブロックもしくはブロックのセットについて使用するための最適値を選択することができ、または閉ループプレディクタを使用するようにのみ選択することもできる。各ブロックまたはブロックのセットの変換係数に付随するメタデータを送信して、開ループ予測が使用されたかどうか、またcのうちどの値が利用されたかを示す。
EncodeBit (using_open_loop);
if (1==using_open_loop) {
EncodeBit (combined_pred_mode & 0x01);
EncodeBit ((combined_pred_mode & 0x02)>>1);
}
あるいは、1つのブロックのメタデータと、前に符号化されたブロックのメタデータとの間には、何らかの相関が存在することもある。その場合、符号器は、H.264でのイントラ予測モードを符号化するために使用されるスキームと同様のスキームに従ってもよい。開ループが追加の予測モードとして使用されていない場合を考慮してもよく、2N+1の選択肢がある。次いで、この予測が使用されているかどうかを示すフラッグが符号化される。使用されていない場合、N=2の場合の以下の擬似コードで示すようにNビットを使用して、残りの2N個のモードを符号化することができる。
predicted_mode = get_mode_prediction ( );
EncodeBit (combined_pred_mode==predicted_mode);
if (combined_pred_mode<predicted_mode) {
EncodeBit (combined_pred_mode & 0x01);
EncodeBit ((combined_pred_mode & 0x02)>>1);
}
else if (combined_pred_mode>predicted_mode) {
combined_pred_mode = combined_pred_mode-1;
EncodeBit (combined_pred_mode & 0x01);
EncodeBit ((combined_pred_mode & 0x02)>>1);
}
復号器のアーキテクチャが図4に示してある。復号器では、ビットストリームは、エントロピー復号化ブロックEDが受け取り、逆量子化ブロックQ−1および逆変換ブロックT−1を通過する。逆変換ブロックの出力が、復号化されたブロック格納装置DBSの入力に送られる。復号化されたブロック格納装置からの復号化されたデータは、閉ループプレディクタPcおよび開ループプレディクタPoの入力に送られる。Poの出力は、利得制御因子cを用いる乗算器(404)を介して、加算器(402)に送られる。プレディクタPcの出力は、利得制御因子(1−c)を用いる乗算器(408)を介して、加算器(406)に送られる。開ループプレディクタPoと利得制御因子cの両方が、符号器が送出するメタデータに応じて選択可能でもよい。2つの加算器は、重み付けされた予測出力を、逆変換ブロックから出力される値に加算するように働く。復元されると、この値は、後続の値の予測に使用するためにDBSに送られる。
最適なプレディクタは、適応型手段によって選択することができる。たとえば、プレディクタは、平均平方エラーを最小化する線形最適化技法により、または、局所勾配を決定および外挿することによって選んでもよい。方法が何であれ、基本的な違いは、プレディクタの選択が現在の画素の隣接部における値の連続関数である連続適応型技法と、プレディクタが切り替わる不連続技法との間にある。
したがって、信号の回転スナップショットをとり、このシステムを解決することにより、適応型システムを得ることができる。これを近似する(また、所与の定常統計が与えられている場合に、それに収束する)ことになる、より扱いやすい適応法は、LMSまたはRLSアルゴリズムを使用することになる。
Claims (37)
- 入力画像値と画像予測値の間の差を形成するステップと、前記差を変換において(in a transform)変換する(transforming)ステップとを含む圧縮符号化の方法であって、画像予測Pが、時間プレディクタまたは空間プレディクタであり下流側の復号器での正確な復元を可能にする予測値に限定されているプレディクタPcと、下流側の復号器での正確な復元を可能にする予測値に限定されていないプレディクタPoとの組合せによって形成され、前記プレディクタPoが空間プレディクタであり、前記変換が空間変換もしくは時間変換であり、または前記プレディクタPoが時間プレディクタであり、前記変換が時間変換である方法。
- 前記画像予測Pが、式P=aPc+bPo(ここで、aおよびbは合計1であることが好ましい)の前記プレディクタPcおよび前記プレディクタPoのそれぞれの出力の重み付けされた合計を含む、請求項1に記載の方法。
- 前記プレディクタPcと前記プレディクタPoの相対的な重み付けが画像内容で変化する、請求項1または請求項2に記載の方法。
- 前記画像予測Pが、P=(1−c)Pc+cPo(ここで、cはゼロから1の間で可変の選択可能な重み付け因子である)として形成される、前記請求項のいずれか一項に記載の方法。
- 前記重み付け因子cを示すメタデータがビットストリームで信号伝送される、請求項4に記載の方法。
- 前記予測Poまたは前記予測Pcが選択可能であり、選択可能な予測を示すメタデータがビットストリームで信号伝送されることが好ましい、前記請求項のいずれか一項に記載の方法。
- 前記予測Poが、1組の方向性プレディクタから選択可能な方向性プレディクタである、前記請求項のいずれか一項に記載の方法。
- 前記差が、空間ブロック変換で変換される、前記請求項のいずれか一項に記載の方法。
- 前記請求項のいずれか一項に従って符号化されたビットストリームを圧縮復号化する方法であって、画像の差を表すビットストリームを受け取るステップと、プレディクタPcの予測値を正確に復元するステップと、プレディクタPoの予測値を正確にではなく復元するステップと、前記復元された予測値の組合せを使用して、前記画像の差と加算するステップとを含む方法。
- 前記復元された予測値の組合せの方式が、前記ビットストリーム内で表されるパラメータの制御下で変化する、請求項9に記載の方法。
- 第1のステップにおいて、入力画像値と画像予測値の間の差を形成するステップと、前記差を変換するステップとを含み、画像予測が、下流側の復号器での正確な復元を可能にする予測値に限定されているプレディクタPcと、下流側の復号器での正確な復元を可能にする予測値に限定されていない空間プレディクタPoとの組合せによって形成され、第2のステップにおいて、前記第1の符号化からビットストリームを受け取るステップと、前記プレディクタPoの前記予測値を正確にではなく復元するステップとを含み、第3のステップにおいて、前記入力画像値と前記第2のステップからの前記正確にではなく復元された画像予測値との間の差を形成するステップと、前記差を変換するステップとを含む、請求項1から10のいずれか一項に記載の方法。
- 入力画像値と画像予測値の間の差を形成するステップと、前記差を変換するステップとを含み、画像予測が、下流側の復号器での正確な復元を可能にする予測値に限定されている閉ループプレディクタ(CLP)と、下流側の復号器での正確な復元を可能にする予測値に限定されていない開ループプレディクタ(OLP)との組合せによって形成され、前記開ループプレディクタおよび前記変換が、同じ時間領域または空間領域にある、圧縮符号化の方法。
- 前記組合せが、前記CLPおよび前記OLPのそれぞれの出力の重み付けされた合計を含み、重み付け因子は合計が1であることが好ましい、請求項12に記載の方法。
- 前記CLPと前記OLPの相対的な重み付けが画像内容で変化する、請求項12または請求項13に記載の方法。
- 前記CLPが空間プレディクタであり、前記OLPが空間プレディクタである、請求項12から14のいずれか一項に記載の方法。
- 前記CLPが、同じ画像内の、隣接していて前に符号化されたブロックから、あるブロックを予測する、請求項15に記載の方法。
- 前記変換が、ブロック変換、離散コサイン変換(DCT)、離散サイン変換(DST)、ウェーブレット変換、ブロック化ウェーブレット変換、重複直交変換(LOT)、ブロック化LOT、または前述したもののいずれかに近いものからなる群から選択される、請求項12から16のいずれか一項に記載の方法。
- 前記空間予測が、動き補償された予測の後に、すなわち動き補償された予測残差に実行される、請求項15から17のいずれか一項に記載の方法。
- 前記CLPが動き補償された予測であり、前に符号化された画像からのブロックベースの動き補償された予測(または動き補償された予測の組合せ)であることが好ましく、前記OLPが空間プレディクタである、請求項12から14のいずれか一項に記載の方法。
- 前記OLPが、同じ変換ブロック内の隣接する画素の平均または他の組合せ平均をとる、画素ごとの空間プレディクタである、請求項15、請求項16または請求項19に記載の方法。
- 前記CLPが空間プレディクタであり、前記OLPが動き補償された予測であり、前に符号化された画像からのブロックベースの動き補償された予測(または動き補償された予測の組合せ)であることが好ましい、請求項12から14のいずれか一項に記載の方法。
- 前記CLPが、同じ画像内の前に符号化されたブロックからの空間プレディクタである、請求項21に記載の方法。
- 前記CLPおよび前記OLPが動き補償された予測であり、前に符号化された画像からのブロックベースの動き補償された予測(または動き補償された予測の組合せ)であることが好ましい、請求項12から14のいずれか一項に記載の方法。
- 前記変換が、ブロック変換、離散コサイン変換(DCT)、離散サイン変換(DST)、ウェーブレット変換、ブロック化ウェーブレット変換、重複直交変換(LOT)、ブロック化LOT、または前述したもののいずれかに近いものからなる群から選択される、請求項12から23のいずれか一項に記載の方法。
- 前記重み付け因子が、ブロックごと、またはフレームごと、または画像のグループ(GOP)ごとに変化する、請求項12から24のいずれか一項に記載の方法。
- 前記重み付け因子が、何らかの(1つまたは複数の)所定のパターンに従って、変換ブロック内で変化し、符号化されたデータと一緒に運搬されるインデックスまたはフラグにより、選ばれたパターンが符号化される、請求項12から24のいずれか一項に記載の方法。
- 前記2つのプレディクタの利得の合計が1になる、前記請求項のいずれか一項に記載の方法。
- 前記請求項のいずれか一項に記載の方法を実施するように構成され適合される装置。
- 請求項1から27のいずれか一項に記載の方法をプログラム可能な装置に実行させる命令を含む、コンピュータプログラム製品。
- 画像情報を受け取り、前記画像情報を空間ブロックに分割するブロックスプリッタと、
ブロック上で動作して、前記ブロックについてのブロック予測値を提供するブロックプレディクタと、
画像情報および予測値を受け取り、差分値を形成する減算器手段と、
空間変換を実行して変換係数を提供するブロック変換と、
前記変換係数に対して近似値を生成するための量子化ユニットと、
変換係数を符号化して、符号化されたビットストリームにするためのエントロピー符号化ユニットと、
変換係数を復元するための逆量子化ユニットと、
前記変換係数に逆空間変換を実行して局所的に復号化された画像値を提供する逆ブロック変換と、
前記局所的に復号化された画像値上で動作して、ローカル復号器予測値を提供するローカル復号器プレディクタとを備えるビデオ圧縮符号器であって、
前記減算器手段が受け取った前記予測値が、前記ブロック予測値と前記ローカル復号器予測値の組合せを含む、ビデオ圧縮符号器。 - 前記組合せが、前記ブロック予測値と前記ローカル復号器予測値の重み付けされた合計を含む、請求項30に記載の符号器。
- 前記ブロック予測値と前記ローカル復号器予測値の相対的な重み付けが画像内容で変化する、請求項30または請求項31に記載の符号器。
- 前記画像予測Pが、P=(1−c)Pc+cPo(ここで、Poは前記ブロック予測値であり、Pcはローカル復号器予測値であり、cはゼロから1の間で可変の重み付け因子である)として形成される、請求項30から32のいずれか一項に記載の符号器。
- 各ブロックにおいて系統づけられた変換済みの画像の差を表す圧縮符号化されたビットストリームを受け取る入力部と、
再スケーリング化された変換係数を提供する逆量子化ユニットと、
前記変換係数に逆空間変換を実行して復号化された画像値を提供する逆ブロック変換と、
前記復号化された画像値上で動作して、前記画像の差と加算するための予測値を提供するプレディクタとを備えるビデオ圧縮復号器であって、
前記プレディクタが、特定のブロックの完全に外側で動作して、そのブロック内での画像の差と加算するためのクローズド予測値を提供するクローズドプレディクタと、特定のブロックの少なくとも部分的に内部で動作して、そのブロック内での画像の差と加算するためのオープン予測値を提供するオープンプレディクタとを備え、前記予測値が、前記クローズド予測値と前記オープン予測値の組合せを含む、ビデオ圧縮復号器。 - 前記組合せが変化し、前記符号化されたビットストリーム内のパラメータ値が、前記組合せの変化を制御する、請求項34に記載の復号器。
- 画像情報を受け取り、前記画像情報を空間ブロックに分割するブロックスプリッタ手段と、
ブロック上で動作して、前記ブロックについてのブロック予測値を提供するブロックプレディクタ手段と、
画像情報および予測値を受け取り、画像の差分値を形成する減算器手段と、
前記画像の差分値に空間変換を実行して変換係数を提供するブロック変換手段と、
変換係数を近似するための量子化手段と、
変換係数を復元するための逆量子化手段と、
前記変換係数に逆空間変換を実行して、局所的に復号化された画像値を提供する逆ブロック変換手段と、
前記局所的に復号化された画像値上で動作して、ローカル復号器予測値を提供するローカル復号器プレディクタ手段とを符号器内に備えるビデオ圧縮システムであって、
前記減算器手段が受け取った前記予測値が、前記ブロック予測値と前記ローカル復号器予測値の可変の組合せを含み、前記ビデオ圧縮システムはさらに、
前記量子化された変換係数を表し前記組合せの変化を記録するパラメータを含む圧縮符号化されたビットストリームを出力するための手段を前記符号器内に備え、
前記圧縮符号化されたビットストリームを受け取ることと、前記変換係数に逆空間変換を実行して、復号化された画像値を提供する逆ブロック変換手段と、変換係数を復元するための逆量子化手段と、前記復号化された画像値上で動作して、前記画像の差と加算するための予測値を提供するプレディクタ手段とを復号器内にさらに含み、
前記プレディクタ手段が、特定のブロックの完全に外側で動作して、そのブロック内での画像の差と加算するためのクローズド予測値を提供するクローズドプレディクタと、特定のブロックの少なくとも部分的に内部で動作して、そのブロック内での画像の差と加算するためのオープン予測値を提供するオープンプレディクタとを備え、前記予測値が、前記クローズド予測値と前記オープン予測値の可変の組合せを含み、前記組合せが、前記ビットストリーム内の前記パラメータに従って前記予測手段によって変化するシステム。 - 前記画像予測値Pが、P=(1−c)Pc+cPo(ここで、Poは前記ブロック予測値であり、Pcはローカル復号器予測値であり、cはゼロから1の間で可変の重み付け因子である)として形成される、請求項36に記載のシステム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EPPCT/EP2009/058879 | 2009-07-10 | ||
PCT/EP2009/058880 WO2011003480A1 (en) | 2009-07-10 | 2009-07-10 | Hybrid open-loop/closed-loop compression of pictures |
EPPCT/EP2009/058880 | 2009-07-10 | ||
PCT/EP2009/058879 WO2011003479A1 (en) | 2009-07-10 | 2009-07-10 | Hybrid open-loop/closed-loop intra prediction |
PCT/EP2010/059945 WO2011004027A2 (en) | 2009-07-10 | 2010-07-09 | Compression of pictures |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012533201A true JP2012533201A (ja) | 2012-12-20 |
JP5841940B2 JP5841940B2 (ja) | 2016-01-13 |
Family
ID=43429605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012519020A Expired - Fee Related JP5841940B2 (ja) | 2009-07-10 | 2010-07-09 | 画像のハイブリッド開ループ/閉ループ圧縮 |
Country Status (4)
Country | Link |
---|---|
US (2) | US9451272B2 (ja) |
JP (1) | JP5841940B2 (ja) |
CA (1) | CA2767617C (ja) |
WO (1) | WO2011004027A2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101619972B1 (ko) * | 2008-10-02 | 2016-05-11 | 한국전자통신연구원 | 이산 여현 변환/이산 정현 변환을 선택적으로 이용하는 부호화/복호화 장치 및 방법 |
GB2486726B (en) | 2010-12-23 | 2017-11-29 | British Broadcasting Corp | Compression of pictures |
CN107820082B9 (zh) | 2011-10-18 | 2021-07-20 | 株式会社Kt | 视频信号解码方法 |
RU2635064C2 (ru) * | 2013-10-14 | 2017-11-08 | ЭйджЭфАй Инновэйшн Инк. | Способ остаточной дифференциальной импульсно-кодовой модуляции в целях расширения диапазона высокоэффективного кодирования видеоизображений (HEVC) |
US10694179B2 (en) * | 2016-01-12 | 2020-06-23 | Telefonaktiebolaget Lm Ericsson (Publ) | Video coding using hybrid intra prediction |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07162870A (ja) * | 1993-09-21 | 1995-06-23 | At & T Corp | ビデオ信号符号化装置 |
JPH10145795A (ja) * | 1996-11-15 | 1998-05-29 | Nippon Telegr & Teleph Corp <Ntt> | 動画像符号化方法、復号方法、動画像符号化装置および動画像復号装置 |
JP2007503777A (ja) * | 2003-08-26 | 2007-02-22 | トムソン ライセンシング | ハイブリッド・イントラ・インター符号化ブロックを符号化する方法及び装置 |
JP2008245131A (ja) * | 2007-03-28 | 2008-10-09 | Toshiba Corp | 動画像復号化装置及び動画像復号化方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1110963C (zh) * | 1997-03-26 | 2003-06-04 | 松下电器产业株式会社 | 图象解码装置 |
US8311113B2 (en) * | 2004-11-12 | 2012-11-13 | Broadcom Corporation | Method and system for using motion prediction to equalize video quality across intra-coded frames |
KR100704626B1 (ko) * | 2005-02-07 | 2007-04-09 | 삼성전자주식회사 | 다 계층 기반의 모션 벡터를 압축하는 방법 및 장치 |
US8457200B2 (en) * | 2006-07-07 | 2013-06-04 | Telefonaktiebolaget Lm Ericsson (Publ) | Video data management |
US8422555B2 (en) * | 2006-07-11 | 2013-04-16 | Nokia Corporation | Scalable video coding |
JP5658033B2 (ja) * | 2007-09-02 | 2015-01-21 | エルジー エレクトロニクス インコーポレイティド | ビデオ信号処理方法及び装置 |
-
2010
- 2010-07-09 WO PCT/EP2010/059945 patent/WO2011004027A2/en active Application Filing
- 2010-07-09 US US13/383,229 patent/US9451272B2/en active Active
- 2010-07-09 JP JP2012519020A patent/JP5841940B2/ja not_active Expired - Fee Related
- 2010-07-09 CA CA2767617A patent/CA2767617C/en not_active Expired - Fee Related
-
2016
- 2016-08-12 US US15/235,328 patent/US20160353132A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07162870A (ja) * | 1993-09-21 | 1995-06-23 | At & T Corp | ビデオ信号符号化装置 |
JPH10145795A (ja) * | 1996-11-15 | 1998-05-29 | Nippon Telegr & Teleph Corp <Ntt> | 動画像符号化方法、復号方法、動画像符号化装置および動画像復号装置 |
JP2007503777A (ja) * | 2003-08-26 | 2007-02-22 | トムソン ライセンシング | ハイブリッド・イントラ・インター符号化ブロックを符号化する方法及び装置 |
JP2008245131A (ja) * | 2007-03-28 | 2008-10-09 | Toshiba Corp | 動画像復号化装置及び動画像復号化方法 |
Non-Patent Citations (2)
Title |
---|
JPN5013002706; ADRIAN MUNTEANU: 'APPLYING OPEN-LOOP CODING IN PREDICTIVE CODING SYSTEMS' ADVANCED CONCEPTS FOR INTELLIGENT VISION SYSTEMS:[LECTURE NOTES IN COMPUTER SCIENCE] , 20081020, P25-37 * |
JPN6014020343; Frederik Verbist(他3名): 'Intra-frame Video Coding using an Open-loop Predictive Coding Approach' Multimedia Signal Processing, 2008 IEEE 10th Workshop on , 20081008, p.273-277, IEEE * |
Also Published As
Publication number | Publication date |
---|---|
CA2767617C (en) | 2018-03-20 |
US20120163450A1 (en) | 2012-06-28 |
WO2011004027A2 (en) | 2011-01-13 |
US20160353132A1 (en) | 2016-12-01 |
JP5841940B2 (ja) | 2016-01-13 |
WO2011004027A3 (en) | 2011-03-10 |
CA2767617A1 (en) | 2011-01-13 |
US9451272B2 (en) | 2016-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2715017C1 (ru) | Устройство кодирования с предсказанием видео, способ кодирования с предсказанием видео, устройство декодирования с предсказанием видео и способ декодирования с предсказанием видео | |
KR101376673B1 (ko) | 고해상도 영상의 부호화/복호화 방법 및 이를 수행하는 장치 | |
KR100723403B1 (ko) | 컬러 성분간 단일 부호화 모드를 이용한 예측영상 생성 방법 및 장치와, 그를 이용한 영상 및 비디오 부호화/복호화방법 및 장치 | |
KR100750136B1 (ko) | 영상의 부호화, 복호화 방법 및 장치 | |
US7782955B2 (en) | Transcoder and transcoding method operating in a transform domain for video coding schemes possessing different transform kernels | |
JP6114782B2 (ja) | 画像の圧縮 | |
US20160353132A1 (en) | Hybrid open-loop/closed-loop compression of pictures | |
KR101700410B1 (ko) | 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치 | |
JP2011166592A (ja) | 画像符号化装置及び画像復号装置 | |
JP6708211B2 (ja) | 動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体 | |
KR101512643B1 (ko) | 동영상 부호화 장치 및 이를 위한 영상 신호의 2차원 정렬 변환 장치 및 방법, 및 이를 위한 기록 매체 | |
KR20100009718A (ko) | 예측 방향을 이용한 영상 부호화/복호화 장치 및 방법 | |
KR101562343B1 (ko) | 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치 | |
KR102111437B1 (ko) | 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치 | |
KR101934840B1 (ko) | 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치 | |
EP2452496B1 (en) | Hybrid open-loop/closed-loop compression of pictures | |
KR101810198B1 (ko) | 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치 | |
WO2011003480A1 (en) | Hybrid open-loop/closed-loop compression of pictures | |
KR101700411B1 (ko) | 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치 | |
Liu et al. | Coding mode analysis of MPEG-2 to H. 264/AVC transcoding for digital TV applications | |
WO2011003479A1 (en) | Hybrid open-loop/closed-loop intra prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130704 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140422 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140520 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140815 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150326 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151026 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5841940 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |