JP2007506293A - 条件付き重複変換 - Google Patents

条件付き重複変換 Download PDF

Info

Publication number
JP2007506293A
JP2007506293A JP2006525502A JP2006525502A JP2007506293A JP 2007506293 A JP2007506293 A JP 2007506293A JP 2006525502 A JP2006525502 A JP 2006525502A JP 2006525502 A JP2006525502 A JP 2006525502A JP 2007506293 A JP2007506293 A JP 2007506293A
Authority
JP
Japan
Prior art keywords
overlap
filter
transform
mode
duplicate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006525502A
Other languages
English (en)
Other versions
JP4986622B2 (ja
JP2007506293A5 (ja
Inventor
スウ ポシャン
スリニバサン スリダー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2007506293A publication Critical patent/JP2007506293A/ja
Publication of JP2007506293A5 publication Critical patent/JP2007506293A5/ja
Application granted granted Critical
Publication of JP4986622B2 publication Critical patent/JP4986622B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/16Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/93Run-length coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets

Abstract

デジタルメディアコンテンツ(例えば、画像、ビデオ、音声等)符号器/復号器が、空間的に変化するパラメータを利用して、空間領域重複変換用の隣接変換ブロックエッジに対する重複前処理および後処理の適用を条件付ける。デジタルメディアのサブブロックに対する重複変換の本条件付き適用は、エッジ、ブロック、マクロブロックまたは他の粒度でシグナリングされうる。さらに、フレームレベルの量子化または他のビットレート関係パラメータに基づく条件付き重複変換の使用を制限することで、低ビットレート符号化でのシグナリングオーバーヘッドの影響が最小化される。

Description

本発明は、メディアコンテンツ信号(例えば、音声、ビデオ、画像、テキスト、スピーチ等)をデジタル的に符号化、復号化、および処理する技術に関する。より詳細には、本発明は、重複変換に基づくデジタルメディアコーデックに関する。
変換符号化は、多くの音声、画像およびビデオ圧縮システムにおいて使用される圧縮技術である。非圧縮のデジタル画像およびビデオは一般的に、2次元グリッド内に配列した画像またはビデオフレーム内の複数位置にあるピクチャエレメントまたは色のサンプルとして表現、または捉えられる。例えば、画像用の典型的なフォーマットは、グリッドとして配列した24ビット色ピクチャエレメントサンプルのストリームから成る。各サンプルは、例えばRGB,またはYIQ等、色空間内のグリッドにおける画素位置での色成分を表現する数である。様々な画像およびビデオシステムは、サンプリングの様々な異なる色解像度、空間解像度、時間解像度を使用してもよい。
非圧縮のデジタル画像およびビデオ信号は、相当量の記憶容量および伝送容量を消費しうる。変換符号化は、信号の空間領域表現を周波数領域(または他の類似変換領域)表現へと変換し、その後、その変換領域表現内の一般的にやや認識しにくい一定の周波数成分解像度を削減することにより、デジタル画像およびビデオのサイズを削減する。これにより一般的に、空間領域において画像またはビデオの色または空間解像度を削減することと比較して、デジタル信号の認識可能な劣化が大幅に削減される。
より具体的には、図1に示す典型的な変換符号化技術100は、非圧縮のデジタル画像の画素を固定サイズの2次元ブロックに分割する。各ブロックは他のブロックと重なるかもしれない。空間周波数分析を行う線形変換110が各ブロックに適用され、ブロック内の間隔をあけたサンプルが周波数(または変換)係数のセットに変換される。この係数は一般的に、ブロック間隔上の対応周波数帯におけるデジタル信号の強さを表す。圧縮のため、変換係数は選択的に量子化され(すなわち、係数値の最下位ビットを落とすこと、またはより高い解像度数のセットの値をより低い解像度にマッピングすること等により、解像度が削減される)、また量子化器/エントロピー符号器120によって圧縮データストリームへとエントロピー符号化または可変長符号化される。逆量子化/エントロピー復号化130の後、変換係数は逆変換140して、元の色/空間サンプル画像/ビデオ信号をほぼ再構築する。
静的画像(またはビデオシーケンスにおけるイントラ符号化フレーム)を圧縮する間、MPEG−2、MPEG−4およびウィンドウズメディア等の最も一般的な標準は、画像を四角形のタイルに区分し、各画像タイルにブロック変換を適用する。与えられたパーティション(一般的にはブロックとして知られる)内の変換係数は、ブロック内の未加工データ成分によってのみ影響を受ける。量子化等の符号器側での不可逆またはロスを伴う操作が原因で、復号化された画像内にアーティファクトが現れる。これらのアーティファクトはブロックに渡って独立であり、ブロッキング効果として知られる視覚的に気に障る効果が生じる。
音声データに対しても同様に、重複しないブロックが独立して変換符号化される場合、量子化エラーによって、復号器で音声信号を再構築する際のブロック境界で、信号内の不連続性が生じるであろう。音声に対しては、周期的クリッキング効果が聞かれている。
(空間領域重複変換)
ブロッキング効果を最小化するため、クロスブロック相関を利用できる。クロスブロック相関を達成する1つの方法は、H.Malvarによる「重複変換を用いた信号処理」(1992年、マサチューセッツ州ノーウッド、アーテックハウス)で記述されているように、重複変換を使用することである。重複変換とは、入力が、現ブロック中のデータ要素に加えて、近隣ブロック内の少数の隣接要素にまたがる変換である。同様に、再構築側では逆変換が、近隣ブロック内の少数のデータ点と同様に、現在のブロック内の全てのデータ点に影響する。
2次元(2D)データの場合では重複2D変換は、左、上、右、下、およびできれば左−上、右−上、左−下、および右−下に対するブロックの選択された要素を伴う、現在のブロックの関数である。現在の変換を計算するために使用される近隣ブロック内のデータ点の数は、重複と呼ばれる。
重複変換は、変換領域において、従来のブロック変換後に変換領域量をマージするステップとして実装されうる。または重複変換は、重複範囲内の画素に適用される前処理段階によって、空間領域において実装されうる。これらの2つの実装は数学的に関係し、従って等価である。
図2に示されるように、変換領域重複変換(SDLT)200は、それぞれ順方向ブロック変換110の前、および逆ブロック変換140の後に行われる、前処理ステップ210および後処理ステップ220として実装される重複変換である(例えば、Srinivasanらによる「デジタルメディア圧縮における空間領域重複変換の改善」米国特許出願番号10/620、744、2003年7月15日掲載(以降、「改善SDLT特許出願」と呼ぶ)を参照のこと)。空間領域重複変換は、効率改善のため既存のブロック変換ベースの圧縮技術を改造する目的でしばしば使用される。
SDLTが、非予測的な(すなわち、イントラ)方法で符号化されている他デジタルメディアコンテンツの画像(ビデオシーケンス内のフレーム等)の全ての部分に対して適用されるとき、一定の制限問題が生じる。すなわち、
1.プレフィルタは範囲拡張的である。従って、符号器側でプレフィルタした後に、画像の一定領域が一杯になるかまたは切り取られてもよい。同様に、復号器側でオーバーフローする可能性がある。
2.プレフィルタは尖鋭化処理(sharpening)である。局所的な高周波数成分(特にブロックエッジに並んだ画像エッジ)を伴う画像領域の符号化効率は、従って重複変換の結果減少する。
デジタルメディア信号処理と符号化/復号化技術とここで記述されるシステムとを使用して実装された条件付き重複変換は、これらの問題に対処するための重複プロセスをより良く制御する。この条件付き重複変換は、重複変換のプレフィルタおよびポストフィルタの選択または適用において、空間的柔軟性を考慮する。言い換えると、この重複変換は、デジタルメディアコンテンツの異なる領域(例えば、画像の別個のブロック)に対して条件付きで適用される。
例えば、ここで記述される条件付き重複変換の一実装は、空間的に変化するモードパラメータを使用して、復号時に適用される重複ポストフィルタの適用と範囲を指定する。ビデオコーデックでは例えば、この空間的に変化するモードパラメータは、画像内のどのブロックエッジに対して重複変換のポストフィルタが適用されるかを指定する。一実装においては、モードパラメータは、より効率的に符号化され、マクロブロック粒度をもったブールフラグとしてビデオシーケンスのイントラ符号化フレームに対して伝送される。これは、ブロックエッジ毎にモードパラメータを符号化するよりも効率的である。さらにこの実装は、ビットレートに関係する量子化パラメータに基づいて条件付き重複モードに制限を課し、低ビットレートでの条件付き重複変換を行うことの影響を最小化する。
本発明の追加的な特徴と利点は、添付図面を参照して進められる以下の実施形態の詳細説明から明らかになるであろう。
以下の記述は、条件付き重複変換の実装に関する。この実装では、重複変換に関連付けられたブロックエッジフィルタが、デジタルメディアコンテンツ上で空間的に変化する基準に基づいて、条件付きで適用される。条件付き重複変換の例示的適用は、画像またはビデオの符号器および復号器にある。しかしながら、この空間領域重複変換の条件付き形態は画像またはビデオコーデックに制限されず、他のメディア符号化、復号化および/または処理システムに対して適用されうる。従って、条件付き重複変換は一般化された画像またはビデオ符号器および復号器の文脈で記述されるが、代わりとして、条件付きまたは空間的に変化する基準に基づいた重複変換の重複フィルタを利用する様々な種類のメディア信号符号化、復号化および/または処理システム(例えば、音声、ビデオ、画像等)に組み込むことができ、これは空間領域内でも変換領域内でも可能である。
(1.一般化されたビデオ符号器および復号器)
図3は一般化されたビデオ符号器(300)のブロック図であり、図4は一般化されたビデオ復号器(400)のブロック図であって、WMV9/VC−9変換が組み込まれうる。符号器および復号器内のモジュール間の関係は、符号器および復号器内の情報の主な流れを示し、他の関係は簡単なため示されていない。特に、符号器設定、モード、テーブル等を示し、ビデオシーケンス、フレーム、マクロブロック、ブロック等に対して使用される副情報を、図3および図4は通常示さない。一般的にそのような副情報は、エントロピー符号化した後に、出力ビットストリームに送信される。出力ビットストリームのフォーマットは、WMV(Windows Media Video)フォーマットまたは別のフォーマットでありうる。
符号器(300)および復号器(400)はブロックベースであり、4:2:0のマクロブロック形式を使用し、各マクロブロックは、4つの輝度と8×8輝度ブロック(場合によっては1つの16×16マクロブロックとして扱われる)および2つの8×8色差ブロックを含む。あるいは、符号器(300)および復号器(400)はオブジェクトベースであって、異なるマクロブロックもしくはブロックの形式を使用し、または8×8ブロックおよび16×16マクロブロックとは異なるサイズもしくは構成の画素のセットに対して動作を行う。
実装および望ましい圧縮タイプに依存して、符号器または復号器のモジュールが追加、除外、多数モジュールへ分割、他モジュールと結合、および/または類似モジュールと取り替えられうる。代替的な実施形態では、異なるモジュールおよび/または他のモジュール設定を有する符号器または復号器が、1または複数の上述の技術を行う。
(A.ビデオ符号器)
図3は、一般的な符号器システム(300)のブロック図である。符号器システム(300)は現フレーム(305)を含むビデオフレームシーケンスを受信し、出力として圧縮ビデオ情報(395)を作成する。ビデオ符号器の特別な実施形態は一般的に、一般化された符号器(300)の変形または補強バージョンを使用する。
符号器システム(300)は、予測フレームおよびキーフレームを圧縮する。提示のため、図3は符号器システム(300)を通るキーフレーム用パス、および順方向予測フレーム用パスを示す。符号器システム(300)のコンポーネントの多くは、キーフレームと予測フレームの両方を圧縮するために使用される。これらのコンポーネントによって行われる厳密な動作は、圧縮される情報のタイプに依存して変化しうる。
予測フレーム(pフレーム、双方向予測であるbフレーム、またはインター符号化フレームとも呼ばれる)は1または複数の他フレームからの予測(または差分)の観点から表現される。予測残差は、予測されたものと元のフレームとの間の差分である。対照的に、キーフレーム(iフレーム、イントラ符号化フレームとも呼ばれる)は、他のフレームを参照せずに圧縮される。
現フレーム(305)が順方向予測フレームである場合、動き推定器(310)が現フレーム(305)のマクロブロックまたは他の画素のセットの動きを参照フレームに関して推定する。この参照フレームは、フレームストア(320)にバッファされた再構築された前フレーム(325)である。代替的な実施形態において、参照フレームが後フレームであるか、または現フレームが双方向的に予測される。動き推定器(310)は、副情報として動きベクトル等の動き情報(315)を出力する。動き補償器(330)は、動き情報を再構築された前フレーム(325)に適用し、動き補償された現フレーム(335)を形成する。しかしながら、予測が完全であることは稀で、動き補償された現フレーム(325)と元の現フレーム(305)の差分が予測残差(345)である。あるいは、動き推定器および動き補償器は、別のタイプの動き推定/補償を適用する。
周波数変換器(360)は、空間領域ビデオ情報を周波数領域(すなわち、スペクトル)データに変換する。ブロックベースのビデオフレームに対して周波数変換器(360)は、以下の節で記述する、離散コサイン変換(「DCT」)に類似した特性を有する変換を適用する。いくつかの実施形態では、周波数変換器(360)は、キーフレームに対する空間予測残差ブロックに周波数変換を適用する。周波数変換器(360)は、8×8、8×4、4×8または他のサイズの周波数変換を適用できる。
量子化器(370)はその後、スペクトルデータ係数のブロックを量子化する。量子化器は、フレーム単位の基準または他の基準に基づき変化するステップサイズを有するスペクトルデータに、均一量子化、スカラー量子化を適用する。あるいは、量子化器は、例えば不均一量子化、ベクトル量子化、もしくは非適応量子化等、別のタイプの量子化をスペクトルデータ係数に適用し、または、周波数変換を使用しない符号器システムにおける空間領域データを直接量子化する。適応量子化に加え、符号器(300)はレート制御に対して、フレーム棄却、適応フィルタリング、または他の技術を使用できる。
再構築された現フレームが次の動き推定/補償に必要とされた場合、逆量子化器(376)は量子化されたスペクトルデータ係数に対して逆量子化を行う。逆周波数変換器(366)はその後、周波数変換器(360)の動作の逆を行い、再構築された予測残差(予測フレームに対する)または再構築されたキーフレームを作成する。現フレーム(305)がキーフレームであった場合、再構築されたキーフレームは再構築された現フレームと捉えられる(不図示)。現フレーム(305)が予測フレームであった場合、再構築された予測残差は動き補償された現フレーム(335)に追加され、再構築された現フレームが形成される。フレームストア(320)は、次フレームの予測に使用するため、再構築された現フレームをバッファする。いくつかの実施形態では、符号器は再構築されたフレームに対してデブロッキングフィルタを適用し、適応的にフレームのブロック内の不連続性を平滑化する。
エントロピー符号器(380)は、一定の副情報(例えば、動き情報(315)、量子化ステップサイズ)と同様に量子化器(370)の出力も圧縮する。典型的なエントロピー符号化技術には、算術符号化、差分符号化、ハフマン符号化、ランレングス符号化、LZ符号化、辞書符号化、およびそれらの組み合わせが含まれる。エントロピー符号器(380)は一般的に、異なる符号化技術を異なる種類の情報(例えば、DC係数、AC係数、異なる種類の副情報)に対して使用し、それを特定の符号化技術内の複数の符号テーブルから選択できる。
エントロピー符号器(380)は圧縮ビデオ情報(395)をバッファ内に置く。バッファレベルのインジケータは、ビットレート適応モジュールにフィードバックされる。圧縮ビデオ情報(395)は一定のまたは相対的に一定のビットレートでバッファ(390)から空乏化され、そのビットレートで次のストリーミング用に格納される。あるいは、符号器システム(300)は圧縮直後に圧縮ビデオ情報を流す。
バッファ(390)の前または後に、圧縮ビデオ情報(395)はネットワーク上での伝送のためにチャネル符号化される。チャネル符号化は、圧縮ビデオ情報(395)に対してエラー検出データおよび訂正データを適用できる。
(B.ビデオ復号器)
図4は、一般的なビデオ復号器システム(400)のブロック図である。復号器(400)は、ビデオフレームの圧縮シーケンスに対する情報(495)を受信し、再構築されたフレーム(405)を含む出力を作成する。ビデオ復号器の特定の実施形態は一般的に、一般化された復号器(400)の変形または補強バージョンを使用する。
復号器システム(400)は、予測フレームおよびキーフレームを圧縮解除する。提示のため、図4は復号器システム(400)を通るキーフレーム用パス、および順方向予測フレーム用パスを示す。復号器システム(400)のコンポーネントの多くは、キーフレームと予測フレームの両方を圧縮するために使用される。これらのコンポーネントによって行われる厳密な動作は、情報が圧縮される型に依存して変化しうる。
バッファ(490)は、圧縮ビデオシーケンスに対する情報を受信し、エントロピー復号器(480)が受信した情報を利用できるようにする。バッファ(490)は一般的に、時間とともに全く一定の割合で情報を受信して、バンド幅または伝送における短期間の変化を平滑化するためのジッタバッファを含む。バッファ(490)は、再生バッファおよび他のバッファを同様に含むことができる。あるいは、バッファ(490)は変化する割合で、情報を受信する。バッファ(490)の前または後に、圧縮ビデオ情報はエラー検出および訂正のために、チャネル復号化および処理されうる。
エントロピー復号器(480)は、符号器で行われたエントロピー符合化の逆を一般的に適用して、エントロピー符号化された副情報(例えば、動き情報、量子化ステップサイズ)と同様に、エントロピー符号化された量子化データをエントロピー復号化する。エントロピー復号化技術には、算術復号化、差分復号化、ハフマン復号化、ランレングス復号化、LZ復号化、辞書復号化、およびそれらの組み合わせが含まれる。エントロピー復号器(480)は頻繁に、異なる復号化技術を異なる種類の情報(例えば、DC係数、AC係数、異なる種類の副情報)に対して使用し、それを特定の復号化技術内の複数の符号テーブルから選択できる。
再構築されるフレーム(405)が順方向予測フレームである場合、動き補償器(430)は動き情報(415)を参照フレーム(425)に適用し、フレーム(405)が再構築される予測(435)を形成する。例えば、動き補償器(430)はマクロブロック動きベクトルを使用して、参照フレーム(425)内のマクロブロックを見つける。フレームバッファ(420)は前の再構築されたフレームを、参照フレームとして使用するため格納する。あるいは、動き補償器は別のタイプの動き補償を適用する。動き補償器による予測が完全であることは稀で、従って復号器(400)も予測残差を再構築する。
復号器が次の動き補償用の再構築されたフレームを必要とする場合、フレームストア(420)は次フレームの予測で使用するための再構築されたフレームをバッファする。いくつかの実施形態では、符号器は再構築されたフレームに対してデブロッキングフィルタを適用し、適応的にフレームのブロック内の不連続性を平滑化する。
逆量子化器(470)は、エントロピー復号化データを逆量子化する。一般的に逆量子化器は、フレーム単位基準または他の基準に基づき変化するステップサイズを有するエントロピー復号化データに、均一逆量子化、スカラー逆量子化を適用する。あるいは逆量子化器は、例えば不均一量子化、ベクトル量子化、もしくは非適応的量子化等、別のタイプの逆量子化をデータに適用し、または、逆周波数変換を使用しない復号器システムにおける空間領域データを直接逆量子化する。
逆周波数変換器(460)は量子化された、周波数領域データを空間領域ビデオ情報に変換する。ブロックベースのビデオフレームに対して、逆周波数変換器(460)は以下の節で記述される逆変換を適用する。いくつかの実施形態では、逆周波数変換器(460)は逆周波数変換を、キーフレームに対する空間予測残差ブロックに適用する。逆周波数変換器(460)は8×8、8×4、4×8、または他のサイズの逆周波数変換を適用できる。
(2.条件付き重複変換)
再び図2に関して、一般的な前空間領域重複変換が符号器/復号器200により画像上で行われた際、前処理および後処理フィルタ段階210、220が画像の隣接ブロックエッジ全てに適用される。8×8ブロックを使用して符号化されたM×Nサイズの画素から成る画像は、輝度チャネル単体で、隣接する8×8ブロック間に約M*N/32個の別のエッジを有する。先行技術の符号器/復号器200が空間領域重複変換を画像に適用する箇所で、フィルタ段階210、220が画像のそれらの隣接ブロックエッジの各々に適用される。
(A.隣接ブロックエッジ毎の重複モードシグナリング)
図5に示す条件付き重複変換の第1の実装において、符号器に対する図である図5に示されるように、符号器は各隣接ブロックエッジに対応する別の記号(重複モード記号510)を送信し、重複フィルタ(M)520−522(フィルタを通りぬける場合がある、すなわちフィルタリングが適用されない)の選択を定義する。符号器において、様々な基準に基づいてフィルタを選択できる。これらの基準は、例えば、フィルタの結果が範囲外であるか否か、平滑化テスト、速度偏差(rate distortion)最適化基準、およびこれらの基準の組み合わせを含む。このスイッチは重複フィルタの「モード」と呼ばれ、モードはプレフィルタおよびポストフィルタが適用される「条件」を判定する。図5は、スイッチ設定を判定し、フィルタリングされる各ブロックエッジに対して送られる、重複モードパラメータを示す。
各プレフィルタおよびポストフィルタに独立してフラグをつけることを許すことの不利な点の1つは、フィルタリングモードに関連するオーバーヘッドが増加することである。例えば、320×240のサイズのビデオが30f/sで符号化されていると仮定する。さらに、1つのIフレーム(イントラ符号化フレーム)が毎秒送信されると仮定する。従って、毎秒、ビデオの中におよそ3600個の8×8イントラブロックエッジがある。(いくつかのブロックは画像境界にある可能性があり、従って隣接ブロックエッジではないため、この数字は近似値である。)単一ビットの重複モード記号(1ビットのオーバーヘッド)が各エッジに送信された場合でも、これは符号化されたビットストリーム内での3.6kbpsビットレート(図3の圧縮ビデオ情報195)を超過し、無意味ではない。
(B.ビットレートベースおよびブロック毎の重複モードシグナリング)
別の実装例では、符号化ビットレートに基づき、かつブロック毎の重複モード記号を使用するようなシグナリングスキームを使用して、コーデックは重複モードにシグナリングするためにより低いオーバーヘッドを実施する。このシグナリングスキームは以下のシンタックス要素を利用する。すなわち、フレームレベルの量子化パラメータ(QP)、フレームレベルの重複フラグ、およびマクロブロックレベルの重複モードフラグである。他のビデオ符号化シンタックスを使用するコーデックにおいて、個々のブロックエッジ、またはブロックエッジのグループに対する条件付き重複変換モードは、他のシンタックススキームおよび要素を使用して符号化されることができる。例えば、フレームの符号化ビットレートまたは量子化に関係する別のシンタックス要素が使用できる。
図6および図7に関して、圧縮ビデオビットストリーム195(図3)は、圧縮プログレッシブビデオフレームまたは別のピクチャのシーケンスに対する情報を含む。ビットストリームは、図4の復号器(400)等の復号器によって復号される、いくつかの階層レイヤに組織される。最上位レイヤはシーケンスレイヤで、フレームシーケンス全体に対する情報を有する。加えて、各圧縮ビデオフレームは、3つの階層レイヤに構造化されるデータから成る。上から下に向かって、各レイヤはピクチャ、マクロブロック、およびブロックである。
図6はシーケンスレイヤ600用のシンタックス図であり、シーケンスレイヤ600はピクチャレイヤのデータを伴うシーケンスヘッダ610を含む(図7を参照)。シーケンスヘッダ610は、復号器によって処理され、シーケンスの復号に使用されるいくつかのシーケンスレベルの要素を含む。これらの要素には、マクロブロック量子化(DQUANT)要素620、量子化器指定子(QUANTIZER)要素630、および重複変換フラグ(OVERLAP)要素640が含まれる。DQUANT620は、量子化ステップサイズがフレーム内で変化しうるか否かを示す2ビットのフィールドである。DQUANTには3つの可能な値がある。DQUANT=0ならば、フレームあたり1つの量子化ステップサイズ(すなわち、フレーム量子化ステップサイズ)のみが使用されうる。DQUANT=1またはDQUANT=2ならば、フレーム内の各マクロブロックを異なるように量子化することが可能である。
QUANTIZER630は、シーケンスに使用される量子化器を示す2ビットの固定長符号(「FLC」)である。量子化器タイプは次の表1に従って符号化される。
Figure 2007506293
(重複変換フラグ(OVERLAP)(1ビット))
OVERLAP640は、以下で詳細に記述されるように、重複変換が使用されるか否かを示す1ビットのフラグである。OVERLAPが1ならば重複変換が使用され、そうでなければ使用されない。
図7は、インターレースイントラ符号化フレーム用(「インターレースIフレーム」)のピクチャレイヤ700に対するシンタックス図である。プログレッシブIフレーム、PピクチャおよびBフレームのような、他のピクチャに対するシンタックス図は、多くの同様なシンタックス要素を有する。ピクチャレイヤ700は、マクロブロックレイヤに対するデータを伴うピクチャヘッダ710を含む。ピクチャヘッダ710は、復号器によって処理され、対応フレームの復号化に使用されるいくつかのピクチャレベルの要素を含む。これらの要素のいくつかは、その存在がシーケンスレベルの要素または先行ピクチャレベルの要素によってシグナリングまたは暗示される場合にのみ、存在する。
図示したビットストリームシンタックスにおいて、フレームレベルの量子化パラメータ(QP)はピクチャ量子化器スケール(PQUANT)の形で存在し、上述したシーケンスレベルのシンタックス要素QUANTIZERによって指定されるように、ピクチャレイヤシンタックス内で暗示的または明示的にシグナリングされうる。いずれの場合でも、ピクチャ量子化器スケール(PQUANT)はピクチャ画像量子化器指数(PQINDEX)要素720から変換される。PQINDEX720は、フレーム全体に対して量子化器スケール指数をシグナリングする5ビットのフィールドである。これは全てのピクチャタイプ内に存在する。陰量子化器(implicit quantizer)が使用される場合、PQINDEXは、フレームに対して使用されるピクチャ量子化器スケール(PQUANT)および量子化器(3QPまたは5QPデットゾーン)の両方を指定する。表2は、PQINDEXがどのようにPQUANTおよび陰モードの量子化器に変換されるかを示す。
Figure 2007506293
量子化器がシーケンスまたはフレームレベルで明示的にシグナリングされる場合、表3で示されるように、PQINDEXがピクチャ量子化ステップサイズPQUANTに変換される。
Figure 2007506293
あるいは、表3に示される変換の代わりに、量子化器がシーケンスまたはフレームレベルで明示的にシグナリングされるとき、1から31までの全てのPQINDEX値に対して、PQUANTはPQINDEXと等しい。
ピクチャヘッダはさらに、条件付き重複フラグ(CONDOVER)要素730および条件付き重複マクロブロックパターンフラグ(OVERFLAGS)要素740を含む。この条件付き重複フラグ要素は以下で詳細に議論されるように、Iピクチャにのみ存在し、OVERLAPがオンで、かつPQUANTが一定範囲内にある場合にのみ存在する。OVERFLAGSシンタックス要素はIピクチャ内にのみ存在し、CONDOVERがバイナリ値11を有する場合にのみ存在する。OVERFLAGSはビットプレーンとして符号化され、未加工モードにおいて、各マクロブロックがローカル情報OVERFLAGMBを伝えることを要求する。
(重複モードルール)
条件付き重複変換のこの第2の実装例において、符号器(図5)は、下記で列挙するようにイントラフレーム内の重複モードフラグに対していくつかの制約を課すことで、オーバーヘッドを制限する。
1.重複モードはバイナリ量であるよう設定される。FALSE値は、重複フィルタリングが適用されない(すなわち、プレフィルタおよびポストフィルタがフィルタを通り抜ける)ことを示し、TRUE値は、上で参照した改善SDLT特許出願における空間領域重複変換に対して定義されたように、重複フィルタリング段階が適用されることを示す。他の実装においては、重複フィルタモード数は図5に示したように、マクロブロック毎の追加オーバーヘッドを犠牲にすることで、より多くなることができる。
2.量子化閾値(QTH)より大きい、またはQP>QTH(すなわち、低ビットレートから非常に低いビットレートに対して)を満たす、フレームベースの量子化パラメータ(QP)の一定値(例えば、表2または表3から判定されたピクチャ量子化器スケール(PQUANT))に対して、重複条件がイントラブロック間の全てのエッジに対してTRUEに設定される。図示した実装において、8という量子化閾値が使用されるが、代替的な実装では異なる量子化閾値を使用できる。
3.もしくは、QP≦QTH(すなわち、高ビットレートから非常に高いビットレートに対して)を満たす一定のフレームベースの量子化パラメータ値に対して、フレーム内の各イントラマクロブロックがバイナリ重複モードフラグと関連付けられる。このフラグと関連付けられる重複フィルタルールは、前方に列挙される。
予測符号化フレーム(Pフレーム)内のイントラブロックおよびマクロブロックに対して、重複モードが量子化パラメータ(QP)単体から暗示的に導出される。このことは、符号化モードの選択においてPフレームがIフレームよりも非常に多くの自由度を考慮するので、合理的である。
図8のフロー図で示されるように、重複モードフラグは以下のように、第2の実装において符号化および復号化される。
1.重複モードが送信されず、さらに第1決定ブロック810におけるシーケンスレベルの重複フラグ(図6のOVERLAP640)がFALSEに設定される場合は、重複は行われない(850)。
2.決定ブロック820においてQP>QTHの場合、重複モードフラグは暗示的にTRUEであり、シーケンスレベルの重複フラグ(OVERLAP640)は決定ブロック810においてTRUEである。この場合、重複はピクチャ(870)における隣接ブロックエッジ全てに対して行われる。
3.決定ブロック820においてQP≦QTHの場合、3つの可能性(a、bまたはc)の1つを示すフレームレベルのフラグ(図7のCONDOVER730)が送信され、以下に示すように動作が実行される。
a.フレームに対して重複なし(850)
b.フレーム内で全てのマクロブロックが重複(870)
c.「条件付き重複」−マクロブロック毎の重複モードフラグ(図7のOVERFLAGS740)が送信される(860)。
これは、理解を簡単にするためフロー図において2つのバイナリ決定に分割される。
4.条件付き重複が示される場合、重複モードフラグは、イントラフレーム内の各イントラマクロブロックに送信されるバイナリフラグ(すなわち、OVERFLAGシンタックス要素)である。
(条件付き重複)
重複モードがマクロブロック毎にシグナリングされるので、複数のエッジが各条件付き重複フラグによって参照される。図示した実装においては、マクロブロックのサイズは(輝度チャネルに対して)16×16画素であり、変換ブロックサイズは8×8画素である。色差チャネルは8×8ブロックサイズに対する半分の空間解像度を有する。従って、エッジはマクロブロックに対して内部にあってもよく(すなわち、輝度チャネルに対するマクロブロック内の各変換ブロック間のエッジ)、または(輝度チャネルエッジのおよそ半分、および全ての色差チャネルエッジに対して)2つのマクロブロックにまたがってもよい。図9に図示するマクロブロックに対してシグナリングされた重複モードフラグの例によって図示されるように、プレ/ポストフィルタをエッジに適用するか否かを判定するルールは、以下に列挙される。
1.重複モードフラグがFALSEであるマクロブロック、またはイントラ符号化でないマクロブロックの内部マクロブロックエッジに対しては、プレフィルタリングまたはポストフィルタリングは適用されない。
2.マクロブロック内の内部8×8イントラブロックエッジの全ては、マクロブロックがイントラ符号化され、対応する重複モードフラグがTRUEの場合は、プレ/ポストフィルタリングされる。
3.2つのマクロブロックにまたがる8×8ブロックエッジは、下記を満たす場合のみフィルタリングされる。
a.2つの8×8ブロックエッジがイントラブロックであり、かつ
b.2つのマクロブロックの重複モードフラグ双方がTRUEである。
(重複モードシグナリング)
条件付き重複変換のこの第2図示された実装におけるイントラフレームのマクロブロック全てはイントラである。重複モードはフレームレベルの量子化パラメータQPに基づいて送信されるので、重複モードフラグは全てのマクロブロックに対して送信されるか、またはどのマクロブロックに対しても送信されないかのどちらかである。全てのマクロブロックに対して送信される場合、重複モードフラグはM×N画像(M、Nは16の倍数と仮定)に対して(M/16)*(N/16)のサイズのビットプレーンを構成する。
図示された条件付き重複変換の実装は、効率的な符号化メカニズム(「ビットプレーン」符号化と呼ばれ、以下で記述する)を使用し、マクロブロック毎の重複モードフラグを送信する。これは、重複モードフラグのビットプレーン表現が高度な空間的相関関係を有する、すなわち、垂直または水平方向の隣接ビットが高い確率で等しい値であるという仮定に依存している。この仮定は重複フラグに対して真であると分かる―現実世界の画像およびビデオに対して、重複モードフラグにおいて同様に明白であるように、十分な空間的連続性があると期待することは合理的である。
ビットプレーン符号化メカニズム(以下でより完全に記述される)は、イントラフレームに対する重複モードシグナリングを符号化するために使用される。フレーム全体に対する重複モードフラグは、タイリングの集まりの1つおよび符号テーブルを使用してフレームレベルで結合符号化される。ただし、マクロブロックヘッダと共に送信されるマクロブロックあたり1ビットで「未加工で」それらが符号化される場合は除く。
(ビットプレーン符号化)
ビットプレーン符号化においては、マクロブロック毎の条件付き重複フラグ等のマクロブロック特定のバイナリ情報は、マクロブロック毎に1つのバイナリ記号に符号化されることがある。これらの場合、フィールドまたはフレーム内の全てのマクロブロックに対する状態は、ビットプレーンとして符号化され、そのフィールドまたはフレームのヘッダに入れて伝送される。このルールに対する1つの例外は、ビットプレーン符号化モードが未加工モードと設定される場合であり、この場合、各マクロブロックに対する状態は記号あたり1ビットとして符号化され、マクロブロックレベルで他のマクロブロックレベルのシンタックスとともに伝送される。
フィールド/フレームレベルのビットプレーン符号化は、2次元バイナリ配列を符号化するために使用される。各配列のサイズはrowMB×colMBであり、ここでrowMBおよびcolMBはそれぞれ、問題としているフィールドまたはフレーム内のマクロブロック行の数およびマクロブロック列の数である。ビットストリーム内で、各配列は連続ビットのセットとして符号化される。7つのモードのうち1つは各配列を符号化するために使用される。7つのモードは、
1.未加工モード―情報は記号あたり1ビットで符号化され、MBレベルのシンタックスの一部として伝送される。
2.通常−2モード―2つの記号が結合的に符号化される。
3.差分−2モード―ビットプレーンの差分符号化の後、2つの残差記号が結合的に符号化される。
4.通常−6モード―6つの記号が結合的に符号化される。
5.差分−6モード―ビットプレーンの差分符号化の後、6つの残差記号が結合的に符号化される。
6.行スキップモード―1ビットスキップして、設定ビットなしで行をシグナリングする。および、
7.列スキップモード―1ビットスキップして、設定ビットなしで列をシグナリングする。
フィールドまたはフレームレベルでのビットプレーンに対するシンタックス要素は、以下のシーケンス内にある。すなわち、INVERT、IMODE、およびDATABITSである。
(反転フラグ(INVERT))
INVERTのシンタックス要素は1ビットの値であり、設定された場合、ビットプレーンがゼロビットよりも多くの設定ビットを有することを示す。INVERTおよびそのモードに依存して、復号器は、元のビットプレーンを再作成するため、解釈されたビットプレーンを反転する。このビットの値は未加工モードが使用される場合は無視されるものとすることに注意する。INVERTの値がビットプレーンの復号化においてどう使用されるかは、以下に提供する。
(符号化モード(IMODE))
IMODEのシンタックス要素は、ビットプレーンを符号化するために使用される符号化モードを示す可変長の値である。表4は、IMODEのシンタックス要素を符号化するために使用される符号テーブルである。IMODEの値がビットプレーンの復号化においてどう使用されるかは、以下に記述する。
Figure 2007506293
(ビットプレーン符号化ビット(DATABITS))
DATABITSのシンタックス要素は、ビットプレーンに対する記号のストリームを符号化する可変サイズのシンタックス要素である。ビットプレーンを符号化するために使用される方法は、IMODEの値により決定される。7つの符号化モードは、以下の項で記述される。
(未加工モード)
このモードでは、ビットプレーンは、マクロブロックのラスタスキャン順でスキャンされる記号あたり1ビットで符号化され、マクロブロックレイヤの一部分として送信される。あるいは、その情報はフィールドまたはフレームレベルにおいて未加工モードで符号化され、DATABITSはrowMB×colMBビットの長さである。
(通常―2モード)
rowMB×colMBが奇数の場合、最初の記号は未加工で符号化される。続く記号は対単位で、自然スキャン順に符号化される。表5のバイナリVLCテーブルが、記号対を符号化するために使用される。
Figure 2007506293
(差分―2モード)
上述のように、通常―2方法はビットプレーンを作成するために使用され、その後差分-1動作が以下で記述されるようにビットプレーンに適用される。
(通常―6モード)
通常―6モードおよび差分―6モードにおいては、ビットプレーンは6画素のグループで符号化される。これらの画素は2×3または3×2のタイルのどちらかにグループ化される。ビットプレーンはルールのセットを使用して最大限にタイル張りされ、残った画素は行スキップおよび列スキップモードの変形を使用して符号化される。2×3の「垂直」タイルは、rowMBが3の倍数でcolMBが3の倍数でない場合に限り使用される。そうでなければ、3×2の「水平」タイルが使用される。ピクチャ上および左のエッジに沿った線形タイルを有する平面タイルに対して、タイルの符号化順序は次のパターンに従う。6要素タイルが最初に符号化され、次いで線形タイルが列スキップおよび行スキップで符号化される。配列サイズが2×3または3×2の倍数である場合、後者の線形タイルは存在せず、ビットプレーンが完全にタイル張りされる。
6要素の四角形タイルは不完全プレフィックス符号、すなわち、符号化に対して終端ノードの全ては使用しないプレフィックス符号、を使用して符号化される。Nをタイル内の設定ビット数とする。すなわち、0≦N≦6である。N<3に対しては、VLCはタイルを符号化するために使用される。N=3に対しては、固定長エスケープの後に5ビットの固定長符号が続き、N>3に対しては、固定長エスケープの後にタイルを補完する符号が続く。
四角形タイルは6ビットの情報を含む。kをタイルに関連付けられた符号とする。ここで、k=bで、bはタイル内の自然スキャン順でのi番目ビットのバイナリ値である。従って、0≦k<64である。VLCと、固定長符号付きエスケープ符号との組み合わせが、kをシグナリングするために使用される。
(差分―6モード)
上述のように、通常―6方法はビットプレーンを作成するために使用され、その後差分-1動作が以下で記述されるようにビットプレーンに適用される。
(行スキップモード)
行スキップ符号化モードにおいては、全て0の行が1ビットのオーバーヘッドでスキップされる。シンタックスは以下の通りである。各行に対して、単一のROWSKIPビットは行がスキップされたかどうかを示す。行がスキップされた場合、次行に対するROWSKIPビットが次に来て、そうでなければ(行がスキップされなければ)、ROWBITSビット(行内の各マクロブロックに対するビット)が次に来る。従って、行全体が0の場合、0ビットがROWSKIP記号として送信され、ROWBITSがスキップされる。行内に設定ビットがある場合、ROWSKIPが1に設定され、行全体が未加工で(ROWBITS)で送信される。行はフィールドまたはフレームの上から下へスキャンされる。
(列スキップモード)
列スキップは、行スキップの置換である。列はフィールドまたはフレームの左から右へスキャンされる。
(差分-1::逆差分復号化)
差分モード(差分―2または差分―6)のいずれかが使用される場合、「差分ビット」のビットプレーンが、対応する通常モード(それぞれ通常―2または通常―6)を使用して、最初に復号化される。差分ビットは、元のビットプレーンを再生成するために使用される。再生成プロセスは、バイナリアルファベット上の2−D DPCMである。位置(i、j)におけるビットを再生成するため、予測器b(i、j)が以下のように(位置(i、j)におけるビットb(i、j)から)生成される。
Figure 2007506293
差分符号化モードに対しては、INVERTに基づいたビット単位の方向反転プロセスは行われない。しかしながら、INVERTフラグが異なるキャパシティで使用され、上に示した予測器の導出用記号Aの値を示す。より具体的には、INVERTが0に等しい場合はAが0に等しく、INVERTが1に等しい場合はAが1に等しい。ビットプレーンの実際の値は、予測器と復号化された差分ビット値との排他論理和をとることで得られる。上の式では、b(i、j)は、最終復号化後(すなわち、通常―2/通常−6を行って、予測器との差分排他論理和をとった後)のij番目の位置におけるビットである。
(例示的重複フィルタ)
条件付き重複変換の第2の実装において使用される重複フィルタモードの一例では、シグナリングされる時に、復号器において非固定の16ビット再構築に対して、重複平滑化が実行される。重複平滑化に関連付けられた転送プロセスが、画素値に対して許容できる9ビット範囲を超える可能性があるので、これは必要である。重複平滑化の結果は、重複平滑化が適用されなかった残りの画素と並べて、9ビットまでクランプされる。
垂直エッジ(上記の例における画素a0、a1、b1、b0)が最初にフィルタリングされ、その後水平エッジ(画素p0、p1、q1、q0)がフィルタリングされる。第1段階のフィルタリング(垂直エッジ平滑化)による直接の結果は、16ビットで格納される。各エッジにまたがる4つの画素に適用されたコアフィルタは、以下の通りである。
Figure 2007506293
フィルタリングされる元の画素は、(x0、x1、x2、x3)である。r0とr1は丸めパラメータで、統計的に不偏な丸めを保証するために、3および4という値を交互にとる。元の値は、明らかに簡単に実装できるエントリを有する行列によりフィルタリングされる。丸め要素を追加した後、これらの値は3ビットだけビットシフトされ、フィルタリング後の出力(y0、y1、y2、y3)を与える。
水平および垂直エッジフィルタの両方に対して、ブロック内の番号付けが1から始まると仮定して、丸め値は奇数番号の列および行それぞれに対して、r0=4、r1=3である。偶数番号の列/行に対しては、r0=3、r1=4である。フィルタリングはその場での16ビット動作として定義される。従って、元の画素が平滑化後に上書きされる。垂直エッジフィルタリングに対して、画素(a0、a1、b1、b0)は(x0、x1、x2、x3)に対応し、次いで(y0、y1、y2、y3)にフィルタリングされる。同様に、水平エッジフィルタリングに対して、それぞれ(p0、p1、q1、q0)と対応する。
2×2角のブロック内の画素は、両方向にフィルタリングされる。フィルタリングの順序はそれらの最終値を判定し、従ってその順序―垂直エッジフィルタリングの後に水平エッジフィルタリング―をビットの正確性のために維持することが重要である。概念的には、フィルタリングされる全ての画素に対して、クランピングが2方向フィルタリング段階に続いて行われる。しかしながら、クランピングとフィルタリングを組み合わせることに対してはいくつかの計算上有利な点がありうる―正確な出力を生成するようそれが慎重になされる限り、これは実装上の問題である。
(3.コンピューティング環境)
条件付き重複変換の上述の実装は、画像およびビデオ信号処理が行われる任意の様々なデバイス上で行われうる。これらのデバイスには、例えば、コンピュータ、画像およびビデオレコーディング、送信および受信機器、ポータブルビデオプレイヤ、ビデオ会議、ウェブビデオストリーミングアプリケーションなどが含まれる。画像およびビデオ符号化技術は、図10に示されるような、コンピュータまたは他のコンピューティング環境(中央処理装置(CPU)、専用グラフィックスプロセッサ、ビデオカード等上で実行されるか否かに関わらず)内で実行する画像およびビデオ処理ソフトウェアにおいてと同様、ハードウェア回路(例えば、ASIC、FPGA等の回路)において実装されうる。
図10は、記述された条件付き重複変換を実装してもよい適切なコンピューティング環境(1000)の一般的な例を図示する。本発明は、多様な汎用目的または特殊目的のコンピューティング環境で実装されてもよいので、コンピューティング環境(1000)は、本発明の使用または機能範囲に関して制限するよう意図されたものではない。
図10に関して、コンピューティング環境(1000)は少なくとも1つの処理ユニット(1010)およびメモリ(1020)を含む。図10において、この最も基本的な構成(1030)は点線内に含まれる。処理ユニット(1010)はコンピュータ実行可能命令を実行し、実際のまたは仮想のプロセッサであってよい。マルチ処理システムにおいては、複数の処理ユニットがコンピュータ実行可能命令を実行し、処理能力を向上させる。メモリ(1020)は揮発性メモリ(例えば、レジスタ、キャッシュ、RAM)、不揮発性メモリ(例えば、ROM、EEPROM、フラッシュメモリ等)、またはその2つの何らかの組み合わせであってもよい。メモリ(1020)は、記述された条件付き重複変換を実装するソフトウェア(1080)を格納する。
コンピューティング環境は追加的な特徴を有してもよい。例えば、コンピューティング環境(1000)はストレージ(1040)、1または複数の入力デバイス(1050)、1または複数の出力デバイス(1060)、1または複数の通信接続(1070)を含む。バス、コントローラ、またはネットワークのような相互接続メカニズム(不図示)が、コンピューティング環境(1000)のコンポーネントを相互接続する。一般的にはオペレーティングシステムソフトウェア(不図示)が、コンピューティング環境(1000)で実行する他ソフトウェアに対する動作環境を提供し、コンピューティング環境(1000)のコンポーネントの活動を調整する。
ストレージ(1040)は取り外し可能または取り外し不可能であってよく、磁気ディスク、磁気テープまたはカセット、CD−ROM、CD−RW、DVD、または情報の格納に使用もしくはコンピューティング環境(1000)内でアクセスされうる他の任意の媒体を含む。ストレージ(1040)は、量子化行列を生成および圧縮する音声符号器を実装する、ソフトウェア(1080)用の命令を格納する。
(複数の)入力デバイス(1050)は、キーボード、マウス、ペン、またはトラックボール、音声入力デバイス、スキャンニングデバイス、またはコンピューティング環境(1000)に対する入力を提供する別のデバイス等、タッチ入力デバイスであってよい。音声に対しては、(複数の)入力デバイス(1050)は、サウンドカードまたは、アナログもしくはデジタル形態の音声入力を受け付ける同様のデバイス、 またはコンピューティング環境に対して音声サンプルを提供するCD−ROMリーダーであってよい。(複数の)出力デバイス(1060)はディスプレイ、プリンタ、スピーカ、CDライター、またはコンピューティング環境(1000)からの出力を提供する別のデバイスであってよい。
(複数の)通信接続(1070)は、別のコンピューティングエンティティに対して、通信媒体上の通信を可能とする。通信媒体は、コンピュータ実行可能命令、圧縮音声またはビデオ情報、または変調データ信号における他のデータ等の情報を運ぶ。変調データ信号は、信号内情報を符号化するというような方法で設定または変更される1または複数の特性を有する信号である。制限ではなく例として、通信媒体は、電気、光学、RF、赤外線、音響、または他のキャリアで実装される、有線または無線技術を含む。
本明細書での変換および符号化/復号化技術は、コンピュータ読取り可能媒体の一般的なコンテキストで記述されうる。コンピュータ読取り可能媒体は、コンピューティング環境内でアクセスされうる利用可能な任意の媒体である。制限ではなく例として、コンピューティング環境(1000)とともに、コンピュータ読取り可能媒体はメモリ(1020)、ストレージ(1040)、通信媒体、およびそれらの任意の組み合わせを含む。
本明細書での条件付き重複変換は、対象となる実際のまたは仮想のプロセッサ上のコンピューティング環境で実行されるプログラムモジュールに含まれるもののような、コンピュータ実行可能命令の一般的なコンテキストで記述されうる。一般的にプログラムモジュールは、特定のタスクを行う、または特定の抽象データ型を実装する、ルーチン、プログラム、ライブラリ、オブジェクト、クラス、コンポーネント、データ構造等を含む。プログラムモジュールの機能性は、様々な実施形態で望ましいようにプログラムモジュール間で組み合わせ、または分割されてよい。プログラムモジュール用のコンピュータ実行可能命令は、ローカルまたは分散コンピューティング環境内で実行されてよい。
提示のために、詳細な記述では、「判定」、「生成」、「調整」、および「適用」等の用語を使用して、コンピューティング環境内のコンピュータ動作を記述する。これらの用語は、コンピュータによって行われる動作に対する高レベルの抽象化であって、人間によって行われる行為と混同されるべきではない。これらの用語に対応する実際のコンピュータ動作は、実装しだいで変化する。
我々の発明原理を適用してもよい多くの可能な実施形態の観点から、本発明と全てのそのような実施形態は、請求項とそれに対する等価物の範囲と精神から生じるものである。
先行技術における典型的な変換符号化技術のブロック図である。 先行技術における空間領域重複変換に基づく符号化/復号化システムのブロック図である。 ここで記述される条件付き重複変換を利用するビデオ符号器のブロック図である。 ここで記述される条件付き重複変換を利用するビデオ復号器のブロック図である。 隣接ブロックエッジ毎の重複モードシグナリングを伴う条件付き重複変換を実装する符号器のブロック図である。 図6は、ビットレートベースおよびマクロブロック毎の重複モードシグナリングを備えた条件付き重複変換の第2の実装に従って符号器/復号器内で利用される、シーケンスレベルのシンタックスの図である。 図7は、ビットレートベースおよびマクロブロック毎の重複モードシグナリングを備えた条件付き重複変換の第2の実装に従って符号器/復号器内で利用される、フレームレベルのシンタックスの図である。 図8は、条件付き重複変換の第2の実装における、重複モードフラグのビットレートベースおよびマクロブロック毎のシグナリングを図示するフロー図である。 図9は、画像内のマクロブロックのセットに対するシグナリングされた重複モードフラグの例として重複フィルタが適用される、隣接マクロブロックエッジを図示する図である。 図10は、図3および図4のビデオ符号器/復号器に対する適切なコンピューティング環境のブロック図である。

Claims (20)

  1. デジタルメディアコンテンツを変換符号化/復号化する方法であって、
    前記デジタルメディアコンテンツのブロックを変換符号化/復号化すること、および
    変換符号化/復号化の前後に、前記デジタルメディアコンテンツの変換ブロック間のエッジのサブセットに、空間的に変化する基準に基づいて条件付きで重複フィルタを適用すること
    を備えたことを特徴とする方法。
  2. 条件付きで重複フィルタを適用することは、前記デジタルメディアコンテンツの隣接変換ブロック間のエッジに適用された複数の重複フィルタモード間で空間的に変化する基準に基づいて切り替えることを特徴とする請求項1に記載の方法。
  3. 前記の複数の重複フィルタモードは、重複なしのフィルタリングを含むことを特徴とする請求項1に記載の方法。
  4. フレームレベルの粒度を有するビデオシーケンス内における、複数エッジの隣接変換ブロック間のエッジに適用される前記重複フィルタモードを切り替えることを備えたことを特徴とする請求項2に記載の方法。
  5. マクロブロックレベルの粒度を有するビデオシーケンス内における、複数エッジの隣接変換ブロック間のエッジに適用される前記重複フィルタモードを切り替えることを備えたことを特徴とする請求項2に記載の方法。
  6. 隣接変換ブロックエッジレベルの粒度を有するビデオシーケンス内における、複数エッジの隣接変換ブロック間のエッジに適用される前記重複フィルタモードを切り替えることを備えたことを特徴とする請求項2に記載の方法。
  7. デジタルメディアコンテンツの符号器から復号器へ、隣接変換ブロックエッジ毎の基準に基づき前記重複フィルタモードをシグナリングすることを備えたことを特徴とする請求項2に記載の方法。
  8. デジタルメディアコンテンツの符号器から復号器へ、マクロブロック毎の基準に基づいて前記重複フィルタモードをシグナリングすることを備えたことを特徴とする請求項2に記載の方法。
  9. 符号化されたビデオビットストリームを復号化する方法であって、
    符号化されたビデオビットストリーム内のフレームの複数の符号化されたブロックのブロックデータを復号化すること、
    前記復号化されたブロックデータの逆量子化を行うこと、
    前記復号化されたブロックデータの変換ブロックの逆変換を行うこと、
    前記符号化されたデオビットストリームの少なくとも1つのシンタックス要素から少なくとも1つの隣接変換ブロックエッジのグループに対して重複モードを判定すること、
    グループに対する前記の判定された重複モードに従って複数の重複フィルタ間で切り替えること、および
    前記それぞれの重複フィルタを前記グループに適用すること
    を備えたことを特徴とする方法。
  10. 前記少なくとも1つのシンタックス要素は、隣接変換ブロックエッジ毎に重複モードフラグを備えたことを特徴とする請求項9に記載の方法。
  11. 前記少なくとも1つのシンタックス要素は、前記符号化されたビデオビットストリームのビットレートに関するシンタックス要素を備えたことを特徴とする請求項9に記載の方法。
  12. 前記符号化されたビデオビットストリームのビットレートに関する前記シンタックス要素は、フレームレベルの量子化パラメータであることを特徴とする請求項11に記載の方法。
  13. 前記少なくとも1つのシンタックス要素は、マクロブロックの粒度を有する重複モードフラグのセットを備えたことを特徴とする請求項9に記載の方法。
  14. 前記重複モードフラグのセットは、ビットプレーン符号化を使用して符号化されることを特徴とする請求項13に記載の方法。
  15. 前記少なくとも1つのシンタックス要素は、フレームレベルの重複パラメータ、フレームベースのビットレート関係パラメータ、および空間的に変化するモードパラメータを備え、前記方法は、
    前記ビットレート関係パラメータが低ビットレートを示す場合、前記それぞれのフレーム内の前記隣接変換ブロックエッジに対する重複フィルタの適用を判定すること、
    前記フレームレベルの重複パラメータが重複を指定しない場合、前記それぞれのフレーム内の前記隣接変換ブロックエッジに対する重複なしフィルタの適用を判定すること、
    前記フレームレベルの重複パラメータが条件付き重複を指定する場合、グループの前記空間的に変換するモードパラメータによって指定される重複フィルタの前記グループ内の前記隣接変換ブロックエッジに対する適用を判定すること、および
    そうでない場合は、前記それぞれのフレーム内の前記隣接変換ブロックエッジに対する前記重複フィルタの適用を判定すること
    をさらに備えたことを特徴とする請求項9に記載の方法。
  16. 前記少なくとも1つのシンタックス要素は、さらにシーケンスレベルの重複パラメータを備え、前記方法は、
    前記シーケンスレベルの重複パラメータが重複を指定しない場合、前記シーケンスの全てのフレーム内における前記隣接変換ブロックエッジに対する前記重複なしフィルタの適用を判定することをさらに備えたことを特徴とする請求項15に記載の方法。
  17. 条件付き重複変換を使用して符号化されたビデオストリームを符号化/復号化する方法を行う処理ユニットによって実行可能なソフトウェアモジュールを有する少なくとも1つのコンピュータ読取り可能プログラム記憶媒体において、前記方法は、
    重複フィルタが隣接ブロックエッジに適用されない少なくとも1つの重複なし状態、および重複フィルタが隣接ブロックエッジに適用される1つの重複状態を有する重複条件を判定することであって、その際前記重複条件はビデオシーケンス内のピクチャ上で空間的に変化すること、および
    前記重複条件が前記重複状態にある場合に前記重複フィルタを隣接ブロックエッジに適用すること
    を備えたことを特徴とするコンピュータ読取り可能プログラム記憶媒体。
  18. 請求項17に記載の少なくとも1つのコンピュータ読取り可能プログラム記憶媒体であって、前記方法は、
    ビットレート関係パラメータに基づいて前記重複フィルタの前記判定および前記適用を制限すること
    をさらに備えたことを特徴とする媒体。
  19. 前記ビットレート関係パラメータは、フレームレベルの量子化パラメータであることを特徴とする請求項18に記載の少なくとも1つのコンピュータ読取り可能プログラム記憶媒体。
  20. 請求項17に記載の少なくとも1つのコンピュータ読取り可能プログラム記憶媒体であって、
    前記重複条件は、マクロブロック毎の重複フラグによって前記ビデオビットストリーム内でシグナリングされ、前記判定と適用は、
    前記重複フィルタを、重複条件が前記重複状態にあるとシグナリングされるマクロブロックのイントラブロックエッジに適用すること、
    前記重複フィルタを、両方の重複条件が前記重複状態にあるとシグナリングされる隣接マクロブロック間のブロックエッジに適用すること
    をさらに備えた特徴とする媒体。
JP2006525502A 2003-09-07 2004-09-02 条件付き重複変換 Active JP4986622B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US50108103P 2003-09-07 2003-09-07
US60/501,081 2003-09-07
US10/931,885 2004-08-31
US10/931,885 US7369709B2 (en) 2003-09-07 2004-08-31 Conditional lapped transform
PCT/US2004/028969 WO2005027492A2 (en) 2003-09-07 2004-09-02 Conditional lapped transform

Publications (3)

Publication Number Publication Date
JP2007506293A true JP2007506293A (ja) 2007-03-15
JP2007506293A5 JP2007506293A5 (ja) 2007-05-17
JP4986622B2 JP4986622B2 (ja) 2012-07-25

Family

ID=34228800

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006525502A Active JP4986622B2 (ja) 2003-09-07 2004-09-02 条件付き重複変換

Country Status (8)

Country Link
US (1) US7369709B2 (ja)
EP (1) EP1661387B1 (ja)
JP (1) JP4986622B2 (ja)
KR (1) KR101028955B1 (ja)
CN (1) CN1998152B (ja)
ES (1) ES2773751T3 (ja)
MX (1) MXPA06002494A (ja)
WO (1) WO2005027492A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023514638A (ja) * 2020-11-12 2023-04-06 テンセント・アメリカ・エルエルシー ビデオ復号の方法、機器、及びコンピュータプログラム

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE50305419D1 (de) 2002-05-02 2006-11-30 Fraunhofer Ges Forschung Kodierung und Dekodierung von Transformationskoeffizienten in Bild- oder Videokodierern
US7590059B2 (en) * 2004-05-21 2009-09-15 Broadcom Corp. Multistandard video decoder
CN101032174B (zh) * 2004-09-29 2013-07-03 汤姆森研究基金有限公司 用于降低分辨率更新视频编码和解码的方法和装置
US9118923B2 (en) * 2005-04-27 2015-08-25 Broadcom Corporation Reconstruction and overlap transform system and method supporting VC-1 decoding
US7953161B2 (en) * 2005-04-27 2011-05-31 Broadcom Corporation System and method for overlap transforming and deblocking
US20060288065A1 (en) * 2005-06-17 2006-12-21 Docomo Communications Laboratories Usa, Inc. Method and apparatus for lapped transform coding and decoding
US8625914B2 (en) 2013-02-04 2014-01-07 Sony Corporation Image processing system, image processing method and program
KR100791295B1 (ko) * 2006-01-12 2008-01-04 삼성전자주식회사 플래그 부호화 방법, 플래그 복호화 방법, 및 상기 방법을이용한 장치
EP1841237B1 (en) 2006-03-29 2014-10-08 TELEFONAKTIEBOLAGET LM ERICSSON (publ) Method and apparatus for video encoding
US8139880B2 (en) * 2008-03-24 2012-03-20 Microsoft Corporation Lifting-based directional lapped transforms
US8275209B2 (en) * 2008-10-10 2012-09-25 Microsoft Corporation Reduced DC gain mismatch and DC leakage in overlap transform processing
US8527649B2 (en) 2010-03-09 2013-09-03 Mobixell Networks Ltd. Multi-stream bit rate adaptation
WO2011121227A1 (fr) * 2010-03-31 2011-10-06 France Telecom Procedes et dispositifs de codage et de decodage d'une sequence d'images mettant en œuvre une prediction par compensation de mouvement avant, flux et programme d'ordinateur correspondants
US8832709B2 (en) 2010-07-19 2014-09-09 Flash Networks Ltd. Network optimization
ES2773774T3 (es) 2010-10-06 2020-07-14 Ntt Docomo Inc Dispositivo, método y programa de codificación bipredictiva de imágenes, y dispositivo, método y programa de decodificación bipredictiva de imágenes
EP2625855B8 (en) * 2010-10-08 2021-03-10 GE Video Compression, LLC Picture coding supporting block partitioning and block merging
DK2675169T3 (da) 2011-02-09 2019-07-22 Lg Electronics Inc Fremgangsmåde til kodning og afkodning af billeddata med en tidsmæssig bevægelsesvektorprediktor og indretning til anvendelse deraf
US8688074B2 (en) 2011-02-28 2014-04-01 Moisixell Networks Ltd. Service classification of web traffic
KR20130108457A (ko) 2011-03-09 2013-10-02 닛본 덴끼 가부시끼가이샤 영상 부호화 장치, 영상 복호 장치, 영상 부호화 방법 및 영상 복호 방법
PL230821B1 (pl) 2011-10-17 2018-12-31 Kt Corp Sposób i urządzenie do kodowania/dekodowania obrazu
US10003817B2 (en) 2011-11-07 2018-06-19 Microsoft Technology Licensing, Llc Signaling of state information for a decoded picture buffer and reference picture lists
GB201119206D0 (en) 2011-11-07 2011-12-21 Canon Kk Method and device for providing compensation offsets for a set of reconstructed samples of an image
EP2805492B1 (en) 2012-01-19 2018-11-14 VID SCALE, Inc. System and method of video coding quantization and dynamic range control
KR102341826B1 (ko) 2012-07-02 2021-12-21 엘지전자 주식회사 영상 정보 코딩 방법 및 이를 이용하는 장치
US9020262B2 (en) * 2012-07-31 2015-04-28 Hewlett-Packard Development Company, L.P. Symbol compression using conditional entropy estimation
US9313500B2 (en) 2012-09-30 2016-04-12 Microsoft Technology Licensing, Llc Conditional signalling of reference picture list modification information
US10043254B2 (en) * 2016-04-14 2018-08-07 Microsoft Technology Licensing, Llc Optimal image transformation based on professionalism score of subject
US10043240B2 (en) 2016-04-14 2018-08-07 Microsoft Technology Licensing, Llc Optimal cropping of digital image based on professionalism score of subject
WO2019009776A1 (en) * 2017-07-05 2019-01-10 Telefonaktiebolaget Lm Ericsson (Publ) DECODING VIDEO SAMPLE BLOCK
JP2021515470A (ja) * 2018-02-26 2021-06-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 選択的な量子化パラメータ送信

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4754492A (en) 1985-06-03 1988-06-28 Picturetel Corporation Method and system for adapting a digitized signal processing system for block processing with minimal blocking artifacts
US5297236A (en) 1989-01-27 1994-03-22 Dolby Laboratories Licensing Corporation Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder
JP2549479B2 (ja) 1991-12-06 1996-10-30 日本電信電話株式会社 動き補償フレーム間帯域分割符号化処理方法
KR0148130B1 (ko) 1992-05-18 1998-09-15 강진구 블럭킹아티팩트를 억제시키는 부호화/복호화 방법 및 그 장치
US5982459A (en) 1995-05-31 1999-11-09 8×8, Inc. Integrated multimedia communications processor and codec
FR2737931B1 (fr) * 1995-08-17 1998-10-02 Siemens Ag Procede destine au traitement de blocs d'images decodes d'un procede de codage d'images a base de blocs
US5825929A (en) 1995-10-05 1998-10-20 Microsoft Corporation Transformation block optimization method
US5850294A (en) * 1995-12-18 1998-12-15 Lucent Technologies Inc. Method and apparatus for post-processing images
US5805739A (en) 1996-04-02 1998-09-08 Picturetel Corporation Lapped orthogonal vector quantization
JPH1070717A (ja) * 1996-06-19 1998-03-10 Matsushita Electric Ind Co Ltd 画像符号化装置及び画像復号化装置
US5973755A (en) 1997-04-04 1999-10-26 Microsoft Corporation Video encoder and decoder using bilinear motion compensation and lapped orthogonal transforms
US6101279A (en) 1997-06-05 2000-08-08 Wisconsin Alumni Research Foundation Image compression system using block transforms and tree-type coefficient truncation
US5859788A (en) 1997-08-15 1999-01-12 The Aerospace Corporation Modulated lapped transform method
US5913191A (en) * 1997-10-17 1999-06-15 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to suppress aliasing artifacts at frame boundaries
US6393156B1 (en) 1998-01-07 2002-05-21 Truong Q. Nguyen Enhanced transform compatibility for standardized data compression
US6393061B1 (en) 1998-05-15 2002-05-21 Hughes Electronics Corporation Method for reducing blocking artifacts in digital images
US6115689A (en) 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
US6029126A (en) 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
US6154762A (en) 1998-06-03 2000-11-28 Microsoft Corporation Fast system and method for computing modulated lapped transforms
US6073153A (en) 1998-06-03 2000-06-06 Microsoft Corporation Fast system and method for computing modulated lapped transforms
US6253165B1 (en) 1998-06-30 2001-06-26 Microsoft Corporation System and method for modeling probability distribution functions of transform coefficients of encoded signal
US6421464B1 (en) 1998-12-16 2002-07-16 Fastvdo Llc Fast lapped image transforms using lifting steps
US6487574B1 (en) 1999-02-26 2002-11-26 Microsoft Corp. System and method for producing modulated complex lapped transforms
US6496795B1 (en) 1999-05-05 2002-12-17 Microsoft Corporation Modulated complex lapped transform for integrated signal enhancement and coding
US6370502B1 (en) 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
US6771829B1 (en) 1999-10-23 2004-08-03 Fastvdo Llc Method for local zerotree image coding
JP2003513565A (ja) * 1999-10-29 2003-04-08 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ符号化方法
US6865229B1 (en) * 1999-12-14 2005-03-08 Koninklijke Philips Electronics N.V. Method and apparatus for reducing the “blocky picture” effect in MPEG decoded images
US6771828B1 (en) 2000-03-03 2004-08-03 Microsoft Corporation System and method for progessively transform coding digital data
US7177358B2 (en) * 2000-06-27 2007-02-13 Mitsubishi Denki Kabushiki Kaisha Picture coding apparatus, and picture coding method
AU2001273510A1 (en) 2000-07-17 2002-01-30 Trustees Of Boston University Generalized lapped biorthogonal transform embedded inverse discrete cosine transform and low bit rate video sequence coding artifact removal
JP2004509531A (ja) 2000-09-12 2004-03-25 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ符号化方法
CN100452883C (zh) * 2001-12-17 2009-01-14 微软公司 处理视频图像的方法
CN101448162B (zh) 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
US6763068B2 (en) 2001-12-28 2004-07-13 Nokia Corporation Method and apparatus for selecting macroblock quantization parameters in a video encoder
US7006699B2 (en) 2002-03-27 2006-02-28 Microsoft Corporation System and method for progressively transforming and coding digital data
US7155065B1 (en) 2002-03-27 2006-12-26 Microsoft Corporation System and method for progressively transforming and coding digital data
US7242713B2 (en) 2002-05-02 2007-07-10 Microsoft Corporation 2-D transforms for image and video coding
US6728315B2 (en) 2002-07-24 2004-04-27 Apple Computer, Inc. Method and apparatus for variable accuracy inter-picture timing specification for digital video encoding with reduced requirements for division operations
US7227901B2 (en) * 2002-11-21 2007-06-05 Ub Video Inc. Low-complexity deblocking filter
US7167522B2 (en) * 2003-02-27 2007-01-23 Texas Instruments Incorporated Video deblocking filter
US7471726B2 (en) 2003-07-15 2008-12-30 Microsoft Corporation Spatial-domain lapped transform in digital media compression
US7305139B2 (en) 2004-12-17 2007-12-04 Microsoft Corporation Reversible 2-dimensional pre-/post-filtering for lapped biorthogonal transform

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6010044452, Trac D. Tran et al., "Lapped transform via time−domain pre− and post−filtering", IEEE Transactions on Signal Processing, 200306, Volume 51, Issue 6, p.1557−1571 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023514638A (ja) * 2020-11-12 2023-04-06 テンセント・アメリカ・エルエルシー ビデオ復号の方法、機器、及びコンピュータプログラム
JP7467650B2 (ja) 2020-11-12 2024-04-15 テンセント・アメリカ・エルエルシー ビデオ復号の方法、機器、及びコンピュータプログラム

Also Published As

Publication number Publication date
CN1998152B (zh) 2012-06-13
CN1998152A (zh) 2007-07-11
US7369709B2 (en) 2008-05-06
JP4986622B2 (ja) 2012-07-25
WO2005027492A2 (en) 2005-03-24
ES2773751T3 (es) 2020-07-14
US20050053150A1 (en) 2005-03-10
KR101028955B1 (ko) 2011-04-12
WO2005027492A3 (en) 2006-11-23
EP1661387A4 (en) 2010-12-22
EP1661387B1 (en) 2019-11-20
MXPA06002494A (es) 2006-06-20
KR20060131719A (ko) 2006-12-20
EP1661387A2 (en) 2006-05-31

Similar Documents

Publication Publication Date Title
JP4986622B2 (ja) 条件付き重複変換
US7412102B2 (en) Interlace frame lapped transform
US10567753B2 (en) Skip macroblock coding
US7602851B2 (en) Intelligent differential quantization of video coding
US7830963B2 (en) Decoding jointly coded transform type and subblock pattern information

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070326

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070830

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100803

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101102

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101202

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110922

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120120

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20120123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120123

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120417

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120424

R150 Certificate of patent or registration of utility model

Ref document number: 4986622

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150511

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250