JP2013153463A - ビデオブロック予測モードの適応形符号化 - Google Patents

ビデオブロック予測モードの適応形符号化 Download PDF

Info

Publication number
JP2013153463A
JP2013153463A JP2013035668A JP2013035668A JP2013153463A JP 2013153463 A JP2013153463 A JP 2013153463A JP 2013035668 A JP2013035668 A JP 2013035668A JP 2013035668 A JP2013035668 A JP 2013035668A JP 2013153463 A JP2013153463 A JP 2013153463A
Authority
JP
Japan
Prior art keywords
prediction mode
prediction
block
prediction modes
modes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013035668A
Other languages
English (en)
Other versions
JP5575940B2 (ja
Inventor
Yan Ye
ヤン・イエ
Karczewicz Marta
マルタ・カークゼウィックズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2013153463A publication Critical patent/JP2013153463A/ja
Application granted granted Critical
Publication of JP5575940B2 publication Critical patent/JP5575940B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/197Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

【課題】ビデオブロックのヘッダー情報の符号化のための技術を提供する。
【解決手段】符号化単位のビデオブロックの予測ブロックの生成に使用するために、単方向の予測モードと少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードとを含む、複数の予測モードのうちの1つを選択する。エンコード装置は、符号化単位の1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、現在のビデオブロックの予測モードをエンコードする。同様に、復号ユニットは、符号化単位のビデオブロックの符号化されたビデオデータを受信し、符号化単位の1つまたは複数の前に復号されたビデオブロックの予測モードに基づいて、ビデオブロックの予測ブロックの生成に使用するための複数の予測モードのうちの1つを識別するために、上記符号化されたビデオデータを復号する。
【選択図】図6

Description

本出願は、それぞれの全内容が参照により本明細書に組み込まれる、2007年6月15日出願の米国特許仮出願第60/944,470号明細書、および2007年10月12日出願の米国特許仮出願第60/979,762号明細書の利益を主張する。
本開示は、ディジタルビデオ符号化に関し、より詳細には、ビデオブロックのエントロピ符号化に関する。
ディジタルビデオ機能は、ディジタルテレビ、ディジタルダイレクト放送方式(digital direct broadcast system)、無線電話ハンドセット(radio telephone handset)などの無線通信装置、無線ブロードキャストシステム、携帯情報端末(PDA)、ラップトップまたはデスクトップコンピュータ、ディジタルカメラ、ディジタル記録装置、ビデオゲーム装置、ビデオゲームコンソールなど、を含む広範な装置に組み込まれることができる。ディジタルビデオ装置は、ディジタルビデオをより効率的に送受信するために、MPEG−2、MPEG−4、またはH.264/MPEG−4,Part 10,Advanced Video Coding(AVC)などのビデオ圧縮技術を実装する。ビデオ圧縮技術は、ビデオ系列につきものの冗長を低減または削除するために空間的および時間的予測を行う。
ビデオ圧縮は、一般に、空間的予測および/または時間的予測を含む。特に、イントラ符号化(intra-coding)は、ビデオフレーム、ビデオフレームのスライスなどを備え得る所与の符号化単位内のビデオブロック間の空間的冗長を低減または削除するために、空間的予測に依存する。これに対して、インター符号化(inter-coding)は、ビデオ系列の連続する符号化単位のビデオブロック間の時間的冗長を低減または削除するために、時間的予測に依存する。イントラ符号化の場合、ビデオエンコーダは、同じ符号化単位内の他のデータに基づいて、データを圧縮するために、空間的予測を行う。インター符号化の場合、ビデオエンコーダは、2つ以上の隣接する符号化単位のマッチするビデオブロックの動きを追跡するために、動き推定および動き補償を行う。
空間的または時間的予測の後、符号化されている元のビデオブロックから予測プロセス中に生成された予測ビデオブロックを取り除くことによって、残差ブロックが生成される。したがって、残差ブロックは、予測ブロックと符号化されている現在のブロックとの間の差を示す。ビデオエンコーダは、残差ブロックの通信に関連付けられているビットレートをさらに低減するために、変換プロセス、量子化プロセス、およびエントロピ符号化プロセスを適用することができる。変換技術は、1組のピクセル値を、周波数領域におけるピクセル値のエネルギーを表す変換係数に変更することができる。量子化は、変換係数に適用され、一般に、任意の所与の係数に関連付けられているビット数を制限するプロセスを伴う。エントロピエンコーディングの前に、ビデオエンコーダは、量子化された係数ブロックをスキャンして、1次元ベクトルの係数にする。ビデオエンコーディングエントロピは、残差データをさらに圧縮するために、量子化された変換係数のベクトルをエンコードする。
ビデオ復号器は、係数を取り出すために、逆エントロピ符号化操作を行うことができる。受信された1次元ベクトルの係数から2次元ブロックを形成するために、復号器で逆スキャンが行われることもできる。次いで、ビデオ復号器は、再構成された残差ブロックを取得するために、その係数を逆量子化し、逆変換する。次いで、ビデオ復号器は、予測情報および動き情報に基づいて、予測ビデオブロックを復号する。次いでビデオ復号器は、再構成されたビデオブロックを生成し、復号されたビデオ情報の系列を生成するために、予測ビデオブロックを対応する残差ブロックに追加する。
本開示は、ビデオブロックのヘッダー情報の符号化のための技術について記述する。特に、本開示の技術は、符号化単位のビデオブロックの予測ブロックの生成に使用するために、単方向の予測モードと少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードとを含む、複数の予測モードのうちの1つを選択する。ビデオエンコーダは、符号化単位の1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、現在のビデオブロックの予測モードをエンコードするように構成され得る。ビデオ復号器は、ビデオエンコーダによって行われるエンコードの逆の復号機能(reciprocal decoding function)を行うように構成されることもできる。したがって、ビデオ復号器は、ビデオブロックの予測ブロックの生成に使用するための予測モードを復号するために、同様の技術を使用する。
ビデオエンコーダは、いくつかの例では、例えば、前にエンコードされたビデオブロックの予測モードの、例えば単方向や多方向などのタイプに基づいて、選択された予測モードの符号化に使用するために、異なる符号化コンテキスト(coding context)を選択することができる。さらに、本開示の技術は、さらに、選択された予測モードに基づいて、ビデオブロックの残存情報に、変換を選択的に適用することができる。一例では、ビデオエンコーダは、予測モードの異なる1つにそれぞれ対応する複数の方向変換(directional transform)を格納し、ビデオブロックの選択された予測モードに基づいて、対応する方向変換をビデオブロックに適用することができる。他の例では、ビデオエンコーダは、少なくとも1つの離散的コサイン変換(DCT)または整数変換、および複数の方向変換を格納し、選択された予測モードが限定された方向性を示すとき、DCTまたは整数変換をビデオブロックの残差データに適用し、選択された予測モードが方向性を示すとき、方向変換のうちの1つを、ビデオブロックの残差データに適用することができる。
一態様では、ビデオデータをエンコードする方法は、符号化単位のビデオブロックの予測ブロックの生成に使用するために、複数の予測モードのうちの1つを選択することと、符号化単位の1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、現在のビデオブロックの予測モードをエンコードすることとを備える。予測モードは、単方向の予測モードと、少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードと、を含む。
別の態様では、ビデオデータをエンコードする装置は、符号化単位のビデオブロックの予測ブロックの生成に使用するために、複数の予測モードのうちの1つを選択する予測ユニットと、符号化単位の1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、現在のビデオブロックの予測モードをエンコードするエントロピエンコーディングユニットと、を備える。予測モードは、単方向の予測モードと、少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードと、を含む。
別の態様では、コンピュータ可読媒体は、ビデオ符号化装置において実行されると、装置にビデオデータを符号化させる命令を備え、これらの命令は、装置に、符号化単位のビデオブロックの予測ブロックの生成に使用するために、複数の予測モードのうちの1つを選択させ、符号化単位の1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、現在のビデオブロックの予測モードをエンコードさせる。予測モードは、単方向の予測モードと、少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードと、を含む。
別の態様では、ビデオデータをエンコードする装置は、符号化単位のビデオブロックの予測ブロックの生成に使用するために、複数の予測モードのうちの1つを選択するための手段と、符号化単位の1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、現在のビデオブロックの予測モードをエンコードするための手段と、を備える。予測モードは、単方向の予測モードと、少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードと、を含む。
別の態様では、ビデオデータを復号する方法は、符号化単位のビデオブロックのエンコードされたビデオデータを受信することと、符号化単位の1つまたは複数の前に復号されたビデオブロックの予測モードに基づいて、ビデオブロックの予測ブロックの生成に使用するための複数の予測モードのうちの1つを識別するために、エンコードされたビデオデータを復号することとを備える。予測モードは、単方向の予測モードと、少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードと、を含む。
別の態様では、ビデオデータを復号するための装置は、符号化単位の1つまたは複数の前に復号されたビデオブロックの予測モードに基づいて、ビデオブロックの予測ブロックの生成に使用するための複数の予測モードのうちの1つを識別するために、符号化単位のビデオブロックのエンコードされたビデオデータを復号するエントロピ復号ユニットを備える。予測モードは、単方向の予測モードと、少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードと、を含む。この装置は、復号された予測モードを使用して、予測ブロックを生成する予測ユニットも含む。
別の態様では、コンピュータ可読媒体は、ビデオ符号化装置において実行されると、装置にビデオブロックを符号化させる命令を備える。これらの命令は、装置に、符号化単位のビデオブロックのエンコードされたビデオデータを受信させ、符号化単位の1つまたは複数の前に復号されたビデオブロックの予測モードに基づいて、ビデオブロックの予測ブロックの生成に使用するための複数の予測モードのうちの1つを識別するために、エンコードされたビデオデータを復号させる。予測モードは、単方向の予測モードと、少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードと、を含む。
別の態様では、ビデオデータを復号するための装置は、符号化単位のビデオブロックのエンコードされたビデオデータを受信するための手段と、符号化単位の1つまたは複数の前に復号されたビデオブロックの予測モードに基づいて、ビデオブロックの予測ブロックの生成に使用するための複数の予測モードのうちの1つを識別するために、エンコードされたビデオデータを復号するための手段と、を備える。予測モードは、単方向の予測モードと、少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードと、を含む。
本開示に記載した技術は、ハードウェア、ソフトウェア、ファームウェア、またはその任意の組合せにおいて実施することができる。ソフトウェアにおいて実施する場合、ソフトウェアは、マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、またはディジタル信号プロセッサ(DSP)、または他の同等の集積または個別論理回路など、1つまたは複数のプロセッサを指し得るプロセッサで実行されることができる。これらの技術を実行するための命令を備えるソフトウェアは、最初にコンピュータ可読媒体に格納され、プロセッサによってロードされ、実行され得る。
したがって、本開示は、本開示に記載されている様々な技術の任意のものをプロセッサに実行させるための命令を備えるコンピュータ可読媒体も企図する。いくつかの場合、コンピュータ可読媒体は、製造業者に販売され、かつ/または装置で使用され得るコンピュータプログラム製品の一部分を形成し得る。コンピュータプログラム製品は、コンピュータ可読媒体を含み得るとともに、いくつかの場合、パッケージング材も含み得る。
本開示の1つまたは複数の態様の詳細は、添付の図面および以下の説明に記載されている。本開示に記載されている技術の他の特徴、目的、および利点は、説明、図面、および特許請求の範囲から明らかになる。
図1は、本開示に記載されている符号化技術を実行するビデオエンコーディングおよび復号システムを示すブロック図である。 図2は、図1のビデオエンコーダの一例をさらに詳しく示すブロック図である。 図3は、図1のビデオ復号器の一例をさらに詳しく示すブロック図である。 図4は、本開示に従う係数のスキャン順序を調整する仮想例を示す概念図である。 図5は、係数のスキャン順序を適応的に調整するように構成されたエンコード装置の動作例を示す流れ図である。 図6は、ビデオブロックのヘッダー情報をエンコードするように構成されたエンコーディングユニットの動作例を示す流れ図である。 図7は、符号化のための符号化コンテキスト選択例を示す流れ図である。 図8は、ビデオブロックのヘッダー情報を復号するように構成された復号ユニットの動作例を示す流れ図である。
図1は、本開示に記載されている符号化技術を実行するビデオエンコードおよび復号システム10を示すブロック図である。図1に示されるように、システム10は、エンコードされたビデオデータを、通信チャネル16を介して宛先装置14に送信するソース装置12を含む。ソース装置12は、宛先装置14に送信するためのエンコードされたビデオデータを生成する。ソース装置12は、ビデオソース18、ビデオエンコーダ20、および送信機22を含み得る。ソース装置12のビデオソース18は、ビデオカメラなどのビデオキャプチャ装置、事前にキャプチャしたビデオを含むビデオアーカイブ、またはビデオコンテンツプロバイダからの供給ビデオを含み得る。別の代替として、ビデオソース18は、ソースビデオとしてのコンピュータグラフィックスベースのデータ、またはライブビデオとコンピュータで生成されたビデオとの組合せを生成することができる。いくつかの場合、ソース装置12は、いわゆるカメラ付き携帯電話またはテレビ電話とすることができ、この場合、ビデオソース18は、ビデオカメラとすることができる。いずれの場合も、キャプチャされた、事前にキャプチャされた、またはコンピュータで生成されたビデオは、送信機22および通信チャネル16を介してソース装置12から宛先装置14に送信するために、ビデオエンコーダ20によって符号化されることができる。
ビデオエンコーダ20は、ビデオソース18からビデオデータを受信する。ビデオソース18から受信されたビデオデータは、一連のビデオフレームとすることができる。ビデオエンコーダ20は、一連のビデオフレームをエンコードするために、この一連のビデオフレームをいくつかの符号化単位に分割し、これらの符号化単位を処理する。符号化単位は、例えば、それらフレームの全体とすることもできるし、それらフレームの一部分(すなわちスライス)とすることもできる。したがって、いくつかの例では、フレームは、スライスに分割され得る。ビデオエンコーダ20は、ビデオデータをエンコードするために、各符号化単位をピクセルのブロック(本明細書では、ビデオブロックまたはブロックと呼ぶ)に分割し、個々の符号化単位内のビデオブロックに対して動作する。したがって、1つの符号化単位(例えば、1つのフレームまたはスライス)は、複数のビデオブロックを含み得る。言い換えれば、1つのビデオ系列は複数のフレームを含み得、1つのフレームは複数のスライスを含み得、1つのスライスは複数のビデオブロックを含み得る。
ビデオブロックは、固定サイズまたは可変サイズを有し、指定された符号化標準に応じてサイズが異なり得る。一例として、国際電気通信連合電気通信標準化部門(ITU−T)のH.264/MPEG−4,Part 10,Advanced Video Coding(AVC)(以下、「H.264/MPEG−4 Part 10 AVC」標準)は、ルーマ成分では16×16、8×8、または4×4など、クロマ成分では8×8など、様々なブロックサイズのイントラ予測をサポートし、加えて、ルーマ成分では16×16、16×8、8×16、8×8、8×4、4×8、および4×4など、クロマ成分では対応する縮尺サイズなど、様々なブロックサイズのインター予測をサポートする。H.264では、例えば、しばしばマクロブロック(MB)と呼ばれる16×16ピクセルの各ビデオブロックが、より小さいサイズのサブブロックに細分割され、サブブロックで予測され得る。一般に、MBおよび様々なサブブロックは、ビデオブロックであると考えられることができる。したがって、MBは、ビデオブロックであると考えられることができ、もしパーティション化またはサブパーティション化した場合には、MBは、それ自体、ビデオブロックの組を定義すると考えられることができる。
ビデオブロックごとに、ビデオエンコーダ20は、ブロックのブロックタイプを選択する。ブロックタイプは、ブロックがインター予測またはイントラ予測のいずれを使用して予測されるかということに加えて、ブロックのパーティションサイズを示し得る。例えば、H.264/MPEG−4 Part 10 AVC標準は、インター16×16、インター16×8、インター8×16、インター8×8、インター8×4、インター4×8、インター4×4、イントラ16×16、イントラ8×8、およびイントラ4×4を含むいくつかのインターおよびイントラ予測ブロックタイプをサポートする。以下で詳しく説明するように、ビデオエンコーダ20は、ビデオブロックごとにブロックタイプのうちの1つを選択することができる。
また、ビデオエンコーダ20は、ビデオブロックごとに予測モードを選択する。イントラ符号化されたビデオブロックの場合、予測モードは、1つまたは複数の前にエンコードされたビデオブロックを使用して、現在のビデオブロックを予測する方法を決定することができる。H.264/MPEG−4 Part 10 AVC標準では、例えば、ビデオエンコーダ20は、イントラ4×4ブロックごとに、9つの可能な単方向の予測モード;すなわち垂直予測モード、水平予測モード、DC予測モード、対角左下予測モード(diagonal down/left prediction mode)、対角右下予測モード(diagonal down/right prediction mode)、垂直右予測モード、水平下予測モード、垂直左予測モード、および水平上予測モード、のうちの1つを選択することができる。各イントラ8×8ブロックを予測するために、類似の予測モードが使用される。イントラ16×16ブロックでは、ビデオエンコーダ20は、4つの可能な単方向モード;すなわち垂直予測モード、水平予測モード、DC予測モード、および平面予測モード、のうちの1つを選択することができる。いくつかの例では、ビデオエンコーダ20は、単方向の予測モードだけではなく、単方向モードの組合せを定義する1つまたは複数の多方向の予測モードも含む予測モードの組から予測モードを選択することができる。例えば、1つまたは複数の多方向の予測モードは、以下でさらに詳しく説明するように、2つの単方向の予測モードを組み合わせた双方向の予測モードとすることができる。
ビデオブロックの予測モードを選択した後、ビデオエンコーダ20は、選択された予測モードを使用して、予測されたビデオブロックを生成する。予測されたビデオブロックは、残差ブロックを形成するために、元のビデオブロックから取り除かれる。残差ブロックは、元のビデオブロックのピクセル値と生成された予測ブロックのピクセル値との間の差を定量化するピクセル差分値の組を含む。残差ブロックは、2次元ブロック形式(例えば、ピクセル差分値の2次元行列またはアレー)で表されことができる。
残差ブロックの生成後、ビデオエンコーダ20は、ブロックを符号化する前に、残差ブロックに対して、他のいくつかの操作を行うことができる。ビデオエンコーダ20は、変換係数のブロックを生成するために、整数変換、DCT変換、方向変換、ウェーブレット変換などの変換をピクセル値の残差ブロックに適用することができる。したがって、ビデオエンコーダ20は、残差ピクセル値を変換係数(残差変換係数とも呼ばれる)に変換する。残差変換係数は、変換ブロックまたは係数ブロックと呼ばれ得る。変換または係数ブロックは、非分離型変換(non-separable transform)が適用されるときには1次元表現の係数とすることができ、分離型変換が適用されるときには2次元表現の係数とすることができる。非分離型変換は、非分離型方向変換を含み得る。分離型変換は、分離型方向変換、DCT変換、整数変換、およびウェーブレット変換を含み得る。
変換の後、ビデオエンコーダ20は、量子化された変換係数(量子化係数、または量子化残差係数とも呼ばれる)を生成するために、量子化を行う。この場合も、量子化係数は、1次元ベクトル形式または2次元ブロック形式で表されことができる。量子化は、一般に、係数を表すために使用されるデータの量をできる限り低減するために、係数が量子化されるプロセスを指す。量子化プロセスは、係数の一部またはすべてに関連付けられているビット深度を低減することができる。本明細書で使用する場合、「係数」という用語は、変換係数、量子化係数、または他のタイプの係数を表すことができる。本開示の技術は、いくつかの例では、残差ピクセル値に加えて、変換係数および量子化変換係数に適用され得る。しかし、説明のために、本開示の技術は、量子化変換係数の文脈で説明する。
分離型変換が使用され、係数ブロックが2次元ブロック形式で表されるとき、ビデオエンコーダ20は、係数をスキャンして2次元形式から1次元形式にする。言い換えれば、ビデオエンコーダ20は、それらの係数をシリアライズして1次元ベクトルの係数にするために、係数を2次元ブロックからスキャンすることができる。本開示の態様のうちの1つによれば、ビデオエンコーダ20は、収集された統計に基づいて、係数ブロックを1次元に変換するために使用されるスキャン順序を調整することができる。統計は、2次元ブロックの各位置における所与の係数値がゼロまたは非ゼロである尤度の表示を備え、例えば、2次元ブロックの係数位置のそれぞれに関連付けられているカウント、確率または他の統計的メトリックを備え得る。いくつかの例では、統計は、ブロックの係数位置のサブセットについてのみ収集され得る。例えば、特定のブロック数の後、スキャン順序が評価されると、非ゼロの係数を有する確率がより高いと決定されるブロック内の係数位置が、非ゼロの係数を有する確率がより低いと決定されるブロック内の係数位置の前にスキャンされるように、スキャン順序が変更されることができる。このように、最初のスキャン順序は、1次元係数ベクトルの先頭に非ゼロの係数、および1次元係数ベクトルの最後にゼロ値の係数をより効率的に分類するように構成され得る。そして、1次元係数ベクトルの先頭には、非ゼロの係数間により短い一続きのゼロがいくつかあり、1次元係数ベクトルの最後には、より長い一続きのゼロが1つあるので、これは、エントロピ符号化に費やされるビット数を低減することができる。
係数のスキャンの後、ビデオエンコーダ20は、コンテキスト適応型可変長エンコード(CAVLC)、コンテキスト適応型2進法算術エンコード(CABAC)、ランレングス符号化など、様々なエントロピ符号化方法のうちの任意のものを使用して、符号化単位のビデオブロックのそれぞれをエンコードする。ソース装置12は、エンコードされたビデオデータを、送信機22およびチャネル16を介して宛先装置14に送信する。通信チャネル16は、無線周波数(RF)スペクトルや1つまたは複数の物理的な送信線など、任意の無線または有線の通信媒体、または無線および有線の媒体の任意の組合せを備え得る。通信チャネル16は、ローカルエリアネットワーク、広域ネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースのネットワークの一部を形成し得る。通信チャネル16は、一般に、ソース装置12から宛先装置14にエンコードされたビデオデータを送信するのに適した任意の通信媒体、または異なる通信媒体の集合を表す。
宛先装置14は、受信機24、ビデオ復号器26、および表示装置28を含み得る。受信機24は、チャネル16を介してソース装置12からエンコードされたビデオビットストリームを受信する。ビデオ復号器26は、エンコードされたビデオビットストリームを復号するために、エントロピ復号を適用して、符号化単位の符号化されたビデオブロックのヘッダー情報および量子化残差係数を取得する。上述したように、ソース装置12によってエンコードされた量子化残差係数は、1次元ベクトルとして符号化される。したがって、ビデオ復号器26は、1次元ベクトルの係数を2次元ブロックの量子化残差係数に変換するために、符号化されたビデオブロックの量子化残差係数をスキャンする。ビデオエンコーダ20と同様に、ビデオ復号器26は、ビデオブロックにおける所与の係数位置がゼロまたは非ゼロである尤度を示す統計を収集し、それによって、エンコードプロセスで使用されたのと同じ方法でスキャン順序を調整することができる。したがって、1次元ベクトル表現のシリアライズされた量子化変換係数を変更して、2次元ブロックの量子化変換係数に戻すために、逆の適応形スキャン順序(reciprocal adaptive scan order)がビデオ復号器26によって適用されることができる。
ビデオ復号器26は、復号されたヘッダー情報および復号された残存情報を使用して、符号化単位のブロックのそれぞれを再構成する。特に、ビデオ復号器26は、現在のビデオブロックの予測ビデオブロックを生成し、ビデオブロックのそれぞれを再構成するために、その予測ブロックを対応する残差ビデオブロックと結合することができる。宛先装置14は、再構成されたビデオブロックを、表示装置28を介してユーザに表示することができる。表示装置28は、ブラウン管(CRT)、液晶ディスプレイ(LCD)、プラズマディスプレイ、発光ダイオード(LED)ディスプレイ、有機LEDディスプレイ、または他のタイプのディスプレイ装置など、様々な表示装置のうちの任意のものを備え得る。
いくつかの場合、ソース装置12および宛先装置14は、実質的に対称的に動作し得る。例えば、ソース装置12および宛先装置14はそれぞれ、ビデオのエンコーディングコンポーネントと復号コンポーネントとを含み得る。したがって、システム10は、例えば、ビデオストリーミング、ビデオブロードキャスティング、またはビデオ電話など、装置12と装置14との間の一方向または二方向のビデオ伝送をサポートし得る。ビデオのエンコーディングコンポーネントと復号コンポーネントとを含む装置は、ディジタルビデオレコーダ(DVR)など、一般的なエンコーディング、アーカイブおよび再生装置の一部分も形成し得る。
ビデオエンコーダ20およびビデオ復号器26は、Moving Picture Experts Group(MPEG)のMPEG−1、MPEG−2、およびMPEG−4によって定義されるもの、ITU−T H.263標準、映画テレビ技術者協会(SMPTE)421Mビデオコーデック標準(一般に「VC−1」と呼ばれる)、中国オーディオビデオ符号化標準ワークグループ(一般に「AVS」と呼ばれる)によって定義される標準、および標準化団体によって定義される、または専有的な標準として組織によって開発される任意の他のビデオ符号化標準など、様々なビデオ圧縮標準のうちの任意のものに従って動作し得る。図1には示していないが、いくつかの態様では、ビデオエンコーダ20およびビデオ復号器26はそれぞれ、オーディオエンコーダおよび復号器と一体化されていてもよく、共通のデータストリームまたは個別のデータストリームにおけるオーディオおよびビデオの両方のエンコーディングを処理するために、適切なMUX−DEMUXユニット、または他のハードウェアおよびソフトウェアを含み得る。このように、ソース装置12および宛先装置14は、マルチメディアデータに対して動作することができる。該当する場合、MUX−DEMUXユニットは、ITU H.223多重装置プロトコル、またはユーザデータグラムプロトコル(UDP)などの他のプロトコルに準拠し得る。
いくつかの態様において、ビデオブロードキャスティングの場合、本開示に記載されている技術は、2007年7月に技術標準TIA−1099として発行された、Forward Link Only(FLO) Air Interface Specification、「Forward Link Only Air Interface Specification for Terrestrial Mobile Multimedia Multicast」(「FLO仕様」)を使用したterrestrial mobile multimedia multicast(TM3)システムにおいてリアルタイムのビデオサービスを配信するためのエンハンスドH.264ビデオ符号化に適用されることができる。すなわち、通信チャネル16は、FLO仕様などに従って無線ビデオ情報をブロードキャストするために使用される無線情報チャネルを含み得る。FLO仕様は、FLO無線インターフェースに適したビットストリーム構文やセマンティクス、および復号プロセスを定義する例を含む。
あるいは、ビデオは、DVB−H(ディジタルビデオブロードキャストハンドヘルド)、ISDB−T(総合地上ディジタル放送サービス(integrated services digital broadcast - terrestrial))、またはDMB(ディジタルメディアブロードキャスト)など、他の標準に従ってブロードキャストされることができる。したがって、ソース装置12は、移動無線端末、ビデオストリーミングサーバ、またはビデオブロードキャストサーバとすることができる。しかし、本開示に記載した技術は、ブロードキャスト、マルチキャスト、またはポイントツーポイントシステムのうちの任意の特定のタイプに限定されない。ブロードキャストの場合、ソース装置12は、いくつかのチャネルのビデオデータを、それぞれ図1の宛先装置14とどうようであることができる複数の宛先装置にブロードキャストすることができる。したがって、図1には単一の宛先装置14が示されているが、ビデオブロードキャスティングの用途の場合、ソース装置12は、一般に、多くの宛先装置に同時にビデオコンテンツをブロードキャストすることになる。
他の例では、送信機22、通信チャネル16、および受信機24は、Ethernet(登録商標)、電話(例えばPOTS)、ケーブル、電力線、および光ファイバシステムを含む任意の有線または無線通信システム、ならびに/あるいは符号分割多元接続(CDMAまたはCDMA2000)通信システム、周波数分割多元接続(FDMA)システム、直交周波数分割多元(OFDM)接続システム、例えばGSM(登録商標)(移動体通信用グローバルシステム),GPRS(汎用パケット無線サービス),EDGE(enhanced data GSM environment)などの時分割多元接続(TDMA)システム、TETRA(地上無線基盤)携帯電話システム、広帯域符号分割多元接続(WCDMA(登録商標))システム、高速データレート1xEV−DO(First generation Evolution Data Only)またはIxEV−DO Gold Multicastシステム、IEEE802.18システム、MediaFLO(商標)システム、DMBシステム、DVB−Hシステム、または2つ以上の装置間のデータ通信のための別の方式、のうちの1つまたは複数を備える無線システムに従った通信のために構成されることができる。
ビデオエンコーダ20およびビデオ復号器26はそれぞれ、1つまたは複数のマクロプロセッサ、ディジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリートロジック、ソフトウェア、ハードウェア、ファームウェア、またはその任意の組合せとして実装されることができる。ビデオエンコーダ20およびビデオ復号器26のそれぞれは、1つまたは複数のエンコーダまたは復号器に含められることができ、そのそれぞれは、それぞれの移動装置、加入者装置、ブロードキャスト装置、サーバなどにおいて、結合されたエンコーダ/復号器(CODEC)の一部として統合され得る。さらに、ソース装置12および宛先装置14はそれぞれ、該当する場合、無線通信をサポートするのに十分な無線周波数(RF)無線コンポーネントおよびアンテナを含む、エンコードされたビデオの送受信に適した変調、復調、周波数変換、フィルタリング、および増幅器のコンポーネントを含み得る。しかし、説明を簡単にするために、こうしたコンポーネントを、図1におけるソース装置12の送信機22および宛先装置14の受信機24として要約される。
図2は、図1のビデオエンコーダ20の一例をさらに詳しく示すブロック図である。ビデオエンコーダ20は、ビデオフレーム内のブロックのイントラ符号化およびインター符号化を行う。イントラ符号化は、例えばフレームやスライスなど、所与のビデオ符号化単位内のビデオデータにおける空間的冗長を低減または削除するのに、空間的予測に依存する。イントラ符号化の場合、ビデオエンコーダ20は、符号化されるブロックと同じ符号化単位内の1つまたは複数の前にエンコードされたブロックに基づいて、空間的予測ブロックを形成する。インター符号化は、ビデオ系列の隣接するフレーム内の時間的冗長を低減または削除するのに、時間的予測に依存する。インター符号化の場合、ビデオエンコーダ20は、2つ以上の隣接するフレーム間のよくマッチするビデオブロックの移動を追跡するために、動き推定を行う。
図2の例において、ビデオエンコーダ20は、ブロックパーティションユニット30、予測ユニット32、フレーム記憶装置34、変換ユニット38、量子化ユニット40、係数スキャンユニット41、逆量子化ユニット42、逆変換ユニット44、およびエントロピエンコーディングユニット46を含む。また、ビデオエンコーダ20は、加算器48Aおよび48B(「加算器48」)も含む。ループ内デブロッキングフィルタ(図示せず)は、ブロッキングアーティファクトを低減または削除するために、再構成されたビデオブロックに適用されることができる。図2において様々な特徴をユニットとして説明しているのは、示した装置の異なる機能的側面を強調するためのものであり、必ずしも、こうしたユニットが別々のハードウェアまたはソフトウェアコンポーネントによって実現される必要があることを含意するものではない。むしろ、1つまたは複数のユニットに関連付けられている機能は、共通または別々のハードウェアまたはソフトウェアコンポーネント内で統合されることができる。
ブロックパーティションユニット30は、例えばビデオソース18(図1)から一連のビデオフレームの形で、ビデオ情報を受信する(図2では「VIDEO IN」と表記)。ブロックパーティションユニット30は、各ビデオフレームを、複数のビデオブロックを含む符号化単位に分割する。上述したように、符号化単位は、1つのフレーム全体、または1つのフレームの一部分(例えば、フレームのスライス)とすることができる。一例では、ブロックパーティションユニット30は、最初に、符号化単位のそれぞれを、16×16のパーティションサイズの複数のビデオブロック(すなわち、マクロブロック)に分割することができる。ブロックパーティションユニット30は、16×16のビデオブロックのそれぞれを、8×8のビデオブロックや4×4のビデオブロックなど、より小さいブロックに、さらに細分割することができる。
ビデオエンコーダ20は、ブロックのブロックタイプに基づいて、符号化単位のビデオブロックごとに、ブロック単位で、イントラ符号化またはインター符号化を行う。予測ユニット32は、ブロックの選択されたパーティションサイズに加えて、ブロックがインター予測を使用して予測されるべきか、イントラ予測を使用して予測されるべきかを示し得るブロックタイプをビデオブロックのそれぞれに割り当てる。インター予測の場合、予測ユニット32は、動きベクトルも決定する。イントラ予測の場合、予測ユニット32は、予測ブロックを生成するために使用する予測モードを決定する。
次いで、予測ユニット32は、予測ブロックを生成する。予測ブロックは、現在のビデオブロックの予測されたバージョンとすることができる。現在のビデオブロックとは、今現在符号化中のビデオブロックを指す。インター予測の場合、例えば、ブロックがインターブロックタイプを割り当てられているとき、予測ユニット32は、現在のビデオブロックのインターエンコードの時間的予測を実行することができる。予測ユニット32は、例えば、最も小さいMSE、SSD、SAD、または他の異なるメトリックを有する隣接フレーム内のブロックなど、現在のビデオブロックに最もよくマッチする隣接フレーム内のブロックを識別するために、例えば、現在のビデオブロックを1つまたは複数の隣接ビデオフレーム内のブロックと比較する。予測ユニット32は、隣接フレームにおいて識別されたブロックを予測ブロックとして選択する。
イントラ予測の場合、すなわち、ブロックがイントラブロックタイプを割り当てられているとき、予測ユニット32は、共通の符号化単位(例えば、フレームまたはスライス)内の1つまたは複数の前にエンコードされた近隣ブロックに基づいて、予測ブロックを生成することができる。予測ユニット32は、例えば、現在のフレーム内の1つまたは複数の前にエンコードされた近隣ブロックを使用して、補間を行うことによって、予測ブロックを生成するために、空間的予測を実行することができる。現在のフレーム内の1つまたは複数の近隣ブロックは、例えば、1つまたは複数の前にエンコードされたフレームまたはブロックを格納するための任意のタイプのメモリまたはデータストア装置を備え得るフレーム記憶装置34から取り出されることができる。
予測ユニット32は、予測モードの組のうちの1つに従って、補間を行うことができる。上述したように、予測モードの組は、単方向の予測モードおよび/または多方向の予測モードを含み得る。多方向の予測モードは、単方向の予測モードの組合せを定義する。一例において、予測モードの組は、H.264/MPEG−4 Part 10 AVC標準で定義された単方向の予測モード、および2つの単方向の予測モードの様々な組合せを定義する双方向の予測モードを含み得る。
イントラ4×4ブロックタイプの場合、例えば、予測モードの組は、H.264/MPEG−4 Part 10 AVC標準で定義された9つの単方向の予測モード、および単方向の予測モードの可能な組合せのサブセットを含み得る。したがって、単方向の予測モードのすべての36個の可能な組合せをサポートする代わりに、ビデオエンコーダ20は、単方向の予測モードの可能な組合せの一部分のみをサポートすることができる。そうすることによって、さほどエンコードの劣化をもたらさない可能性がある。合計18個のイントラ予測モードを含むイントラ予測モードの組の一例が以下に示されている。
モード0:垂直
モード1:水平
モード2:DC
モード3:対角左下
モード4:対角右下
モード5:垂直右
モード6:水平下
モード7:垂直左
モード8:水平上
モード9:垂直+水平(モード0+モード1)
モード10:DC+垂直(モード2+モード0)
モード11:DC+水平(モード2+モード1)
モード12:対角左下+水平(モード3+モード1)
モード13:対角右下+垂直(モード4+モード0)
モード14:垂直右+水平(モード5+モード1)
モード15:水平下+垂直(モード6+モード0)
モード16:垂直左+水平(モード7+モード1)
モード17:水平上+垂直(モード8+モード0)
上記で示した組の例では、モード0〜8は、単方向の予測モードであり、モード9〜17は、双方向の予測モードである。特に、モード0〜8は、H.264/MPEG−4 Part 10 AVC標準で定義されるイントラ4×4予測モードである。モード9〜17は、可能な双方向の予測モードのサブセットである。示した例における可能な双方向の予測モードのサブセットは、各単方向の予測モードを組み込む少なくとも1つの組合せを含む。各双方向の予測モードは、DC予測モード(例えば、モード10および11)を含む双方向の予測モードに加えて、非並行であり、いくつかの例では、実質的に互いに直交する補間方向を有する単方向の予測モードを組み合わせる。言い換えれば、双方向の予測モードのサブセットは、一般に、「垂直」カテゴリからの予測モードを、「水平」カテゴリからの予測モードと組み合わせた双方向の予測モードを含む。こうした双方向の予測モードは、イントラ予測プロセスに、かなり離れた位置から使用可能な予測ピクセルを組み合わせることを許し、したがって、現在のビデオブロック内のより多くのピクセル位置の予測品質を向上させることができる。
上述した予測モードの組は、説明の目的で記載されている。予測モードの組は、より多くの、またはより少ない予測モードを含んでいてよい。例えば、予測モードの組は、より多くの、またはより少ない双方向の予測モードを含んでいてもよく、または双方向の予測モードを含んでいなくてもよい。他の例では、の予測モードの組は、単方向の予測モードのサブセットのみを含んでいてもよい。さらに、予測モードの組は、双方向の予測モードに加えて、またはその代わりに、2つを超える単方向の予測モードを組み合わせた多方向の予測モード含んでいてもよい。さらに、イントラ4×4ブロックタイプを参照して上述したが、本開示の技術は、他のイントラブロックタイプ(例えば、イントラ8×8ブロックタイプまたはイントラ16×16ブロックタイプ)またはインターブロックタイプに適用することができる。
複数の予測モードのうちのどの1つを特定のブロックのために選択するかを決定するために、予測ユニット32は、その組の予測モードごとに、ラグランジュコストなど、符号化コストを推定し、最も小さい符号化コストの予測モードを選択することができる。他の例では、予測ユニット32は、可能な予測モードの組の一部分のみの符号化コストを推定することができる。例えば、予測ユニット32は、1つまたは複数の近隣ビデオブロックのために選択された予測モードに基づいて、その組の予測モードの一部分を選択することができる。予測ユニット32は、選択された予測モードを使用して、予測ブロックを生成する。
予測ブロックの生成後、ビデオエンコーダ20は、加算器48Aで現在のビデオブロックから予測ユニット32によって生成された予測ブロックを取り除くことによって、残差ブロックを生成する。残差ブロックは、現在のビデオブロックのピクセル値と予測ブロックのピクセル値との間の差を定量化するピクセル差分値の組を含む。残差ブロックは、2次元ブロック形式(例えば、ピクセル値の2次元行列またはアレー)で表されことができる。言い換えれば、残差ブロックは、ピクセル値の2次元表現である。
変換ユニット38は、残差変換係数を生成するために、残差ブロックに変換を適用する。変換ユニット38は、例えば、DCT、整数変換、方向変換、ウェーブレット変換、またはその組合せを適用することができる。変換ユニット38は、予測ブロックを生成するために、予測ユニット32によって選択された予測モードに基づいて、残差ブロックに変換を選択的に適用することができる。言い換えれば、残存情報に適用された変換は、予測ユニット32によってブロックのために選択された予測モードに依存し得る。
変換ユニット38は、複数の異なる変換を維持し、そのブロックの予測モードに基づいて、残差ブロックに変換を選択的に適用することができる。複数の異なる変換は、DCT、整数変換、方向変換、ウェーブレット変換、またはその組合せを含み得る。いくつかの例では、変換ユニット38は、1つのDCTまたは整数変換と複数の方向変換とを維持し、現在のビデオブロックのために選択された予測モードに基づいて、変換を選択的に適用することができる。例えば、変換ユニット38は、限定された方向性を示す予測モードでは、DCTまたは整数変換を残差ブロックに適用し、有意の方向性を示す予測モードでは、方向変換のうちの1つを残差ブロックに適用することができる。
上述した予測モードの組の例を使用して、変換ユニット38は、DCTまたは整数変換を、モード2、9、および12〜17に適用することができる。これらのモードは、DC予測と、ほぼ直交する方向の2つの予測モードの組合せと、のいずれかであるため、限定された方向性を示し得る。それとは反対に、モード1、3〜8、10、および11は、方向性を示し得るモードであり、したがって、変換ユニット38は、残差ビデオブロックのより良いエネルギー圧縮を達成するために、これらのモードのそれぞれに異なる方向変換を適用し得る。言い換えれば、より強い方向性を有する予測モードが選択されると、方向性は、こうした予測モードの残差ブロックにおいて表されることもできる。また、異なる予測モードの残差ブロックは、異なる方向特性を示す。したがって、DCTやDCTのような整数変換などの変換に比べて、それぞれの予測モード用に特に訓練された(trained)方向変換は、所与の予測モードの残差ブロックのためにより良いエネルギー圧縮を提供することができる。一方、強力な方向性を含まない予測モードの場合、DCTまたはDCTのような整数変換などの変換は、十分なエネルギー圧縮を提供する。このように、変換ユニット38は、可能な予想モードのそれぞれのために別個の変換を維持する必要はなく、したがって、変換格納要件を下げる。さらに、DCTおよび/または整数変換の適用は、計算の複雑度に関して、それほど複雑ではない。
他の例では、変換ユニット38は、可能な予測モードごとに異なる方向変換を維持し、ブロックの選択された予測モードに基づいて、対応する方向変換を適用することができる。上述した予測モードの組の例では、変換ユニット38は、18個の異なる方向変換を維持することができ、そのそれぞれは、18個の可能なイントラ4×4予測モードのうちの1つに対応する。さらに、変換ユニット38は、18個の可能なイントラ8×8予測モードの18個の異なる方向変換、および4つの可能なイントラ16×16予測モードの4つの異なる方向変換、および他のパーティションサイズの任意の他の予測モードの変換を維持することができる。ブロックの選択された予測モードに基づいて、個別の方向変換を適用することは、特に、有意の方向性を示す予測モードが選択されるブロックの場合、残差エネルギーがキャプチャされる効率を増加する。方向変換は、例えば、非分離型カルーネンレーベ変換(KLT)に由来する非分離型方向変換、または分離型方向変換とすることができる。いくつかの例では、方向変換は、データのトレーニングセットを使用して、事前に計算されていてもよい。
KLTは、基底関数が信号の統計から導出される線形変換であり、したがって、適応形とすることができる。KLTは、できるだけ多くのエネルギーをできるだけ少ない係数に入れるように設計されている。KLTは、一般に、分離型ではなく、したがって、変換ユニット38は、以下で詳しく説明するように、完全な行列乗算(full matrix multiplication)を行う。非分離型方向変換の4×4残差ブロックへの適用が、例示の目的で説明される。例えば、8×8ブロックや16×16ブロックなど、異なるサイズのブロックに、類似の技術が使用される。
4×4残差ブロックXは、4行および4列のピクセル値、すなわち合計16個のピクセル値を有する2次元ブロック形式で表される。非分離型方向変換を適用するために、4×4残差ブロックは、ピクセル値の1次元ベクトルxすなわち長さ16に再配列される。4×4残差ブロックXは、Xにおけるピクセルをラスタスキャン順に配列することによって、ベクトルxに再配列される。すなわち、4×4残差ブロックXが、
Figure 2013153463
のように書かれる場合、長さ16の残差ブロックxは、
Figure 2013153463
のように書かれる。
以下の式(1)に従って行列乗算を実行することによって、変換係数ベクトルyが得られる。
y=Tx (1)
ただし、Tは、ブロックのために選択された予測モードに対応するサイズ16×16の変換行列である。また、変換係数ベクトルyは、長さ16の係数を有する1次元ベクトルでもある。
非分離型方向変換の使用は、計算コストおよび格納要件の増加を必然的に伴い得る。一般に、サイズN×Nの残差ブロックの場合、非分離型方向変換は、サイズN×Nの基底関数を必要とする。すなわち、4×4の残差ブロックの場合には、非分離型方向変換は16×16のサイズを有し;8×8の残差ブロックの場合には、非分離型方向変換は64×64のサイズを有し;16×16の残差ブロックの場合にし、非分離型方向変換は256×256のサイズを有する。異なる非分離型方向変換は、その組の予測モードごとに使用され得るため、変換ユニット32は、4×4のブロックの場合には18個の16×16の方向変換を、8×8のブロックの場合には18個の64×64の変換(上述した予測モードの組の例の場合)を、予測モードの組がより大きいならば、場合によってはそれ以上を格納することができる。これは、変換プロセスの実行に必要な変換行列を格納するために、大きいメモリリソースを使用することになり得る。非分離型方向変換の計算コストも高い。一般に、非分離型方向変換をN×Nブロックに適用することは、N×N回の乗算およびN×(N−1)回の加算を必要とする。
非分離型方向変換の代わりに、変換ユニット32は、予測モードごとに分離型方向変換を維持することができる。分離型方向変換は、非分離型方向変換に比べて、より低い格納および計算コストを有する。4×4残差ブロックXの場合、例えば、分離型変換は、以下の式(2)によって示されるように適用される:
Y=CXR (2)
ここで、Yは、結果として得られた変換係数行列であり、Cは、列変換行列であり、Rは、行変換行列であり、そのすべては、ブロックのサイズに等しいサイズを有する(例えば、この例では4×4)。したがって、結果として得られた変換係数行列Yもまた、サイズ4×4の2次元行列である。
予測モードごとに、変換ユニット32は、2つのN×N変換行列(例えば、行列の対CおよびR)を格納することができ、この場合、N×Nは、ブロックサイズに対応する(例えば、N=4、8、または16)。上述した4×4のブロックの場合の18個の予測モードの組の例では、変換ユニット32は、非分離型変換が使用されるときに格納される18個の16×16の変換行列より少ない記憶領域ですむ36個の4×4の変換行列を格納する。さらに、変換ユニット32は、非分離型方向変換の実行に使用されるN×N回の乗算およびN×(N−1)回の加算よりかなり少ない演算である、2×N×N×N回の乗算および2×N×N×(N−1)回の加算を使用して分離型方向変換を行うことができる。表1は、4×4および8×8のブロックサイズの分離型対非分離型の方向変換の使用の間で、格納要件および計算要件を比較している。16×16ブロックの場合の分離型方向変換と非分離型方向変換との間の比較は、類似の方法で行われ得る。表1に示されるように、分離型方向変換を使用することは、非分離型方向変換に比べて、計算の複雑度および格納要件の両方が低減し、この低減は、より大きいブロックサイズには、より顕著になり、例えば、8×8のブロックの場合の低減は、4×4のブロックの場合の低減より大きい。
Figure 2013153463
予測モードごとの分離型変換行列は、訓練ビデオ系列の組からの予測残差を使用して取得され得る。非分離型KLT変換の導出と同様に、特異値分解(SVD)プロセスが、行変換行列および列変換行列それぞれを取得するために、最初に行方向、次いで列方向に、訓練セットの予測残差に適用されることができる。あるいは、非分離型方向変換行列、すなわち非分離型KLT変換行列が、最初に、訓練セットからの予測残差を使用して訓練されることができ;次いで、予測モードごとの分離型変換行列が、非分離型変換行列を分離型変換行列にさらに分解することによって取得されることができる。
どちらにしても、結果として得られた変換行列は、通常、浮動小数点相対精度を有する。固定小数点精度数は、変換プロセスにおける固定小数点演算の使用を可能し且つ計算コストを低減するために、変換行列における係数に近づけるために使用される。変換行列における係数の固定小数点の近似の精度は、固定小数点演算を使用した変換プロセス中に必要な計算の複雑度と最大精度との間のバランスを見つけることによって決定される。言い換えれば、変換行列の固定小数点の近似の精度がより高いことは、固定小数点の近似を使用するため、誤差がより小さくなる可能性があり、これは望ましいが、変換行列の固定小数点の近似の精度が高すぎることは、固定小数点演算に、変換プロセス中にオーバーフローさせる可能性もあり、これは、望ましくない。
ピクセル値の残差ブロックに変換を適用した後、量子化ユニット40は、ビットレートをさらに低減するために、変換係数を量子化する。量子化の後、逆量子化ユニット42および逆変換ユニット44は、残差ブロックを再構成するために(図2では「RECON RESID BLOCK」と表記)、それぞれ逆量子化および逆変換を適用することができる。加算器48Bは、フレーム記憶装置34に格納するための再構成されたビデオブロックを生成するために、再構成された残差ブロックを、予測ユニット32によって生成された予測ブロックに加算する。再構成されたビデオブロックは、その後のビデオブロックをイントラ符号化またはインター符号化するために、予測ユニット32によって使用され得る。
上述したように、DCT、H.264/AVCで使用される整数変換、および分離型方向変換を含む分離型変換が使用されるとき、結果として得られた変換係数は、2次元係数行列として表される。したがって、量子化の後、係数スキャンユニット41は、係数をスキャンして2次元ブロック形式から1次元ベクトル形式にするもので、これは、しばしば係数スキャニングと呼ばれるプロセスである。特に、係数スキャンユニット41は、スキャン順序に従って、係数をスキャンする。本開示の一態様に従って、係数スキャンユニット41は、1つまたは複数の係数統計に基づいて、係数スキャニングに使用されるスキャン順序を適応的に調整することができる。いくつかの例では、各予測モードが異なる係数統計を有し得るため、係数スキャンユニット41は、予測モードごとに、別々にスキャン順序を適応的に調整することができる。
係数スキャンユニット41は、第1のスキャン順序を使用して、量子化された残差ブロックの係数を最初にスキャンすることができる。一態様では、第1のスキャン順序は、H.264/MPEG−4 Part 10 AVCの用途で一般に使用されるジグザグスキャン順とすることができる。係数スキャンユニット41は、ジグザグスキャン順を使用して最初にスキャンされるものとして説明されているが、本開示の技術は、任意の特定の最初のスキャン順序または技術に限定されない。さらに、予測モードのそれぞれは、例えば、特にその予測モード用に訓練されるスキャン順序など、異なる最初のスキャン順序を有し得る。しかし、説明の目的で、ジグザグスキャン順について説明する。ジグザグスキャン順は、2次元ブロックの左上角の係数が、係数ベクトルの先頭の方に圧縮されるように、量子化係数を1次元ベクトルに配列する。ジグザグスキャン順は、限定された方向性を有する係数ブロックに十分なコンパクト性を提供し得る。
残差ブロックが、何らかのまたは有意の方向性を有し且つ分離型方向変換を使用して変換される場合、結果として得られた2次元変換係数ブロックは、依然として、何らかの量の方向性を含み得る。これは、分離型方向変換を使用することが、より低い計算の複雑度および格納要件の利益を得るが、非分離型方向変換の使用と同程度に残差ブロックにおける方向性を得ることができないからである。一例として、方向変換の垂直予測(上述した例におけるモード0)への適用後、非ゼロ係数は、水平方向に沿って存在する傾向にある。したがって、ジグザグスキャン順は、係数ベクトルの先頭の方に圧縮される非ゼロ係数のすべてをもたらさない可能性がある。固定されたジグザグスキャン順の代わりに、スキャン順序を水平方向に向けるように係数スキャン順序を適応させることによって、係数ブロックの非ゼロ係数は、ジグザグスキャン順でスキャンされた場合よりも、1次元係数ベクトルの先頭の方に、より圧縮され得る。次いで、1次元係数ベクトルの先頭には非ゼロの係数間により短い一続きのゼロがいくつかあり、1次元係数ベクトルの最後にはより長い一続きのゼロが1つあるので、これは、エントロピ符号化に費やされるビット数を低減することができる。1次元係数ベクトルを生成するために使用されるスキャン順序を適応させる概念は、他の予測モードにも適用される。例えば、各予測モ―ドが、係数ブロックにおける異なる方向性、したがって異なる係数統計を有し得るため、係数スキャンユニット41は、予測モードごとに、別々にスキャン順序を適応的に調整することができる。このように、スキャン順序は、予測モードごとに異なり得る。
上述したように、特に方向変換が残差ブロックに適用される場合、最初のスキャン順序は、ジグザグスキャン順ではない可能性がある。こうした場合、最初のスキャン順序は、以下で説明する技術のうちの1つを使用して事前に決定されることができる。一例として、最初のスキャン順序は、訓練ビデオ系列の組を使用して決定され得る。後述する統計など、非ゼロ係数の統計は、予測モードごとに収集され、係数スキャン順序を初期化するために使用される。特に、非ゼロ係数の確率が最も高い位置は、最初のスキャン順序の第1の係数位置であり、次いで、非ゼロの係数の確率が次に高い位置は、最初のスキャン順序の第2の係数位置であり、最初のスキャン順序の最後の係数位置である非ゼロの確率が最も低いものまで、以下同様である。あるいは、最初のスキャン順序は、分離型変換行列の固有値の大きさに基づいて決定され得る。例えば、固有値は、降順にソートされることができ、係数は、固有値の対応する順序に従ってスキャンされる。
最初のスキャン順序が上述した技術のうちの1つを使用して決定される場合でさえ、様々なタイプのビデオソースは、量子化残差係数に、ブロック内の異なる係数位置に配置されるようにさせ得る。例えば、共通中間フォーマット(CIF)、クォーターCIF(QCIF)、およびハイデフィニション(例えば720p/iまたは1080p/i)ビデオソースなどの異なる解像度のビデオソースは、非ゼロ係数に、ブロック内の異なる係数位置に配置されるようにさせ得る。したがって、最初のスキャン順序がブロックの予測モードに基づいて選択される場合でさえ、係数スキャンユニット41は、1次元係数ベクトルの先頭の方に、非ゼロ係数のコンパクト性を向上させるために、依然としてスキャン順序を適応させることができる。
スキャン順序を適応させるために、係数スキャンユニット41またはビデオエンコーダ20の他のユニットは、1つまたは複数のブロックについて1つまたは複数の係数統計を収集することができる。言い換えれば、係数スキャンは、ブロックごとに行われるため、係数スキャンユニット41は、ブロック内の位置のそれぞれが非ゼロの係数を有する回数を示す統計を収集することができる。例えば、係数スキャンユニット41は、2次元ブロックにおける係数位置にそれぞれ対応する複数のカウンタを維持し、非ゼロの係数がそれぞれの位置に配置されると、その位置に対応するカウンタをインクリメントすることができる。このようにして、高いカウント値は、非ゼロの係数がきわめて頻繁に存在するブロック内の位置に対応し、低いカウント値は、非ゼロの係数があまり存在しないブロック内の位置に対応する。いくつかの例では、係数スキャンユニット41は、予測モードごとに、係数統計の別々の組を収集することができる。
上述したように、係数スキャンユニット41は、収集された統計に基づいて、スキャン順序を適応させることができる。係数スキャンユニット41は、収集された統計に基づいて、非ゼロ係数を有する尤度がより小さいと決定される係数位置の前に、非ゼロ係数を有する尤度がより高いと決定される係数位置をスキャンするように、スキャン順序を適応させることができる。例えば、係数スキャンユニット41は、それぞれの係数位置が非ゼロ値を有する回数をカウント値が表すとき、それらのカウント値に基づいて、降順に2次元ブロックの係数位置をスキャンするように、スキャン順序を適応させることができる。あるいは、カウンタは、ブロック内の位置のそれぞれがゼロ値の係数の位置であった回数を追跡し、それらのカウント値に基づいて、昇順に係数位置をスキャンするように、スキャン順序を適応させることができる。いくつかの例では、統計が、ブロックの係数位置のすべての代わりに、ブロックの係数位置のサブセットについてのみ、収集されることができる。この場合、係数スキャンユニット41は、スキャン順序の一部のみを適応させることができる。
係数スキャンユニット41は、固定または非固定の間隔で、スキャン順序を適応させることができる。例えば、係数スキャンユニット41は、ブロック境界など、固定の間隔で、スキャン順序を適応させることができる。いくつかの例では、係数スキャンユニット41は、4×4または8×8のブロック境界で、またはマクロブロック境界で、スキャン順序を適応させることができる。このようにして、スキャン順序は、ブロックまたはマクロブロックごとに適応され得る。しかし、システムの複雑度を低減するために、係数スキャンユニット41は、例えばnブロックまたはマクロブロックごとなどのように、あまり頻繁にスキャン順序を適応させなくてもよい。あるいは、係数スキャンユニット41は、非固定の間隔で、スキャン順序を適応させることができる。係数スキャンユニット41は、例えば、ブロック内のある位置のカウント値のうちの1つが閾値を超えるとき、スキャン順序を適応させることができる。スキャン順序を適応させた後、係数スキャンユニット41は、適応されたスキャン順序を使用して、少なくとも1つのその後のビデオブロックのその後の量子化残差ブロックをスキャンすることができる。いくつかの例では、係数スキャンユニット41は、少なくとも1つのその後のビデオブロックが第1のビデオブロックの符号化単位に存在するとき、適応されたスキャン順序を使用して、少なくとも1つのその後のビデオブロックのその後の量子化された残差ブロックをスキャンすることができる。係数スキャンユニット41は、スキャン順序が収集された統計に従って再度適応されるまで、またはスキャン順序が再度初期化されるまで、その後のビデオブロックを引き続きスキャンすることができる。このようにして、係数スキャンユニット41は、量子化残差係数がエントロピエンコーディングユニット46によってより効率的にエンコードされ得るような方法で1次元係数ベクトルを生成するように、スキャン順序を適応させる。
係数スキャンユニット41は、いくつかの例では、収集された統計を正規化することができる。係数カウントが閾値に到達したとき、収集された統計の正規化が望ましい場合がある。閾値に到達したカウント値を有するブロック内の、本明細書では係数位置Aと呼ぶ係数位置は、例えば、ある期間の間、係数位置が非ゼロの係数を有していなかったときでさえ、最も高いカウントを有する係数位置のままであり得る。この理由は、位置Aの係数カウントが大きく、したがって、他の係数カウントが複数のブロック(例えば、何十、あるいは何百ものブロック)にわたって得られるまで、本明細書では係数位置Bと呼ぶブロック内の別の位置の係数カウントが位置Aの係数カウントを超えられず、結果的に係数位置AとBとの間のスキャン順序の変化(すなわち、スワッピング)をもたらせないことがあるからである。したがって、ビデオエンコーダ20が局所的な係数統計に対し、より迅速に適応できるようにするために、係数スキャンユニット41は、カウントのうちの1つが閾値に到達すると、係数を正規化することができる。例えば、係数スキャンユニット41は、2分の1だけカウント値のそれぞれを低減するなど、予め定められた倍数だけカウント値のそれぞれを低減することによって、またはカウント値を最初のカウント値の組に再設定することによって、係数を正規化することができる。係数スキャンユニット41は、他の正規化方法を使用することができる。例えば、係数スキャンユニット41は、特定の数のブロックをエンコードした後、統計をリフレッシュすることができる。
エントロピエンコーディングユニット46は、ブロックの残差係数を表す1次元係数ベクトルに加えて、1つまたは複数のヘッダー構文要素の形のブロックのブロックヘッダー情報を受信する。ヘッダー構文要素は、ブロックタイプ、予測モード、ルーマおよびクロマの符号化ブロックパターン(CBP)、ブロックパーティション、および1つまたは複数の動きベクトルなど、現在のビデオブロックの特定の特性を識別することができる。これらのヘッダー構文要素は、ビデオエンコーダ20内の他のコンポーネントから、例えば予測ユニット32から、受信され得る。
エントロピエンコーディングユニット46は、エンコードされたビットストリーム(図2では「VIDEO BITSTREAM」と表記)を生成するために、現在のビデオブロックのヘッダー情報および残存情報をエンコードする。エントロピエンコーディングユニット46は、本開示に記載された技術に従ってブロックのそれぞれの構文要素のうちの1つまたは複数をエンコードする。特に、エントロピエンコーディングユニット46は、1つまたは複数の前にエンコードされたビデオブロックの構文要素に基づいて、現在のブロックの構文要素をエンコードすることができる。したがって、エントロピエンコーディングユニット46は、1つまたは複数の前にエンコードされたビデオブロックの構文要素を格納するための1つまたは複数のバッファを含み得る。エントロピエンコーディングユニット46は、現在のビデオブロックの構文要素をエンコードするのを助けるために、任意の位置にある任意の数の近隣ブロックを分析することができる。説明の目的で、エントロピエンコーディングユニット46は、現在のブロックのすぐ上に配置されている前にエンコードされたブロック(すなわち、上側の近隣ブロック)、および現在のブロックのすぐ左に配置されている前にエンコードされたブロック(すなわち、左側の近隣ブロック)に基づいて、予測モードをエンコードするものとして説明する。しかし、ブロックタイプ、ブロックパーティション、CBPなど、他のヘッダー構文要素をエンコードするために、類似の技術を使用してもよい。また、上側および左側の近隣ブロックだけではなく、より多くの近隣ブロックが現在のビデオブロックのエンコードに関与する類似の技術が使用されてもよい。
エントロピエンコーディングユニット46の演算が、上述した18個の予測モードの組を参照し、且つ以下の疑似コードの例を考慮して、説明される。
Figure 2013153463
エントロピエンコーディングユニット46は、それぞれ上側の近隣ブロックの予測モード、左側の近隣ブロックの予測モード、および現在のブロックの予測モードに等しくなるように、変数upMode、leftMode、およびcurrModeを初期化する。上述したように、上側の近隣ブロック、左側の近隣ブロック、および現在のブロックの予測モードは、ラグランジュコスト分析に基づいて決定されることができる。エントロピエンコーディングユニット46は、現在のホックの予測モード(currMode)を、近隣ブロックの予測モード(upModeおよびleftMode)と比較する。現在のブロックの予測モードが近隣ブロックのいずれかの予測モードに等しい場合、エントロピエンコーディングユニット46は、「1」にエンコードする。したがって、現在のブロックの予測モードを表すためにエントロピエンコーディングユニット46によってエンコードされた第1のビットは、現在の予測モードが上側の近隣ブロックの予測モード、または左側の近隣ブロックの予測モードのいずれかと同じであるかどうかを示す。
現在のブロックの予測モードが近隣ブロックのいずれかの予測モードと等しい場合、すなわち、第1のエンコードされたビットが「1」である場合、エントロピエンコーディングユニット46は、上側の近隣ブロックの予測モードを、左側の近隣ブロックの予測モードと比較する。上側の近隣ブロックの予測モードが、左側の近隣ブロックの予測モードと同じである場合、エントロピエンコーディングユニット46は、予測モードのビットをこれ以上エンコードしない。この場合、予測モードは、単一ビットを使用してエンコードされ得る。
しかし、上側の近隣ブロックの予測モードが左側の近隣ブロックの予測モードに等しくない場合、エントロピエンコーディングユニット46は、近隣ブロックのうちのどれが現在のブロックと同じ予測モードを有するかを指定するために、予測モードを表す少なくとも1つの追加ビットをエンコードする。例えば、エントロピエンコーディングユニット46が上側および左側の近隣ブロックの予測モードを分析するとき、エントロピエンコーディングユニット46は、現在のブロックの予測モードが上側の近隣ブロックの予測モードと同じである場合には「1」にエンコードすることができ、現在のブロックの予測モードが左側の近隣ブロックの予測モードと同じである場合には「0」にエンコードする。あるいは、エントロピエンコーディングユニット46は、現在のブロックの予測モードが左側の近隣ブロックの予測モードと同じである場合には「1」にエンコードし、現在のブロックの予測モードが上側の近隣ブロックの予測モードと同じである場合には「0」にエンコードする。いずれの場合も、エンコードされた予測モードの第2のビットは、上側または左側の近隣ブロックのうちのどれが現在のブロックの予測モードと同じ予測モードを有するかを示す。このようにして、エントロピエンコーディングユニット46は、現在のブロックの予測モードが近隣ブロックのうちの1つの予測モードと等しいとき、わずか1ビット、多くて2ビットを使用して、現在のブロックの予測モードをエンコードすることができる。エントロピエンコーディングユニット46が2つを超える近隣ブロックを分析する場合、エントロピエンコーディングユニット46は、前にエンコードされたブロックのうちのどれが現在のブロックと同じ予測モードを有するかを指定するために、1つを超える追加ビットをエンコードすることができる。
現在のビデオブロックの予測モードが上側の近隣ブロックの予測モード、または左側の近隣ブロックの予測モードのいずれとも同じではない場合には、エントロピエンコーディングユニット46は、現在のビデオブロックの予測モードがいずれの近隣ブロックの予測モードとも同じではないことを示す「0」を送信する。エントロピエンコーディングユニット46は、現在のブロックの予測モードを表す符号語をエンコードする。一例として上述した1組の18個の予測モードを使用して、エントロピエンコーディングユニット46は、4ビット符号語を使用して、現在のビデオブロックの予測モードをエンコードすることができる。一般に5ビット符号語を必要とする可能な予測モードが18個あるが、上側の近隣ブロックおよび左側の近隣ブロックの予測モードは、現在のブロックの予測モードとすでに比較されて、現在のブロックの予測モードに等しくないことが決定されているので、上記可能な予測モードのうちの2つは、現在のブロックの組、すなわち、上側の近隣ブロックおよび左側の近隣ブロックの予測モードからすでに除去されている可能性がある。しかし、上側の近隣ブロックおよび左側の近隣ブロックが同じ予測モードを有するとき、16個の予測モードの代わりに、依然として17個の予測モードが可能であり、この場合も、表すために、4ビット符号語ではなく、5ビット符号語を必要とする。この場合、予測プロセス中、予測ユニット32は、現在のブロックの予測モードを、4ビット符号語を使用して表すことができるように、その組から残りの17個のエンコードモードのうちの1つを選択的に削除することができる。一例では、予測ユニット32は、最後の予測モード、例えば、この例では、予測モード17を削除することができる。しかし、予測ユニット32は、他の様々な方法のうちの任意のものを使用して、削除すべきその組の予測モードのうちの任意のものを選択することができる。例えば、予測ユニット32は、各予測モードが選択される確率を追跡し、選択される確率が最も低い予測モードを削除することができる。
選択された予測モードを削除した後、エントロピエンコーディングユニット46は、予測モード番号が[0,15]の範囲になるように、16個の残りの予測モードの範囲を調整する。一例では、エントロピエンコーディングユニット46は、モード番号が最も小さい残りの予測モードに0を割り当てることから始めて、予測モード番号が最も大きい残りの予測モードに15を割り当てることで終了するように、残りの予測モードに0から15まで番号を仮に付け直す。例えば、上側の近隣ブロックの予測モードがモード12であり、左側の近隣ブロックの予測モードがモード14である場合、エントロピエンコーディングユニット46は、予測モード13、予測モード15、予測モード16、および予測モード17を、それぞれ予測モード12、予測モード13、予測モード14、予測モード15と番号を付け直すことができる。次いで、エントロピエンコーディングユニット46は、4ビットを使用して、予測モードをエンコードする。可能な予測モードがより多いまたはより少ない予測モードの組を備える他の例では、エントロピエンコーディングユニット46は、類似の技術を使用して、ビットがより多いまたはより少ない予測モードをエンコードすることができる。
エントロピエンコーディングユニット46は、CAVLCまたはCABACを使用して、現在のビデオブロックの予測モードをエンコードすることができる。強い相関が、現在のブロックの予測モードと、上側および左側の近隣ブロックの予測モードと、の間に存在し得る。特に、上側の近隣ブロックの予測モードと左側の近隣ブロックの予測モードとが、いずれも単方向の予測モードであるときには、現在のブロックの予測モードも、単方向の予測モードの1つである確率が高い。同様に、上側の近隣ブロックの予測モードと左側の近隣ブロックの予測モードとが、いずれも双方向の予測モードであるときには、現在のブロックの予測モードも、双方向の予測モードのうちの1つである確率が高い。このようにして、上側および左側の近隣ブロックの予測モードのカテゴリ(例えば単方向対双方向)が変わると、現在のブロックの予測モードの確率分布が変わる。
したがって、エントロピエンコーディングユニット46は、いくつかの態様において、1つまたは複数の前にエンコードされたビデオブロック(例えば、上側および左側の近隣ビデオブロック)の予測モードが単方向であるか、双方向であるかに応じて、異なる符号化コンテキストを選択することができる。CABACの場合、異なる符号化コンテキストが、所与のコンテキスト内の予測モードの組の異なる確率を反映する。上側および左側の近隣符号化ブロックの両方が単方向の予測モードを有する場合に対応する、本明細書では「第1の符号化コンテキスト」と呼ぶ符号化コンテキストを例にとる。近隣の相関のために、第1の符号化コンテキストは、双方向の予測モードよりも高い確率を単方向の予測モードに割り当て得る。したがって、CABACエンコードの場合に第1の符号化コンテキストが選択されたとき(すなわち、上側および左側の近隣予測モードの両方が単方向)、現在の予測モードが双方向の予測モードのうちの1つである場合に比べて、現在の予測モードが単方向の予測モードのうちの1つである場合、現在の予測モードの符号化に費やされるビットがより少ない可能性がある。CAVLCの場合、異なる符号化コンテキストのために、異なるVLC符号化テーブルが定義されることができる。例えば、第1の符号化コンテキストが選択されたとき(すなわち、上側および左側の両方の近隣ブロックが単方向の予測モードを有する)、双方向の予測モードよりも短い符号語を単方向の予測モードに割り当てるVLC符号化テーブルが使用され得る。
このように、エントロピエンコーディングユニット46は、上側のビデオブロックの予測モードおよび左側のビデオブロックの予測モードがいずれも単方向の予測モードであるとき、第1の符号化コンテキストを選択することができる。エントロピエンコーディングユニット46は、上側のビデオブロックの予測モードおよび左側のビデオブロックの予測モードがいずれも単方向の予測モードでないときには、異なる符号化コンテキストを選択することができる。例えば、エントロピエンコーディングユニット46は、上側の近隣ビデオブロックの予測モードおよび左側の近隣ビデオブロックの予測モードがいずれも双方向の予測モードであるとき、第2の符号化コンテキストを選択することができる。上側および左側の近隣ブロックの予測モードがいずれも双方向であるとき、第2の符号化コンテキストは、現在のビデオブロックの予測モードの確率分布をモデリングする。第2の符号化コンテキストの確率分布は、CABAC符号化の場合には単方向の予測モードよりも高い確率を双方向の予測モードに割り当て、CAVLCエンコードの場合には単方向の予測モードよりも短い符号語を双方向の予測モードに割り当て得る。
エントロピエンコーディングユニット46は、近隣ブロックのうちの一つの予測モードが単方向の予測モードであり、近隣ブロックのうちの他の予測モードが双方向の予測モードであるとき、さらに第3の符号化コンテキストを選択することができる。第3の符号化コンテキストは、その組の単方向の予測モードおよび双方向の予測モードに現在の予測モードの確率をより均等に分布する。1つまたは複数の前にエンコードされたビデオブロック(例えば、上側および左側のビデオブロック)の予測モードが単方向であるか、双方向であるかに基づいて、エンコードに使用するための異なる符号化コンテキストを選択することは、予測モード情報をより良く圧縮することができるようになる。
図3は、図1のビデオ復号器26の一例をさらに詳しく示すブロック図である。ビデオ復号器26は、ビデオフレームやスライスなど、符号化単位内のブロックのイントラ復号およびインター復号を行うことができる。図3の例では、ビデオ復号器26は、エントロピ復号ユニット60、予測ユニット62、係数スキャンユニット63、逆量子化ユニット64、逆変換ユニット66、およびフレーム記憶装置68を含む。ビデオ復号器26は、逆変換ユニット66の出力と予測ユニット62の出力とを結合する加算器69も含む。
エントロピ復号ユニット60は、エンコードされたビデオビットストリーム(図3では「VIDEO BITSTREAM」と表記)を受信し、残存情報(例えば、1次元ベクトルの量子化残差係数の形)、およびヘッダー情報(例えば、1つまたは複数のヘッダー構文要素の形)を取得するために、エンコードされたビットストリームを復号する。エントロピ復号ユニット60は、図2のエンコードモジュール46によって実行されるエンコードの逆の復号機能を実行する。例示の目的で、エントロピ復号ユニット60は予測モード構文要素の復号を行うことについて説明する。これらの技術は、ブロックタイプ、ブロックパーティション、CBPなど、他の構文要素の復号に拡張されることができる。
特に、エントロピ復号ユニット60は、予測モードを表す第1のビットを分析して、現在のブロックの予測モードが、例えば上側の近隣ブロックや左側の近隣ブロックなど、分析された前に復号されたブロックのうちの任意のものの予測モードに等しいかどうかを決定する。エントロピ復号モジュール60は、第1のビットが「1」であるときには、現在のブロックの予測モードが近隣ブロックのうちの1つの予測モードに等しいことを決定し、第1のビットが「0」であるときには、現在のブロックの予測モードが近隣ブロックのいずれの予測モードとも同じではないことを決定することができる。
第1のビットが「1」であり、上側の近隣ブロックの予測モードが左側の近隣ブロックの予測モードと同じである場合、エントロピ復号ユニット60は、これ以上ビットを受信する必要はない。エントロピ復号ユニット60は、近隣ブロックのいずれかの予測モードを現在のブロックの予測モードとして選択する。エントロピ復号ユニット60は、例えば、1つまたは複数の前に復号されたブロックの前の予測モードを格納する1つまたは複数のバッファ(または他のメモリ)を含み得る。
第1のビットが「1」であり、上側の近隣ブロックの予測モードが左側の近隣ブロックの予測モードと同じではない場合、エントロピ復号ユニット60は、予測モードを表す第2のビットを受信し、エントロピ復号ユニット60は、第2のビットに基づいて、近隣ブロックのうちのどれが現在のブロックと同じ予測モードを有するかを決定する。例えば、エントロピ復号ユニット60は、第2のビットが「1」であるときには、現在のブロックの予測モードが上側の近隣ブロックの予測モードと同じであることを決定し、第2のビットが「0」であるときには、現在のブロックの予測モードが左側の近隣ブロックの予測モードと同じであることを決定することができる。エントロピ復号ユニット60は、現在の近隣ブロックの予測モードを現在のブロックの予測モードとして選択する。
しかし、第1のビットが「0」であるとき、エントロピ復号ユニット60は、現在のブロックの予測モードが近隣ブロックのいずれの予測モードとも同じではないことを決定する。したがって、エントロピ復号ユニット60は、上側および左側の近隣ブロックの予測モードを、可能な予測モードの組から削除することができる。可能な予測モードの組は、1つまたは複数の単方向の予測モードおよび/あるいは1つまたは複数の多方向の予測モードを含み得る。合計18個の予測モードを含む予測モードの組の一例が、図2の説明において上述されている。上側および左側の近隣ブロックが同じ予測モードを有する場合、エントロピ復号ユニット60は、近隣ブロックの予測モード、および少なくとも1つの他の予測モードを削除することができる。一例として、エントロピ復号ユニット60は、最大モード番号の予測モ―ド(例えば、上述した18個の予測モードの組におけるモード17)を削除することができる。しかし、エントロピ復号ユニット60は、復号ユニット60が予測ユニット32によって削除されたものと同じ予測モードを削除する限り、様々な方法の他の任意のものを使用して、削除すべき組の予測モードのうちの任意のものを選択することができる。例えば、エントロピ復号ユニット60は、選択される確率が最も低い予測モードを削除することができる。
エントロピ復号ユニット60は、予測モード番号が0〜15の範囲になるように、残りの予測モードの予測モード番号を調整することができる。一例では、エントロピエンコーディングユニット46は、図2を参照して上述したように、モード番号が最も小さい残りの予測モードから始めて、予測モード番号が最も大きい残りの予測モードで終了するように、残りの予測モードに0から15まで番号を仮に付け直し得る。エントロピ復号ユニット60は、現在のブロックの予測モードに対応する残りの予測モードの予測モード番号を取得するために、残りのビット、例えば、記載した例では4ビットを復号する。
いくつかの例では、エントロピ復号ユニット60は、CAVLCまたはCABACを使用して、現在のビデオブロックの予測モードを復号することができる。現在のブロックの予測モードと、1つまたは複数の前に復号されたブロック(例えば、上側および左側の近隣ブロックの予測モード)との間に強い相関が存在し得るため、エントロピ復号ユニット60は、1つまたは複数の前に復号されたビデオブロックの予測モードのタイプに基づいて、ブロックの予測モードに異なる符号化コンテキストを選択することができる。言い換えれば、エントロピ復号ユニット60は、前に復号されたブロックの予測モードが単方向であるか、双方向であるかに基づいて、異なる符号化コンテキストを選択することができる。
一例として、エントロピ復号ユニット60は、前に復号されたブロックの両方の予測モードが単方向の予測モードであるときには、第1の符号化コンテキストを選択し、前に復号されたブロックの両方の予測モードが双方向の予測モードであるときには、第2の符号化コンテキストを選択し、前に復号されたブロックのうちの1つの予測モードが単方向の予測モードであり且つ前に復号されたブロックのうちの他の1つの予測モードが双方向の予測モードであるときには、第3の符号化コンテキストを選択することができる。
予測ユニット62は、ヘッダー情報の少なくとも一部分を使用して、予測ブロックを生成する。例えば、イントラ符号化ブロックの場合、エントロピ復号ユニット60は、予測ブロックの生成のために、予測ユニット62に、ヘッダー情報の少なくとも一部分(例えば、このブロックのブロックタイプおよび予測モード)を提供し得る。予測ユニット62は、ブロックタイプおよび予測モードに従って、共通の符号化単位内の1つまたは複数の近隣するブロック(または近隣するブロックの部分)を使用して、予測ブロックを生成する。一例として、例えば、予測ユニット62は、予測モード構文要素によって指定された予測モードを使用して、ブロックタイプ構文要素によって示されるパーティションサイズの予測ブロックを生成することができる。現在の符号化単位内の1つまたは複数の近隣するブロック(または近隣するブロックの部分)は、例えば、フレーム記憶装置68から取り出され得る。
また、エントロピ復号ユニット60は、1次元係数ベクトルの形で残存情報を取得するために、エンコードされたビデオデータを復号する。分離型変換(例えば、DCT、H.264/AVC整数変換、分離型方向変換)が使用される場合、係数スキャンユニット63は、2次元ブロックを生成するために、1次元係数ベクトルをスキャンする。係数スキャンユニット63は、図2の係数スキャンユニット41によって実行されるスキャンの逆のスキャン機能を実行する。特に、係数スキャンユニット63は、1次元ベクトルの係数を2次元形式にするために、最初のスキャン順序に従って、係数をスキャンする。言い換えれば、係数スキャンユニット63は、2次元ブロックの量子化係数を生成するために、1次元ベクトルをスキャンする。
係数スキャンユニット63は、このスキャン順序をビデオエンコーダ20によって使用されるスキャン順序と同期するために、1つまたは複数の係数統計に基づいて、係数スキャンに使用されるスキャン順序を適応的に調整することができる。そうするために、係数スキャンユニット63は、1つまたは複数のブロックの1つまたは複数の係数統計を収集し、収集された統計に基づいて、スキャン順序を適応させることができる。言い換えれば、2次元ブロックの量子化係数が再構成されるとき、係数スキャンユニット63は、2次元ブロック内の位置のそれぞれが非ゼロの係数の位置である回数を示す統計を収集することができる。係数スキャンユニット63は、2次元ブロックにおける係数位置にそれぞれ対応する複数のカウンタを維持し、非ゼロの係数がそれぞれの位置に配置されると、その位置に対応するカウンタをインクリメントすることができる。
係数スキャンユニット63は、収集された統計に基づいて、スキャン順序を適応させることができる。係数スキャンユニット63は、収集された統計に基づいて、非ゼロ係数を有する尤度がより小さいと決定される係数位置の前に、非ゼロ係数を有する尤度がより高い位置をスキャンするように、スキャン順序を適応させることができる。係数スキャンユニット63は、ビデオエンコーダ20によって使用されるのと同じ固定または非固定の間隔で、スキャン順序を適応させる。係数スキャンユニット63は、ビデオエンコーダ20に関して上述したのと同じ方法で、収集された統計を正規化する。
上述したように、係数スキャンユニット63は、いくつかの例では、別々の係数統計を収集することができ、予測モードごとに、別々にスキャン順序を適応的に調整することができる。例えば、予測モードのそれぞれが、異なる係数統計を有し得るため、係数スキャンユニット63は、そうすることができる。
2次元ブロックの量子化残差係数の生成後、逆量子化ユニット64は、量子化残差係数を逆量子化すなわちデ量子化(de-quantize)する。逆変換ユニット66は、ピクセル値の残差ブロックを生成するために、例えば、逆DCT、逆整数変換、逆方向変換などの逆変換を、デ量子化された残差係数に適用する。加算器69は、再構成されたビデオブロックを形成するために、予測ユニット62によって生成された予測ブロックを、逆変換ユニット66からの残差ブロックと合計する。このようにして、ビデオ復号器26は、ヘッダー情報および残存情報を使用して、ブロックごとにビデオ系列のフレームを再構成する。
ブロックベースのビデオ符号化は、時として、符号化されたビデオフレームのブロック境界において、視覚的に知覚できるブロックノイズ(blockiness)をもたらし得る。こうした場合、デブロックフィルタリングは、視覚的に知覚可能なブロックノイズを低減または除去するために、ブロック境界をスムーズにすることができる。したがって、ブロックノイズを低減または除去するために、復号されたブロックをフィルタ処理するために、デブロッキングフィルタ(図示せず)が適用されることもできる。任意のオプションのデブロックフィルタリングの後、再構成されたブロックは、次いで、その後のビデオブロックの空間的および時間的予測の参照ブロックを提供するとともに、表示装置(例えば図1の表示装置28)を駆動するために復号されたビデオを生成する、フレーム記憶装置68に入れられる。
図4は、本開示に従う適応形スキャンの仮想例を示す概念図である。この例では、係数位置は、項目71に、c1〜c16と表記されている。実際の係数値は、ブロック1(72)、ブロック2(73)、ブロック3(74)、およびブロック4(75)に、4つの連続するブロックとして示されている。ブロック1〜4の実際の係数値は、量子化残差係数、量子化なしの変換係数、または他のタイプの係数を表し得る。他の例では、位置は、残差ブロックのピクセル値の位置を表し得る。ブロック1〜4は、同じ予測モードに関連付けられているブロックを備え得る。図4に示されている例において、ブロック1〜4は、4×4のブロックである。しかし、上述したように、本開示の技術は、任意のサイズのブロックに適用するように拡張され得る。さらに、ビデオエンコーダ20の係数スキャンユニット41に関して以下で説明するが、ビデオ復号器26の係数スキャンユニット63は、統計を収集し、類似の方法でスキャン順序を適応させることができる。
最初に、係数スキャンユニット41は、ジグザグスキャン順を使用して、ブロック1の係数をスキャンし得る。この場合、係数スキャンユニット41は、c1、c2、c5、c9、c6、c3、c4、c7、c10、c13、c14、c11、c8、c12、c15、c16の順序でブロック1の係数位置をスキャンする。したがって、ブロック1の係数をスキャンした後、係数スキャンユニット41は、1次元係数ベクトルvを出力し、この場合、v=[9,4,6,1,1,0,0,0,0,2,0,0,0,0,0,0]である。図4に示される例では、係数スキャンユニット41は、最初に、ジグザグスキャン順を使用して、ブロック1の係数をスキャンするが、このジグザグスキャンは、適応形スキャンの唯一の可能な開始点ではない。水平スキャン、垂直スキャン、または他の任意の最初のスキャン系列が、最初のスキャン順序として使用されることができる。ジグザグスキャンの使用は、2次元係数間の一続きの4つのゼロを有する1次元係数ベクトルvをもたらす。
統計1(76)は、ブロック1の統計を表す。統計1(76)は、各係数位置が非ゼロの値を有する回数を追跡するための各係数位置のカウント値とすることができる。図4の例では、係数統計は、すべてゼロに初期化される。しかし、他の初期化方式が使用されてもよい。例えば、各予測モードの代表的な、または平均の係数統計が、それぞれの予測モードの統計を初期化するために使用されてもよい。ブロック1のエンコードの後、統計1(76)は、非ゼロであるブロック1のいずれの係数位置についても1の値を、およびゼロの値を有するブロック1のいずれの係数位置についても0の値を有する。統計2(77)は、ブロック1および2の結合された統計を表す。係数スキャンモジュール41は、係数位置がブロック2において非ゼロの値を有するときには統計1(76)のカウントをインクリメントし、係数位置がゼロの値を有するときにはカウントを同じに維持する。したがって、図4に示されるように、係数スキャンモジュール41は、係数位置c1、c2、c5、c9、およびc13の統計を、2の値にインクリメントし、係数位置の残りの統計を統計1(76)と同じに維持する。統計3(78)は、ブロック1〜3の結合された統計を表し、統計4(79)は、ブロック1〜4の結合された統計を表す。上述したように、いくつかの態様では、係数スキャンユニット41は、複数のカウンタを使用して、ブロックの統計を収集することができる。
係数スキャンユニット41は、収集された統計に基づいて、スキャン順序を適応させることができる。示した例では、係数スキャンユニット41は、統計4(79)に基づいて、4つのビデオブロックの後のスキャン順序を適応させるように構成されることができる。この場合、係数スキャンユニット41は、収集された統計を分析し、係数位置がその対応するカウント値によって降順にスキャンされるように、スキャン順序を適応させる。したがって、係数スキャンユニット41は、最初のスキャン順序に従ってブロック1〜4をスキャンし、その次のブロック、例えばブロック5(図示せず)、の位置を、c1、c5、c9、c2、c13、c6、c3、c4、c7、c10、c14、c11、c8、c12、c15、c16の順序でスキャンするように、スキャン順序を適応させることができる。係数スキャンユニット41は、ブロックについての収集された統計に基づいてスキャン順序が再度適応されるまで、または、例えばその後の符号化単位の最初に再度初期化されるまで、この新しいスキャン順序に従ってその後のブロックをスキャンし続ける。
最初のスキャン順序(例えば、ジグザグスキャン順)から新しいスキャン順序に変更するように、スキャン順序を適応させることは、1次元係数ベクトルの先頭が非ゼロの係数、最後がゼロ係数であることを促す。図4の例では、新しいスキャン順序は、所与の予測モードについて、垂直次元における係数は、水平次元における係数より非ゼロである尤度が高いという事実を反映して、水平次元における係数より早く垂直次元における係数をスキャンする。ブロック1〜4は、すべて同じ予測モードを有していてもよく、過去の統計は、将来の非ゼロの係数位置の見込みを表し得る。したがって、スキャン順序を定義するために過去の統計を使用することによって、本開示の技術は、スキャンされた1次元ベクトルの先頭近くに非ゼロの係数、およびスキャンされた1次元ベクトルの最後近くにゼロ値係数を分類することを促し、したがって、2つの非ゼロ係数間のゼロの連続の数を除去または低減することができる。次いでこれは、エントロピ符号化中に達成されることができる圧縮のレベルを向上させることができる。
図5は、本開示に従う符号化技術を示す流れ図である。図5に示された符号化技術は、ビデオブロックのエンコードまたは復号のいずれにもに使用されることができる。図5に示すように、係数スキャンユニット41、63は、現在のブロックの対応する予測モードについて定義された最初のスキャン順序に従ってブロックの係数をスキャンする(80)。ビデオエンコーダ20から見ると、スキャンは、2次元ブロックの係数を1次元係数ベクトルに変換する。しかし、ビデオ復号器26から見ると、スキャンは、1次元係数ベクトルを2次元係数ブロックに変換することになる。一例として、対応する予測モードの最初のスキャン順序は、ジグザグスキャン順とすることができる。ジグザグスキャンは、唯一の可能な最初のスキャン順序ではない。水平スキャン、垂直スキャン、または他の任意の最初のスキャン順序が、最初のスキャン順序として使用されることができる。
係数スキャンユニット41、63は、1つまたは複数のブロックの統計を収集する(82)。特に、スキャンされるブロックごとに、係数スキャンユニット41、63は、例えばカウンタで、2次元ブロック内の係数位置のそれぞれが非ゼロの係数である頻度を追跡する統計を収集することができる。係数スキャンユニット41、63は、スキャン順序を評価するかどうかを決定する(83)。係数スキャンユニット41、63は、固定(例えば、ブロック境界ごと、またはn個のブロック境界の後)または非固定の間隔(例えば、ブロック内の位置のカウント値のうちの1つが閾値を超えたとき)でスキャン順序を評価することができる。
係数スキャンユニット41、63がスキャン順序を評価しないことを決定した場合、係数スキャンユニット41、63は、最初のスキャン順序に従って次のブロックをスキャンする(80)。例えば、n個のブロックがエンコード/復号された後、係数スキャンユニット41、63がスキャン順序を評価することを決定した場合、係数スキャンユニットは、収集された統計に基づいて、スキャン順序を適応させることができる(84)。例えば、係数スキャンユニット41、63は、所与の位置が非ゼロ係数を有する尤度をカウント値が反映する場合、それらのカウント値に基づいて、降順でブロックの係数位置をスキャンするように、スキャン順序を適応させることができる。スキャン順序を適応させた後、係数スキャンユニット41、63は、いくつかの例では、統計の任意のカウント値が閾値を超えるかどうかを決定することができる(86)。係数位置のうちの1つが、閾値を超える対応するカウント値を有する場合、係数スキャンユニット41、63は、収集された統計、例えば係数カウント値を正規化することができる(87)。例えば、係数スキャンユニット41、63は、各カウント値を所定の倍数だけ低減する、例えば各カウント値を半分に低減するために2分の1だけ低減することによって、またはカウント値を最初のカウント値の組に再設定することによって、係数カウント値を正規化することができる。係数カウント値を正規化することは、ビデオエンコーダ20に、局所的な係数統計へより迅速に適応することを許すことができる。
収集された統計を正規化した後、または正規化が行われないとき、係数スキャンユニット41、63は、適応されたスキャン順序を使用して、その後のブロックをスキャンする(88)。係数スキャンユニット41、63は、少なくとも1つのその後のブロックが以前スキャンされたビデオブロックの符号化単位内に存在するとき、適応されたスキャン順序を使用して、上記少なくとも1つのその後のブロックをスキャンすることができる。係数スキャンユニット41、63は、スキャン順序が再度調整される、または例えば符号化単位の境界で再初期化されるまで、その後のビデオブロックをスキャンし続けることができる。このようにして、係数スキャンユニット41、63は、非ゼロである尤度がより小さいと決定されたブロックの係数位置の前に、非ゼロである尤度がより高いと決定されたブロックの係数位置をスキャンするように、収集された統計に基づいて、スキャン順序を適応させる。したがって、1次元係数ベクトルは、スキャンされた1次元ベクトルの先頭近くに非ゼロ係数を、且つスキャンされた1次元ベクトルの最後近くにゼロ値係数を、分類させるように配列される。次いでこれは、エントロピ符号化中に達成されることができる圧縮のレベルを向上させることができる。
いくつかの例では、係数スキャンユニット41、63は、各予測モードが異なる係数統計を有し得るので、予測モードごとに、別々にスキャン順序を適応的に調整することができる。言い換えれば、係数スキャンユニット41、63は、予測モードごとに別々の統計を維持し、スキャン順序を、それぞれの統計に基づいて異なるように、予測モードごとに調整することができる。したがって、上述したフローチャート例は、予測モードごとに係数スキャンユニット41、63によって実行され得る。
図6は、本開示の技術のうちの1つに従ってビデオブロックのヘッダー情報をエンコードする、例えばビデオエンコーダ20のエントロピエンコーディングユニット46などのエンコーディングユニットの動作例を示す流れ図である。エントロピエンコーディングユニット46は、1つまたは複数のヘッダー構文要素の形でブロックのヘッダー情報を受信する(90)。ヘッダー構文要素は、ブロックタイプ、予測モード、ルーマおよび/またはクロマの符号化ブロックパターン(CBP)、ブロックパーティション、および1つまたは複数の動きベクトルなど、現在のビデオブロックの特定の特性を識別することができる。図6は、現在のブロックの予測モードをエンコードすることに関して示されている。しかし、ヘッダー構文要素のうちの他のものをエンコードするために、類似の技術が使用されてもよい。
エントロピエンコーディングユニット46は、現在のブロックの予測モードを、1つまたは複数の前にエンコードされたブロックの予測モードと比較する(92)。1つまたは複数の前にエンコードされたブロックは、例えば、1つまたは複数の近隣するブロックを備え得る。図6の例では、例えば上側の近隣ブロックおよび左側の近隣ブロックなど、2つの前に符号化されたブロックが分析される。現在のブロックの予測モードが前にエンコードされたブロックのいずれかの予測モードと同じである場合、エントロピエンコーディングユニット46は、それを示すために、第1のビットをエンコードする(94)。一例として、エントロピエンコーディングユニット46は、現在のブロックの予測モードが前にエンコードされたブロックのいずれかの予測モードと同じであることを示すために、第1のビットを「1」としてエンコードし得る。
エントロピエンコーディングユニット46は、上側の近隣ブロックの予測モードを左側の近隣ブロックの予測モードと比較する(98)。上側の近隣ブロックの予測モードが、左側の近隣ブロックの予測モードと同じである場合、エントロピエンコーディングユニット46は、予測モードのビットをそれ以上エンコードしない(100)。この場合、予測モードは、単一ビットを使用してエンコードされ得る。
しかし、上側の近隣ブロックの予測モードが左側の近隣ブロックの予測モードと等しくない場合には、エントロピエンコーディングユニット46は、近隣ブロックのうちのどれが現在のブロックと同じ予測モードを有するかを示すために、予測モードを表す第2のビットをエンコードする(102)。例えば、エントロピエンコーディングユニット46は、現在のブロックの予測モードが上側の近隣ブロックの予測モードと同じである場合には「1」にエンコードし、現在のブロックの予測モードが左側の近隣ブロックの予測モードと同じである場合には「0」にエンコードする。したがって、エントロピエンコーディングユニット46は、現在のブロックの予測モードが近隣ブロックのうちの1つの予測モードと等しいとき、わずか1ビット、多くて2ビットを使用して、現在のブロックの予測モードをエンコードすることができる。
現在のブロックの予測モードが前にエンコードされたブロックのいずれの予測モードとも同じではない場合、エントロピエンコーディングユニット46は、それを示すために、第1のビットをエンコードする(96)。上記の例を続けると、エントロピエンコーディングユニット46は、現在のブロックの予測モードが前にエンコードされたブロックのいずれの予測モードとも同じではないことを示すために、第1のビットを「0」としてエンコードし得る。エントロピエンコーディングユニット46は、可能な予測モードの組を再配列することができる(104)。エントロピエンコーディングユニット46は、可能な予測モードの組から近隣ブロックの予測モードまたは予測モード群を削除することによって、可能な予測モードの組を再配列することができる。上側および左側の近隣ブロックが互いに異なる予測モードを有するとき、エントロピエンコーディングユニット46は、その組から2つの予測モードを削除することができる。上側および左側の近隣ブロックが互いに同じ予測モードを有するとき、エントロピエンコーディングユニット46は、その組から1つの予測モード(すなわち、上側および左側の近隣ブロックの予測モード)を削除することができる。さらに、いくつかの例では、エントロピエンコーディングユニット46は、その組から1つまたは複数の追加のエンコードモードを選択的に削除することができる。エントロピエンコーディングユニット46が1つまたは複数の追加の符号化モードを削除するとき、図2の予測ユニット32も、同じ追加のエンコードモードが選択されないように、可能な予測モードの組からそれらの追加のエンコードモードを削除する。1つまたは複数の予測モードを削除した後、エントロピエンコーディングユニット46は、その組の残りの予測モードのモード番号を調整する。
エントロピエンコーディングユニット46は、現在のブロックの予測モードを表す符号語をエンコードする(106)。エントロピエンコーディングユニット46は、CAVLC、CABAC、または他のエントロピ符号化方法を使用して、現在のビデオブロックの予測モードをエンコードすることができる。図7を参照してより詳細に説明するように、エンコーディングユニット46は、いくつかの例では、1つまたは複数の前にエンコードされたブロックの予測モードに基づいて、現在のブロックの予測モードのエンコードに使用するための符号化コンテキストを適応的に選択することができる。
図7は、本開示の一態様に従った符号化コンテキスト選択を示す流れ図である。上述したように、現在のブロックの予測モードのタイプと、上側および左側の近隣ブロックなど、1つまたは複数の前にエンコードされたブロックの予測モードのタイプとの間に相関が存在し得る。例えば、上側および左側の近隣ブロックの予測モードがいずれも単方向の予測モードであるとき、現在のブロックの予測モードも単方向の予測モードである確率がより高い。同様に、上側および左側の近隣ブロックの予測モードがいずれも双方向の予測モードであるとき、現在のブロックの予測モードも双方向の予測モードである確率がより高い。
したがって、エントロピエンコーディングユニット46は、上側および左側の近隣ブロックの予測モードが単方向の予測モードであるかどうかを決定し(112)、上側の近隣ブロックと左側の近隣ブロックとの両方の予測モードが単方向の予測モードであるときには、第1の符号化コンテキストを選択することができる(114)。第1の符号化コンテキストは、上側および左側の近隣ブロックの予測モードがいずれも単方向であるとき、現在のビデオブロックの予測モードの確率分布をモデリングする。第1の符号化コンテキストの確率分布は、その組の双方向の予測モードよりも、その組の単方向の予測モードについて、より高い確率を提供し得る。例えば、CAVLCの場合、第1の符号化コンテキストは、双方向の予測モードに関連付けられている符号語よりも、単方向の予測モードに、より短い符号語を関連付ける符号化テーブルを使用することができる。
上側および左側の近隣ブロックのそれぞれの予測モードが単方向の予測モードではないとき、エントロピエンコーディングユニット46は、上側および左側の近隣ブロックのそれぞれの予測モードが双方向の予測モードであるかどうかを決定することができる(116)。エントロピエンコーディングユニット46は、上側および左側の近隣ブロックのそれぞれの予測モードがいずれも双方向の予測モードであるとき、第2の符号化コンテキストを選択することができる(117)。第2の符号化コンテキストは、現在のモードが単方向の予測モードよりも双方向の予測モードである確率がより高いという想定に基づいて、現在のビデオブロックの予測モードの確率分布をモデリングする。この場合も、CAVLCの場合、例えば、第2の符号化コンテキストは、単方向の予測モードに関連付けられている符号語よりも双方向の予測モードに、より短い符号語を関連付ける符号化テーブルを使用することができる。
上側および左側の近隣ブロックの予測モードがいずれも双方向の予測モードではないとき、すなわち、前にエンコードされたブロックの予測モードが、双方向および単方向の予測モードの組合せであるとき、エントロピエンコーディングユニット46は、第3の符号化コンテキストを選択することができる(118)。第3の符号化コンテキストは、現在の予測モードの確率が、その組の単方向の予測モードおよび双方向の予測モードに、より均等に分布されるという想定下で生成される。例えば、CAVLCの場合、第3の符号化コンテキストは、類似の符号長の符号語を、双方向の予測モードと単方向の予測モードとに関連付ける符号化テーブルを使用することができる。
エントロピエンコードモジュール46は、選択された符号化コンテキストに従って現在のビデオブロックの予測モードをエンコードする(119)。1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、現在のビデオブロックの予測モードのエンコードに使用するための異なる符号化コンテキストを選択することは、予測モード情報のより良い圧縮をもたらし得る。復号ユニット60がビデオブロックの予測モードを正確に復号することができるように、同じ符号化コンテキスト選択技術が復号ユニット60によって実行される。
図8は、本開示の技術に従ってビデオブロックのヘッダー情報を復号する、ビデオ復号器26のエントロピ復号ユニット60などの復号ユニットの動作例を示す流れ図である。エントロピ復号ユニット60は、ヘッダー情報を、例えば1つまたは複数のヘッダー構文要素の形で取得するために、エンコードされたビデオビットストリームを復号する。予測モードの復号を行うエントロピ復号ユニット60の説明が、例示の目的で述べられる。これらの技術は、ブロックタイプ、ブロックパーティション、CBPなど、他のヘッダー構文要素の復号に拡張されることができる。
特に、エントロピ復号ユニット60は、現在のブロックの予測モードを表す第1のビットを受信する(120)。エントロピ復号ユニット60は、現在のブロックの予測モードが、例えば上側または左側の近隣ブロックなど、前に復号されたブロックの予測モードと同じであることを、予測モードを表す第1のビットが示すかどうかを決定する(122)。例えば、エントロピ復号モジュール60は、第1のビットが「1」であるときには、現在のブロックの予測モードが上側および左側の近隣ブロックの一方の予測モードと同じであることを、および第1のビットが「0」であるときには、現在のブロックの予測モードが上側および左側の近隣ブロックの予測モードと同じではないことを決定することができる。
現在のブロックの予測モードが上側および左側の近隣ブロックのうちの一方の予測モードと同じであることをエントロピ復号ユニット60が決定したとき、エントロピ復号ユニット60は、上側の近隣ブロックの予測モードと左側の近隣ブロックの予測モードとが、同じであるかどうかを決定する(124)。上側の近隣ブロックの予測モードと左側の近隣ブロックの予測モードとが同じであるときには、現在のビデオブロックの予測モードを表すビットがそれ以上受信されず、エントロピ復号ユニット60は、近隣ブロックのいずれかの予測モードを、現在のブロックの予測モードとして選択する(126)。上側の近隣ブロックの予測モードと左側の近隣ブロックの予測モードとが異なるときには、予測ビットを表す1つの追加ビットが受信され、エントロピ復号ユニット60は、予測モードを表す次に受信されたそのビットに基づいて、適切な近隣ブロックの予測モードを、現在のブロックの予測モードとして選択する(128)。例えば、エントロピ復号ユニット60は、次に受信されたビットが「1」であるときには、上側の近隣ブロックの予測モードを現在のブロックの予測モードとして選択し、次に受信されたビットが「0」であるときには、左側の近隣ブロックの予測モードを現在のブロックの予測モードとして選択することができる。
現在のブロックの予測モードが上側および左側の近隣ブロックのいずれの予測モードとも同じではないことをエントロピ復号ユニット60が決定したとき、すなわち、予測モードを表す第1のビットが「0」であるとき、エントロピ復号ユニット60エントロピ復号ユニット60は、可能な予測モードの組の1つまたは複数の予測モードを削除することができる(130)。エントロピ復号ユニット60は、上側および左側の近隣ブロックの予測モードを、可能な予測モードの組から削除することができる。上側および左側の近隣ブロックが同じ予測モードを有する場合、エントロピ復号ユニット60は、上記で詳細に説明したように、近隣ブロックの予測モード、および少なくとも1つの他の予測モードを削除することができる。
エントロピ復号ユニット60は、現在のブロックの予測モードの予測モード番号を取得するために、残りのビット、例えば、記載した例では4ビット、を復号する(132)。エントロピ復号ユニット60は、エントロピエンコーディングユニット46によって実行される予測モード番号付け調整プロセスの逆の方法で、残りの予測モードの予測モード番号付けを調整することができる(134)。一例では、エントロピ復号ユニット60は、削除された予測モードを挿入し直すことによって、復号された予測モード番号(0から15の範囲)を付け直して、元の予測モード番号(0から17の範囲)になるようにすることができる。いくつかの例では、エントロピ復号ユニット60は、1つまたは複数の前に復号されたビデオブロックの予測モードに基づいて、例えば、上記で詳しく説明したように、前に復号されたブロックの予測モードがいずれも単方向か、いずれも双方向か、または一方が単方向で他方が双方向であるか、に基づいて、ブロックの予測モードについて、異なる符号化コンテキストを選択することができる。エントロピ復号ユニット60は、選択された予測モードに従って、予測ブロックを生成するために、予測モードを予測ユニット62に提供する(136)。図3を参照して説明したように、予測ブロックは、ユーザに提示するために再構成されたブロックを生成するために、残差ピクセル値と結合される。
本開示に記載した技術は、ハードウェア、ソフトウェア、ファームウェア、またはその任意の組合せにおいて実施されることができる。ユニットまたはコンポーネントとして説明された任意の特徴は、統合された論理装置に一緒に、または別個であるが、相互運用可能な論理装置として別々に実施されることができる。ソフトウェアにおいて実施される場合、こうした技術は、実行されると、上述した方法のうちの1つまたは複数を実行する命令を備えるコンピュータ可読媒体によって少なくとも一部分実現され得る。コンピュータ可読媒体は、パッケージング材を含み得るコンピュータプログラム製品の一部を形成し得る。コンピュータ可読媒体は、シンクロナスダイナミックランダムアクセスメモリ(SDRAM)などのランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、不揮発性ランダムアクセスメモリ(NVRAM)、電気的消去可能プログラマブル読み取り専用メモリ(EEPROM)、フラッシュメモリ、磁気または光データ記憶媒体などを備え得る。これらの技術は、さらに、または代わりに、命令またはデータ構造の形でコードを運び、または伝える、およびコンピュータによってアクセスされ、読み取られ、かつ/または実行され得るコンピュータ可読通信媒体によって少なくとも一部分実現することができる。
コードは、1つまたは複数のディジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASCI)、フィールドプログラマブルロジックアレイ(FPGA)、または他の同等の集積または個別論理回路など、1つまたは複数のプロセッサによって実行されることができる。したがって、「プロセッサ」という用語は、本明細書で使用する場合、上記の構造のうちの任意のもの、または本明細書に記載される技術の実施に適した他の任意の構造を指し得る。さらに、いくつかの態様において、本明細書に記載した機能は、エンコードおよび復号のために構成された、または結合されたビデオエンコーダ−復号器(CODEC)に組み込まれる専用のソフトウェアユニットまたはハードウェアユニット内に設けられることができる。様々な特徴をユニットとして説明しているのは、示した装置の異なる機能的側面を強調するためのものであり、必ずしも、こうしたユニットを別々のハードウェアまたはソフトウェアコンポーネントによって実現する必要があることを含意するものではない。むしろ、1つまたは複数のユニットに関連付けられている機能は、共通または別々のハードウェアまたはソフトウェアコンポーネント内で統合されることができる。
本開示の様々な実施形態について説明した。これらおよび他の実施形態は、以下の特許請求の範囲内に含まれる。
非分離型方向変換の使用は、計算コストおよび格納要件の増加を必然的に伴い得る。一般に、サイズN×Nの残差ブロックの場合、非分離型方向変換は、サイズN×Nの基底関数を必要とする。すなわち、4×4の残差ブロックの場合には、非分離型方向変換は16×16のサイズを有し;8×8の残差ブロックの場合には、非分離型方向変換は64×64のサイズを有し;16×16の残差ブロックの場合にし、非分離型方向変換は256×256のサイズを有する。異なる非分離型方向変換は、その組の予測モードごとに使用され得るため、変換ユニット38は、4×4のブロックの場合には18個の16×16の方向変換を、8×8のブロックの場合には18個の64×64の変換(上述した予測モードの組の例の場合)を、予測モードの組がより大きいならば、場合によってはそれ以上を格納することができる。これは、変換プロセスの実行に必要な変換行列を格納するために、大きいメモリリソースを使用することになり得る。非分離型方向変換の計算コストも高い。一般に、非分離型方向変換をN×Nブロックに適用することは、N×N回の乗算およびN×(N−1)回の加算を必要とする。
非分離型方向変換の代わりに、変換ユニット38は、予測モードごとに分離型方向変換を維持することができる。分離型方向変換は、非分離型方向変換に比べて、より低い格納および計算コストを有する。4×4残差ブロックXの場合、例えば、分離型変換は、以下の式(2)によって示されるように適用される:
Y=CXR (2)
ここで、Yは、結果として得られた変換係数行列であり、Cは、列変換行列であり、Rは、行変換行列であり、そのすべては、ブロックのサイズに等しいサイズを有する(例えば、この例では4×4)。したがって、結果として得られた変換係数行列Yもまた、サイズ4×4の2次元行列である。
予測モードごとに、変換ユニット38は、2つのN×N変換行列(例えば、行列の対CおよびR)を格納することができ、この場合、N×Nは、ブロックサイズに対応する(例えば、N=4、8、または16)。上述した4×4のブロックの場合の18個の予測モードの組の例では、変換ユニット38は、非分離型変換が使用されるときに格納される18個の16×16の変換行列より少ない記憶領域ですむ36個の4×4の変換行列を格納する。さらに、変換ユニット38は、非分離型方向変換の実行に使用されるN×N回の乗算およびN×(N−1)回の加算よりかなり少ない演算である、2×N×N×N回の乗算および2×N×N×(N−1)回の加算を使用して分離型方向変換を行うことができる。表1は、4×4および8×8のブロックサイズの分離型対非分離型の方向変換の使用の間で、格納要件および計算要件を比較している。16×16ブロックの場合の分離型方向変換と非分離型方向変換との間の比較は、類似の方法で行われ得る。表1に示されるように、分離型方向変換を使用することは、非分離型方向変換に比べて、計算の複雑度および格納要件の両方が低減し、この低減は、より大きいブロックサイズには、より顕著になり、例えば、8×8のブロックの場合の低減は、4×4のブロックの場合の低減より大きい。
Figure 2013153463
エントロピエンコーディングユニット46は、それぞれ上側の近隣ブロックの予測モード、左側の近隣ブロックの予測モード、および現在のブロックの予測モードに等しくなるように、変数upMode、leftMode、およびcurrModeを初期化する。上述したように、上側の近隣ブロック、左側の近隣ブロック、および現在のブロックの予測モードは、ラグランジュコスト分析に基づいて決定されることができる。エントロピエンコーディングユニット46は、現在のブロックの予測モード(currMode)を、近隣ブロックの予測モード(upModeおよびleftMode)と比較する。現在のブロックの予測モードが近隣ブロックのいずれかの予測モードに等しい場合、エントロピエンコーディングユニット46は、「1」にエンコードする。したがって、現在のブロックの予測モードを表すためにエントロピエンコーディングユニット46によってエンコードされた第1のビットは、現在の予測モードが上側の近隣ブロックの予測モード、または左側の近隣ブロックの予測モードのいずれかと同じであるかどうかを示す。
現在のブロックの予測モードが上側および左側の近隣ブロックのいずれの予測モードとも同じではないことをエントロピ復号ユニット60が決定したとき、すなわち、予測モードを表す第1のビットが「0」であるとき、エントロピ復号ユニット60は、可能な予測モードの組の1つまたは複数の予測モードを削除することができる(130)。エントロピ復号ユニット60は、上側および左側の近隣ブロックの予測モードを、可能な予測モードの組から削除することができる。上側および左側の近隣ブロックが同じ予測モードを有する場合、エントロピ復号ユニット60は、上記で詳細に説明したように、近隣ブロックの予測モード、および少なくとも1つの他の予測モードを削除することができる。
本開示の様々な実施形態について説明した。これらおよび他の実施形態は、以下の特許請求の範囲内に含まれる。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
(1) ビデオデータをエンコードする方法であって、
符号化単位のビデオブロックの予測ブロックの生成に使用するために、単方向の予測モードと少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードとを含む、複数の予測モードのうちの1つを選択することと、
前記符号化単位の1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、前記現在のビデオブロックの前記予測モードをエンコードすることと、
を備える方法。
(2) 前記符号化単位の前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードに基づいて、前記ビデオブロックの前記予測モードのエンコードに使用するために、複数の符号化コンテキストのうちの1つを選択することをさらに備え、エンコードすることが前記選択された符号化コンテキストに従ってエンコードすることを備える(1)に記載の方法。
(3) 前記符号化コンテキストのうちの1つを選択することが、
前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて単方向の予測モードであるときには、第1の符号化コンテキストを選択することと、
前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて多方向の予測モードであるときには、第2の符号化コンテキストを選択することと、
前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて単方向ではなく、すべて多方向でもないときには、第3の符号化コンテキストを選択することと、
を備える(2)に記載の方法。
(4) 残差ブロックを形成するために、前記選択された予測モードを使用して生成された前記予測モードを、前記ビデオブロックから取り除くことと、
前記選択された予測モードに基づいて、前記残差ブロックに適用するための変換を選択することと、
残差変換係数を生成するために、前記選択された変換を前記残差ブロックに適用することと、
をさらに備える(1)に記載の方法。
(5) 前記残差ブロックに適用するための前記変換を選択することが、
前記選択された予測モードが限定された方向性を示すときには、前記残差ブロックに適用するために、離散的コサイン変換(DCT)および整数変換のうちの一方を選択することと、
前記選択された予測モードが方向性を示すときには、前記残差ブロックに適用するために、方向変換を選択することと、
を備える(4)に記載の方法。
(6) 前記DCTおよび前記整数変換のうちの一方を選択することが、前記選択された予測モードがDCの単方向の予測モード、または実質的に直交する方向を指す少なくとも2つの予測モードを組み合わせた多方向の予測モードであるときには、前記残差ブロックに適用するために、前記DCTおよび前記整数変換のうちの一方を選択することを備える(5)に記載の方法。
(7) 複数の方向変換を格納することをさらに備え、前記複数の方向変換のそれぞれが、方向性を示す前記予測モードのうちの1つに対応し、前記方向変換を選択することが、前記選択された予測モードに対応する前記複数の方向変換のうちの前記1つを選択することを備える(5)に記載の方法。
(8) 前記予測モードのうちの1つにそれぞれ対応する複数の方向変換を格納することをさらに備え、前記方向変換のそれぞれが、サイズN×Nの列変換行列、およびサイズN×Nの行変換行列を備え、N×Nが前記ビデオブロックの大きさである(4)に記載の方法。
(9) 前記予測モードのうちの1つにそれぞれ対応する複数の方向変換を格納することをさらに備え、前記複数の方向変換のそれぞれが、サイズN ×N の変換行列を備え、Nが前記ビデオブロックの大きさである(4)に記載の方法。
(10) 前記複数の予測モードが単方向の予測モードと可能な双方向の予測モードのサブセットとを含み、前記双方向の予測モードのサブセットが前記単方向の予測モードのそれぞれを含む少なくとも1つの組合せを含む(1)に記載の方法。
(11) 前記符号化単位の1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、前記現在のビデオブロックの前記予測モードをエンコードすることが、
前記現在のブロックの前記予測モードが前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードのうちの1つと同じであることを示すために、前記予測モードを表す第1のビットをエンコードすることと、
前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードが互いに同じではないとき、前記1つまたは複数の前にエンコードされたビデオブロックのうちのどれが前記ビデオブロックの前記予測モードと同じ予測モードを有するかを示すために、前記予測モードを表す少なくとも1つの追加ビットをエンコードすることと、
を備える(1)に記載の方法。
(12) 前記符号化単位の1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、前記現在のビデオブロックの前記予測モードをエンコードすることが、
前記現在のブロックの前記予測モードが前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードのうちのいずれとも同じではないことを示すために、前記予測モードを表す第1のビットをエンコードすることと、
前記複数の予測モードから前記1つまたは複数の前にエンコードされたビデオブロックの少なくとも前記予測モードを削除することと、
前記符号化単位の前記前にエンコードされたビデオブロックのうちの2つ以上が同じ予測モードを有しているとき、前記1つまたは複数の前にエンコードされたビデオブロックの予測モードではない少なくとも1つの追加の予測モードを削除することと、
前記複数の予測モードの前記残りの予測モード中の予測モード識別子を仮に再配列することと、
前記現在のビデオブロックの前記予測モードに対応する前記予測モード識別子を識別する符号語をエンコードすることと、
を備える(1)に記載の方法。
(13) ビデオデータをエンコードする装置であって、
符号化単位のビデオブロックの予測ブロックの生成に使用するために、単方向の予測モードと少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードとを含む、複数の予測モードのうちの1つを選択する予測ユニットと、
前記符号化単位の1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、前記現在のビデオブロックの前記予測モードをエンコードするエントロピエンコーディングユニットと、
を備える装置。
(14) 前記エントロピエンコーディングユニットが、前記符号化単位の前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードに基づいて、前記ビデオブロックの前記予測モードのエンコードに使用するために、複数の符号化コンテキストのうちの1つを選択し、前記選択された符号化コンテキストに従って前記予測モードをエンコードする(13)に記載の装置。
(15) 前記エントロピエンコーディングユニットが、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて単方向の予測モードであるときには第1の符号化コンテキストを選択し、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて多方向の予測モードであるときには第2の符号化コンテキストを選択し、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて単方向ではなく、すべて多方向でもないときには第3の符号化コンテキストを選択する(14)に記載の装置。
(16) 前記選択された予測モードに基づいて、残差ブロックに適用するための変換を選択し、残差変換係数を生成するために、前記選択された変換を前記残差ブロックに適用する変換ユニットをさらに備え、前記エントロピエンコーディングユニットが前記残差変換係数をエンコードする(13)に記載の装置。
(17) 前記変換ユニットが、前記選択された予測モードが限定された方向性を示すときには、前記残差ブロックに適用するために、離散的コサイン変換(DCT)および整数変換のうちの一方を選択し、前記選択された予測モードが方向性を示すときには、前記残差ブロックに適用するために、方向変換を選択する(16)に記載の装置。
(18) 前記選択された予測モードがDCの単方向の予測モード、または実質的に直交する方向を指す少なくとも2つの予測モードを組み合わせた多方向の予測モードであるときには、前記変換ユニットが、前記残差ブロックに適用するために、前記DCTおよび前記整数変換のうちの一方を選択する(17)に記載の装置。
(19) 複数の方向変換を格納するメモリをさらに備え、前記複数の方向変換のそれぞれが、方向性を示す前記予測モードのうちの1つに対応し、前記変換ユニットが、前記選択された予測モードに対応する前記複数の方向変換のうちの前記1つを選択する(17)に記載の装置。
(20) 前記予測モードのうちの1つにそれぞれ対応する複数の方向変換を格納するメモリをさらに備え、前記方向変換のそれぞれが、サイズN×Nの列変換行列、およびサイズN×Nの行変換行列を備え、N×Nが前記ビデオブロックの大きさである(16)に記載の装置。
(21) 前記予測モードのうちの1つにそれぞれ対応する複数の方向変換を格納するメモリをさらに備え、前記複数の方向変換のそれぞれが、サイズN ×N の変換行列を備え、Nが前記ビデオブロックの大きさである(16)に記載の装置。
(22) 前記複数の予測モードが単方向の予測モードと可能な双方向の予測モードのサブセットとを含み、前記双方向の予測モードのサブセットが前記単方向の予測モードのそれぞれを含む少なくとも1つの組合せを含む(13)に記載の装置。
(23) 前記エントロピエンコーディングユニットが、
前記現在のブロックの前記予測モードが前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードのうちの1つと同じであることを示すために、前記予測モードを表す第1のビットをエンコードし、
前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードが互いに同じではないとき、前記1つまたは複数の前にエンコードされたビデオブロックのうちのどれが前記ビデオブロックの前記予測モードと同じ予測モードを有するかを示す少なくとも1つの追加ビットをエンコードする、
(13)に記載の装置。
(24) 前記予測ユニットが、
前記複数の予測モードから前記1つまたは複数の前にエンコードされたビデオブロックの少なくとも前記予測モードを削除し、
前記符号化単位の前記前にエンコードされたビデオブロックのうちの2つ以上が同じ予測モードを有しているとき、前記1つまたは複数の前にエンコードされたビデオブロックの予測モードではない少なくとも1つの追加の予測モードを削除し、
前記複数の予測モードの前記残りの予測モード中の予測モード識別子を仮に再配列し、
前記エントロピエンコーディングユニットが、
前記現在のブロックの前記予測モードが前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードのうちのいずれとも同じではないことを示すために、前記予測モードを表す第1のビットをエンコードし、
前記現在のビデオブロックの前記予測モードに対応する前記予測モード識別子を識別する符号語をエンコードする、
(13)に記載の装置。
(25) 前記装置が無線通信装置を備える(13)に記載の装置。
(26) 前記装置が集積回路装置を備える(13)に記載の装置。
(27) ビデオ符号化装置において実行されると、前記装置にビデオブロックを符号化させる命令を備えるコンピュータ可読媒体であって、前記命令が、前記装置に、
符号化単位のビデオブロックの予測ブロックの生成に使用するために、単方向の予測モードと少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードとを含む、複数の予測モードのうちの1つを選択させ、
前記符号化単位の1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、前記現在のビデオブロックの前記予測モードをエンコードさせる、
コンピュータ可読媒体。
(28) 前記装置に、前記符号化単位の前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードに基づいて、前記ビデオブロックの前記予測モードのエンコードに使用するために、複数の符号化コンテキストのうちの1つを選択させる命令をさらに備え、エンコードすることが前記選択された符号化コンテキストに従ってエンコードすることを備える(27)に記載のコンピュータ可読媒体。
(29)
前記命令が前記装置に、
前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて単方向の予測モードであるときには、第1の符号化コンテキストを選択させ、
前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて多方向の予測モードであるときには、第2の符号化コンテキストを選択させ、
前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて単方向ではなく、すべて多方向でもないときには、第3の符号化コンテキストを選択させる、
(28)に記載のコンピュータ可読媒体。
(30) 前記装置に、
残差ブロックを形成するために、前記選択された予測モードを使用して生成された前記予測モードを、前記ビデオブロックから取り除かせ、
前記選択された予測モードに基づいて、前記残差ブロックに適用するための変換を選択させ、
残差変換係数を生成するために、前記選択された変換を前記残差ブロックに適用させる、
命令をさらに備える(27)に記載のコンピュータ可読媒体。
(31) 前記命令が前記装置に、
前記選択された予測モードが限定された方向性を示すときには、前記残差ブロックに適用するために、離散的コサイン変換(DCT)および整数変換のうちの一方を選択させ、
前記選択された予測モードが方向性を示すときには、前記残差ブロックに適用するために、方向変換を選択させる、
(30)に記載のコンピュータ可読媒体。
(32) 前記選択された予測モードがDCの単方向の予測モード、または実質的に直交する方向を指す少なくとも2つの予測モードを組み合わせた多方向の予測モードであるときには、前記命令が前記装置に、前記残差ブロックに適用するために、前記DCTおよび前記整数変換のうちの一方を選択させる(31)に記載のコンピュータ可読媒体。
(33) 前記装置に複数の方向変換を格納させる命令をさらに備え、前記複数の方向変換のそれぞれが、方向性を示す前記予測モードのうちの1つに対応し、前記方向変換を選択することが、前記選択された予測モードに対応する前記複数の方向変換のうちの前記1つを選択することを備える(31)に記載のコンピュータ可読媒体。
(34) 前記装置に前記予測モードのうちの1つにそれぞれ対応する複数の方向変換を格納させる命令をさらに備え、前記方向変換のそれぞれが、サイズN×Nの列変換行列、およびサイズN×Nの行変換行列を備え、N×Nが前記ビデオブロックの大きさである(30)に記載のコンピュータ可読媒体。
(35) 前記装置に前記予測モードのうちの1つにそれぞれ対応する複数の方向変換を格納させる命令をさらに備え、前記複数の方向変換のそれぞれが、サイズN ×N の変換行列を備え、Nが前記ビデオブロックの大きさである(30)に記載のコンピュータ可読媒体。
(36) 前記複数の予測モードが単方向の予測モードと可能な双方向の予測モードのサブセットとを含み、前記双方向の予測モードのサブセットが前記単方向の予測モードのそれぞれを含む少なくとも1つの組合せを含む(27)に記載のコンピュータ可読媒体。
(37) 前記命令が前記装置に、
前記現在のブロックの前記予測モードが前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードのうちの1つと同じであることを示すために、前記予測モードを表す第1のビットをエンコードさせ、
前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードが互いに同じではないとき、前記1つまたは複数の前にエンコードされたビデオブロックのうちのどれが前記ビデオブロックの前記予測モードと同じ予測モードを有するかを示すために、前記予測モードを表す少なくとも1つの追加ビットをエンコードさせる、
(27)に記載のコンピュータ可読媒体。
(38) 前記命令が前記装置に、
前記現在のブロックの前記予測モードが前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードのうちのいずれとも同じではないことを示すために、前記予測モードを表す第1のビットをエンコードさせ、
前記複数の予測モードから前記1つまたは複数の前にエンコードされたビデオブロックの少なくとも前記予測モードを削除させ、
前記符号化単位の前記前にエンコードされたビデオブロックのうちの2つ以上が同じ予測モードを有しているとき、前記1つまたは複数の前にエンコードされたビデオブロックの予測モードではない少なくとも1つの追加の予測モードを削除させ、
前記複数の予測モードの前記残りの予測モード中の予測モード識別子を仮に再配列させ、
前記現在のビデオブロックの前記予測モードに対応する前記予測モード識別子を識別する符号語をエンコードさせる、
(27)に記載のコンピュータ可読媒体。
(39) ビデオデータをエンコードする装置であって、
符号化単位のビデオブロックの予測ブロックの生成に使用するために、単方向の予測モードと少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードとを含む、複数の予測モードのうちの1つを選択するための手段と、
前記符号化単位の1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、前記現在のビデオブロックの前記予測モードをエンコードするための手段と、
を備える装置。
(40) 前記符号化単位の前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードに基づいて、前記ビデオブロックの前記予測モードのエンコードに使用するために、複数の符号化コンテキストのうちの1つを選択するための手段をさらに備え、エンコードすることが前記選択された符号化コンテキストに従ってエンコードすることを備える(39)に記載の装置。
(41) 前記選択手段が、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて単方向の予測モードであるときには第1の符号化コンテキストを選択し、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて多方向の予測モードであるときには第2の符号化コンテキストを選択し、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて単方向ではなく、すべて多方向でもないときには第3の符号化コンテキストを選択する(40)に記載の装置。
(42) 残差ブロックを形成するために、前記選択された予測モードを使用して生成された前記予測ブロックを、前記ビデオブロックから取り除くための手段と、
前記選択された予測モードに基づいて、残差ブロックに適用するための変換を選択するための手段と、
残差変換係数を生成するために、前記選択された変換を前記残差ブロックに適用するための手段と、
をさらに備える(39)に記載の装置。
(43) 前記変換選択手段が、前記選択された予測モードが限定された方向性を示すときには、前記残差ブロックに適用するために、離散的コサイン変換(DCT)および整数変換のうちの一方を選択し、前記選択された予測モードが方向性を示すときには、前記残差ブロックに適用するために、方向変換を選択する(42)に記載の装置。
(44) 前記選択された予測モードがDCの単方向の予測モード、または実質的に直交する方向を指す少なくとも2つの予測モードを組み合わせた多方向の予測モードであるときには、前記変換選択手段が、前記残差ブロックに適用するために、前記DCTおよび前記整数変換のうちの一方を選択する(43)に記載の装置。
(45) 複数の方向変換を格納するための手段をさらに備え、前記複数の方向変換のそれぞれが、方向性を示す前記予測モードのうちの1つに対応し、前記変換選択手段が、前記選択された予測モードに対応する前記複数の方向変換のうちの前記1つを選択する(43)に記載の装置。
(46) 前記予測モードのうちの1つにそれぞれ対応する複数の方向変換を格納するための手段をさらに備え、前記方向変換のそれぞれが、サイズN×Nの列変換行列、およびサイズN×Nの行変換行列を備え、N×Nが前記ビデオブロックの大きさである(42)に記載の装置。
(47) 前記予測モードのうちの1つにそれぞれ対応する複数の方向変換を格納することをさらに備え、前記複数の方向変換のそれぞれが、サイズN ×N の変換行列を備え、Nが前記ビデオブロックの大きさである(42)に記載の装置。
(48) 前記複数の予測モードが単方向の予測モードと可能な双方向の予測モードのサブセットとを含み、前記双方向の予測モードのサブセットが前記単方向の予測モードのそれぞれを含む少なくとも1つの組合せを含む(39)に記載の装置。
(49) 前記エンコード手段が、前記現在のブロックの前記予測モードが前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードのうちの1つと同じであることを示すために、前記予測モードを表す第1のビットをエンコードし、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードが互いに同じではないとき、前記1つまたは複数の前にエンコードされたビデオブロックのうちのどれが前記ビデオブロックの前記予測モードと同じ予測モードを有するかを示すために、前記予測モードを表す少なくとも1つの追加ビットをエンコードする(39)に記載の装置。
(50) 前記予測モード選択手段が、
前記複数の予測モードから前記1つまたは複数の前にエンコードされたビデオブロックの少なくとも前記予測モードを削除し、
前記符号化単位の前記前にエンコードされたビデオブロックのうちの2つ以上が同じ予測モードを有しているとき、前記1つまたは複数の前にエンコードされたビデオブロックの予測モードではない少なくとも1つの追加の予測モードを削除し、
前記複数の予測モードの前記残りの予測モード中の予測モード識別子を仮に再配列し、
前記エンコード手段が、
前記現在のブロックの前記予測モードが前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードのうちのいずれとも同じではないことを示すために、前記予測モードを表す第1のビットをエンコードし、
前記現在のビデオブロックの前記予測モードに対応する前記予測モード識別子を識別する符号語をエンコードする、
(39)に記載の装置。
(51) ビデオデータを復号する方法であって、
符号化単位のビデオブロックのエンコードされたビデオデータを受信することと、
前記符号化単位の1つまたは複数の前に復号されたビデオブロックの予測モードに基づいて、前記ビデオブロックの予測ブロックの生成に使用するための、単方向の予測モードと少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードとを含む、複数の予測モードのうちの1つを識別するために、前記エンコードされたビデオデータを復号することと、
を備える方法。
(52) 前記符号化単位の前記1つまたは複数の前に復号されたビデオブロックの前記予測モードに基づいて、前記ビデオブロックの前記予測モードの復号に使用するために、複数の符号化コンテキストのうちの1つを選択することをさらに備え、復号することが前記選択された符号化コンテキストに従って復号することを備える(51)に記載の方法。
(53) 前記複数の符号化コンテキストのうちの1つを選択することが、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて単方向の予測モードであるときには、第1の符号化コンテキストを選択することと、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて多方向の予測モードであるときには、第2の符号化コンテキストを選択することと、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて単方向ではなく、すべて多方向でもないときには、第3の符号化コンテキストを選択することと、
を備える(52)に記載の方法。
(54) 前記識別された予測モードに基づいて、前記ビデオブロックの残差変換係数に適用するために、逆変換を選択することと、
残差データを生成するために、前記ビデオブロックの前記残差変換係数に前記選択された逆変換を適用することと、
をさらに備える(51)に記載の方法。
(55) 前記変換された残差係数に適用するための逆変換を選択することが、
前記識別された予測モードが限定された方向性を示すときには、前記ビデオブロックの前記残差変換係数に適用するために、逆離散的コサイン変換(逆DCT)および逆整数変換のうちの一方を選択することと、
前記識別された予測モードが方向性を示すときには、前記ビデオブロックの前記残差変換係数に適用するために、逆方向変換を選択することと、
を備える(54)に記載の方法。
(56) 前記逆DCTおよび前記逆整数変換のうちの一方を選択することが、前記識別された予測モードがDCの単方向の予測モード、または実質的に直交する方向を指す少なくとも2つの予測モードを組み合わせた多方向の予測モードであるときには、前記ビデオブロックの前記残差変換係数に適用するために、前記逆DCTおよび逆整数変換のうちの一方を選択することを備える(55)に記載の方法。
(57) 方向性を示す前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納することをさらに備え、前記逆方向変換を選択することが、前記識別された予測モードに対応する前記複数の逆方向変換のうちの前記1つを選択することを備える(55)に記載の方法。
(58) 前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納することをさらに備え、前記複数の逆方向変換のそれぞれが、サイズN×Nの列変換行列、およびサイズN×Nの行変換行列を備え、N×Nが前記ビデオブロックの大きさである(54)に記載の方法。
(59) 前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納することをさらに備え、前記複数の逆方向変換のそれぞれが、サイズN ×N の変換行列を備え、N×Nが前記ビデオブロックの大きさである(54)に記載の方法。
(60) 前記複数の予測モードが単方向の予測モードと可能な双方向の予測モードのサブセットとを含み、前記双方向の予測モードのサブセットが前記単方向の予測モードのそれぞれを含む少なくとも1つの組合せを含む(51)に記載の方法。
(61) 前記符号化単位の1つまたは複数の前に復号されたビデオブロックの予測モードに基づいて、前記ビデオブロックの予測ブロックの生成に使用するための前記複数の予測モードのうちの1つを識別するために、前記エンコードされたビデオデータを復号することが、
前記予測モードを表す第1のエンコードされたビットに基づいて、前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードを、前記1つまたは複数の前に復号されたビデオブロックの前記予測モードのうちの1つとして識別することと、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードが同じであるとき、前記1つまたは複数の前に復号されたビデオブロックのうちの任意のものの前記予測モードを選択することと、
を備える(51)に記載の方法。
(62) 前記1つまたは複数の前に復号されたビデオブロックの前記予測モードが同じではないとき、前記予測モードを表す少なくとも1つの追加のエンコードされたビットに基づいて、前記1つまたは複数の前に復号されたビデオブロックのうちのどれが前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードと同じ予測モードを有するかを識別することと、
前記識別された前に復号されたビデオブロックの前記予測モードを選択することと、
をさらに備える(61)に記載の方法。
(63) 前記符号化単位の1つまたは複数の前に復号されたビデオブロックの予測モードに基づいて、前記ビデオブロックの予測ブロックの生成に使用するための前記複数の予測モードのうちの1つを識別するために、前記エンコードされたビデオデータを復号することが、
前記予測モードを表す第1のエンコードされたビットに基づいて、前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードを、前記1つまたは複数の前に復号されたビデオブロックの前記予測モードのいずれでもないと識別することと、
前記複数の予測モードから前記1つまたは複数の前に復号されたビデオブロックの少なくとも前記予測モードを削除することと、
前記符号化単位の前記前にエンコードされたビデオブロックのうちの2つ以上が同じ予測モードを有しているとき、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードではない少なくとも1つの追加の予測モードを削除することと、
前記複数の予測モードの前記残りの予測モード中の予測モード識別子を仮に再配列することと、
前記現在のビデオブロックの予測ブロックの生成に使用するための前記予測モードに対応する前記予測モード識別子を識別するための符号語を復号することと、
を備える(51)に記載の方法。
(64) ビデオデータを復号する装置であって、
符号化単位の1つまたは複数の前に復号されたビデオブロックの予測モードに基づいて、前記ビデオブロックの予測ブロックの生成に使用するための、単方向の予測モードと少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードとを含む、複数の予測モードのうちの1つを識別するために、前記符号化単位のビデオブロックのエンコードされたビデオデータを復号するエントロピ復号ユニットと、
前記復号された予測モードを使用して、前記予測ブロックを生成する予測ユニットと、
を備える装置。
(65) 前記エントロピ復号ユニットが、前記符号化単位の前記1つまたは複数の前に復号されたビデオブロックの前記予測モードに基づいて、前記ビデオブロックの前記予測モードの復号に使用するために、複数の符号化コンテキストのうちの1つを選択し、復号することが前記選択された符号化コンテキストに従って復号することを備える(64)に記載の装置。
(66) 前記エントロピ復号ユニットが、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて単方向の予測モードであるときには、第1の符号化コンテキストを選択し、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて多方向の予測モードであるときには、第2の符号化コンテキストを選択し、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて単方向ではなく、すべて多方向でもないときには、第3の符号化コンテキストを選択する、
(65)に記載の装置。
(67) 前記識別された予測モードに基づいて、前記ビデオブロックの残差変換係数に適用するために、逆変換を選択し、
残差データを生成するために、前記ビデオブロックの前記残差変換係数に前記選択された逆変換を適用する、
逆変換ユニットをさらに備える(64)に記載の装置。
(68) 前記逆変換ユニットが、
前記識別された予測モードが限定された方向性を示すときには、前記ビデオブロックの前記残差変換係数に適用するために、逆離散的コサイン変換(逆DCT)および逆整数変換のうちの一方を選択し、
前記識別された予測モードが方向性を示すときには、前記ビデオブロックの前記残差変換係数に適用するために、逆方向変換を選択する、
(67)に記載の装置。
(69) 前記識別された予測モードがDCの単方向の予測モード、または実質的に直交する方向を指す少なくとも2つの予測モードを組み合わせた多方向の予測モードのいずれかであるとき、前記逆変換ユニットが、前記ビデオブロックの前記残差変換係数に適用するために、前記逆DCTおよび逆整数変換のうちの一方を選択する(68)に記載の装置。
(70) 前記逆変換ユニットが、方向性を示す前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納し、前記識別された予測モードに対応する前記複数の逆方向変換のうちの前記1つを選択する(68)に記載の装置。
(71) 前記逆変換ユニットが、前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納し、前記複数の逆方向変換のそれぞれが、サイズN×Nの列変換行列、およびサイズN×Nの行変換行列を備え、N×Nが前記ビデオブロックの大きさである(67)に記載の装置。
(72) 前記逆変換ユニットが、前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納し、前記複数の逆方向変換のそれぞれが、サイズN ×N の変換行列を備え、N×Nが前記ビデオブロックの大きさである(67)に記載の装置。
(73) 前記複数の予測モードが単方向の予測モードと可能な双方向の予測モードのサブセットとを含み、前記双方向の予測モードのサブセットが前記単方向の予測モードのそれぞれを含む少なくとも1つの組合せを含む(64)に記載の装置。
(74) 前記復号ユニットが、
前記予測モードを表す第1のエンコードされたビットに基づいて、前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードを、前記1つまたは複数の前に復号されたビデオブロックの前記予測モードのうちの1つとして識別し、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードが同じであるとき、前記1つまたは複数の前に復号されたビデオブロックのうちの任意のものの前記予測モードを選択する、
(64)に記載の装置。
(75) 前記復号ユニットが、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードが同じではないとき、前記予測モードを表す少なくとも1つの追加のエンコードされたビットに基づいて、前記1つまたは複数の前に復号されたビデオブロックのうちのどれが前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードと同じ予測モードを有するかを識別し、
前記識別された前に復号されたビデオブロックの前記予測モードを選択する、
(74)に記載の装置。
(76) 前記復号ユニットが、
前記予測モードを表す第1のエンコードされたビットに基づいて、前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードを、前記1つまたは複数の前に復号されたビデオブロックの前記予測モードのいずれでもないと識別し、
前記複数の予測モードから前記1つまたは複数の前に復号されたビデオブロックの少なくとも前記予測モードを削除し、
前記符号化単位の前記前にエンコードされたビデオブロックのうちの2つ以上が同じ予測モードを有しているとき、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードではない少なくとも1つの追加の予測モードを削除し、
前記複数の予測モードの前記残りの予測モード中の予測モード識別子を仮に再配列し、
前記現在のビデオブロックの予測ブロックの生成に使用するための前記予測モードに対応する前記予測モード識別子を識別するための符号語を復号する、
(64)に記載の装置。
(77) 前記装置が無線通信装置を備える(64)に記載の装置。
(78) 前記装置が集積回路装置を備える(64)に記載の装置。
(79) ビデオ復号化装置において実行されると、前記装置にビデオブロックを復号化させる命令を備えるコンピュータ可読媒体であって、前記命令が前記装置に、
符号化単位のビデオブロックのエンコードされたビデオデータを受信させ、
前記符号化単位の1つまたは複数の前に復号されたビデオブロックの予測モードに基づいて、前記ビデオブロックの予測ブロックの生成に使用するための、単方向の予測モードと少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードとを含む、複数の予測モードのうちの1つを識別するために、前記エンコードされたビデオデータを復号させる、
コンピュータ可読媒体。
(80) 前記装置に、前記符号化単位の前記1つまたは複数の前に復号されたビデオブロックの前記予測モードに基づいて、前記ビデオブロックの前記予測モードの復号に使用するために、複数の符号化コンテキストのうちの1つを選択させる命令をさらに備え、復号することが前記選択された符号化コンテキストに従って復号することを備える(79)に記載のコンピュータ可読媒体。
(81) 前記命令が前記装置に、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて単方向の予測モードであるときには、第1の符号化コンテキストを選択させ、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて多方向の予測モードであるときには、第2の符号化コンテキストを選択させ、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて単方向ではなく、すべて多方向でもないときには、第3の符号化コンテキストを選択させる、
(80)に記載のコンピュータ可読媒体。
(82) 前記装置に、
前記識別された予測モードに基づいて、前記ビデオブロックの残差変換係数に適用するために、逆変換を選択させ、
残差データを生成するために、前記ビデオブロックの前記残差変換係数に前記選択された逆変換を適用させる、
命令をさらに備える(79)に記載のコンピュータ可読媒体。
(83) 前記命令が前記装置に、
前記識別された予測モードが限定された方向性を示すときには、前記ビデオブロックの前記残差変換係数に適用するために、逆離散的コサイン変換(逆DCT)および逆整数変換のうちの一方を選択させ、
前記識別された予測モードが方向性を示すときには、前記ビデオブロックの前記残差変換係数に適用するために、逆方向変換を選択させる、
(82)に記載のコンピュータ可読媒体。
(84) 前記識別された予測モードがDCの単方向の予測モード、または実質的に直交する方向を指す少なくとも2つの予測モードを組み合わせた多方向の予測モードであるとき、前記命令が前記装置に、前記ビデオブロックの前記残差変換係数に適用するために、前記逆DCTおよび逆整数変換のうちの1つを選択させる(83)に記載のコンピュータ可読媒体。
(85) 前記装置に方向性を示す前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納させる命令をさらに備え、前記逆方向変換を選択することが、前記識別された予測モードに対応する前記複数の逆方向変換のうちの前記1つを選択することを備える(83)に記載のコンピュータ可読媒体。
(86) 前記装置に前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納させる命令をさらに備え、前記複数の逆方向変換のそれぞれが、サイズN×Nの列変換行列、およびサイズN×Nの行変換行列を備え、N×Nが前記ビデオブロックの大きさである(82)に記載のコンピュータ可読媒体。
(87) 前記装置に前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納させる命令をさらに備え、前記複数の逆方向変換のそれぞれが、サイズN ×N の変換行列を備え、N×Nが前記ビデオブロックの大きさである(82)に記載のコンピュータ可読媒体。
(88) 前記複数の予測モードが単方向の予測モードと可能な双方向の予測モードのサブセットとを含み、前記双方向の予測モードのサブセットが前記単方向の予測モードのそれぞれを含む少なくとも1つの組合せを含む(79)に記載のコンピュータ可読媒体。
(89) 前記命令が前記装置に、
前記予測モードを表す第1のエンコードされたビットに基づいて、前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードを、前記1つまたは複数の前に復号されたビデオブロックの前記予測モードのうちの1つとして識別させ、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードが同じであるとき、前記1つまたは複数の前に復号されたビデオブロックのうちの任意のものの前記予測モードを選択させる、
(79)に記載のコンピュータ可読媒体。
(90) 前記装置に、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードが同じではないとき、前記予測モードを表す少なくとも1つの追加のエンコードされたビットに基づいて、前記1つまたは複数の前に復号されたビデオブロックのうちのどれが前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードと同じ予測モードを有するかを識別させ、
前記識別された前に復号されたビデオブロックの前記予測モードを選択させる、
命令をさらに備える(89)に記載のコンピュータ可読媒体。
(91) 前記命令が前記装置に、
前記予測モードを表す第1のエンコードされたビットに基づいて、前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードを、前記1つまたは複数の前に復号されたビデオブロックの前記予測モードのいずれでもないと識別させ、
前記複数の予測モードから前記1つまたは複数の前に復号されたビデオブロックの少なくとも前記予測モードを削除させ、
前記符号化単位の前記前にエンコードされたビデオブロックのうちの2つ以上が同じ予測モードを有しているとき、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードではない少なくとも1つの追加の予測モードを削除させ、
前記複数の予測モードの前記残りの予測モード中の予測モード識別子を仮に再配列させ、
前記現在のビデオブロックの予測ブロックの生成に使用するための前記予測モードに対応する前記予測モード識別子を識別するための符号語を復号させる、
(79)に記載のコンピュータ可読媒体。
(92) ビデオデータを復号する装置であって、
符号化単位のビデオブロックのエンコードされたビデオデータを受信するための手段と、
前記符号化単位の1つまたは複数の前に復号されたビデオブロックの予測モードに基づいて、前記ビデオブロックの予測ブロックの生成に使用するための、単方向の予測モードと少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードとを含む、複数の予測モードのうちの1つを識別するために、前記エンコードされたビデオデータを復号するための手段と、
を備える装置。
(93) 前記復号手段が、前記符号化単位の前記1つまたは複数の前に復号されたビデオブロックの前記予測モードに基づいて、前記ビデオブロックの前記予測モードの復号に使用するために、複数の符号化コンテキストのうちの1つを選択し、復号することが前記選択された符号化コンテキストに従って復号することを備える(92)に記載の装置。
(94) 前記復号手段が、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて単方向の予測モードであるときには、第1の符号化コンテキストを選択し、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて多方向の予測モードであるときには、第2の符号化コンテキストを選択し、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて単方向ではなく、すべて多方向でもないときには、第3の符号化コンテキストを選択する、
(93)に記載の装置。
(95) 残差変換係数を変換するための手段をさらに備え、前記変換手段が、
前記識別された予測モードに基づいて、前記ビデオブロックの残差変換係数に適用するために、逆変換を選択し、
残差データを生成するために、前記ビデオブロックの前記残差変換係数に前記選択された逆変換を適用する、
(92)に記載の装置。
(96) 前記変換手段が、
前記識別された予測モードが限定された方向性を示すときには、前記ビデオブロックの前記残差変換係数に適用するために、逆離散的コサイン変換(逆DCT)および逆整数変換のうちの一方を選択し、
前記識別された予測モードが方向性を示すときには、前記ビデオブロックの前記残差変換係数に適用するために、逆方向変換を選択する、
(95)に記載の装置。
(97) 前記識別された予測モードがDCの単方向の予測モード、または実質的に直交する方向を指す少なくとも2つの予測モードを組み合わせた多方向の予測モードのいずれかであるとき、前記変換手段が、前記ビデオブロックの前記残差変換係数に適用するために、前記逆DCTおよび逆整数変換のうちの一方を選択する(96)に記載の装置。
(98) 方向性を示す前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納するための手段をさらに備え、前記変換手段が前記識別された予測モードに対応する前記複数の逆方向変換のうちの前記1つを選択する(96)に記載の装置。
(99) 前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納するための手段をさらに備え、前記複数の逆方向変換のそれぞれが、サイズN×Nの列変換行列、およびサイズN×Nの行変換行列を備え、N×Nが前記ビデオブロックの大きさである(95)に記載の装置。
(100) 前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納するための手段をさらに備え、前記複数の逆方向変換のそれぞれが、サイズN ×N の変換行列を備え、N×Nが前記ビデオブロックの大きさである(95)に記載の装置。
(101) 前記複数の予測モードが単方向の予測モードと可能な双方向の予測モードのサブセットとを含み、前記双方向の予測モードのサブセットが前記単方向の予測モードのそれぞれを含む少なくとも1つの組合せを含む(92)に記載の装置。
(102) 前記復号手段が、
前記予測モードを表す第1のエンコードされたビットに基づいて、前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードを、前記1つまたは複数の前に復号されたビデオブロックの前記予測モードのうちの1つとして識別し、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードが同じであるとき、前記1つまたは複数の前に復号されたビデオブロックのうちの任意のものの前記予測モードを選択する、
(60)に記載の装置。
(103) 前記復号手段が、
前記1つまたは複数の前に復号されたビデオブロックの前記予測モードが同じではないとき、前記予測モードを表す少なくとも1つの追加のエンコードされたビットに基づいて、前記1つまたは複数の前に復号されたビデオブロックのうちのどれが前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードと同じ予測モードを有するかを識別し、
前記識別された前に復号されたビデオブロックの前記予測モードを選択する、
(102)に記載の装置。
(104) 前記復号手段が、
前記予測モードを表す第1のエンコードされたビットに基づいて、前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードを、前記1つまたは複数の前に復号されたビデオブロックの前記予測モードのいずれでもないと識別し、
前記複数の予測モードから前記1つまたは複数の前に復号されたビデオブロックの少なくとも前記予測モードを削除し、
前記符号化単位の前記前にエンコードされたビデオブロックのうちの2つ以上が同じ予測モードを有しているとき、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードではない少なくとも1つの追加の予測モードを削除し、
前記複数の予測モードの前記残りの予測モード中の予測モード識別子を仮に再配列し、
前記現在のビデオブロックの予測ブロックの生成に使用するための前記予測モードに対応する前記予測モード識別子を識別するための符号語を復号する、
(92)に記載の装置。

Claims (104)

  1. ビデオデータをエンコードする方法であって、
    符号化単位のビデオブロックの予測ブロックの生成に使用するために、単方向の予測モードと少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードとを含む、複数の予測モードのうちの1つを選択することと、
    前記符号化単位の1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、前記現在のビデオブロックの前記予測モードをエンコードすることと、
    を備える方法。
  2. 前記符号化単位の前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードに基づいて、前記ビデオブロックの前記予測モードのエンコードに使用するために、複数の符号化コンテキストのうちの1つを選択することをさらに備え、エンコードすることが前記選択された符号化コンテキストに従ってエンコードすることを備える請求項1に記載の方法。
  3. 前記符号化コンテキストのうちの1つを選択することが、
    前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて単方向の予測モードであるときには、第1の符号化コンテキストを選択することと、
    前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて多方向の予測モードであるときには、第2の符号化コンテキストを選択することと、
    前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて単方向ではなく、すべて多方向でもないときには、第3の符号化コンテキストを選択することと、
    を備える請求項2に記載の方法。
  4. 残差ブロックを形成するために、前記選択された予測モードを使用して生成された前記予測ブロックを、前記ビデオブロックから取り除くことと、
    前記選択された予測モードに基づいて、前記残差ブロックに適用するための変換を選択することと、
    残差変換係数を生成するために、前記選択された変換を前記残差ブロックに適用することと、
    をさらに備える請求項1に記載の方法。
  5. 前記残差ブロックに適用するための前記変換を選択することが、
    前記選択された予測モードが限定された方向性を示すときには、前記残差ブロックに適用するために、離散的コサイン変換(DCT)および整数変換のうちの一方を選択することと、
    前記選択された予測モードが方向性を示すときには、前記残差ブロックに適用するために、方向変換を選択することと、
    を備える請求項4に記載の方法。
  6. 前記DCTおよび前記整数変換のうちの一方を選択することが、前記選択された予測モードがDCの単方向の予測モード、または実質的に直交する方向を指す少なくとも2つの予測モードを組み合わせた多方向の予測モードであるときには、前記残差ブロックに適用するために、前記DCTおよび前記整数変換のうちの一方を選択することを備える請求項5に記載の方法。
  7. 複数の方向変換を格納することをさらに備え、前記複数の方向変換のそれぞれが、方向性を示す前記予測モードのうちの1つに対応し、前記方向変換を選択することが、前記選択された予測モードに対応する前記複数の方向変換のうちの前記1つを選択することを備える請求項5に記載の方法。
  8. 前記予測モードのうちの1つにそれぞれ対応する複数の方向変換を格納することをさらに備え、前記方向変換のそれぞれが、サイズN×Nの列変換行列、およびサイズN×Nの行変換行列を備え、N×Nが前記ビデオブロックの大きさである請求項4に記載の方法。
  9. 前記予測モードのうちの1つにそれぞれ対応する複数の方向変換を格納することをさらに備え、前記複数の方向変換のそれぞれが、サイズN×Nの変換行列を備え、Nが前記ビデオブロックの大きさである請求項4に記載の方法。
  10. 前記複数の予測モードが単方向の予測モードと可能な双方向の予測モードのサブセットとを含み、前記双方向の予測モードのサブセットが前記単方向の予測モードのそれぞれを含む少なくとも1つの組合せを含む請求項1に記載の方法。
  11. 前記符号化単位の1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、前記現在のビデオブロックの前記予測モードをエンコードすることが、
    前記現在のブロックの前記予測モードが前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードのうちの1つと同じであることを示すために、前記予測モードを表す第1のビットをエンコードすることと、
    前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードが互いに同じではないとき、前記1つまたは複数の前にエンコードされたビデオブロックのうちのどれが前記ビデオブロックの前記予測モードと同じ予測モードを有するかを示すために、前記予測モードを表す少なくとも1つの追加ビットをエンコードすることと、
    を備える請求項1に記載の方法。
  12. 前記符号化単位の1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、前記現在のビデオブロックの前記予測モードをエンコードすることが、
    前記現在のブロックの前記予測モードが前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードのうちのいずれとも同じではないことを示すために、前記予測モードを表す第1のビットをエンコードすることと、
    前記複数の予測モードから前記1つまたは複数の前にエンコードされたビデオブロックの少なくとも前記予測モードを削除することと、
    前記符号化単位の前記前にエンコードされたビデオブロックのうちの2つ以上が同じ予測モードを有しているとき、前記1つまたは複数の前にエンコードされたビデオブロックの予測モードではない少なくとも1つの追加の予測モードを削除することと、
    前記複数の予測モードの前記残りの予測モード中の予測モード識別子を仮に再配列することと、
    前記現在のビデオブロックの前記予測モードに対応する前記予測モード識別子を識別する符号語をエンコードすることと、
    を備える請求項1に記載の方法。
  13. ビデオデータをエンコードする装置であって、
    符号化単位のビデオブロックの予測ブロックの生成に使用するために、単方向の予測モードと少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードとを含む、複数の予測モードのうちの1つを選択する予測ユニットと、
    前記符号化単位の1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、前記現在のビデオブロックの前記予測モードをエンコードするエントロピエンコーディングユニットと、
    を備える装置。
  14. 前記エントロピエンコーディングユニットが、前記符号化単位の前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードに基づいて、前記ビデオブロックの前記予測モードのエンコードに使用するために、複数の符号化コンテキストのうちの1つを選択し、前記選択された符号化コンテキストに従って前記予測モードをエンコードする請求項13に記載の装置。
  15. 前記エントロピエンコーディングユニットが、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて単方向の予測モードであるときには第1の符号化コンテキストを選択し、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて多方向の予測モードであるときには第2の符号化コンテキストを選択し、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて単方向ではなく、すべて多方向でもないときには第3の符号化コンテキストを選択する請求項14に記載の装置。
  16. 前記選択された予測モードに基づいて、残差ブロックに適用するための変換を選択し、残差変換係数を生成するために、前記選択された変換を前記残差ブロックに適用する変換ユニットをさらに備え、前記エントロピエンコーディングユニットが前記残差変換係数をエンコードする請求項13に記載の装置。
  17. 前記変換ユニットが、前記選択された予測モードが限定された方向性を示すときには、前記残差ブロックに適用するために、離散的コサイン変換(DCT)および整数変換のうちの一方を選択し、前記選択された予測モードが方向性を示すときには、前記残差ブロックに適用するために、方向変換を選択する請求項16に記載の装置。
  18. 前記選択された予測モードがDCの単方向の予測モード、または実質的に直交する方向を指す少なくとも2つの予測モードを組み合わせた多方向の予測モードであるときには、前記変換ユニットが、前記残差ブロックに適用するために、前記DCTおよび前記整数変換のうちの一方を選択する請求項17に記載の装置。
  19. 複数の方向変換を格納するメモリをさらに備え、前記複数の方向変換のそれぞれが、方向性を示す前記予測モードのうちの1つに対応し、前記変換ユニットが、前記選択された予測モードに対応する前記複数の方向変換のうちの前記1つを選択する請求項17に記載の装置。
  20. 前記予測モードのうちの1つにそれぞれ対応する複数の方向変換を格納するメモリをさらに備え、前記方向変換のそれぞれが、サイズN×Nの列変換行列、およびサイズN×Nの行変換行列を備え、N×Nが前記ビデオブロックの大きさである請求項16に記載の装置。
  21. 前記予測モードのうちの1つにそれぞれ対応する複数の方向変換を格納するメモリをさらに備え、前記複数の方向変換のそれぞれが、サイズN×Nの変換行列を備え、Nが前記ビデオブロックの大きさである請求項16に記載の装置。
  22. 前記複数の予測モードが単方向の予測モードと可能な双方向の予測モードのサブセットとを含み、前記双方向の予測モードのサブセットが前記単方向の予測モードのそれぞれを含む少なくとも1つの組合せを含む請求項13に記載の装置。
  23. 前記エントロピエンコーディングユニットが、
    前記現在のブロックの前記予測モードが前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードのうちの1つと同じであることを示すために、前記予測モードを表す第1のビットをエンコードし、
    前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードが互いに同じではないとき、前記1つまたは複数の前にエンコードされたビデオブロックのうちのどれが前記ビデオブロックの前記予測モードと同じ予測モードを有するかを示す少なくとも1つの追加ビットをエンコードする、
    請求項13に記載の装置。
  24. 前記予測ユニットが、
    前記複数の予測モードから前記1つまたは複数の前にエンコードされたビデオブロックの少なくとも前記予測モードを削除し、
    前記符号化単位の前記前にエンコードされたビデオブロックのうちの2つ以上が同じ予測モードを有しているとき、前記1つまたは複数の前にエンコードされたビデオブロックの予測モードではない少なくとも1つの追加の予測モードを削除し、
    前記複数の予測モードの前記残りの予測モード中の予測モード識別子を仮に再配列し、
    前記エントロピエンコーディングユニットが、
    前記現在のブロックの前記予測モードが前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードのうちのいずれとも同じではないことを示すために、前記予測モードを表す第1のビットをエンコードし、
    前記現在のビデオブロックの前記予測モードに対応する前記予測モード識別子を識別する符号語をエンコードする、
    請求項13に記載の装置。
  25. 前記装置が無線通信装置を備える請求項13に記載の装置。
  26. 前記装置が集積回路装置を備える請求項13に記載の装置。
  27. ビデオ符号化装置において実行されると、前記装置にビデオブロックを符号化させる命令を備えるコンピュータ可読媒体であって、前記命令が、前記装置に、
    符号化単位のビデオブロックの予測ブロックの生成に使用するために、単方向の予測モードと少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードとを含む、複数の予測モードのうちの1つを選択させ、
    前記符号化単位の1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、前記現在のビデオブロックの前記予測モードをエンコードさせる、
    コンピュータ可読媒体。
  28. 前記装置に、前記符号化単位の前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードに基づいて、前記ビデオブロックの前記予測モードのエンコードに使用するために、複数の符号化コンテキストのうちの1つを選択させる命令をさらに備え、エンコードすることが前記選択された符号化コンテキストに従ってエンコードすることを備える請求項27に記載のコンピュータ可読媒体。
  29. 前記命令が前記装置に、
    前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて単方向の予測モードであるときには、第1の符号化コンテキストを選択させ、
    前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて多方向の予測モードであるときには、第2の符号化コンテキストを選択させ、
    前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて単方向ではなく、すべて多方向でもないときには、第3の符号化コンテキストを選択させる、
    請求項28に記載のコンピュータ可読媒体。
  30. 前記装置に、
    残差ブロックを形成するために、前記選択された予測モードを使用して生成された前記予測ブロックを、前記ビデオブロックから取り除かせ、
    前記選択された予測モードに基づいて、前記残差ブロックに適用するための変換を選択させ、
    残差変換係数を生成するために、前記選択された変換を前記残差ブロックに適用させる、
    命令をさらに備える請求項27に記載のコンピュータ可読媒体。
  31. 前記命令が前記装置に、
    前記選択された予測モードが限定された方向性を示すときには、前記残差ブロックに適用するために、離散的コサイン変換(DCT)および整数変換のうちの一方を選択させ、
    前記選択された予測モードが方向性を示すときには、前記残差ブロックに適用するために、方向変換を選択させる、
    請求項30に記載のコンピュータ可読媒体。
  32. 前記選択された予測モードがDCの単方向の予測モード、または実質的に直交する方向を指す少なくとも2つの予測モードを組み合わせた多方向の予測モードであるときには、前記命令が前記装置に、前記残差ブロックに適用するために、前記DCTおよび前記整数変換のうちの一方を選択させる請求項31に記載のコンピュータ可読媒体。
  33. 前記装置に複数の方向変換を格納させる命令をさらに備え、前記複数の方向変換のそれぞれが、方向性を示す前記予測モードのうちの1つに対応し、前記方向変換を選択することが、前記選択された予測モードに対応する前記複数の方向変換のうちの前記1つを選択することを備える請求項31に記載のコンピュータ可読媒体。
  34. 前記装置に前記予測モードのうちの1つにそれぞれ対応する複数の方向変換を格納させる命令をさらに備え、前記方向変換のそれぞれが、サイズN×Nの列変換行列、およびサイズN×Nの行変換行列を備え、N×Nが前記ビデオブロックの大きさである請求項30に記載のコンピュータ可読媒体。
  35. 前記装置に前記予測モードのうちの1つにそれぞれ対応する複数の方向変換を格納させる命令をさらに備え、前記複数の方向変換のそれぞれが、サイズN×Nの変換行列を備え、Nが前記ビデオブロックの大きさである請求項30に記載のコンピュータ可読媒体。
  36. 前記複数の予測モードが単方向の予測モードと可能な双方向の予測モードのサブセットとを含み、前記双方向の予測モードのサブセットが前記単方向の予測モードのそれぞれを含む少なくとも1つの組合せを含む請求項27に記載のコンピュータ可読媒体。
  37. 前記命令が前記装置に、
    前記現在のブロックの前記予測モードが前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードのうちの1つと同じであることを示すために、前記予測モードを表す第1のビットをエンコードさせ、
    前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードが互いに同じではないとき、前記1つまたは複数の前にエンコードされたビデオブロックのうちのどれが前記ビデオブロックの前記予測モードと同じ予測モードを有するかを示すために、前記予測モードを表す少なくとも1つの追加ビットをエンコードさせる、
    請求項27に記載のコンピュータ可読媒体。
  38. 前記命令が前記装置に、
    前記現在のブロックの前記予測モードが前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードのうちのいずれとも同じではないことを示すために、前記予測モードを表す第1のビットをエンコードさせ、
    前記複数の予測モードから前記1つまたは複数の前にエンコードされたビデオブロックの少なくとも前記予測モードを削除させ、
    前記符号化単位の前記前にエンコードされたビデオブロックのうちの2つ以上が同じ予測モードを有しているとき、前記1つまたは複数の前にエンコードされたビデオブロックの予測モードではない少なくとも1つの追加の予測モードを削除させ、
    前記複数の予測モードの前記残りの予測モード中の予測モード識別子を仮に再配列させ、
    前記現在のビデオブロックの前記予測モードに対応する前記予測モード識別子を識別する符号語をエンコードさせる、
    請求項27に記載のコンピュータ可読媒体。
  39. ビデオデータをエンコードする装置であって、
    符号化単位のビデオブロックの予測ブロックの生成に使用するために、単方向の予測モードと少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードとを含む、複数の予測モードのうちの1つを選択するための手段と、
    前記符号化単位の1つまたは複数の前にエンコードされたビデオブロックの予測モードに基づいて、前記現在のビデオブロックの前記予測モードをエンコードするための手段と、
    を備える装置。
  40. 前記符号化単位の前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードに基づいて、前記ビデオブロックの前記予測モードのエンコードに使用するために、複数の符号化コンテキストのうちの1つを選択するための手段をさらに備え、エンコードすることが前記選択された符号化コンテキストに従ってエンコードすることを備える請求項39に記載の装置。
  41. 前記選択手段が、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて単方向の予測モードであるときには第1の符号化コンテキストを選択し、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて多方向の予測モードであるときには第2の符号化コンテキストを選択し、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードがすべて単方向ではなく、すべて多方向でもないときには第3の符号化コンテキストを選択する請求項40に記載の装置。
  42. 残差ブロックを形成するために、前記選択された予測モードを使用して生成された前記予測ブロックを、前記ビデオブロックから取り除くための手段と、
    前記選択された予測モードに基づいて、残差ブロックに適用するための変換を選択するための手段と、
    残差変換係数を生成するために、前記選択された変換を前記残差ブロックに適用するための手段と、
    をさらに備える請求項39に記載の装置。
  43. 前記変換選択手段が、前記選択された予測モードが限定された方向性を示すときには、前記残差ブロックに適用するために、離散的コサイン変換(DCT)および整数変換のうちの一方を選択し、前記選択された予測モードが方向性を示すときには、前記残差ブロックに適用するために、方向変換を選択する請求項42に記載の装置。
  44. 前記選択された予測モードがDCの単方向の予測モード、または実質的に直交する方向を指す少なくとも2つの予測モードを組み合わせた多方向の予測モードであるときには、前記変換選択手段が、前記残差ブロックに適用するために、前記DCTおよび前記整数変換のうちの一方を選択する請求項43に記載の装置。
  45. 複数の方向変換を格納するための手段をさらに備え、前記複数の方向変換のそれぞれが、方向性を示す前記予測モードのうちの1つに対応し、前記変換選択手段が、前記選択された予測モードに対応する前記複数の方向変換のうちの前記1つを選択する請求項43に記載の装置。
  46. 前記予測モードのうちの1つにそれぞれ対応する複数の方向変換を格納するための手段をさらに備え、前記方向変換のそれぞれが、サイズN×Nの列変換行列、およびサイズN×Nの行変換行列を備え、N×Nが前記ビデオブロックの大きさである請求項42に記載の装置。
  47. 前記予測モードのうちの1つにそれぞれ対応する複数の方向変換を格納することをさらに備え、前記複数の方向変換のそれぞれが、サイズN×Nの変換行列を備え、Nが前記ビデオブロックの大きさである請求項42に記載の装置。
  48. 前記複数の予測モードが単方向の予測モードと可能な双方向の予測モードのサブセットとを含み、前記双方向の予測モードのサブセットが前記単方向の予測モードのそれぞれを含む少なくとも1つの組合せを含む請求項39に記載の装置。
  49. 前記エンコード手段が、前記現在のブロックの前記予測モードが前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードのうちの1つと同じであることを示すために、前記予測モードを表す第1のビットをエンコードし、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードが互いに同じではないとき、前記1つまたは複数の前にエンコードされたビデオブロックのうちのどれが前記ビデオブロックの前記予測モードと同じ予測モードを有するかを示すために、前記予測モードを表す少なくとも1つの追加ビットをエンコードする請求項39に記載の装置。
  50. 前記予測モード選択手段が、
    前記複数の予測モードから前記1つまたは複数の前にエンコードされたビデオブロックの少なくとも前記予測モードを削除し、
    前記符号化単位の前記前にエンコードされたビデオブロックのうちの2つ以上が同じ予測モードを有しているとき、前記1つまたは複数の前にエンコードされたビデオブロックの予測モードではない少なくとも1つの追加の予測モードを削除し、
    前記複数の予測モードの前記残りの予測モード中の予測モード識別子を仮に再配列し、
    前記エンコード手段が、
    前記現在のブロックの前記予測モードが前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードのうちのいずれとも同じではないことを示すために、前記予測モードを表す第1のビットをエンコードし、
    前記現在のビデオブロックの前記予測モードに対応する前記予測モード識別子を識別する符号語をエンコードする、
    請求項39に記載の装置。
  51. ビデオデータを復号する方法であって、
    符号化単位のビデオブロックのエンコードされたビデオデータを受信することと、
    前記符号化単位の1つまたは複数の前に復号されたビデオブロックの予測モードに基づいて、前記ビデオブロックの予測ブロックの生成に使用するための、単方向の予測モードと少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードとを含む、複数の予測モードのうちの1つを識別するために、前記エンコードされたビデオデータを復号することと、
    を備える方法。
  52. 前記符号化単位の前記1つまたは複数の前に復号されたビデオブロックの前記予測モードに基づいて、前記ビデオブロックの前記予測モードの復号に使用するために、複数の符号化コンテキストのうちの1つを選択することをさらに備え、復号することが前記選択された符号化コンテキストに従って復号することを備える請求項51に記載の方法。
  53. 前記複数の符号化コンテキストのうちの1つを選択することが、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて単方向の予測モードであるときには、第1の符号化コンテキストを選択することと、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて多方向の予測モードであるときには、第2の符号化コンテキストを選択することと、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて単方向ではなく、すべて多方向でもないときには、第3の符号化コンテキストを選択することと、
    を備える請求項52に記載の方法。
  54. 前記識別された予測モードに基づいて、前記ビデオブロックの残差変換係数に適用するために、逆変換を選択することと、
    残差データを生成するために、前記ビデオブロックの前記残差変換係数に前記選択された逆変換を適用することと、
    をさらに備える請求項51に記載の方法。
  55. 前記変換された残差係数に適用するための逆変換を選択することが、
    前記識別された予測モードが限定された方向性を示すときには、前記ビデオブロックの前記残差変換係数に適用するために、逆離散的コサイン変換(逆DCT)および逆整数変換のうちの一方を選択することと、
    前記識別された予測モードが方向性を示すときには、前記ビデオブロックの前記残差変換係数に適用するために、逆方向変換を選択することと、
    を備える請求項54に記載の方法。
  56. 前記逆DCTおよび前記逆整数変換のうちの一方を選択することが、前記識別された予測モードがDCの単方向の予測モード、または実質的に直交する方向を指す少なくとも2つの予測モードを組み合わせた多方向の予測モードであるときには、前記ビデオブロックの前記残差変換係数に適用するために、前記逆DCTおよび逆整数変換のうちの一方を選択することを備える請求項55に記載の方法。
  57. 方向性を示す前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納することをさらに備え、前記逆方向変換を選択することが、前記識別された予測モードに対応する前記複数の逆方向変換のうちの前記1つを選択することを備える請求項55に記載の方法。
  58. 前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納することをさらに備え、前記複数の逆方向変換のそれぞれが、サイズN×Nの列変換行列、およびサイズN×Nの行変換行列を備え、N×Nが前記ビデオブロックの大きさである請求項54に記載の方法。
  59. 前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納することをさらに備え、前記複数の逆方向変換のそれぞれが、サイズN×Nの変換行列を備え、N×Nが前記ビデオブロックの大きさである請求項54に記載の方法。
  60. 前記複数の予測モードが単方向の予測モードと可能な双方向の予測モードのサブセットとを含み、前記双方向の予測モードのサブセットが前記単方向の予測モードのそれぞれを含む少なくとも1つの組合せを含む請求項51に記載の方法。
  61. 前記符号化単位の1つまたは複数の前に復号されたビデオブロックの予測モードに基づいて、前記ビデオブロックの予測ブロックの生成に使用するための前記複数の予測モードのうちの1つを識別するために、前記エンコードされたビデオデータを復号することが、
    前記予測モードを表す第1のエンコードされたビットに基づいて、前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードを、前記1つまたは複数の前に復号されたビデオブロックの前記予測モードのうちの1つとして識別することと、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードが同じであるとき、前記1つまたは複数の前に復号されたビデオブロックのうちの任意のものの前記予測モードを選択することと、
    を備える請求項51に記載の方法。
  62. 前記1つまたは複数の前に復号されたビデオブロックの前記予測モードが同じではないとき、前記予測モードを表す少なくとも1つの追加のエンコードされたビットに基づいて、前記1つまたは複数の前に復号されたビデオブロックのうちのどれが前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードと同じ予測モードを有するかを識別することと、
    前記識別された前に復号されたビデオブロックの前記予測モードを選択することと、
    をさらに備える請求項61に記載の方法。
  63. 前記符号化単位の1つまたは複数の前に復号されたビデオブロックの予測モードに基づいて、前記ビデオブロックの予測ブロックの生成に使用するための前記複数の予測モードのうちの1つを識別するために、前記エンコードされたビデオデータを復号することが、
    前記予測モードを表す第1のエンコードされたビットに基づいて、前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードを、前記1つまたは複数の前に復号されたビデオブロックの前記予測モードのいずれでもないと識別することと、
    前記複数の予測モードから前記1つまたは複数の前に復号されたビデオブロックの少なくとも前記予測モードを削除することと、
    前記符号化単位の前記前にエンコードされたビデオブロックのうちの2つ以上が同じ予測モードを有しているとき、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードではない少なくとも1つの追加の予測モードを削除することと、
    前記複数の予測モードの前記残りの予測モード中の予測モード識別子を仮に再配列することと、
    前記現在のビデオブロックの予測ブロックの生成に使用するための前記予測モードに対応する前記予測モード識別子を識別するための符号語を復号することと、
    を備える請求項51に記載の方法。
  64. ビデオデータを復号する装置であって、
    符号化単位の1つまたは複数の前に復号されたビデオブロックの予測モードに基づいて、前記ビデオブロックの予測ブロックの生成に使用するための、単方向の予測モードと少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードとを含む、複数の予測モードのうちの1つを識別するために、前記符号化単位のビデオブロックのエンコードされたビデオデータを復号するエントロピ復号ユニットと、
    前記復号された予測モードを使用して、前記予測ブロックを生成する予測ユニットと、
    を備える装置。
  65. 前記エントロピ復号ユニットが、前記符号化単位の前記1つまたは複数の前に復号されたビデオブロックの前記予測モードに基づいて、前記ビデオブロックの前記予測モードの復号に使用するために、複数の符号化コンテキストのうちの1つを選択し、復号することが前記選択された符号化コンテキストに従って復号することを備える請求項64に記載の装置。
  66. 前記エントロピ復号ユニットが、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて単方向の予測モードであるときには、第1の符号化コンテキストを選択し、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて多方向の予測モードであるときには、第2の符号化コンテキストを選択し、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて単方向ではなく、すべて多方向でもないときには、第3の符号化コンテキストを選択する、
    請求項65に記載の装置。
  67. 前記識別された予測モードに基づいて、前記ビデオブロックの残差変換係数に適用するために、逆変換を選択し、
    残差データを生成するために、前記ビデオブロックの前記残差変換係数に前記選択された逆変換を適用する、
    逆変換ユニットをさらに備える請求項64に記載の装置。
  68. 前記逆変換ユニットが、
    前記識別された予測モードが限定された方向性を示すときには、前記ビデオブロックの前記残差変換係数に適用するために、逆離散的コサイン変換(逆DCT)および逆整数変換のうちの一方を選択し、
    前記識別された予測モードが方向性を示すときには、前記ビデオブロックの前記残差変換係数に適用するために、逆方向変換を選択する、
    請求項67に記載の装置。
  69. 前記識別された予測モードがDCの単方向の予測モード、または実質的に直交する方向を指す少なくとも2つの予測モードを組み合わせた多方向の予測モードのいずれかであるとき、前記逆変換ユニットが、前記ビデオブロックの前記残差変換係数に適用するために、前記逆DCTおよび逆整数変換のうちの一方を選択する請求項68に記載の装置。
  70. 前記逆変換ユニットが、方向性を示す前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納し、前記識別された予測モードに対応する前記複数の逆方向変換のうちの前記1つを選択する請求項68に記載の装置。
  71. 前記逆変換ユニットが、前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納し、前記複数の逆方向変換のそれぞれが、サイズN×Nの列変換行列、およびサイズN×Nの行変換行列を備え、N×Nが前記ビデオブロックの大きさである請求項67に記載の装置。
  72. 前記逆変換ユニットが、前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納し、前記複数の逆方向変換のそれぞれが、サイズN×Nの変換行列を備え、N×Nが前記ビデオブロックの大きさである請求項67に記載の装置。
  73. 前記複数の予測モードが単方向の予測モードと可能な双方向の予測モードのサブセットとを含み、前記双方向の予測モードのサブセットが前記単方向の予測モードのそれぞれを含む少なくとも1つの組合せを含む請求項64に記載の装置。
  74. 前記復号ユニットが、
    前記予測モードを表す第1のエンコードされたビットに基づいて、前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードを、前記1つまたは複数の前に復号されたビデオブロックの前記予測モードのうちの1つとして識別し、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードが同じであるとき、前記1つまたは複数の前に復号されたビデオブロックのうちの任意のものの前記予測モードを選択する、
    請求項64に記載の装置。
  75. 前記復号ユニットが、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードが同じではないとき、前記予測モードを表す少なくとも1つの追加のエンコードされたビットに基づいて、前記1つまたは複数の前に復号されたビデオブロックのうちのどれが前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードと同じ予測モードを有するかを識別し、
    前記識別された前に復号されたビデオブロックの前記予測モードを選択する、
    請求項74に記載の装置。
  76. 前記復号ユニットが、
    前記予測モードを表す第1のエンコードされたビットに基づいて、前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードを、前記1つまたは複数の前に復号されたビデオブロックの前記予測モードのいずれでもないと識別し、
    前記複数の予測モードから前記1つまたは複数の前に復号されたビデオブロックの少なくとも前記予測モードを削除し、
    前記符号化単位の前記前にエンコードされたビデオブロックのうちの2つ以上が同じ予測モードを有しているとき、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードではない少なくとも1つの追加の予測モードを削除し、
    前記複数の予測モードの前記残りの予測モード中の予測モード識別子を仮に再配列し、
    前記現在のビデオブロックの予測ブロックの生成に使用するための前記予測モードに対応する前記予測モード識別子を識別するための符号語を復号する、
    請求項64に記載の装置。
  77. 前記装置が無線通信装置を備える請求項64に記載の装置。
  78. 前記装置が集積回路装置を備える請求項64に記載の装置。
  79. ビデオ復号化装置において実行されると、前記装置にビデオブロックを復号化させる命令を備えるコンピュータ可読媒体であって、前記命令が前記装置に、
    符号化単位のビデオブロックのエンコードされたビデオデータを受信させ、
    前記符号化単位の1つまたは複数の前に復号されたビデオブロックの予測モードに基づいて、前記ビデオブロックの予測ブロックの生成に使用するための、単方向の予測モードと少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードとを含む、複数の予測モードのうちの1つを識別するために、前記エンコードされたビデオデータを復号させる、
    コンピュータ可読媒体。
  80. 前記装置に、前記符号化単位の前記1つまたは複数の前に復号されたビデオブロックの前記予測モードに基づいて、前記ビデオブロックの前記予測モードの復号に使用するために、複数の符号化コンテキストのうちの1つを選択させる命令をさらに備え、復号することが前記選択された符号化コンテキストに従って復号することを備える請求項79に記載のコンピュータ可読媒体。
  81. 前記命令が前記装置に、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて単方向の予測モードであるときには、第1の符号化コンテキストを選択させ、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて多方向の予測モードであるときには、第2の符号化コンテキストを選択させ、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて単方向ではなく、すべて多方向でもないときには、第3の符号化コンテキストを選択させる、
    請求項80に記載のコンピュータ可読媒体。
  82. 前記装置に、
    前記識別された予測モードに基づいて、前記ビデオブロックの残差変換係数に適用するために、逆変換を選択させ、
    残差データを生成するために、前記ビデオブロックの前記残差変換係数に前記選択された逆変換を適用させる、
    命令をさらに備える請求項79に記載のコンピュータ可読媒体。
  83. 前記命令が前記装置に、
    前記識別された予測モードが限定された方向性を示すときには、前記ビデオブロックの前記残差変換係数に適用するために、逆離散的コサイン変換(逆DCT)および逆整数変換のうちの一方を選択させ、
    前記識別された予測モードが方向性を示すときには、前記ビデオブロックの前記残差変換係数に適用するために、逆方向変換を選択させる、
    請求項82に記載のコンピュータ可読媒体。
  84. 前記識別された予測モードがDCの単方向の予測モード、または実質的に直交する方向を指す少なくとも2つの予測モードを組み合わせた多方向の予測モードであるとき、前記命令が前記装置に、前記ビデオブロックの前記残差変換係数に適用するために、前記逆DCTおよび逆整数変換のうちの1つを選択させる請求項83に記載のコンピュータ可読媒体。
  85. 前記装置に方向性を示す前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納させる命令をさらに備え、前記逆方向変換を選択することが、前記識別された予測モードに対応する前記複数の逆方向変換のうちの前記1つを選択することを備える請求項83に記載のコンピュータ可読媒体。
  86. 前記装置に前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納させる命令をさらに備え、前記複数の逆方向変換のそれぞれが、サイズN×Nの列変換行列、およびサイズN×Nの行変換行列を備え、N×Nが前記ビデオブロックの大きさである請求項82に記載のコンピュータ可読媒体。
  87. 前記装置に前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納させる命令をさらに備え、前記複数の逆方向変換のそれぞれが、サイズN×Nの変換行列を備え、N×Nが前記ビデオブロックの大きさである請求項82に記載のコンピュータ可読媒体。
  88. 前記複数の予測モードが単方向の予測モードと可能な双方向の予測モードのサブセットとを含み、前記双方向の予測モードのサブセットが前記単方向の予測モードのそれぞれを含む少なくとも1つの組合せを含む請求項79に記載のコンピュータ可読媒体。
  89. 前記命令が前記装置に、
    前記予測モードを表す第1のエンコードされたビットに基づいて、前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードを、前記1つまたは複数の前に復号されたビデオブロックの前記予測モードのうちの1つとして識別させ、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードが同じであるとき、前記1つまたは複数の前に復号されたビデオブロックのうちの任意のものの前記予測モードを選択させる、
    請求項79に記載のコンピュータ可読媒体。
  90. 前記装置に、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードが同じではないとき、前記予測モードを表す少なくとも1つの追加のエンコードされたビットに基づいて、前記1つまたは複数の前に復号されたビデオブロックのうちのどれが前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードと同じ予測モードを有するかを識別させ、
    前記識別された前に復号されたビデオブロックの前記予測モードを選択させる、
    命令をさらに備える請求項89に記載のコンピュータ可読媒体。
  91. 前記命令が前記装置に、
    前記予測モードを表す第1のエンコードされたビットに基づいて、前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードを、前記1つまたは複数の前に復号されたビデオブロックの前記予測モードのいずれでもないと識別させ、
    前記複数の予測モードから前記1つまたは複数の前に復号されたビデオブロックの少なくとも前記予測モードを削除させ、
    前記符号化単位の前記前にエンコードされたビデオブロックのうちの2つ以上が同じ予測モードを有しているとき、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードではない少なくとも1つの追加の予測モードを削除させ、
    前記複数の予測モードの前記残りの予測モード中の予測モード識別子を仮に再配列させ、
    前記現在のビデオブロックの予測ブロックの生成に使用するための前記予測モードに対応する前記予測モード識別子を識別するための符号語を復号させる、
    請求項79に記載のコンピュータ可読媒体。
  92. ビデオデータを復号する装置であって、
    符号化単位のビデオブロックのエンコードされたビデオデータを受信するための手段と、
    前記符号化単位の1つまたは複数の前に復号されたビデオブロックの予測モードに基づいて、前記ビデオブロックの予測ブロックの生成に使用するための、単方向の予測モードと少なくとも2つの単方向の予測モードを組み合わせた多方向の予測モードとを含む、複数の予測モードのうちの1つを識別するために、前記エンコードされたビデオデータを復号するための手段と、
    を備える装置。
  93. 前記復号手段が、前記符号化単位の前記1つまたは複数の前に復号されたビデオブロックの前記予測モードに基づいて、前記ビデオブロックの前記予測モードの復号に使用するために、複数の符号化コンテキストのうちの1つを選択し、復号することが前記選択された符号化コンテキストに従って復号することを備える請求項92に記載の装置。
  94. 前記復号手段が、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて単方向の予測モードであるときには、第1の符号化コンテキストを選択し、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて多方向の予測モードであるときには、第2の符号化コンテキストを選択し、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードがすべて単方向ではなく、すべて多方向でもないときには、第3の符号化コンテキストを選択する、
    請求項93に記載の装置。
  95. 残差変換係数を変換するための手段をさらに備え、前記変換手段が、
    前記識別された予測モードに基づいて、前記ビデオブロックの残差変換係数に適用するために、逆変換を選択し、
    残差データを生成するために、前記ビデオブロックの前記残差変換係数に前記選択された逆変換を適用する、
    請求項92に記載の装置。
  96. 前記変換手段が、
    前記識別された予測モードが限定された方向性を示すときには、前記ビデオブロックの前記残差変換係数に適用するために、逆離散的コサイン変換(逆DCT)および逆整数変換のうちの一方を選択し、
    前記識別された予測モードが方向性を示すときには、前記ビデオブロックの前記残差変換係数に適用するために、逆方向変換を選択する、
    請求項95に記載の装置。
  97. 前記識別された予測モードがDCの単方向の予測モード、または実質的に直交する方向を指す少なくとも2つの予測モードを組み合わせた多方向の予測モードのいずれかであるとき、前記変換手段が、前記ビデオブロックの前記残差変換係数に適用するために、前記逆DCTおよび逆整数変換のうちの一方を選択する請求項96に記載の装置。
  98. 方向性を示す前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納するための手段をさらに備え、前記変換手段が前記識別された予測モードに対応する前記複数の逆方向変換のうちの前記1つを選択する請求項96に記載の装置。
  99. 前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納するための手段をさらに備え、前記複数の逆方向変換のそれぞれが、サイズN×Nの列変換行列、およびサイズN×Nの行変換行列を備え、N×Nが前記ビデオブロックの大きさである請求項95に記載の装置。
  100. 前記予測モードのうちの1つにそれぞれ対応する複数の逆方向変換を格納するための手段をさらに備え、前記複数の逆方向変換のそれぞれが、サイズN×Nの変換行列を備え、N×Nが前記ビデオブロックの大きさである請求項95に記載の装置。
  101. 前記複数の予測モードが単方向の予測モードと可能な双方向の予測モードのサブセットとを含み、前記双方向の予測モードのサブセットが前記単方向の予測モードのそれぞれを含む少なくとも1つの組合せを含む請求項92に記載の装置。
  102. 前記復号手段が、
    前記予測モードを表す第1のエンコードされたビットに基づいて、前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードを、前記1つまたは複数の前に復号されたビデオブロックの前記予測モードのうちの1つとして識別し、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードが同じであるとき、前記1つまたは複数の前に復号されたビデオブロックのうちの任意のものの前記予測モードを選択する、
    請求項60に記載の装置。
  103. 前記復号手段が、
    前記1つまたは複数の前に復号されたビデオブロックの前記予測モードが同じではないとき、前記予測モードを表す少なくとも1つの追加のエンコードされたビットに基づいて、前記1つまたは複数の前に復号されたビデオブロックのうちのどれが前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードと同じ予測モードを有するかを識別し、
    前記識別された前に復号されたビデオブロックの前記予測モードを選択する、
    請求項102に記載の装置。
  104. 前記復号手段が、
    前記予測モードを表す第1のエンコードされたビットに基づいて、前記ビデオブロックの前記予測ブロックの生成に使用するための前記予測モードを、前記1つまたは複数の前に復号されたビデオブロックの前記予測モードのいずれでもないと識別し、
    前記複数の予測モードから前記1つまたは複数の前に復号されたビデオブロックの少なくとも前記予測モードを削除し、
    前記符号化単位の前記前にエンコードされたビデオブロックのうちの2つ以上が同じ予測モードを有しているとき、前記1つまたは複数の前にエンコードされたビデオブロックの前記予測モードではない少なくとも1つの追加の予測モードを削除し、
    前記複数の予測モードの前記残りの予測モード中の予測モード識別子を仮に再配列し、
    前記現在のビデオブロックの予測ブロックの生成に使用するための前記予測モードに対応する前記予測モード識別子を識別するための符号語を復号する、
    請求項92に記載の装置。
JP2013035668A 2007-06-15 2013-02-26 ビデオブロック予測モードの適応形符号化 Active JP5575940B2 (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US94447007P 2007-06-15 2007-06-15
US60/944,470 2007-06-15
US97976207P 2007-10-12 2007-10-12
US60/979,762 2007-10-12
US12/133,227 2008-06-04
US12/133,227 US8428133B2 (en) 2007-06-15 2008-06-04 Adaptive coding of video block prediction mode

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2010512367A Division JP5254324B2 (ja) 2007-06-15 2008-06-12 ビデオブロック予測モードの適応形符号化

Publications (2)

Publication Number Publication Date
JP2013153463A true JP2013153463A (ja) 2013-08-08
JP5575940B2 JP5575940B2 (ja) 2014-08-20

Family

ID=40132292

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2010512367A Active JP5254324B2 (ja) 2007-06-15 2008-06-12 ビデオブロック予測モードの適応形符号化
JP2010512409A Pending JP2010530190A (ja) 2007-06-15 2008-06-13 映像コーディングに関する適応型係数走査
JP2010512386A Pending JP2010530188A (ja) 2007-06-15 2008-06-13 分離可能方向性変換
JP2013035668A Active JP5575940B2 (ja) 2007-06-15 2013-02-26 ビデオブロック予測モードの適応形符号化

Family Applications Before (3)

Application Number Title Priority Date Filing Date
JP2010512367A Active JP5254324B2 (ja) 2007-06-15 2008-06-12 ビデオブロック予測モードの適応形符号化
JP2010512409A Pending JP2010530190A (ja) 2007-06-15 2008-06-13 映像コーディングに関する適応型係数走査
JP2010512386A Pending JP2010530188A (ja) 2007-06-15 2008-06-13 分離可能方向性変換

Country Status (14)

Country Link
US (5) US8488668B2 (ja)
EP (3) EP2165543B1 (ja)
JP (4) JP5254324B2 (ja)
KR (3) KR101107867B1 (ja)
CN (3) CN101682770B (ja)
BR (3) BRPI0813351B1 (ja)
CA (3) CA2687260C (ja)
DK (1) DK2165543T3 (ja)
ES (1) ES2530796T3 (ja)
PL (1) PL2165543T3 (ja)
PT (1) PT2165543E (ja)
RU (4) RU2447612C2 (ja)
TW (3) TW200915880A (ja)
WO (3) WO2008157269A2 (ja)

Families Citing this family (275)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NO326065B1 (no) * 2007-01-11 2008-09-08 Tandberg Telecom As Atte pixlers heltallstransform
US8045612B1 (en) 2007-01-19 2011-10-25 Marvell International Ltd. Fast inverse integer transform for video decoding
US8238428B2 (en) * 2007-04-17 2012-08-07 Qualcomm Incorporated Pixel-by-pixel weighting for intra-frame coding
US8488668B2 (en) * 2007-06-15 2013-07-16 Qualcomm Incorporated Adaptive coefficient scanning for video coding
US8571104B2 (en) * 2007-06-15 2013-10-29 Qualcomm, Incorporated Adaptive coefficient scanning in video coding
CN103338365B (zh) 2007-06-29 2017-04-12 夏普株式会社 图像编码装置、图像编码方法、图像译码装置、图像译码方法
WO2009032255A2 (en) * 2007-09-04 2009-03-12 The Regents Of The University Of California Hierarchical motion vector processing method, software and devices
US8331454B2 (en) * 2007-11-12 2012-12-11 Cisco Technology, Inc. Integer transform function for video compression systems
KR20090097013A (ko) * 2008-03-10 2009-09-15 삼성전자주식회사 영상 부호화장치 및 영상 복호화장치
KR101375668B1 (ko) * 2008-03-17 2014-03-18 삼성전자주식회사 변환 계수의 부호화, 복호화 방법 및 장치
US8542748B2 (en) 2008-03-28 2013-09-24 Sharp Laboratories Of America, Inc. Methods and systems for parallel video encoding and decoding
EP2106148A3 (en) * 2008-03-28 2010-11-03 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding information about intra-prediction mode of video
KR20090129926A (ko) * 2008-06-13 2009-12-17 삼성전자주식회사 영상 부호화 방법 및 그 장치, 영상 복호화 방법 및 그 장치
KR100963424B1 (ko) * 2008-07-23 2010-06-15 한국전자통신연구원 스케일러블 영상 복호화기 및 그 제어 방법
US8000546B2 (en) * 2008-08-01 2011-08-16 National Cheng Kung University Adaptive scan method for image/video coding
US8619856B2 (en) * 2008-10-03 2013-12-31 Qualcomm Incorporated Video coding with large macroblocks
US8634456B2 (en) * 2008-10-03 2014-01-21 Qualcomm Incorporated Video coding with large macroblocks
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US8483285B2 (en) * 2008-10-03 2013-07-09 Qualcomm Incorporated Video coding using transforms bigger than 4×4 and 8×8
EP3668098A1 (en) 2009-01-27 2020-06-17 InterDigital VC Holdings, Inc. Methods and apparatus for transform selection in video encoding and decoding
KR101710619B1 (ko) * 2009-02-04 2017-02-28 삼성전자주식회사 단계적인 영상 부호화, 복호화 방법 및 장치
WO2010090629A1 (en) 2009-02-05 2010-08-12 Thomson Licensing Methods and apparatus for adaptive mode video encoding and decoding
WO2010090484A2 (ko) * 2009-02-09 2010-08-12 삼성전자 주식회사 저복잡도 주파수 변환을 이용한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
EP2396969A4 (en) * 2009-02-13 2012-12-12 Research In Motion Ltd MODIFIED ENTROPIC CODING FOR IMAGES AND VIDEOS
US8634466B2 (en) * 2009-03-17 2014-01-21 Freescale Semiconductor, Inc. Video decoder plus a discrete cosine transform unit
KR101379185B1 (ko) * 2009-04-14 2014-03-31 에스케이 텔레콤주식회사 예측 모드 선택 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
US9113168B2 (en) 2009-05-12 2015-08-18 Lg Electronics Inc. Method and apparatus of processing a video signal
US8451903B2 (en) * 2009-05-14 2013-05-28 Massachusetts Institute Of Technology Selecting transforms for compressing visual data
US8509309B2 (en) 2009-05-14 2013-08-13 Massachusetts Institute Of Technology Selecting transforms for compressing visual data
CN101895739B (zh) * 2009-05-20 2012-12-19 深圳市融创天下科技股份有限公司 基于块统计特性的编码方法
US8660261B2 (en) * 2009-06-04 2014-02-25 Mediatek Singapore Pte. Ltd. System and apparatus for integrated video/image encoding/decoding and encryption/decryption
US8700410B2 (en) * 2009-06-18 2014-04-15 Texas Instruments Incorporated Method and system for lossless value-location encoding
US8873626B2 (en) * 2009-07-02 2014-10-28 Qualcomm Incorporated Template matching for video coding
CN101945270B (zh) * 2009-07-06 2013-06-19 联发科技(新加坡)私人有限公司 视频编码器、进行内部预测及进行视频数据压缩的方法
WO2011010959A1 (en) * 2009-07-23 2011-01-27 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for encoding and decoding of images
US9357221B2 (en) 2009-07-23 2016-05-31 Thomson Licensing Methods and apparatus for adaptive transform selection for video encoding and decoding
JP5700970B2 (ja) * 2009-07-30 2015-04-15 トムソン ライセンシングThomson Licensing 画像シーケンスを表す符号化データストリームの復号方法と画像シーケンスの符号化方法
KR101474756B1 (ko) 2009-08-13 2014-12-19 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
KR101712097B1 (ko) * 2009-08-19 2017-03-03 삼성전자 주식회사 유연한 직교 변환에 기초한 영상 부호화, 복호화 방법 및 장치
US9819952B2 (en) * 2009-10-05 2017-11-14 Thomson Licensing Dtv Methods and apparatus for embedded quantization parameter adjustment in video encoding and decoding
US8477845B2 (en) * 2009-10-16 2013-07-02 Futurewei Technologies, Inc. Predictive adaptive scan ordering for video coding
US20110090954A1 (en) * 2009-10-21 2011-04-21 Cohen Robert A Video Codes with Directional Transforms
CN102045560B (zh) * 2009-10-23 2013-08-07 华为技术有限公司 一种视频编解码方法及设备
AU2014268181B2 (en) * 2009-10-28 2016-02-18 Samsung Electronics Co., Ltd. Method and apparatus for encoding residual block, and method and apparatus for decoding residual block
KR101457894B1 (ko) * 2009-10-28 2014-11-05 삼성전자주식회사 영상 부호화 방법 및 장치, 복호화 방법 및 장치
KR20110045949A (ko) 2009-10-28 2011-05-04 삼성전자주식회사 회전 변환을 이용한 영상 부호화, 복호화 방법 및 장치
TWI396448B (zh) * 2009-10-30 2013-05-11 Hon Hai Prec Ind Co Ltd 熵解碼裝置
KR20110065089A (ko) * 2009-12-09 2011-06-15 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR20110065092A (ko) * 2009-12-09 2011-06-15 삼성전자주식회사 회전 변환을 이용한 영상 부호화, 복호화 방법 및 장치
KR101441879B1 (ko) * 2009-12-09 2014-09-23 에스케이텔레콤 주식회사 영상 부호화 장치 및 방법, 및 거기에 이용되는 변환 부호화 장치 및 방법, 변환기저 생성장치 및 방법, 및 영상 복호화 장치 및 방법
KR20110068792A (ko) * 2009-12-16 2011-06-22 한국전자통신연구원 적응적 영상 부호화 장치 및 방법
TWI389577B (zh) * 2009-12-31 2013-03-11 Via Tech Inc 視訊解碼解塊之裝置與方法
CN102118613B (zh) * 2009-12-31 2012-11-21 华为技术有限公司 视频解码和编码方法及装置
JP5696248B2 (ja) * 2010-01-07 2015-04-08 株式会社東芝 動画像符号化装置及び動画像復号化装置
JP5323209B2 (ja) * 2010-01-07 2013-10-23 株式会社東芝 動画像符号化装置及び動画像復号化装置
JP5525650B2 (ja) * 2010-01-07 2014-06-18 株式会社東芝 動画像復号化装置、方法及びプログラム
JP5908619B2 (ja) * 2010-01-07 2016-04-26 株式会社東芝 動画像符号化装置及び動画像復号化装置
JP5432359B2 (ja) * 2010-01-07 2014-03-05 株式会社東芝 動画像符号化装置、方法及びプログラム
JP5597782B2 (ja) * 2010-01-07 2014-10-01 株式会社東芝 動画像符号化装置及び動画像復号化装置
JP5526277B2 (ja) * 2010-01-07 2014-06-18 株式会社東芝 動画像復号化装置、方法及びプログラム
JP5432412B1 (ja) * 2010-01-07 2014-03-05 株式会社東芝 動画像符号化装置及び動画像復号化装置
WO2011083573A1 (ja) 2010-01-07 2011-07-14 株式会社 東芝 動画像符号化装置及び動画像復号化装置
US8885714B2 (en) * 2010-01-14 2014-11-11 Texas Instruments Incorporated Method and system for intracoding in video encoding
EP2533539A2 (en) * 2010-02-02 2012-12-12 Humax Co., Ltd. Image encoding/decoding method for rate-distortion optimization and apparatus for performing same
KR101495724B1 (ko) 2010-02-02 2015-02-25 삼성전자주식회사 계층적 데이터 단위의 스캔 순서에 기반한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
WO2011108240A1 (ja) * 2010-03-01 2011-09-09 パナソニック株式会社 画像符号化方法および画像復号方法
EP2545529A1 (en) * 2010-03-10 2013-01-16 Thomson Licensing Methods and apparatus for constrained transforms for video coding and decoding having transform selection
CN102215388B (zh) * 2010-04-09 2013-11-06 华为技术有限公司 一种简化方向性变换的方法、装置和系统
US20110249743A1 (en) * 2010-04-09 2011-10-13 Jie Zhao Super-block for high performance video coding
JP5914962B2 (ja) * 2010-04-09 2016-05-11 ソニー株式会社 画像処理装置および方法、プログラム、並びに、記録媒体
CN102215391B (zh) * 2010-04-09 2013-08-28 华为技术有限公司 视频数据编码、解码方法及装置、变换处理方法及装置
CN102215390B (zh) * 2010-04-09 2014-07-09 华为技术有限公司 图像编解码处理方法和装置
US8619857B2 (en) 2010-04-09 2013-12-31 Sharp Laboratories Of America, Inc. Methods and systems for intra prediction
US20110249741A1 (en) * 2010-04-09 2011-10-13 Jie Zhao Methods and Systems for Intra Prediction
US8644375B2 (en) 2010-04-09 2014-02-04 Sharp Laboratories Of America, Inc. Methods and systems for intra prediction
US8705619B2 (en) * 2010-04-09 2014-04-22 Sony Corporation Directional discrete wavelet transform (DDWT) for video compression applications
WO2011127963A1 (en) * 2010-04-13 2011-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sample region merging
DK2559246T3 (en) 2010-04-13 2016-09-19 Ge Video Compression Llc Fusion of sample areas
PL3621306T3 (pl) 2010-04-13 2022-04-04 Ge Video Compression, Llc Kodowanie wideo przy wykorzystaniu podpodziałów obrazów multidrzewa
CN106454376B (zh) 2010-04-13 2019-10-01 Ge视频压缩有限责任公司 解码器、重建数组的方法、编码器、编码方法及数据流
NO2559244T3 (ja) 2010-04-13 2017-12-30
BR122020007923B1 (pt) 2010-04-13 2021-08-03 Ge Video Compression, Llc Predição interplano
KR101791078B1 (ko) * 2010-04-16 2017-10-30 에스케이텔레콤 주식회사 영상 부호화/복호화 장치 및 방법
US8638863B1 (en) 2010-05-18 2014-01-28 Google Inc. Apparatus and method for filtering video using extended edge-detection
KR102004836B1 (ko) 2010-05-26 2019-07-29 엘지전자 주식회사 비디오 신호의 처리 방법 및 장치
US8902978B2 (en) * 2010-05-30 2014-12-02 Lg Electronics Inc. Enhanced intra prediction mode signaling
CN102281435B (zh) * 2010-06-11 2013-10-02 华为技术有限公司 编码方法、解码方法、编码装置、解码装置及编解码系统
US8396305B2 (en) 2010-07-09 2013-03-12 Sony Corporation Image compression utilizing ring-tree entropy coding and directional transforms
US9215470B2 (en) * 2010-07-09 2015-12-15 Qualcomm Incorporated Signaling selected directional transform for video coding
US8837577B2 (en) * 2010-07-15 2014-09-16 Sharp Laboratories Of America, Inc. Method of parallel video coding based upon prediction type
WO2012008925A1 (en) * 2010-07-15 2012-01-19 Agency For Science, Technology And Research Method, apparatus and computer program product for encoding video data
US8873617B2 (en) * 2010-07-15 2014-10-28 Sharp Laboratories Of America, Inc. Method of parallel video coding based on same sized blocks
JP2012023632A (ja) 2010-07-15 2012-02-02 Sony Corp 符号化装置および符号化方法、並びに、復号装置および復号方法
CN101895757A (zh) * 2010-07-15 2010-11-24 北京大学 预测残差块的重排序、逆重排序方法及系统
BR112013000865B1 (pt) 2010-07-15 2021-08-10 Kabushiki Kaisha Toshiba Métodos de codificação e de decodificação de imagem
US8855188B2 (en) * 2010-07-15 2014-10-07 Sharp Laboratories Of America, Inc. Method of parallel video coding based on mapping
MY186093A (en) 2010-07-15 2021-06-21 Velos Media Int Ltd Image encoding device, and image decoding device
CN101895756B (zh) * 2010-07-15 2012-10-31 北京大学 视频图像块的编码、解码、重构方法及系统
KR20120009618A (ko) * 2010-07-19 2012-02-02 에스케이 텔레콤주식회사 주파수변환단위 분할부호화 방법 및 장치와 이를 이용한 영상 부호화/복호화 방법 및 장치
JP2012028858A (ja) * 2010-07-20 2012-02-09 Sony Corp 画像処理装置及び画像処理方法
WO2012014461A1 (ja) * 2010-07-28 2012-02-02 パナソニック株式会社 符号化方法および復号化方法
KR101373814B1 (ko) * 2010-07-31 2014-03-18 엠앤케이홀딩스 주식회사 예측 블록 생성 장치
US10136130B2 (en) * 2010-08-17 2018-11-20 M&K Holdings Inc. Apparatus for decoding an image
US11284072B2 (en) 2010-08-17 2022-03-22 M&K Holdings Inc. Apparatus for decoding an image
KR101677480B1 (ko) * 2010-09-07 2016-11-21 에스케이 텔레콤주식회사 효과적인 화면내 예측모드 집합 선택을 이용한 영상 부호화/복호화 방법 및 장치
KR20120025111A (ko) * 2010-09-07 2012-03-15 에스케이 텔레콤주식회사 참조 화소들의 특성을 이용하여 예측모드 정보의 전송을 생략할 수 있는 화면 내 예측 부호화/복호화 장치 및 그 방법
US9154801B2 (en) * 2010-09-30 2015-10-06 Texas Instruments Incorporated Method and apparatus for diagonal scan and simplified coding of transform coefficients
CN102447895B (zh) * 2010-09-30 2013-10-02 华为技术有限公司 扫描方法及装置、反扫描方法及装置
US9378185B2 (en) * 2010-09-30 2016-06-28 Texas Instruments Incorporated Transform and quantization architecture for video coding and decoding
US8923395B2 (en) * 2010-10-01 2014-12-30 Qualcomm Incorporated Video coding using intra-prediction
US9313514B2 (en) 2010-10-01 2016-04-12 Sharp Kabushiki Kaisha Methods and systems for entropy coder initialization
US20120082243A1 (en) * 2010-10-05 2012-04-05 General Instrument Corporation Method and Apparatus for Feature Based Video Coding
US9532059B2 (en) 2010-10-05 2016-12-27 Google Technology Holdings LLC Method and apparatus for spatial scalability for video coding
US9641846B2 (en) * 2010-10-22 2017-05-02 Qualcomm Incorporated Adaptive scanning of transform coefficients for video coding
US9497472B2 (en) * 2010-11-16 2016-11-15 Qualcomm Incorporated Parallel context calculation in video coding
US8711940B2 (en) * 2010-11-29 2014-04-29 Mediatek Inc. Method and apparatus of motion vector prediction with extended motion vector predictor
US9288496B2 (en) * 2010-12-03 2016-03-15 Qualcomm Incorporated Video coding using function-based scan order for transform coefficients
US9042440B2 (en) 2010-12-03 2015-05-26 Qualcomm Incorporated Coding the position of a last significant coefficient within a video block based on a scanning order for the block in video coding
US8976861B2 (en) 2010-12-03 2015-03-10 Qualcomm Incorporated Separately coding the position of a last significant coefficient of a video block in video coding
MX337875B (es) * 2010-12-17 2016-03-22 Mitsubishi Electric Corp Dispositivo de codificacion de imagen, dispositivo de decodificacion de imagen, metodo de codificacion de imagen y metodo de decodificacion de imagen.
KR20120070479A (ko) 2010-12-21 2012-06-29 한국전자통신연구원 화면 내 예측 방향 정보 부호화/복호화 방법 및 그 장치
US9049444B2 (en) * 2010-12-22 2015-06-02 Qualcomm Incorporated Mode dependent scanning of coefficients of a block of video data
US20120163472A1 (en) * 2010-12-22 2012-06-28 Qualcomm Incorporated Efficiently coding scanning order information for a video block in video coding
US20120163456A1 (en) 2010-12-22 2012-06-28 Qualcomm Incorporated Using a most probable scanning order to efficiently code scanning order information for a video block in video coding
US10992958B2 (en) * 2010-12-29 2021-04-27 Qualcomm Incorporated Video coding using mapped transforms and scanning modes
KR101739580B1 (ko) * 2010-12-30 2017-05-25 에스케이 텔레콤주식회사 적응적 스캔 장치 및 그 스캔 방법
US9490839B2 (en) 2011-01-03 2016-11-08 Qualcomm Incorporated Variable length coding of video block coefficients
CA2822929C (en) * 2011-01-04 2016-07-12 Research In Motion Limited Coding of residual data in predictive compression
WO2012092661A1 (en) * 2011-01-04 2012-07-12 Research In Motion Limited Coding of residual data in predictive compression
CN104811706B (zh) * 2011-01-06 2017-10-27 三星电子株式会社 视频的编码方法和装置及视频的解码方法和装置
KR20130099242A (ko) 2011-01-07 2013-09-05 노키아 코포레이션 비디오 코딩의 움직임 예측
ES2957772T3 (es) * 2011-01-07 2024-01-25 Ntt Docomo Inc Procedimiento de codificación predictiva, dispositivo de codificación predictiva y programa de codificación predictiva de un vector de movimiento, y procedimiento de descodificación predictiva, dispositivo de descodificación predictiva y programa de descodificación predictiva de un vector de movimiento
US9071851B2 (en) * 2011-01-10 2015-06-30 Qualcomm Incorporated Adaptively performing smoothing operations
JP5850214B2 (ja) * 2011-01-11 2016-02-03 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
US9210442B2 (en) 2011-01-12 2015-12-08 Google Technology Holdings LLC Efficient transform unit representation
AU2015202844B2 (en) * 2011-01-12 2016-03-17 Ntt Docomo, Inc. Image predict coding method, image predict coding device, image predict coding program, image predict decoding method, image predict decoding device, and image predict decoding program
JP5781313B2 (ja) * 2011-01-12 2015-09-16 株式会社Nttドコモ 画像予測符号化方法、画像予測符号化装置、画像予測符号化プログラム、画像予測復号方法、画像予測復号装置及び画像予測復号プログラム
US8811759B2 (en) * 2011-01-13 2014-08-19 Sony Corporation System and method for effectively performing an intra prediction procedure
US20120183064A1 (en) 2011-01-14 2012-07-19 Sony Corporation Codeword assignment for intra chroma mode signaling for hevc
US9232227B2 (en) * 2011-01-14 2016-01-05 Sony Corporation Codeword space reduction for intra chroma mode signaling for HEVC
CN102595129B (zh) * 2011-01-14 2016-01-13 索尼公司 用于hevc的帧内色度模式信令的码字分配
US8990435B2 (en) 2011-01-17 2015-03-24 Mediatek Inc. Method and apparatus for accessing data of multi-tile encoded picture stored in buffering apparatus
US9497466B2 (en) * 2011-01-17 2016-11-15 Mediatek Inc. Buffering apparatus for buffering multi-partition video/image bitstream and related method thereof
US9380319B2 (en) * 2011-02-04 2016-06-28 Google Technology Holdings LLC Implicit transform unit representation
US8442338B2 (en) * 2011-02-28 2013-05-14 Sony Corporation Visually optimized quantization
FR2972588A1 (fr) 2011-03-07 2012-09-14 France Telecom Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
US9106913B2 (en) 2011-03-08 2015-08-11 Qualcomm Incorporated Coding of transform coefficients for video coding
US9338449B2 (en) 2011-03-08 2016-05-10 Qualcomm Incorporated Harmonized scan order for coding transform coefficients in video coding
CN102685503B (zh) 2011-03-10 2014-06-25 华为技术有限公司 变换系数的编码方法、变换系数的解码方法,和装置
KR20140018873A (ko) * 2011-04-07 2014-02-13 엘지전자 주식회사 영상 정보 부호화 방법 및 복호화 방법
CN102238387B (zh) * 2011-05-25 2017-07-18 深圳市云宙多媒体技术有限公司 一种视频熵编码、熵解码方法、装置
KR101842851B1 (ko) * 2011-06-17 2018-03-27 가부시키가이샤 제이브이씨 켄우드 화상 부호화 장치, 화상 부호화 방법 및 화상 부호화 프로그램, 및 화상 복호 장치, 화상 복호 방법 및 화상 복호 프로그램
CN102843560B (zh) * 2011-06-21 2015-01-21 华为技术有限公司 图像变换处理方法、设备和系统
FR2977111A1 (fr) 2011-06-24 2012-12-28 France Telecom Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
US9167253B2 (en) 2011-06-28 2015-10-20 Qualcomm Incorporated Derivation of the position in scan order of the last significant transform coefficient in video coding
WO2013003777A1 (en) * 2011-06-29 2013-01-03 General Instrument Corporation Methods and system for using a scan coding pattern during intra coding
US9445093B2 (en) * 2011-06-29 2016-09-13 Qualcomm Incorporated Multiple zone scanning order for video coding
US9516316B2 (en) 2011-06-29 2016-12-06 Qualcomm Incorporated VLC coefficient coding for large chroma block
US8929455B2 (en) * 2011-07-01 2015-01-06 Mitsubishi Electric Research Laboratories, Inc. Method for selecting transform types from mapping table for prediction modes
US9392301B2 (en) 2011-07-01 2016-07-12 Qualcomm Incorporated Context adaptive entropy coding for non-square blocks in video coding
US9338456B2 (en) 2011-07-11 2016-05-10 Qualcomm Incorporated Coding syntax elements using VLC codewords
US9756360B2 (en) 2011-07-19 2017-09-05 Qualcomm Incorporated Coefficient scanning in video coding
US9699456B2 (en) * 2011-07-20 2017-07-04 Qualcomm Incorporated Buffering prediction data in video coding
CN102447898B (zh) * 2011-08-26 2013-09-25 西安电子科技大学 用fpga实现klt变换的方法
MX343471B (es) * 2011-08-29 2016-11-07 Ibex Pt Holdings Co Ltd Metodo para generar un bloque de prediccion en modo de prediccion de vector de movimiento avanzada (amvp).
GB2494468B (en) 2011-09-12 2014-01-15 Canon Kk Method and device for encoding or decoding information representing prediction modes
CN103797792B (zh) 2011-09-15 2018-06-05 Vid拓展公司 用于空间预测的系统和方法
RU2595587C2 (ru) 2011-10-17 2016-08-27 Кт Корпорейшен Способ адаптивного преобразования, основанный на внутрикадровом предсказании, и устройство, использующее такой способ
CN107071415B (zh) * 2011-10-17 2020-07-07 株式会社东芝 编码设备、解码设备、编码方法和解码方法
KR101718953B1 (ko) 2011-10-17 2017-03-22 주식회사 케이티 영상 부호화/복호화 방법 및 그 장치
RU2715382C2 (ru) 2011-10-18 2020-02-27 Кт Корпорейшен Способ декодирования видеосигнала
CN104378639B (zh) 2011-10-19 2018-05-04 株式会社Kt 解码视频信号的方法
AU2015201780B2 (en) * 2011-10-31 2016-07-28 Samsung Electronics Co., Ltd. Method and apparatus for determining a context model for transform coefficient level entropy encoding and decoding
SI3145197T1 (sl) 2011-10-31 2018-09-28 Samsung Electronics Co., Ltd, Postopek določanja kontekstnega modela za entropijsko dekodiranje na stopnji transformnega koeficienta
EP2740270A4 (en) 2011-10-31 2015-04-29 Mediatek Inc APPARATUS AND METHOD FOR BUILDING REFERENCED CONTEXT TABLES TO PERFORM AN ENTROPTIC DECODING OF A MULTI-TILE ENCODED IMAGE AND CORRESPONDING ENTROPY DECODER
KR20130049523A (ko) * 2011-11-04 2013-05-14 오수미 인트라 예측 블록 생성 장치
KR20130049522A (ko) * 2011-11-04 2013-05-14 오수미 인트라 예측 블록 생성 방법
JP2013102297A (ja) 2011-11-07 2013-05-23 Canon Inc 画像符号化方法、画像符号化装置及びプログラム、画像復号方法、画像復号装置及びプログラム
JP5871628B2 (ja) * 2011-11-07 2016-03-01 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
FR2982447A1 (fr) * 2011-11-07 2013-05-10 France Telecom Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
KR20130050405A (ko) * 2011-11-07 2013-05-16 오수미 인터 모드에서의 시간 후보자 결정방법
TWI580264B (zh) * 2011-11-10 2017-04-21 Sony Corp Image processing apparatus and method
US9674528B2 (en) * 2011-11-21 2017-06-06 Panasonic Intellectual Property Management Co., Ltd. Image processing apparatus and image processing method
JPWO2013094199A1 (ja) * 2011-12-21 2015-04-27 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 画像符号化方法、画像符号化装置、画像復号化方法、画像復号化装置、および画像符号化復号化装置
US8660374B1 (en) 2011-12-23 2014-02-25 Massachusetts Institute Of Technology Selecting transform paths for compressing visual data
CN103220506B (zh) 2012-01-19 2015-11-25 华为技术有限公司 一种编解码方法和设备
AU2012200319B2 (en) 2012-01-19 2015-11-26 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the significance map for residual coefficients of a transform unit
CN107302368B (zh) 2012-01-20 2020-07-28 Ge视频压缩有限责任公司 从数据流解码具有变换系数级别的多个变换系数的装置
AU2012200345B2 (en) 2012-01-20 2014-05-01 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the significance map residual coefficients of a transform unit
US9451277B2 (en) * 2012-02-08 2016-09-20 Qualcomm Incorporated Restriction of prediction units in B slices to uni-directional inter prediction
US9363510B2 (en) * 2012-03-02 2016-06-07 Qualcomm Incorporated Scan-based sliding window in context derivation for transform coefficient coding
US11039138B1 (en) * 2012-03-08 2021-06-15 Google Llc Adaptive coding of prediction modes using probability distributions
TW201401891A (zh) 2012-03-26 2014-01-01 Jvc Kenwood Corp 影像編碼裝置、影像編碼方法、影像編碼程式、送訊裝置、送訊方法、及送訊程式、以及影像解碼裝置、影像解碼方法、影像解碼程式、收訊裝置、收訊方法、及收訊程式
MY172302A (en) * 2012-04-15 2019-11-21 Samsung Electronics Co Ltd Method and apparatus for determining reference images for inter-prediction
GB2501535A (en) * 2012-04-26 2013-10-30 Sony Corp Chrominance Processing in High Efficiency Video Codecs
US20130301713A1 (en) * 2012-05-14 2013-11-14 Qualcomm Incorporated Systems and methods for intra prediction video coding
ES2961654T3 (es) 2012-06-29 2024-03-13 Electronics & Telecommunications Res Inst Método y dispositivo para codificar/decodificar imágenes
JP5885604B2 (ja) * 2012-07-06 2016-03-15 株式会社Nttドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム
US9344742B2 (en) * 2012-08-10 2016-05-17 Google Inc. Transform-domain intra prediction
US9319684B2 (en) 2012-08-21 2016-04-19 Qualcomm Incorporated Alternative transform in scalable video coding
US9538175B2 (en) * 2012-09-26 2017-01-03 Qualcomm Incorporated Context derivation for context-adaptive, multi-level significance coding
US9219915B1 (en) 2013-01-17 2015-12-22 Google Inc. Selection of transform size in video coding
US9967559B1 (en) 2013-02-11 2018-05-08 Google Llc Motion vector dependent spatial transformation in video coding
US9544597B1 (en) * 2013-02-11 2017-01-10 Google Inc. Hybrid transform in video encoding and decoding
EP2946550A1 (en) 2013-04-09 2015-11-25 Siemens Aktiengesellschaft A method for coding a sequence of digital images
JP5535361B2 (ja) * 2013-04-10 2014-07-02 株式会社東芝 画像符号化装置、方法およびプログラム
JP5537695B2 (ja) * 2013-04-10 2014-07-02 株式会社東芝 画像復号化装置、方法およびプログラム
US9674530B1 (en) 2013-04-30 2017-06-06 Google Inc. Hybrid transforms in video coding
US9967594B2 (en) * 2013-06-28 2018-05-08 Mozilla Corporation Probability modeling of intra prediction modes
RU2624464C1 (ru) * 2013-07-24 2017-07-04 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Порядки сканирования для кодирования без преобразования
CN103391443A (zh) * 2013-08-05 2013-11-13 深圳市云宙多媒体技术有限公司 一种大尺寸块的亮度变换域帧内预测编解码方法及系统
CN103402094A (zh) * 2013-08-05 2013-11-20 深圳市云宙多媒体技术有限公司 一种变换域色度帧内预测编解码方法及系统
JP2015115614A (ja) * 2013-12-06 2015-06-22 日本電信電話株式会社 変換処理方法、逆変換処理方法、変換処理装置、逆変換処理装置、変換処理プログラム及び逆変換処理プログラム
US10362336B2 (en) 2014-03-25 2019-07-23 Qualcomm Incorporated Palette predictor signaling with run length code for video coding
JP5622954B2 (ja) * 2014-04-17 2014-11-12 株式会社東芝 画像復号化装置、方法およびプログラム
CN103974076B (zh) * 2014-05-19 2018-01-12 华为技术有限公司 图像编解码方法和设备、系统
JP5925855B2 (ja) * 2014-09-17 2016-05-25 株式会社東芝 画像復号化装置、方法およびプログラム、第1のプログラムおよび第2のプログラム、サーバシステムならびにダウンロード制御方法
US9565451B1 (en) 2014-10-31 2017-02-07 Google Inc. Prediction dependent transform coding
JP5775959B2 (ja) * 2014-11-07 2015-09-09 株式会社Nttドコモ 画像予測符号化方法、画像予測符号化装置、画像予測符号化プログラム、画像予測復号方法、画像予測復号装置及び画像予測復号プログラム
US10306229B2 (en) 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
WO2016133356A1 (ko) * 2015-02-17 2016-08-25 엘지전자(주) 적응적 스캔 오더를 이용하여 비디오 신호를 인코딩, 디코딩하는 방법 및 장치
JP6042478B2 (ja) * 2015-04-01 2016-12-14 株式会社東芝 画像復号化装置
WO2016167538A1 (ko) * 2015-04-12 2016-10-20 엘지전자(주) 비디오 신호의 인코딩, 디코딩 방법 및 그 장치
JP6038243B2 (ja) * 2015-07-15 2016-12-07 株式会社Nttドコモ 画像予測復号方法及び画像予測復号装置
US9769499B2 (en) 2015-08-11 2017-09-19 Google Inc. Super-transform video coding
US9699461B2 (en) * 2015-08-14 2017-07-04 Blackberry Limited Scaling in perceptual image and video coding
US10277905B2 (en) 2015-09-14 2019-04-30 Google Llc Transform selection for non-baseband signal coding
US10681379B2 (en) * 2015-09-29 2020-06-09 Qualcomm Incorporated Non-separable secondary transform for video coding with reorganizing
US9807423B1 (en) 2015-11-24 2017-10-31 Google Inc. Hybrid transform scheme for video coding
CN108605130B (zh) * 2015-11-27 2021-05-11 联发科技股份有限公司 一种用于对与区块相关的符号进行熵编解码的方法和装置
CN111526360A (zh) * 2016-02-06 2020-08-11 华为技术有限公司 图像编解码方法及装置
CA3014271C (en) 2016-02-12 2020-10-20 Huawei Technologies Co., Ltd. Method and apparatus for scan order selection
SG11201806810YA (en) 2016-02-12 2018-09-27 Huawei Tech Co Ltd Method and apparatus for scan order selection
US10623774B2 (en) 2016-03-22 2020-04-14 Qualcomm Incorporated Constrained block-level optimization and signaling for video coding tools
US10708164B2 (en) * 2016-05-03 2020-07-07 Qualcomm Incorporated Binarizing secondary transform index
WO2017196128A1 (ko) * 2016-05-12 2017-11-16 엘지전자(주) 계수 유도 복원을 이용하여 비디오 신호를 처리하는 방법 및 장치
WO2017195917A1 (ko) * 2016-05-12 2017-11-16 엘지전자 주식회사 비디오 코딩 시스템에서 인트라 예측 방법 및 장치
EP3454559A4 (en) 2016-05-13 2019-03-13 Sony Corporation IMAGE PROCESSING DEVICE AND METHOD
CN109479138B (zh) * 2016-07-13 2023-11-03 韩国电子通信研究院 图像编码/解码方法和装置
WO2018026028A1 (ko) * 2016-08-02 2018-02-08 엘지전자(주) 서브 계수 그룹을 이용하여 레지듀얼 신호를 인코딩, 디코딩하는 방법 및 장치
JP6310034B2 (ja) * 2016-10-20 2018-04-11 株式会社東芝 復号装置、復号方法および復号プログラム
JP6310992B2 (ja) * 2016-11-01 2018-04-11 株式会社Nttドコモ 画像予測復号方法及び画像予測復号装置
CN106507111B (zh) * 2016-11-17 2019-11-15 上海兆芯集成电路有限公司 使用残差补偿的视频编码方法以及使用该方法的装置
US10694202B2 (en) * 2016-12-01 2020-06-23 Qualcomm Incorporated Indication of bilateral filter usage in video coding
EP3609183B1 (en) * 2017-04-13 2023-05-03 LG Electronics Inc. Image encoding/decoding method and device therefor
CN108933941A (zh) * 2017-05-26 2018-12-04 富士通株式会社 图像编码方法和装置以及图像解码方法和装置
US10356411B2 (en) * 2017-05-30 2019-07-16 Google Llc Adaptation of scan order entropy coding
US10326994B2 (en) * 2017-08-15 2019-06-18 Google Llc Modifying a scan order to limit scan distance
KR102535361B1 (ko) 2017-10-19 2023-05-24 삼성전자주식회사 머신 러닝을 사용하는 영상 부호화기 및 그것의 데이터 처리 방법
EP3484148A1 (en) 2017-11-09 2019-05-15 Thomson Licensing Automated scanning order for sub-divided blocks
AU2018371372B2 (en) * 2017-11-24 2022-11-24 Sony Corporation Image processing device and method
US10382758B2 (en) 2017-12-15 2019-08-13 Google Llc Transform block-level scan order selection for video coding
JP6980920B2 (ja) 2017-12-21 2021-12-15 エルジー エレクトロニクス インコーポレイティドLg Electronics Inc. 選択的変換に基づいた映像コーディング方法およびその装置
CN108259897B (zh) * 2018-01-23 2021-08-27 北京易智能科技有限公司 一种基于深度学习的帧内编码优化方法
JP7170738B2 (ja) 2018-02-28 2022-11-14 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. 複合予測および制限付きマージ
JP6486528B2 (ja) * 2018-03-19 2019-03-20 株式会社Nttドコモ 画像予測復号方法及び画像予測復号装置
WO2019190284A1 (ko) * 2018-03-29 2019-10-03 엘지전자 주식회사 비디오 압축을 위한 변환 커널의 저복잡도 연산을 수행하는 방법 및 장치
CN112166605A (zh) 2018-06-21 2021-01-01 株式会社Kt 用于处理视频信号的方法和设备
EP3815377B1 (en) 2018-07-16 2022-12-28 Huawei Technologies Co., Ltd. Video encoder, video decoder, and corresponding encoding and decoding methods
WO2020046086A1 (ko) * 2018-09-02 2020-03-05 엘지전자 주식회사 영상 신호를 처리하기 위한 방법 및 장치
CN114885163B (zh) * 2018-09-02 2024-04-23 Lg电子株式会社 用于对图像信号编码和解码的方法及计算机可读记录介质
CN109345177B (zh) * 2018-10-20 2022-03-18 广东三胜电器股份有限公司 一种基于云视频信息处理的冷链食品物流可视化方法
WO2020087324A1 (zh) * 2018-10-31 2020-05-07 富士通株式会社 图像编码方法、装置以及电子设备
US11012711B2 (en) 2018-11-29 2021-05-18 Tencent America LLC Adaptive most probable modes for multiple reference line intra prediction
US11102513B2 (en) * 2018-12-06 2021-08-24 Tencent America LLC One-level transform split and adaptive sub-block transform
US11323748B2 (en) 2018-12-19 2022-05-03 Qualcomm Incorporated Tree-based transform unit (TU) partition for video coding
KR20200084300A (ko) 2019-01-02 2020-07-10 디지털인사이트 주식회사 영상 복호화 방법, 영상 부호화 방법, 영상 복호화 장치, 영상 부호화 장치 및 컴퓨터 판독 가능한 기록 매체
JP7282904B2 (ja) 2019-02-19 2023-05-29 エルジー エレクトロニクス インコーポレイティド 映像コーディングシステムにおいてレジデュアル情報を使用する映像デコーディング方法及びその装置
US11122297B2 (en) 2019-05-03 2021-09-14 Google Llc Using border-aligned block functions for image compression
EP3975556A4 (en) 2019-06-19 2022-08-03 Lg Electronics Inc. IMAGE DECODING METHOD FOR PERFORMING INTER-PREDICTION WHEN THE CURRENT BLOCK PREDICTION MODE CANNOT FINALLY BE SELECTED AND ASSOCIATED DEVICE
CN110267041B (zh) * 2019-06-28 2021-11-09 Oppo广东移动通信有限公司 图像编码方法、装置、电子设备和计算机可读存储介质
US11800110B2 (en) * 2021-04-20 2023-10-24 Tencent America LLC Adaptive scanning with multiple transform selection
US11838498B2 (en) * 2021-06-28 2023-12-05 Tencent America LLC Harmonized design for intra bi-prediction and multiple reference line selection
CN113873252B (zh) * 2021-09-27 2023-12-19 上海哔哩哔哩科技有限公司 图像处理方法及装置、电子设备和存储介质
CN116600123B (zh) * 2023-07-17 2023-11-07 北京中星微人工智能芯片技术有限公司 视频编码方法及装置、视频解码方法及装置、电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10191324A (ja) * 1996-11-07 1998-07-21 Matsushita Electric Ind Co Ltd 画像符号化方法および画像符号化装置並びに画像符号化プログラムを記録した記録媒体
JP2003204550A (ja) * 2002-01-07 2003-07-18 Mitsubishi Electric Corp 動画像符号化装置および動画像復号装置
JP2005039743A (ja) * 2003-07-18 2005-02-10 Sony Corp 画像情報符号化装置及び方法、並びに画像情報復号装置及び方法
JP2005528047A (ja) * 2002-05-28 2005-09-15 シャープ株式会社 画像符号化システム、画像復号システム、及び画像を分割したブロックの画素値の予測方法
JP2007503777A (ja) * 2003-08-26 2007-02-22 トムソン ライセンシング ハイブリッド・イントラ・インター符号化ブロックを符号化する方法及び装置

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BE1000643A5 (fr) 1987-06-05 1989-02-28 Belge Etat Procede de codage de signaux d'image.
JPH01155678A (ja) 1987-12-11 1989-06-19 Matsushita Electric Ind Co Ltd 半導体発光装置
US5136371A (en) 1990-03-15 1992-08-04 Thomson Consumer Electronics, Inc. Digital image coding using random scanning
DE69322713T2 (de) 1992-08-31 1999-05-06 Victor Company Of Japan Vorrichtung zur orthogonalen Transformationskodierung und -dekodierung
TW224553B (en) 1993-03-01 1994-06-01 Sony Co Ltd Method and apparatus for inverse discrete consine transform and coding/decoding of moving picture
TW297202B (ja) 1993-10-13 1997-02-01 Rca Thomson Licensing Corp
KR0183688B1 (ko) 1994-01-12 1999-05-01 김광호 영상부호화방법 및 장치
KR0178198B1 (ko) 1995-03-28 1999-05-01 배순훈 영상 신호 부호화 장치
US5721822A (en) 1995-07-21 1998-02-24 Intel Corporation Run-length encoding/decoding video signals using scan patterns explicitly encoded into bitstreams
US5790706A (en) 1996-07-03 1998-08-04 Motorola, Inc. Method and apparatus for scanning of transform coefficients
JP2002232887A (ja) 1996-11-07 2002-08-16 Matsushita Electric Ind Co Ltd 画像符号化方法および画像符号化装置並びに画像復号化方法および画像復号化装置
CN1882090A (zh) 1996-11-07 2006-12-20 松下电器产业株式会社 图像编码装置和图像解码装置
JPH10271505A (ja) 1997-03-25 1998-10-09 Oki Electric Ind Co Ltd 信号処理装置、符号化回路および復号回路
US5995055A (en) 1997-06-30 1999-11-30 Raytheon Company Planar antenna radiating structure having quasi-scan, frequency-independent driving-point impedance
CN100459715C (zh) 1997-07-31 2009-02-04 日本胜利株式会社 数字视频信号块间预测编码/解码装置及编码/解码方法
JP2900998B2 (ja) * 1997-07-31 1999-06-02 日本ビクター株式会社 ブロック間内挿予測符号化装置、復号化装置、符号化方法及び復号化方法
US6674910B1 (en) 1998-11-24 2004-01-06 Hyundai Electronics Industries Co., Ltd. Apparatus and method for image-compression encoding and decoding using adaptive transform
MXPA02004015A (es) 1999-10-22 2003-09-25 Activesky Inc Un sistema de video orientado a los objetos.
US6724818B1 (en) 2000-07-17 2004-04-20 Telefonaktiebolaget Lm Ericsson (Publ) Alternative block orders for better prediction
CN1142683C (zh) 2000-10-13 2004-03-17 清华大学 无转置行列分离二维离散余弦正反变换电路及其方法
JP2002135126A (ja) 2000-10-26 2002-05-10 Seiko Epson Corp 半導体装置及びこれを用いた電子機器
CN101448162B (zh) 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
KR100468844B1 (ko) 2002-01-07 2005-01-29 삼성전자주식회사 정지영상 및 동영상을 부호화/복호화하기 위한변환계수들의 최적주사방법
MXPA04006814A (es) 2002-01-14 2004-12-06 Nokia Corp Filtros dinamicos de codificacion.
JP4510465B2 (ja) 2002-01-22 2010-07-21 ノキア コーポレイション イメージ/ビデオ符号器及び/又は復号器における変換係数の符号化
US6757576B2 (en) 2002-02-05 2004-06-29 Gcc, Inc. System and method for drawing and manufacturing bent pipes
KR100508798B1 (ko) 2002-04-09 2005-08-19 엘지전자 주식회사 쌍방향 예측 블록 예측 방법
US7170937B2 (en) * 2002-05-01 2007-01-30 Texas Instruments Incorporated Complexity-scalable intra-frame prediction technique
RU2314656C2 (ru) 2002-06-11 2008-01-10 Нокиа Корпорейшн Внутреннее кодирование, основанное на пространственном прогнозировании
CN101043626B (zh) * 2002-07-15 2010-06-09 株式会社日立制作所 动态图像编码方法
US6795584B2 (en) 2002-10-03 2004-09-21 Nokia Corporation Context-based adaptive variable length coding for adaptive block transforms
US7463782B2 (en) 2002-11-05 2008-12-09 Canon Kabushiki Kaisha Data encoding with an amplitude model and path between the data and corresponding decoding
FI116710B (fi) 2002-12-20 2006-01-31 Oplayo Oy Kuvien koodausmenetelmä ja -järjestely
KR100750110B1 (ko) 2003-04-22 2007-08-17 삼성전자주식회사 4×4인트라 휘도 예측 모드 결정방법 및 장치
JP3756897B2 (ja) 2003-07-30 2006-03-15 株式会社東芝 動画像符号化装置及び動画像符号化方法
US7289562B2 (en) 2003-08-01 2007-10-30 Polycom, Inc. Adaptive filter to improve H-264 video quality
US20050036549A1 (en) * 2003-08-12 2005-02-17 Yong He Method and apparatus for selection of scanning mode in dual pass encoding
US7688894B2 (en) * 2003-09-07 2010-03-30 Microsoft Corporation Scan patterns for interlaced video content
JP4127818B2 (ja) 2003-12-24 2008-07-30 株式会社東芝 動画像符号化方法及びその装置
KR20050068207A (ko) * 2003-12-29 2005-07-05 엘지.필립스 엘시디 주식회사 2-블록 레이저 마스크 및 이를 이용한 결정화방법
EP1558039A1 (en) 2004-01-21 2005-07-27 Deutsche Thomson-Brandt Gmbh Method and apparatus for generating/evaluating prediction information in picture signal encoding/decoding
JP4542447B2 (ja) 2005-02-18 2010-09-15 株式会社日立製作所 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法
US8731054B2 (en) 2004-05-04 2014-05-20 Qualcomm Incorporated Method and apparatus for weighted prediction in predictive frames
US8369402B2 (en) 2004-06-17 2013-02-05 Canon Kabushiki Kaisha Apparatus and method for prediction modes selection based on image formation
JP2006005659A (ja) * 2004-06-17 2006-01-05 Canon Inc 画像符号化装置及びその方法
US8311119B2 (en) 2004-12-31 2012-11-13 Microsoft Corporation Adaptive coefficient scan order
US7706443B2 (en) 2005-03-11 2010-04-27 General Instrument Corporation Method, article of manufacture, and apparatus for high quality, fast intra coding usable for creating digital video content
WO2006109141A1 (en) 2005-04-12 2006-10-19 Nokia Corporation Method and system for motion compensated fine granularity scalable video coding with drift control
EP1768415A1 (en) 2005-09-27 2007-03-28 Matsushita Electric Industrial Co., Ltd. Adaptive scan order of DCT coefficients and its signaling
BRPI0611672A2 (pt) 2005-07-22 2009-01-13 Mitsubishi Electric Corp codificador e decodificador de imagem, mÉtodo de codificaÇço de imagem, programa de codificaÇço de imagem, meio de gravaÇço legÍvel por computador, mÉtodo de decodificaÇço de imagem, programa de decodificaÇço de imagem, e, corrente de bits codificada por imagem
US7933337B2 (en) * 2005-08-12 2011-04-26 Microsoft Corporation Prediction of transform coefficients for image compression
JP2007053561A (ja) 2005-08-17 2007-03-01 Matsushita Electric Ind Co Ltd 画像符号化装置および画像符号化方法
EP2733952A1 (en) 2005-10-21 2014-05-21 Electronics and Telecommunications Research Institute Method for encoding moving picture using adaptive scanning
WO2007063472A2 (en) 2005-11-30 2007-06-07 Koninklijke Philips Electronics N.V. Encoding method and apparatus applying coefficient reordering
US7529484B2 (en) 2005-12-14 2009-05-05 Nec Laboratories America, Inc. Triplexer transceiver using parallel signal detection
CN1801940A (zh) 2005-12-15 2006-07-12 清华大学 整型变换电路和整型变换方法
US8000539B2 (en) 2005-12-21 2011-08-16 Ntt Docomo, Inc. Geometrical image representation and compression
US20080008246A1 (en) 2006-07-05 2008-01-10 Debargha Mukherjee Optimizing video coding
US8488668B2 (en) 2007-06-15 2013-07-16 Qualcomm Incorporated Adaptive coefficient scanning for video coding
US8571104B2 (en) * 2007-06-15 2013-10-29 Qualcomm, Incorporated Adaptive coefficient scanning in video coding
US9078008B2 (en) 2009-04-20 2015-07-07 Dolby Laboratories Licensing Corporation Adaptive inter-layer interpolation filters for multi-layered video delivery
US9641846B2 (en) 2010-10-22 2017-05-02 Qualcomm Incorporated Adaptive scanning of transform coefficients for video coding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10191324A (ja) * 1996-11-07 1998-07-21 Matsushita Electric Ind Co Ltd 画像符号化方法および画像符号化装置並びに画像符号化プログラムを記録した記録媒体
JP2003204550A (ja) * 2002-01-07 2003-07-18 Mitsubishi Electric Corp 動画像符号化装置および動画像復号装置
JP2005528047A (ja) * 2002-05-28 2005-09-15 シャープ株式会社 画像符号化システム、画像復号システム、及び画像を分割したブロックの画素値の予測方法
JP2005039743A (ja) * 2003-07-18 2005-02-10 Sony Corp 画像情報符号化装置及び方法、並びに画像情報復号装置及び方法
JP2007503777A (ja) * 2003-08-26 2007-02-22 トムソン ライセンシング ハイブリッド・イントラ・インター符号化ブロックを符号化する方法及び装置

Also Published As

Publication number Publication date
US20080310504A1 (en) 2008-12-18
US9578331B2 (en) 2017-02-21
JP2010530188A (ja) 2010-09-02
CN101743751B (zh) 2013-05-01
BRPI0813345A2 (pt) 2015-08-11
JP2010530190A (ja) 2010-09-02
TW200913727A (en) 2009-03-16
CA2687263A1 (en) 2008-12-24
BRPI0813351B1 (pt) 2020-09-15
US8619853B2 (en) 2013-12-31
WO2008157360A3 (en) 2009-03-26
TWI401959B (zh) 2013-07-11
JP5254324B2 (ja) 2013-08-07
WO2008157269A2 (en) 2008-12-24
US8520732B2 (en) 2013-08-27
RU2463729C2 (ru) 2012-10-10
EP2172026A2 (en) 2010-04-07
EP2168381A2 (en) 2010-03-31
KR20100029838A (ko) 2010-03-17
WO2008157431A2 (en) 2008-12-24
DK2165543T3 (en) 2015-02-23
CA2687260A1 (en) 2008-12-24
KR101107867B1 (ko) 2012-02-09
US20080310512A1 (en) 2008-12-18
US20080310507A1 (en) 2008-12-18
ES2530796T3 (es) 2015-03-05
CN101803386A (zh) 2010-08-11
PT2165543E (pt) 2015-02-24
CA2687260C (en) 2013-08-27
BRPI0813351A2 (pt) 2015-08-11
EP2165543B1 (en) 2014-12-17
BRPI0813345B1 (pt) 2021-01-12
RU2010101115A (ru) 2011-07-20
JP2010530184A (ja) 2010-09-02
JP5575940B2 (ja) 2014-08-20
RU2010101085A (ru) 2011-07-27
KR101161065B1 (ko) 2012-06-28
RU2434360C2 (ru) 2011-11-20
TW200913723A (en) 2009-03-16
US20140112387A1 (en) 2014-04-24
RU2446615C2 (ru) 2012-03-27
RU2010101116A (ru) 2011-07-20
TW200915880A (en) 2009-04-01
WO2008157360A2 (en) 2008-12-24
US8428133B2 (en) 2013-04-23
CN101682770A (zh) 2010-03-24
PL2165543T3 (pl) 2015-04-30
CN101743751A (zh) 2010-06-16
US20130044812A1 (en) 2013-02-21
US8488668B2 (en) 2013-07-16
KR101091479B1 (ko) 2011-12-07
WO2008157431A8 (en) 2010-03-04
BRPI0813349A2 (pt) 2015-11-03
KR20100029837A (ko) 2010-03-17
CA2687263C (en) 2015-10-20
KR20100029246A (ko) 2010-03-16
EP2165543A2 (en) 2010-03-24
CA2687725A1 (en) 2008-12-24
CN101682770B (zh) 2012-07-04
RU2010101053A (ru) 2011-07-20
RU2447612C2 (ru) 2012-04-10
WO2008157269A3 (en) 2009-03-19
WO2008157431A3 (en) 2009-02-19

Similar Documents

Publication Publication Date Title
JP5575940B2 (ja) ビデオブロック予測モードの適応形符号化
US8483285B2 (en) Video coding using transforms bigger than 4×4 and 8×8
KR101247923B1 (ko) 4×4 및 8×8 보다 큰 변환을 이용한 비디오 코딩

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140513

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140603

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140702

R150 Certificate of patent or registration of utility model

Ref document number: 5575940

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250