JP5259828B2 - Video coding using transforms larger than 4x4 and 8x8 - Google Patents
Video coding using transforms larger than 4x4 and 8x8 Download PDFInfo
- Publication number
- JP5259828B2 JP5259828B2 JP2011530171A JP2011530171A JP5259828B2 JP 5259828 B2 JP5259828 B2 JP 5259828B2 JP 2011530171 A JP2011530171 A JP 2011530171A JP 2011530171 A JP2011530171 A JP 2011530171A JP 5259828 B2 JP5259828 B2 JP 5259828B2
- Authority
- JP
- Japan
- Prior art keywords
- block
- transform
- size
- video
- syntax element
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 184
- 230000008569 process Effects 0.000 claims description 90
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 74
- 230000033001 locomotion Effects 0.000 claims description 74
- 230000009466 transformation Effects 0.000 claims description 40
- 238000006243 chemical reaction Methods 0.000 description 29
- 239000013598 vector Substances 0.000 description 23
- 238000004891 communication Methods 0.000 description 18
- 230000005540 biological transmission Effects 0.000 description 16
- 238000013139 quantization Methods 0.000 description 15
- 230000002123 temporal effect Effects 0.000 description 10
- 238000005192 partition Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000006073 displacement reaction Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000005022 packaging material Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
優先権の主張
各出願の内容全体が参照によって本明細書に組み込まれる、本出願は、2008年10月3日に出願された米国仮出願第61/102783号および2009年5月18日に出願された米国特許仮出願第61/179228号の利益を主張する。
PRIORITY CLAIM The entire contents of each application are incorporated herein by reference. This application is filed on US Provisional Application No. 61/102783 filed Oct. 3, 2008 and May 18, 2009. Claims the benefit of US Provisional Patent Application No. 61 / 179,228.
本発明は、8×8よりも大きい変換サイズを使用したビデオデータの符号化および復号に関する。 The present invention relates to encoding and decoding video data using a transform size larger than 8 × 8.
デジタルビデオ機能は、デジタルテレビ、デジタル直接放送システム、無線電話ハンドセットなどの無線通信装置、無線放送システム、パーソナルデジタルアシスタンス(PDA)、ラップトップまたはデスクトップコンピュータ、デジタルカメラ、デジタル録音装置、ビデオゲーム装置、ビデオゲームコンソースなどを含む広範囲の装置に組み込むことができる。デジタルビデオ装置は、MPEG−2や、MPEG−4や、H.264/MPEG−4,Part 10,Advanced Video Coding(AVC)などのビデオ圧縮技術を実施してデジタルビデオをより効率的に送受信する。ビデオ圧縮技術は、空間予測および時間予測を実施してビデオシーケンスに固有の冗長性を低減させるかあるいは排除する。
Digital video functions include digital television, digital direct broadcast system, wireless communication device such as wireless telephone handset, wireless broadcast system, personal digital assistance (PDA), laptop or desktop computer, digital camera, digital recording device, video game device, It can be incorporated into a wide range of devices including video game consources. Digital video devices include MPEG-2, MPEG-4, H.264, etc. H.264 / MPEG-4,
ビデオ圧縮は一般に、空間予測および/または時間予測を含む。特に、画面内符号化は、空間予測によって、ビデオフレーム、ビデオフレームのスライスなどを含んでよい所与の符号化後単位内のビデオブロック同士の間の空間冗長性を低減させるかあるいは排除する。これに対して、画面間符号化は、時間予測によって、ビデオシーケンスの連続的な符号化後単位のビデオブロック同士の間の時間冗長性を低減させるかあるいは排除する。画面内符号化の場合、ビデオ符号器は、空間予測を実行し、同じ符号化後単位内の他のデータに基づいてデータを圧縮する。画面間符号化の場合、ビデオ符号器は、動き推定および動き補償を実行して、2つ以上の隣接する符号化後単位の互いに一致するビデオブロックの移動を追跡する。 Video compression generally includes spatial prediction and / or temporal prediction. In particular, intra-screen coding reduces or eliminates spatial redundancy between video blocks within a given post-coding unit that may include video frames, slices of video frames, etc., by spatial prediction. In contrast, inter-frame coding reduces or eliminates temporal redundancy between video blocks in consecutive post-coding units of a video sequence by temporal prediction. For intra-picture encoding, the video encoder performs spatial prediction and compresses data based on other data in the same post-encoding unit. For inter-screen coding, the video encoder performs motion estimation and motion compensation to track the movement of two or more adjacent post-coding units of matching video blocks.
空間または時間予測の後、符号化中の元のビデオブロックから予測プロセス中に生成される予測ビデオブロックを減算することによって、残余ブロックが生成される。したがって、残余ブロックは、予測ブロックと符号化中の現在のブロックとの差を示す。ビデオ符号器は、変換プロセス、量子化プロセス、およびエントロピー符号化プロセスを適用して、残余ブロックの伝達に関連するビットレートをさらに低減させ得る。これらの変換技術は、1組の画素値を周波数ドメインにおける画素値のエネルギーを表す変換係数に変換することができる。量子化は、変換係数に適用され、一般に、任意の所与の係数に関連するビットの数を制限するプロセスを伴う。エントロピー符号化の前に、ビデオ符号器は、量子化された係数ブロックをスキャンして係数の一次元ベクトルに変換する。ビデオ符号器エントロピーは、量子化された変換係数のベクトルを符号化して残余データをさらに圧縮する。 After spatial or temporal prediction, a residual block is generated by subtracting the predicted video block generated during the prediction process from the original video block being encoded. Thus, the residual block indicates the difference between the prediction block and the current block being encoded. The video encoder may apply a transform process, a quantization process, and an entropy coding process to further reduce the bit rate associated with the transmission of the residual block. These conversion techniques can convert a set of pixel values into conversion coefficients that represent the energy of the pixel values in the frequency domain. Quantization is applied to the transform coefficients and generally involves a process that limits the number of bits associated with any given coefficient. Prior to entropy coding, the video encoder scans the quantized coefficient block and converts it to a one-dimensional vector of coefficients. Video encoder entropy encodes a quantized vector of transform coefficients to further compress the residual data.
ビデオ復号器は、エントロピー復号演算を実行して係数を取り込むことができる。また復号器で逆方向スキャンを実行して、係数の受信された一次元ベクトルから二次元ブロックを形成することができる。ビデオ復号器は次いで、各係数を逆量子化し逆変換して、再構成された残余ブロックを得る。ビデオ復号器は次に、動き情報を含む予測情報に基づいて予測ビデオブロックを復号する。ビデオ復号器は次いで、再構成されたビデオブロックを生成するとともにビデオ情報の復号シーケンスを生成するために、予測ビデオブロックを対応する再構成された残余ブロックに加算する。 The video decoder can perform entropy decoding operations to capture the coefficients. A reverse scan can also be performed at the decoder to form a two-dimensional block from the received one-dimensional vector of coefficients. The video decoder then dequantizes and inverse transforms each coefficient to obtain a reconstructed residual block. The video decoder then decodes the predicted video block based on the prediction information including motion information. The video decoder then adds the predicted video block to the corresponding reconstructed residual block to generate a reconstructed video block and a decoded sequence of video information.
本出願のシステム、方法、および装置はそれぞれ、いくつかの態様を有し、どの態様もその所望の属性にのみ関係しているわけではない。以下に、特許請求の範囲によって表される本出願の範囲を制限せずに、本出願の顕著な特徴についてここで簡単に論じる。この議論を検討し、特に「詳細な説明」という名称の節を読んだ後、本出願の例示的な特徴が、特に、たとえばビデオ符号化効率の向上を含む、いくつかの向上をどのように実現できるかが理解される。 Each of the systems, methods, and apparatus of the present application has several aspects, and none of the aspects relate only to its desired attributes. In the following, the salient features of the present application will be briefly discussed here without limiting the scope of the present application as represented by the claims. After reviewing this discussion and reading the section entitled “Detailed Description” in particular, the exemplary features of the present application show some improvements, including, for example, improved video coding efficiency, among others. It is understood whether it can be realized.
一実施形態には、ビデオデータを符号化する方法において、予測モードに基づく予測ビデオブロックを生成するためにビデオフレーム内の元のビデオブロックに空間予測または動き補償を適用することと、残余ブロックを形成するために、ビデオフレーム内の元のビデオブロックから予測ビデオブロックを減算することと、残余ブロックに適用するための第1の変換サイズを有する変換を選択することと、選択された変換を示すヘッダデータを生成することであって、前記ヘッダデータが、少なくとも1つの変換サイズを示す第1の値を有する第1の構文要素および予測ビデオブロックの予測ブロックサイズを示す第2の構文要素を備えており、一緒になった前記第1の構文要素と第2の構文要素が第1の変換サイズを示すように、前記ヘッダデータを生成することと、残余変換係数を生成するために、選択された変換を残余ブロックに適用することと、ヘッダデータおよび残余変換係数に基づくビデオ信号を生成することとを備える方法がある。 In one embodiment, in a method for encoding video data, applying spatial prediction or motion compensation to an original video block in a video frame to generate a predicted video block based on a prediction mode; Indicating the selected transform, subtracting the predictive video block from the original video block in the video frame to form, selecting a transform having a first transform size to apply to the remaining blocks Generating header data, the header data comprising a first syntax element having a first value indicating at least one transform size and a second syntax element indicating a predicted block size of the predicted video block; So that the combined first syntax element and second syntax element indicate a first transform size. Generating a data to generate residual transform coefficients, a method comprising the applying the selected transform to the residual block, and generating a video signal based on the header data and the residual transform coefficients.
他の実施形態には、ビデオデータを復号する方法において、少なくとも1つのブロックについてのヘッダデータおよび少なくとも1つのブロックについての残余変換係数を備えるビデオのフレーム内の少なくとも1つのブロックを示すビデオ信号を受信することであって、ヘッダデータが、少なくとも1つの変換サイズを示す第1の値を有する第1の構文要素および少なくとも1つのブロックの予測ブロックサイズを示す第2の構文要素を備えており、一緒になった前記第1の構文要素と第2の構文要素が、少なくとも1つのブロックを符号化するのに使用される第1の変換サイズを有する変換を示している、前記ビデオ信号を受信することと、少なくとも1つのブロックの予測ブロックサイズの予測ビデオブロックを生成するために少なくとも1つのブロックに空間予測または動き補償を適用することと、前記第1の構文要素および第2の構文要素に基づいて少なくとも1つのブロックを符号化するのに使用される第1の変換サイズを判定することと、復号された残余ブロックを得るために判定された第1の変換サイズの逆変換を残余変換係数に適用することと、復号されたビデオブロックを得るために復号された残余ブロックを予測ビデオブロックに加算することを備える方法がある。 In another embodiment, in a method for decoding video data, receiving a video signal indicative of at least one block in a frame of video comprising header data for at least one block and residual transform coefficients for at least one block. The header data comprises a first syntax element having a first value indicating at least one transform size and a second syntax element indicating a predicted block size of at least one block, together Receiving the video signal, wherein the first syntax element and the second syntax element are indicative of a transform having a first transform size used to encode at least one block. And less to generate a predictive video block with a predictive block size of at least one block Applying a spatial prediction or motion compensation to one block and a first transform size used to encode at least one block based on the first syntax element and the second syntax element. Determining, applying an inverse transform of the first transform size determined to obtain a decoded residual block to the residual transform coefficients, and decoding the residual block decoded to obtain a decoded video block There is a method comprising adding to a predicted video block.
他の実施形態には、ビデオデータを符号化する装置において、予測モードに基づいて予測ビデオブロックを生成するために、ビデオフレーム内の元のビデオブロックに空間予測または動き補償を適用するための手段と、残余ブロックを形成するために、ビデオフレーム内の元のビデオブロックから予測ビデオブロックを減算するための手段と、残余ブロックに適用するために第1の変換サイズを有する変換を選択するための手段と、選択された変換を示すヘッダデータを生成するための手段であって、ヘッダデータが、少なくとも1つの変換サイズを示す第1の値を有する第1の構文要素および予測ビデオブロックの予測ブロックサイズを示す第2の構文要素を備えており、前記第1の構文要素と第2の構文要素が一緒に第1の変換サイズを示すように、前記ヘッダデータを生成するための手段と、残余変換係数を生成するために、選択された変換を残余ブロックに適用するための手段と、ヘッダデータおよび残余変換係数に基づくビデオ信号を生成するための手段とを備える装置がある。 In another embodiment, in an apparatus for encoding video data, means for applying spatial prediction or motion compensation to an original video block in a video frame to generate a predicted video block based on a prediction mode And means for subtracting the predicted video block from the original video block in the video frame to form a residual block, and for selecting a transform having a first transform size to apply to the residual block Means for generating header data indicative of the selected transform, wherein the header data has a first syntax element having a first value indicative of at least one transform size and a prediction block of the prediction video block A second syntax element indicative of a size, wherein the first syntax element and the second syntax element together define a first transform size. Means for generating the header data, means for applying the selected transform to the residual block to generate a residual transform coefficient, and a video signal based on the header data and the residual transform coefficient. There are devices comprising means for generating.
他の実施形態には、ビデオデータを復号する装置において、少なくとも1つのブロックについてのヘッダデータおよび少なくとも1つのブロックについての残余変換係数を備える、ビデオのフレーム内の少なくとも1つのブロックを示すビデオ信号を受信するための手段であって、前記ヘッダデータが、少なくとも1つの変換サイズを示す第1の値を有する第1の構文要素および少なくとも1つのブロックの予測ブロックサイズを示す第2の構文要素を備えており、一緒になった前記第1の構文要素と第2の構文要素が少なくとも1つのブロックを符号化するのに使用される第1の変換サイズを有する変換を示している、前記ビデオ信号を受信するための手段と、少なくとも1つのブロックの予測ブロックサイズの予測ビデオブロックを生成するために、少なくとも1つのブロックに空間予測または動き補償を適用するための手段と、前記第1の構文要素および第2の構文要素に基づいて少なくとも1つのブロックを符号化するのに使用される第1の変換サイズを判定するための手段と、復号された残余ブロックを得るために、判定された第1の変換サイズの逆変換を残余変換係数に適用する手段と、復号された残余ブロックを予測ビデオブロックに加算し、復号されたビデオブロックを得るための手段とを備える装置がある。 In another embodiment, in an apparatus for decoding video data, a video signal indicative of at least one block in a frame of video comprising header data for at least one block and a residual transform coefficient for at least one block. Means for receiving, wherein the header data comprises a first syntax element having a first value indicative of at least one transform size and a second syntax element indicative of a predicted block size of at least one block. The video signal, wherein the combined first and second syntax elements are indicative of a transform having a first transform size used to encode at least one block. Means for receiving and generating a predicted video block of predicted block size of at least one block And means for applying spatial prediction or motion compensation to at least one block and encoding at least one block based on the first syntax element and the second syntax element. Means for determining a first transform size, means for applying an inverse transform of the determined first transform size to a residual transform coefficient to obtain a decoded residual block, and a decoded residual block And a means for adding to the predicted video block and obtaining a decoded video block.
他の実施形態には、ビデオデータを符号化するシステムにおいて、予測モードに基づく予測ビデオブロックを生成するために、ビデオフレーム内の元のビデオブロックに空間予測または動き補償を適用するように構成された予測ユニットと、残余ブロックを形成するために、ビデオフレーム内の元のビデオブロックから予測ビデオブロックを減算するように構成された加算器と、第1の変換サイズを有する変換を選択して残余ブロックに適用し、選択された変換を示すヘッダデータを生成するように構成されたプロセッサであって、ヘッダデータが、少なくとも1つの変換サイズを示す第1の値を有する第1の構文要素および予測ビデオブロックの予測ブロックサイズを示す第2の構文要素を備えており、前記第1の構文要素と第2の構文要素が一緒に第1の変換サイズを示すように、前記ヘッダを生成するプロセッサと、残余変換係数を生成するために、選択された変換を残余ブロックに適用するように構成されたブロック変換ユニットと、前記ヘッダデータおよび残余変換係数に基づくビデオ信号を生成するように構成されたエントロピー符号化ユニットとを備えるシステムがある。 In another embodiment, a system for encoding video data is configured to apply spatial prediction or motion compensation to an original video block in a video frame to generate a predicted video block based on a prediction mode. Selected residual unit, an adder configured to subtract the predicted video block from the original video block in the video frame to form a residual block, and a transform having a first transform size to select the residual A processor configured to apply to a block and generate header data indicative of a selected transformation, wherein the header data has a first value indicative of at least one transformation size and a first syntax element and prediction A second syntax element indicating a predicted block size of the video block, the first syntax element and the second syntax element; A processor that generates the header, together with a block transform unit configured to apply a selected transform to the residual block to generate a residual transform coefficient, such that There is a system comprising an entropy coding unit configured to generate a video signal based on the header data and residual transform coefficients.
他の実施形態には、ビデオデータを復号するシステムにおいて、少なくとも1つのブロックについてのヘッダデータおよび少なくとも1つのブロックについての残余変換係数を備える、ビデオのフレーム内の少なくとも1つのブロックを示すビデオ信号を受信するように構成された受信器であって、前記ヘッダデータが、少なくとも1つの変換サイズを示す第1の値を有する第1の構文要素および少なくとも1つのブロックの予測ブロックサイズを示す第2の構文要素を備えており、一緒になった第1の構文要素と第2の構文要素が少なくとも1つのブロックを符号化するのに使用される第1の変換サイズを有する変換を示す、受信器と、少なくとも1つのブロックの予測ブロックサイズの予測ビデオブロックを生成するために、少なくとも1つのブロックに空間予測または動き補償を適用するように構成された予測ユニットと、前記第1の構文要素および第2の構文要素に基づいて少なくとも1つのブロックを符号化するのに使用される第1の変換サイズを判定するように構成されたプロセッサと、復号された残余ブロックを得るために判定された第1の変換サイズの逆変換を残余変換係数に適用するように構成された逆変換ユニットと、復号されたビデオブロックを得るために、復号された残余ブロックを予測ビデオブロックに加算するように構成された加算器とを備えるシステムがある。 In another embodiment, in a system for decoding video data, a video signal indicative of at least one block in a frame of video comprising header data for at least one block and residual transform coefficients for at least one block. A receiver configured to receive, wherein the header data includes a first syntax element having a first value indicative of at least one transform size and a second indicative of a predicted block size of at least one block; A receiver comprising a syntax element, the combined first syntax element and the second syntax element indicating a transform having a first transform size used to encode at least one block; At least to generate a predicted video block of predicted block size of at least one block A prediction unit configured to apply spatial prediction or motion compensation to one block and a first used to encode at least one block based on the first syntax element and the second syntax element; A processor configured to determine a transform size of the first transform size, and an inverse transform unit configured to apply an inverse transform of the first transform size determined to obtain a decoded residual block to the residual transform coefficients There are systems that comprise an adder configured to add the decoded residual block to the predicted video block to obtain a decoded video block.
以下の詳細な説明はある特定の実施形態を対象にする。しかし、本明細書の教示は多数の異なる方法に適用することができる。この説明では、同じ部分が同じ参照符号で示されている図面を参照する。 The following detailed description is directed to certain specific embodiments. However, the teachings herein can be applied in many different ways. In this description, reference is made to the drawings wherein like parts are designated with like reference numerals.
一実施形態は、ビデオ符号化および復号用の変換サイズ構文要素を対象とする。画像およびビデオ信号の符号化および復号プロセスにおいて簡略化された1組の変換選択規則および指針を実施することによって、低ビットレート構文を作成することが可能であった。上述のように、変換サイズ構文は、符号器における特定の変換サイズを示す手段であるとともに復号器における変換サイズを解釈する手段である。変換サイズ構文要素は、使用すべき変換のサイズを示すのに使用することができ、かついくつかのビットを備えるフラグ値を含んでよい。以下の詳細な説明では概して用語「ビデオ」、「画像」、および「ピクチャ」が交換可能に使用されることがあることに留意されたい。したがって、本発明の様々な形態の範囲をこれらの用語同士の違いの概念によって制限すべきではない。 One embodiment is directed to transform size syntax elements for video encoding and decoding. By implementing a simplified set of transform selection rules and guidelines in the image and video signal encoding and decoding processes, it was possible to create a low bit rate syntax. As described above, the transform size syntax is a means for indicating a specific transform size in the encoder and a means for interpreting the transform size in the decoder. The transform size syntax element may be used to indicate the size of the transform to be used and may include a flag value comprising a number of bits. Note that in the following detailed description, the terms “video”, “image”, and “picture” may be used interchangeably. Accordingly, the scope of the various forms of the present invention should not be limited by the concept of differences between these terms.
図1は、本開示で説明する符号化技術を実施するビデオ符号化・復号システム10を示すブロック図である。図1に示されているように、システム10は、符号化されたビデオデータを通信チャネル16を介して送信先装置14に送信する送信元装置12を含んでいる。送信元装置12は、ビデオ送信装置18、ビデオ符号器20、および送信器22を含んでよい。送信元装置12のビデオ送信装置18は、ビデオカメラなどのビデオ取り込み装置、事前に取り込まれたビデオを含むビデオアーカイブ、またはビデオコンテンツプロバイダからのビデオフィードを含んでよい。さらなる代替形態として、ビデオ送信装置18は、ソースビデオとしてのコンピュータグラフィクスによるデータ、またはライブビデオとコンピュータによって生成されたビデオの組合せを生成することができる。場合によっては、送信元装置12は携帯電話またはテレビ電話であってよく、その場合、ビデオ送信装置18は、電話に搭載されたビデオカメラであってよい。それぞれの場合に、取り込まれたか、事前に取り込まれたか、あるいはコンピュータによって生成されたビデオは、送信器22および通信チャネル16を介して送信元装置12から送信先装置14に送信するようにビデオ符号器20によって符号化することができる。
FIG. 1 is a block diagram illustrating a video encoding /
ビデオ符号器20はビデオ送信装置18からビデオデータを受信する。ビデオ送信装置18から受信されるビデオデータは一連のビデオフレームであってよい。ビデオ符号器20は、一連のフレームを符号化単位に分割し、これらの符号化単位を処理して一連のビデオフレームを符号化する。符号化単位はたとえば、フレーム全体またはフレームの一部(たとえばスライス)であってよい。したがって、場合によっては、フレームをスライスに分割することができる。ビデオ符号器20は、ビデオデータを符号化するために、各符号化単位を画素のブロック(本明細書ではビデオブロックまたはブロックと呼ばれる)に分割し、個々の符号化単位内のビデオブロックを処理する。そのため、符号化単位(たとえば、フレームやスライス)は複数のビデオブロックを含んでよい。言い換えれば、ビデオシーケンスは複数のフレームを含んでよく、フレームは複数のスライスを含んでよく、スライスは複数のビデオブロックを含んでよい。
各ビデオブロックは、一定サイズまたは可変サイズを有してよく、かつ指定された符号化標準に応じて異なるサイズを有してよい。一例として、国際電気通信連合電気通信標準化部門(ITU−T)H.264/MPEG−4,Part 10,Advanced Video Coding(AVC)(以下「H.264/MPEG−4 Part 10 AVC」標準)は、輝度成分については16×16画素、8×8画素、または4×4画素、および彩度成分については8×8画素のような様々なブロックサイズの画像内予測をサポートする。画像内予測は、輝度成分については16×16画素、16×8画素、8×16画素、8×8画素、8×4画素、4×8画素、4×4画素のような様々なブロックサイズで実行することができ、彩度成分については対応するスケールのサイズで実行することができる。H.264では、たとえば、16×16画素の各ビデオブロックは、マクロブロック(MB)と呼ばれることが多く、より小さいサイズの副ブロックに細分して副ブロック単位で画像内予測または画像間予測を施すことができる。一般に、MBおよび様々な副ブロックをビデオブロックとみなすことができる。したがって、MBをビデオブロックとみなすことができ、区分または再区分される場合、MB自体をビデオブロックの組を形成するとみなすことができる。
Each video block may have a constant size or a variable size, and may have a different size depending on the specified coding standard. As an example, International Telecommunication Union Telecommunication Standardization Sector (ITU-T) H.264. H.264 / MPEG-4,
各ビデオブロックごとに、ビデオ符号器20は、ブロックのブロックタイプを選択する。ブロックタイプは、このブロックが画像間予測を使用して予測されるかそれとも画像内予測を使用して予測されるかということと、ブロックの予測ブロックサイズとを示すことができる。たとえば、H.264/MPEG−4 Part 10 AVC標準は、Inter 16×16、Inter 16×8、Inter 8×16、Inter 8×8、Inter 8×4、Inter 4×8、Inter 4×4、Intra 16×16、Intra 8×8、およびIntra 4×4を含むいくつかの画像間予測ブロックタイプおよび画像内予測ブロックタイプをサポートする。以下に詳しく説明するように、ビデオ符号器20は、符号化すべき各ビデオブロックについてブロックタイプの1つを選択することができる。
For each video block,
ビデオ符号器20は、各ビデオブロックについて予測モードも選択する。画像内符号化されたビデオブロックの場合、予測モードは、事前に符号化された1つまたは複数のビデオブロックを使用して現在のビデオブロックを予測する方法を判定することができる。H.264/MPEG−4 Part 10 AVC標準では、たとえば、ビデオ符号器20は、各Intra 4×4ブロックごとに9つの考えられる一方向予測モード、すなわち垂直予測モード、水平予測モード、DC予測モード、対角左下予測モード、対角右下予測モード、垂直右予測モード、水平下予測モード、垂直左予測モード、および水平上予測モードのうちの1つを選択することができる。各Intra 8×8ブロックを予測するのにも同様の予測モードが使用される。Intra 16×16ブロックについては、ビデオ符号器20は、4つの考えられる一方向予測モード、すなわち垂直予測モード、水平予測モード、DC予測モード、および平面上予測モードのうちの1つを選択することができる。場合によっては、ビデオ符号器20は、一方向予測モードだけでなく、一方向モードの組合せを定める1つまたは複数の多方向予測モードも含む1組の予測モードから予測モードを選択することができる。たとえば、1つまたは複数の多方向予測モードは、2つの一方向予測モードを組み合わせた二方向予測モードであってよい。
ビデオ符号器20は、ビデオブロックの予測モードを選択した後、選択された予測モードを使用して予測ビデオブロックを生成する。予測ビデオブロックが元のビデオブロックから減算されて残余ブロックが形成される。残余ブロックは、元のビデオブロックの画素値と生成された予測ブロックの画素値との差としての1組の画素差値を含んでいる。残余ブロックは、二次元ブロックフォーマット(たとえば、画素差値の二次元マトリクスやアレイ)で表すことができる。
After selecting the prediction mode of the video block, the
ビデオ符号器20は、残余ブロックを生成した後、ブロックを符号化する前に残余ブロックにいくつかの他の演算を実行することができる。ビデオ符号器20は、整数変換、DCT変換、方向性変換、またはウェーブレット変換などの変換を画素値の残余ブロックに適用して変換係数のブロックを生成することができる。変換係数は残余ブロックの周波数ドメイン表現であってよい。したがって、ビデオ符号器20は残余画素値を変換係数(残余変換係数とも呼ばれる)に変換する。残余変換係数を変換ブロックまたは係数ブロックと呼ぶことができる。残余変換係数は、分離不能な変換が適用されるときには係数の一次元表現であってよく、あるいは分離可能な変換が適用されるときには係数の二次元表現であってよい。分離不能な変換は分離不能な方向性変換を含んでよい。分離可能な変換は、分離可能な方向性変換、DCT変換、整数変換、およびウェーブレット変換を含んでよい。
変換後に、ビデオ符号器20は、量子化を実行して量子化変換係数を生成する(量子化係数または量子化残余係数とも呼ばれる)。この場合も、量子化係数を一次元ベクトルフォーマットまたは二次元ブロックフォーマットで表すことができる。量子化とは一般に、係数を量子化して、場合によっては、係数を表すのに使用されるデータの量を少なくするプロセスを指す。量子化プロセスは、いくつかまたはすべての係数に関連するビット深さを浅くすることができる。用語「係数」は、本明細書で使用されるときは、変換係数、量子化係数、または他の種類の係数を表すことができる。本開示の技術は、場合によっては、残余画素値、量子化残余画素値、ならびに変換係数および量子化変換係数に適用することができる。
After conversion,
分離可能な変換が使用され、かつ係数ブロックが二次元ブロックフォーマットで表されるとき、ビデオ符号器20は、係数をスキャンして二次元フォーマットから一次元フォーマットに変換する。言い換えれば、ビデオ符号器20は、二次元ブロックから得た係数をスキャンして係数を係数の一次元ベクトルに直列化することができる。本開示の態様の1つによれば、ビデオ符号器20は、収集された統計に基づいて係数ブロックを一次元に変換するのに使用されるスキャン順序を調整することができる。統計は、二次元ブロックの各位置における所与の係数値が零または非零になる可能性の表示を備えてよく、かつたとえば、二次元ブロックの各係数位置に関連する計数、確率または他の統計基準を備えてよい。場合によっては、ブロックの係数位置のサブセットについてのみ統計を収集することができる。たとえば特定数のブロックの後でスキャン順序が評価されると、非零係数を有する確率がより高いと判定されたブロック内の係数位置が、非零係数を有する確率がより低いと判定されたブロック内の係数位置より前にスキャンされるようにスキャン順序を変更することができる。このように、一次元係数ベクトルの最初の部分において非零係数をより効率的にグループ化し、一次元係数ベクトルの最後の部分において零値係数をより効率的にグループ化するように最初のスキャン順序を適合させることができる。これによって、一次元係数ベクトルの最初の部分の非零係数間の零のランが短くなり、一次元係数ベクトルの最後の部分に零のより長い1つのランが位置するようになるため、エントロピー符号化に使用されるビット数を少なくすることができる。
When a separable transform is used and the coefficient block is represented in a two-dimensional block format,
ビデオ符号器20は、係数をスキャンした後、コンテクスト適応可変長符号化(CAVLC)、コンテクスト適応2進算術符号化(CABAC)、ランレングス符号化など、様々なエントロピー符号化方法のいずれかを使用して符号化単位の各ビデオブロックを符号化する。送信元装置12は、符号化されたビデオデータを送信器22およびチャネル16を介して送信先装置14に送信する。通信チャネル16は、無線周波数(RF)スペクトルや1つまたは複数の物理伝送線などの任意の無線通信媒体または有線通信媒体、あるいは無線媒体と有線媒体の任意の組合せを備えてよい。通信チャネル16は、ローカルエリアネットワークなどのパケット式ネットワーク、広域ネットワーク、インターネットなどのグローバルネットワークの一部を形成することができる。通信チャネル16は一般に、符号化されたビデオデータを送信元装置12から送信先装置14まで送信するための任意の適切な通信媒体または様々な通信媒体の集合を表す。
送信先装置14は受信器24と、ビデオ復号器26と、表示装置28とを含んでよい。ビデオ信号を受信する一手段である受信器24は、符号化されたビデオビットストリームを送信元装置12からチャネル16を介して受信する。ビデオ復号器26は、エントロピー復号を適用して符号化されたビデオビットストリームを復号し、ヘッダ情報、動きベクトル、および符号化後単位の符号化されたビデオブロックの量子化残余係数を得る。上述のように、送信元装置12によって符号化された量子化残余係数は一次元ベクトルとして符号化されている。したがって、ビデオ復号器26は、符号化されたビデオブロックの量子化残余係数をスキャンして係数の一次元ベクトルを量子化残余係数の二次元ブロックに変換する。ビデオ復号器26は、ビデオ符号器20と同様に、ビデオブロック内の所与の係数位置が零または非零になる可能性を示す統計を収集し、それによって、符号化プロセスで使用されたのと同じ方法でスキャン順序を調整することができる。したがって、直列化された量子化変換係数の一次元ベクトル表現を量子化変換係数の二次元ブロックに変換し直すために、ビデオ復号器26によって相互適応スキャン順序を適用することができる。
The
ビデオ復号器26は、復号されたヘッダ情報および復号された残余情報を使用して符号化単位の各ブロックを再構成する。特に、ビデオ復号器26は、ヘッダ情報の一部として含められる予測情報および動き情報を使用して現在のビデオブロックの予測ビデオブロックを生成し、予測ブロックを対応する残余ビデオブロックと組み合わせて各ビデオブロックを再構成することができる。送信先装置14は、再構成されたビデオブロックを表示装置28を介してユーザに表示することができる。表示装置28は、陰極管(CRT)、液晶ディスプレイ(LCD)、プラズマディスプレイ、発光ダイオード(LED)ディスプレイ、有機LEDディスプレイ、他の種類の表示ユニットのような様々な表示装置のいずれかを備えてよい。
The
場合によっては、送信元装置12と送信先装置14は実質的に対称的に動作することができる。たとえば、送信元装置12および送信先装置14はそれぞれ、ビデオ符号化構成要素およびビデオ復号構成要素を含んでよい。したがって、システム10は、たとえばビデオストリーミング、ビデオ放送、またはテレビ電話用の装置12、14間の一方向または二方向ビデオ伝送をサポートすることができる。ビデオ符号化構成要素およびビデオ復号構成要素を含む装置は、デジタルビデオレコーダ(DVR)などの一般的な符号化記録再生装置の一部を形成してもよい。
In some cases,
ビデオ符号器20およびビデオ復号器26は、MPEG−1、MPEG−2、およびMPEG−4におけるMoving Picture Experts Group(MPEG)によって定められた標準、ITU−T H.263標準、H.264/MPEG4 Part 10 AVC標準、米国映画テレビ技術者協会(SMPTE)421MビデオCODEC標準(一般には「VC−1」と呼ばれる)、Audio Video Coding Standard Workgroup of China(一般には「AVS」と呼ばれる)によって定められた標準のような様々なビデオ圧縮標準のいずれかと、標準化団体によって定められたかあるいはある機関によって独自標準として開発された任意の他のビデオ符号化標準に従って動作することができる。図1には示されていないが、いくつかの態様では、ビデオ符号器20およびビデオ復号器26はそれぞれ、オーディオ符号器および復号器とそれぞれ一体化することができ、かつ共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を扱う適切なMUX−DEMUXユニットまたは他のハードウェアおよびソフトウェアを含んでよい。このように、送信元装置12および送信先装置14はマルチメディアデータを処理することができる。MUX−DEMUXユニットは、必要に応じて、ITU H.223マルチプレクサプロトコル、またはユーザデータグラムプロトコル(UDP)のような他のプロトコルに従うことができる。
The
いくつかの態様では、ビデオ放送の場合、本開示で説明する技術を拡張H.264ビデオ符号化に適用して、2007年7月に技術標準TIA−1099(「FLO仕様」)として発表されたForward Link Only(FLO)無線インタフェース仕様「Forward Link Only Air Interface Specification for Terrestrial Mobile Multimedia Multicast」を使用して地上移動体マルチメディアマルチキャスト(TM3)システムにおけるリアルタイムビデオサービスを供給することができる。すなわち、通信チャネル16は、FLO仕様などに従って無線ビデオ情報を放送するのに使用される無線情報チャネルを備えてよい。FLO仕様は、FLO無線インタフェースに適したビットストリーム構文および意味ならびに復号プロセスを定義する例を含む。
In some aspects, in the case of video broadcast, the techniques described in this disclosure are extended H.264. Applying to H.264 video coding, Forward Link Only Air Interface Multi-Turrestrable Multi-Turrestrable Multi-Terristral Mestre Ref. Tera-1099 ("FLO Specification") published in July 2007 Can be used to provide real-time video services in terrestrial mobile multimedia multicast (TM3) systems. That is, the
あるいは、DVB−H(デジタルビデオ放送−ハンドヘルド)、ISDB−T(統合サービスデジタル放送−地上)、またはDMB(デジタル媒体放送)のような他の標準に従ってビデオを放送することができる。したがって、送信元装置12は移動無線端末、ビデオストリーミングサーバ、またはビデオ放送サーバであってよい。しかし、本開示で説明する技術は、任意の特定の種類の放送、マルチキャスト、またはポイントツーポイントシステムに限定されない。放送の場合、送信元装置12は、各々が図1の送信先装置14と同様の装置であってよい複数の送信先装置にビデオデータのいくつかのチャネルを放送することができる。したがって、図1には単一の送信先装置14が示されているが、ビデオ放送アプリケーションの場合、送信元装置12は通常、ビデオコンテンツを多数の送信先装置に同時に放送する。
Alternatively, the video can be broadcast according to other standards such as DVB-H (Digital Video Broadcast-Handheld), ISDB-T (Integrated Services Digital Broadcast-Terrestrial), or DMB (Digital Media Broadcast). Accordingly, the
他の例では、イーサネット(登録商標)、電話(たとえばPOTS)、ケーブル、電力線、および光ファイバシステムのうちの1つまたは複数を含む任意の有線または無線通信システム、ならびに/または符号分割多元接続(CDMAまたはCDMA2000)通信システム、周波数分割多元接続(FDMA)システム、直交周波数分割多元(OFDM)接続システム、GSM(登録商標)(Global System for Mobile Communication)やGPRS(汎用パケット無線サービス)やEDGE(拡張データGSM環境)などの時分割多重接続(TDMA)システム、TETRA(Terrestrial Trunked Radio)携帯電話システム、広帯域符号分割多元接続(WCDMA)システム、高データレート1xEV−DO(First generation Evolution Data Only)または1xEV−DOゴールドマルチキャストシステム、IEEE 802.18システム、MediaFLO.TM.システム、DMBシステム、DVB−Hシステム、または2つ以上の装置間のデータ通信用の他の方式のうちの1つまたは複数を含む無線システムによる通信向けに送信器22、通信チャネル16、および受信器24を構成することができる。
In other examples, any wired or wireless communication system including one or more of Ethernet, telephone (eg, POTS), cable, power line, and fiber optic system, and / or code division multiple access ( CDMA or CDMA2000) communication system, frequency division multiple access (FDMA) system, orthogonal frequency division multiple access (OFDM) access system, GSM (Global System for Mobile Communication), GPRS (General Packet Radio Service), EDGE (extended) Time division multiple access (TDMA) system such as data GSM environment), TETRA (Terrestrial Trunked Radio) mobile phone system, wideband code division multiple access (WCDMA) system High data rate 1xEV-DO (First generation Evolution Data Only) or 1xEV-DO Gold Multicast system, IEEE 802.18 system, MediaFLO. TM.
ビデオ符号器20およびビデオ復号器26はそれぞれ、1つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(EPGA)、離散ロジック、ソフトウェア、ハードウェア、ファームウェア、またはそれらの組合せとして実現することができる。ビデオ符号器20およびビデオ復号器26の各々は、いずれも、それぞれの移動装置、加入者装置、放送装置、サーバなどに複合符号器/復号器(CODEC)の一部として一体化することのできる1つまたは複数の符号器または復号器に含めることができる。また、送信元装置12および送信先装置14はそれぞれ、無線通信をサポートするのに十分な無線周波数(RF)無線構成要素およびアンテナを含め、必要に応じて、符号化されたビデオを送受信するのに適切な変調構成要素、復調構成要素、周波数変換構成要素、フィルタリング構成要素、および増幅器構成要素を含んでよい。しかし、例示を容易にするために、このような構成要素については、図1の送信元装置12の送信器22および送信先装置14の受信器24として簡単に説明する。
図2は、ビデオ符号器20の一例を示すブロック図である。ビデオ復号器26は、ビデオ符号器20と同様の構成要素を含んでよい。ビデオ符号器20は、ビデオフレーム内のブロックの画像内符号化および画像間符号化を実行することができる。画像内符号化は、空間予測によって、所与のビデオフレーム内のビデオの空間冗長性を低減させるかあるいは排除する。画像間符号化は、時間予測によって、互いに隣接するフレーム内のビデオの時間冗長性を低減させるかあるいは排除する。画像間符号化の場合、ビデオ符号器20は、動き推定を実行して2つ以上の隣接するフレーム間の互いに一致するビデオブロックの移動を追跡する。
FIG. 2 is a block diagram illustrating an example of the
図2に示されているように、ビデオ符号器20は、符号化すべきビデオフレーム内の現在のビデオブロック21を受信する。図2の例では、ビデオ符号器20は、動き予測ユニット23と、基準フレームストア25と、ブロック変換ユニット29と、量子化ユニット31と、逆量子化ユニット33と、逆変換ユニット35と、エントロピー符号化ユニット37と、モード決定ユニット43と、空間予測ユニット47と、非ブロック化フィルタ49とを含んでいる。ビデオ符号器20は、加算器39、加算器41、およびスイッチ51も含んでいる。ビデオ符号器20は、量子化係数をスキャンするための不図示のスキャンユニットも含んでよい。図2は、ビデオブロックを画像間符号化するビデオ符号器20の時間予測構成要素およびビデオブロックを画像内符号化する空間予測構成要素を示している。スイッチ51は、モード決定ユニット43によって制御することができ、空間予測ビデオブロックまたは時間予測ビデオブロックを入力ビデオブロック用の予測ビデオブロックとして選択するのに使用することができる。
As shown in FIG. 2,
動き予測ユニット23は、画像間符号化を評価する際、ビデオブロック21を1つまたは複数の互いに隣接するビデオフレーム内のブロックと比較して1つまたは複数の動きベクトルを生成する。隣接する1つまたは複数のフレームを基準フレームストア25から取り込むことができる。可変サイズ、たとえば16×16、16×8、8×16、8×8、またはそれより小さいサイズのブロックについて動き推定を実行することができる。動き予測ユニット23は、たとえば速度(rate)歪みモデルに基づいて現在のビデオブロック21に最もよく一致する隣接するフレーム内のブロックを識別し、各ブロック間の変位を求める。これに基づいて、動き予測ユニット23は、変位の大きさおよび軌跡を示す動きベクトルを作成する。
When estimating inter-picture coding,
動きベクトルは、2分の1または4分の1画素精度、あるいは場合によってはそれよりも高い精度を有してよく、ビデオ符号器20が整数画素位置より高い精度で動きを追跡してより優れた予測ブロックを得るのを可能にする。分数画素値を有する動きベクトルを使用すると、動き予測ユニット23で補間演算を実行することができる。たとえば、AVC/H.264標準では、2分の1画素位置で輝度信号を得る際、係数(1、−5、20、20、−5、1)/32を有する6タップウィーナーフィルタを使用することができる。4分の1画素位置で輝度信号を得る際、整数画素位置における値および2分の1画素位置における補間値に対する双線形フィルタリングを使用することができる。最高で1/8画素精度を有してよい彩度構成要素の分数画素補間で双線形フィルタを使用することもできる。動き予測ユニット23は、速度歪みモデルを使用してビデオブロックの最良の動きベクトルを識別した後、動き補償によって予測ビデオブロックを出力する。
Motion vectors may have half or quarter pixel accuracy, or even higher accuracy, and better as
代替形態において、画像内符号化を評価する場合、空間予測ユニット47が使用され、同じ符号化単位(たとえば、同じフレーム)内のすでに符号化されたブロックを使用して予測ビデオブロックが形成される。たとえば、ビデオブロック21をビデオブロック21と同じフレーム内のすでに符号化された他のブロックと比較することができる。いくつかの実施形態では、すでに符号化されたブロックを基準フレームストア25から取り込むことができる。いくつかの実施形態では、様々な空間予測方法を使用することができる。たとえば、H.264/MPEG−4 AVCでは、サイズ4×4、8×8、および/または16×16のビデオブロックに対して方向性空間予測を実行することができる。さらに、4×4輝度ブロックおよび8×8輝度ブロックに合計で9つの予測方向を使用することができる。16×16輝度ブロックおよび16×16彩度ブロックに合計で4つの予測方向を使用することができる。他の種類の空間予測を同じ符号化単位内で実行することができる。たとえば、動き推定と同様のプロセスを使用して、現在の符号化単位のすでに符号化された部分内で現在のビデオブロックに一致するビデオブロックを識別することができる。さらに、一致するビデオブロックと現在のビデオブロックとの変位量を求め、次いで、現在のビデオブロックについての符号化されたビデオヘッダデータの一部として示すことができる。モード決定ユニット43は、ラグランジュ速度歪みモデルのように事前に定められた基準に基づいて最適な空間予測モード(たとえば、予測ブロックサイズ、予測方向、または予測ビデオブロックの変位など)を選択することができる。
In an alternative, when evaluating intra-picture coding,
ビデオ符号器20は、元のブロックから予測ブロックを減算するための一手段である加算器39における元の、現在のビデオブロック21から、動き予測ユニット23または空間予測ユニット47によって作成された予測ビデオブロックを減算することによって残余ビデオブロックを形成する。変換を適用するための一手段であるブロック変換ユニット29は、残余ブロックに変換を適用する。モード決定ユニット43によって、使用すべき変換のサイズおよび種類をブロック変換ユニット29に示すことができる。量子化ユニット31は、変換係数を量子化してビットレートをさらに低下させる。ビデオ信号を生成するための一手段であるエントロピー符号化ユニット37は、量子化係数をエントロピー符号化してビットレートをさらに低下させる。ビデオ復号器26は逆演算を実行して符号化されたビデオを再構成する。
The
逆量子化ユニット33および逆変換ユニット35はそれぞれ、逆量子化および逆変換を適用して残余ブロックを再構成する。加算器41は、再構成された残余ブロックを予測ブロックに加算し、基準フレームストア25に格納される再構成されたビデオブロックを作成する。再構成されたビデオブロックは、動き予測ユニット23または空間予測ユニット47によって、現在のビデオフレームまたは以後のビデオフレーム内の以後のビデオブロックを符号化するのに使用される。
現在のビデオフレーム21内の所与のブロックに動き補償を実行する際、動き予測ユニット23は、固定された1組のフィルタを使用して基準フレームから得た基準ブロックを補間することができる。現在のブロックが一方向に予測される場合には1つの基準ブロックが必要であり、現在のブロックが二方向(双方向)に予測される場合には2つの基準ブロックが必要である。H.264では、場合によっては、順方向および逆方向における複数の基準フレームを使用することができる。動き予測ユニット23で使用される実際のフィルタは、動きベクトルの分数部によって決まる。たとえば、動きベクトルが所与の次元の基準フレーム内の2分の1画素位置を指す場合、2分1画素位置の値を求めるには、(1、−5、20、20、−5、1)/32などの6タップフィルタがその次元において2分の1画素動きベクトルと一緒に使用される。両方の動きベクトル構成要素が整数位置を指す場合、基準フレームストア25内の基準フレームから得た画素値を補間フィルタリング演算を実行せずに直接使用することができる。
In performing motion compensation on a given block in the
図7は、ビデオ復号器26の一例を示すブロック図である。符号化されたビットストリームがシステム700に送り込まれる。ビットストリームの各部分は、それぞれの異なるビデオブロックに相当する。さらに、これらのビデオブロックのいくつかは単一のビデオフレームを構成してもよい。ビットストリームの、所与のビデオブロックに相当する部分がエントロピー復号ユニット702でエントロピー復号され、量子化残余変換係数を備える残余ブロックが形成される。次に、残余ブロックを不図示の逆スキャンユニットで逆スキャンすることができる。残余ブロックを逆量子化ユニット706で逆量子化し逆変換ユニット708で逆変換して復号された残余ブロックを形成することができる。エントロピー復号ユニット702は、後述のように、受信されたヘッダデータに基づいて、実行すべき逆変換の種類および/またはサイズを判定することができる。予測ビデオブロックが生成され、加算ユニット710で、復号された残余ブロックに加算される。
FIG. 7 is a block diagram illustrating an example of the
2種類の予測方法、すなわち画像内予測方法および画像間予測方法のうちの一方を使用して予測ビデオブロックを形成することができる。空間予測ユニット716は、同じビデオフレーム(または符号化単位としてビデオスライスが使用される場合には同じビデオスライス)内のすでに符号化されたブロックを使用して画像内予測ブロックを生成する。動き補償ユニット718は、基準フレームストア720に格納されている前のフレームおよび/または後のフレームを使用して画像間予測ブロックを生成する。ビデオブロックを符号化するのに使用される符号化モードを示す受信されたヘッダデータに応じて、空間予測ユニット716または動き補償ユニット718を呼び出して画像内予測ブロックまたは画像間予測ブロックを生成するようにスイッチ722を切り替えることができる。次に、予測ブロックが、加算ユニット710で、復号された残余ブロックに加算され、復号されたビデオブロックが生成される。
One of two types of prediction methods can be used to form a predictive video block: an intra-picture prediction method and an inter-picture prediction method.
次に、結果として得られた再構成されたビデオブロックは、視覚的に悪影響を与える恐れのあるブロック化アーチファクトを防止するためにビデオブロックをブロックエッジの所でフィルタリングすることができる非ブロック化フィルタリングユニット712に送信される。生成される出力は、復号された最終ビデオブロックである。復号された最終ビデオブロックは、同じまたは他のビデオフレーム内の他のビデオブロックを再構成できるように基準フレームストア720に格納することができる。
The resulting reconstructed video block can then be deblocked filtered so that the video block can be filtered at the block edge to prevent blocking artifacts that can be visually detrimental. Transmitted to
復号器は、符号化されたビデオストリームを適切に復号するために、ビデオデータを符号化するのにどのような種類の変換が使用されたかを知る必要がある。復号器は次に、符号器で使用される順変換に対応する適切な逆変換を適用することがある。したがって、ビデオブロックを符号化するのに使用された変換の種類を示すデータをビデオビットストリームの一部として復号器に送信してビデオブロックを適切に復号する必要がある。 The decoder needs to know what kind of transform was used to encode the video data in order to properly decode the encoded video stream. The decoder may then apply an appropriate inverse transform corresponding to the forward transform used in the encoder. Therefore, it is necessary to properly decode the video block by sending data indicating the type of transform used to encode the video block to the decoder as part of the video bitstream.
図2に関して説明したように、ブロック変換ユニット29は残余ビデオブロックに変換を適用する。残余ブロックに変換を適用すると、量子化およびエントロピー符号化と組み合わせたときに高圧縮効率を可能にする所望のエネルギー集中が実現される。MPEG2やH.264/AVCのような一般的なブロック式ビデオ符号化システムで使用される変換の例には8×8DCT変換ならびに4×4および8×8整数変換が含まれる。
As described with respect to FIG. 2, block
H.264/AVC標準は、高符号化効率をもたらす最新のビデオ符号化標準である。H.264/AVCは様々な種類のブロック変換を使用する。画像内予測(空間予測)されたブロックおよび画像間予測(時間予測)されたブロックについて、H.264/AVCは、4×4DCT変換に基づく4×4整数変換または8×8DCT変換に基づく8×8整数変換を使用する。 H. The H.264 / AVC standard is the latest video coding standard that provides high coding efficiency. H. H.264 / AVC uses various types of block conversion. For blocks that have undergone intra-picture prediction (spatial prediction) and blocks that have undergone inter-picture prediction (temporal prediction). H.264 / AVC uses a 4 × 4 integer transform based on a 4 × 4 DCT transform or an 8 × 8 integer transform based on an 8 × 8 DCT transform.
ビデオ信号の彩度信号については、追加的なレベルの2×2アダマール変換が各ブロック内の2×2DC構成要素に適用される。 For the saturation signal of the video signal, an additional level of 2 × 2 Hadamard transform is applied to the 2 × 2 DC components in each block.
ビデオ信号の輝度信号については、変換は以下のように選択される。まず、当該ブロックが画像内予測されるかそれとも画像間予測されるかが判定される。このブロックが画像間予測される場合、次に、ブロックサイズが8×8よりも小さいかどうかが判定される。該ブロックが8×8よりも小さい場合、4×4整数変換が使用される。該ブロックが8×8以上である場合、4×4整数変換または8×8整数変換が使用される。 For the luminance signal of the video signal, the conversion is selected as follows. First, it is determined whether the block is predicted within a picture or between pictures. If this block is predicted between images, it is next determined whether the block size is smaller than 8 × 8. If the block is smaller than 8x8, a 4x4 integer transform is used. If the block is 8x8 or greater, a 4x4 integer transform or an 8x8 integer transform is used.
当該ブロックが画像内予測される場合、このブロックがINTRA_16×16モードを使用して予測されるかどうかが判定される。該ブロックがINTRA_16×16モードを使用して予測される場合、4×4整数変換が該ブロックに適用され、追加的なレベルの4×4アダマール変換が各ブロック内の4×4DC構成要素に適用される。該ブロックがINTRA_16×16モードを使用して予測されない場合、該ブロックがINTRA_4×4モードを使用して予測される場合には4×4整数変換が使用され、該ブロックがINTRA_8×8モードを使用して予測される場合には8×8整数変換が使用される。 If the block is predicted in-picture, it is determined whether this block is predicted using the INTRA — 16 × 16 mode. If the block is predicted using the INTRA_16 × 16 mode, a 4 × 4 integer transform is applied to the block and an additional level of 4 × 4 Hadamard transform is applied to the 4 × 4 DC component in each block Is done. If the block is not predicted using the INTRA_16x16 mode, a 4x4 integer transform is used if the block is predicted using the INTRA_4x4 mode, and the block uses the INTRA_8x8 mode Therefore, 8 × 8 integer conversion is used.
当該ブロックに対して4×4変換または8×8変換を使用できる場合、変換の選択は使用中のH.264/AVCプロファイルに依存する。ハイプロファイル以外の任意のH.264プロファイル(たとえば、ベースラインプロファイル、拡張ベースラインプロファイル、メインプロファイル)の下では、4×4整数変換のみが使用される。H.264/AVCハイプロファイル(すなわち、忠実度範囲拡張)の下では、8×8DCT変換に基づく8×8整数変換を輝度信号に使用することもできる。4×4整数変換と8×8整数変換のいずれを選択するかは、追加的な構文要素、変換_サイズ_8×8_フラグによって示される。4×4変換または8×8変換を使用できる場合(たとえば、サイズが8×8以上の画像間符号化されたブロック)、変換_サイズ_8×8_フラグが符号化されたビデオデータと一緒に復号器に送信される。変換_サイズ_8×8_フラグが1に設定された場合、残余ブロックに対して8×8整数変換が適用され、そうでない場合(変換_サイズ_8×8_フラグが0に設定された場合)、残余ブロックに対して4×4整数変換が適用される。 If a 4 × 4 or 8 × 8 transform can be used for the block, the transform selection is the H.264 in use. Depends on H.264 / AVC profile. Arbitrary H. other than high profile Under the H.264 profile (eg, baseline profile, extended baseline profile, main profile), only 4 × 4 integer transforms are used. H. Under the H.264 / AVC high profile (ie, fidelity range extension), an 8 × 8 integer transform based on the 8 × 8 DCT transform can also be used for the luminance signal. Whether to select 4 × 4 integer conversion or 8 × 8 integer conversion is indicated by an additional syntax element, conversion_size_8 × 8_flag. If a 4x4 transform or an 8x8 transform can be used (eg, an inter-coded block of size 8x8 or larger), the transform_size_8x8_flag is decoded along with the encoded video data Sent to the instrument. If the transform_size_8 × 8_flag is set to 1, then 8 × 8 integer transform is applied to the remaining block, otherwise (the transform_size_8 × 8_flag is set to 0), the remainder A 4 × 4 integer transform is applied to the block.
H.264/AVCでは、16×16、16×8、8×16、8×8、8×4、4×8、および4×4のような様々なブロックサイズ(すなわち、モーションパーティション)に対して動き予測を実行することができる。通常、対象の縁部および多数のディテールを有する領域の周りではより小さいモーションパーティションが使用され、一方、より平滑な領域の周りにはより大きなモーションパーティションが通常選択される。その結果、動き予測後の残余ブロックも通常より平滑になり、すなわちそれらの残余ブロックはより低い周波数の成分を含む傾向がある。このような信号については、より大きい変換を適用すると、よりうまくエネルギーの集中が行われ得る。モーションパーティションおよび変換サイズを選択する方法およびそのための符号器は、すべて参照によって本明細書に組み込まれる米国特許第5107345号、米国特許第6996283号、および米国特許第6600836号に記載されている。上述のように、H.264/AVCは、4×4整数変換および8×8整数変換のみを画像間符号化されたビデオブロックに使用する。4×4整数変換および8×8整数変換は、現在1ビットサイズに限定されている変換_サイズ_8×8_フラグの値によって示される。したがって、1ビット変換_サイズ_8×8_フラグでは2種類の変換しか示せないためH.264で使用されている現在の構文で追加的な変換サイズを示すことはできない。符号器および復号器によって使用される追加的な変換サイズを示すのを可能にする構文および構文要素について以下に説明する。いくつかの実施形態では、この構文要素は、変換サイズを示す2ビットフラグ値を備える。フラグ値は、復号器に送信されるヘッダ情報の一部として含めることができる。 H. In H.264 / AVC, motion is available for various block sizes (ie, motion partitions) such as 16 × 16, 16 × 8, 8 × 16, 8 × 8, 8 × 4, 4 × 8, and 4 × 4. Prediction can be performed. Typically, smaller motion partitions are used around areas of interest and multiple details, while larger motion partitions are usually selected around smoother areas. As a result, the residual blocks after motion prediction are also smoother than usual, i.e., those residual blocks tend to contain lower frequency components. For such signals, applying a larger transformation may result in better energy concentration. Methods for selecting motion partitions and transform sizes and encoders therefor are described in US Pat. No. 5,107,345, US Pat. No. 6,996,283, and US Pat. No. 6,600,286, all incorporated herein by reference. As mentioned above, H.M. H.264 / AVC uses only 4 × 4 integer transforms and 8 × 8 integer transforms for video blocks that have been inter-coded. The 4 × 4 integer transform and the 8 × 8 integer transform are indicated by the value of transform_size_8 × 8_flag, which is currently limited to 1 bit size. Therefore, since the 1-bit conversion_size_8 × 8_flag can indicate only two types of conversion, The current syntax used in H.264 cannot indicate additional transform sizes. The syntax and syntax elements that make it possible to indicate additional transform sizes used by the encoder and decoder are described below. In some embodiments, this syntax element comprises a 2-bit flag value indicating the transform size. The flag value can be included as part of the header information sent to the decoder.
以下の実施形態では、画像間予測されたビデオブロックまたは画像内予測されたビデオブロックを上述の方法と一緒に使用することができる。すなわち、動き補償または空間予測によってビデオブロックの予測ブロックを形成することができる。動き補償を使用する実施形態では、予測ブロックサイズはモーションパーティションサイズに等しく、したがって、用語「予測ブロック」と用語「モーションパーティション」は相互交換可能に使用することができる。さらに、空間予測が使用される実施形態では、予測ブロックサイズは、使用される空間予測ブロックのサイズに等しい。したがって、用語「予測ブロック」と用語「画像内予測ブロック」または用語「空間予測ブロック」を相互交換可能に使用することができる。たとえば、INTRA_16×16予測およびINTRA_8×8予測を使用して符号化されたビデオブロックに複数の変換選択肢を使用することができる。4×4変換だけでなく、16×16変換、16×8変換、8×16変換、または8×8変換をINTRA_16×16予測されたビデオブロックに適用することができ、INTRA_8×8予測されたビデオブロックに8×8変換を適用することができる。画像内予測されたブロックについては、画像間予測されたビデオブロックと同様に変換サイズを示すことができる。変換サイズフラグ構文要素を予測ブロックサイズ構文要素と組み合わせることができ、変換サイズフラグ構文要素の可変長符号化を使用することができる。 In the following embodiment, an inter-picture predicted video block or an intra-picture predicted video block may be used with the method described above. That is, a prediction block of a video block can be formed by motion compensation or spatial prediction. In embodiments that use motion compensation, the predicted block size is equal to the motion partition size, so the terms “predicted block” and the term “motion partition” can be used interchangeably. Further, in embodiments where spatial prediction is used, the prediction block size is equal to the size of the spatial prediction block used. Accordingly, the terms “prediction block” and the term “intra-picture prediction block” or the term “spatial prediction block” can be used interchangeably. For example, multiple transform options may be used for video blocks encoded using INTRA — 16 × 16 prediction and INTRA — 8 × 8 prediction. In addition to 4x4 transforms, 16x16 transforms, 16x8 transforms, 8x16 transforms, or 8x8 transforms can be applied to INTRA_16x16 predicted video blocks, and INTRA_8x8 predicted An 8 × 8 transform can be applied to the video block. For the intra-picture predicted block, the transform size can be indicated in the same manner as the inter-picture predicted video block. The transform size flag syntax element can be combined with the predicted block size syntax element, and variable length encoding of the transform size flag syntax element can be used.
後述の構文は、フラグ値と所与のブロックの予測ブロックサイズとの両方を使用して変換サイズを示す。当該ブロックの予測ブロックサイズとフラグ値を組み合わせると、フラグ値と変換サイズとの1対1の対応を使用するときよりも多くの変換サイズを示すことができる。たとえば、変換サイズとフラグ値との1対1の対応では、2ビットフラグは、各フラグ値が単一の変換サイズを示す4つの異なる変換サイズを示すに過ぎない。しかし、該ブロックの予測ブロックサイズをさらに利用することによって、同数のビットをフラグに使用して追加的な変換サイズを示すことができる。たとえば、変換サイズを該ブロックの予測ブロックサイズに等しくすべきであることをフラグ値00が示し、予測ブロックサイズがN個の異なるブロックサイズの予測ブロックサイズであってよい場合、単一のフラグ値00が、N個の異なる変換サイズを示すことができる。したがって、一実施形態では、使用中の変換サイズが該ブロックの予測ブロックサイズに等しいことをフラグ値の1つまたは複数が示すことができる。他の実施形態では、可変長符号化を使用してフラグ値を符号化することができる。 The syntax described below indicates the transform size using both the flag value and the predicted block size for a given block. Combining the predicted block size and flag value of the block can indicate more transform sizes than when using a one-to-one correspondence between flag values and transform sizes. For example, in a one-to-one correspondence between conversion size and flag value, a 2-bit flag only indicates four different conversion sizes, each flag value indicating a single conversion size. However, by further utilizing the predicted block size of the block, the same number of bits can be used for flags to indicate additional transform sizes. For example, if the flag value 00 indicates that the transform size should be equal to the predicted block size of the block, and the predicted block size may be a predicted block size of N different block sizes, a single flag value 00 can indicate N different transform sizes. Thus, in one embodiment, one or more of the flag values can indicate that the transform size in use is equal to the predicted block size of the block. In other embodiments, flag values can be encoded using variable length encoding.
図3は、所与のビデオブロックについて符号器20によって使用される変換サイズを示すフラグ値を符号器に設定するプロセス300の例示的な実施形態である。各ビデオブロックの予測ブロックサイズをモード決定ユニット43で判定することができ、変換をブロック変換ユニット29で実行することができる(図2参照)。予測ブロックサイズの選択とあるブロックで使用される変換サイズの選択は、モード決定ユニット43によって行うことができる。プロセス300の第1のステップ302では、この所与のブロックの予測ブロックサイズが8×8よりも大きいかどうかが判定される。予測ブロックサイズが8×8以下である場合、プロセスはステップ306に進む。あるいは、予測ブロックサイズが8×8よりも大きい場合、プロセスはステップ338に進む。
FIG. 3 is an exemplary embodiment of a
ステップ306では、予測ブロックサイズが8×8よりも小さいかどうかが判定される。予測ブロックサイズが8×8よりも小さい場合、プロセス300は、当該ブロックに4×4変換が適用されるステップ310に進む。次いで、プロセス300は、どのフラグ値も復号器に送信されるように設定されないステップ314に進む。あるいは、予測ブロックサイズが8×8以上であるとステップ306で判定される場合、プロセスは、該ブロックで使用すべき変換サイズが8×8であるかどうかが判定されるステップ318に進む。8×8変換サイズを使用すべきでないと判定される場合、プロセス300は、該ブロックに4×4変換が適用されるステップ322に進み、次に、値が0の1ビットフラグが復号器に送信されるように設定されるステップ326に進む。代替形態において、ステップ318で、8×8変換を使用すべきであると判定され、プロセスは、該ブロックに8×8変換が適用されるステップ330に進み、次に、値が1の1ビットフラグが復号器に送信されるように設定されるステップ334に進む。
In
予測ブロックサイズが8×8よりも大きいとステップ302で判定される場合、プロセスはステップ338に進む。ステップ338で、この所与のブロックに8×8よりも大きい変換サイズを使用すべきかどうかが、自動的にまたは手動で、符号器で判定される。8×8よりも大きい変換サイズを使用すべきでない場合、プロセス300は、この所与のブロックに対して使用すべき変換サイズが8×8であるかどうかが判定されるステップ342に進む。使用すべき変換サイズが8×8ではない場合、プロセス300は、該ブロックに4×4変換が適用されるステップ346に進み、次に、1ビットフラグ値0が復号器に送信されるように設定されるステップ350に進む。代替形態において、使用すべき変換サイズが8×8である場合、プロセス300は、該ブロックに8×8変換が適用されるステップ354に進み、次いで2ビットフラグ値10が復号器に送信されるように設定されるステップ358に進む。
If it is determined at
使用すべき変換サイズが8×8よりも大きいとステップ338で判定される場合、プロセス300はステップ362に進む。ステップ362では、この所与のブロックの予測ブロックサイズが16×16であるかどうかが判定される。予測ブロックサイズが16×16であると判定される場合、プロセス300は、16×16変換が該ブロックに適用されるステップ366に進み、次にステップ382に進む。あるいは、予測ブロックサイズが16×16ではないとステップ362で判定される場合、プロセス300は、予測ブロックサイズが8×16であるかどうかが判定されるステップ370に進む。予測ブロックサイズが8×16であると判定される場合、プロセス300は、該ブロックに8×16変換が適用される次のステップ374に進み、次いでステップ382に進む。あるいは、予測ブロックサイズが8×16ではないと判定される場合、プロセス300は、該ブロックに16×8変換が適用される次のステップ374に進み、次いでステップ382に進む。ステップ382では、2ビットフラグ値11が復号器に送信されるように設定される。
If
プロセス300によれば、フラグ値は以下の変換タイプに対応する。
当業者には、プロセス300のステップのいくつかを省略するかあるいは新しいステップを追加しても同じ結果を実現できることが認識される。さらに、ステップのいくつかを異なる順序で実行することができる。フラグ値を再構成する(たとえば、0を8×8変換とし、10を4×4変換とする)ことができることにも留意されたい。
One skilled in the art will recognize that some of the steps of
図4は、所与のビデオブロックについて符号器20によって使用される変換サイズを示すフラグ値を符号器で設定する他のプロセス400の例示的な実施形態である。予測ブロックサイズをモード決定ユニット43で判定することができ、変換をブロック変換ユニット29で実行することができる。予測ブロックサイズの選択とあるブロックで使用される変換サイズの選択は、モード決定ユニット43によって行われる。プロセス400の第1のステップ402では、所与のブロックの予測ブロックサイズが8×8よりも大きいかどうかが判定される。予測ブロックサイズが8×8以下である場合、プロセスはステップ406に進む。あるいは、予測ブロックサイズが8×8よりも大きい場合、プロセスはステップ438に進む。
FIG. 4 is an exemplary embodiment of another process 400 for setting a flag value at the encoder indicating the transform size used by the
ステップ406では、予測ブロックサイズが8×8よりも小さいかどうかが判定される。予測ブロックサイズが8×8よりも小さい場合、プロセス400は、当該ブロックに4×4変換が適用されるステップ410に進む。次いで、プロセス400は、どのフラグ値も復号器に送信されるように設定されないステップ414に進む。あるいは、予測ブロックサイズが8×8以上であるとステップ406で判定される場合、プロセスは、該ブロックで使用すべき変換サイズが8×8であるかどうかが判定されるステップ418に進む。8×8変換サイズを使用すべきでないと判定される場合、プロセス400は、該ブロックに4×4変換が適用されるステップ422に進み、次に、値が0の1ビットフラグが復号器に送信されるように設定されるステップ426に進む。代替形態において、ステップ418で、8×8変換を使用すべきであると判定され、プロセスは、該ブロックに8×8変換が適用されるステップ430に進み、次に、値が1の1ビットフラグが復号器に送信されるように設定されるステップ434に進む。
In
予測ブロックサイズが8×8よりも大きいとステップ402で判定される場合、プロセスはステップ438に進む。ステップ438で、予測ブロックサイズが16×16であるかどうかが判定される。予測ブロックサイズが16×16である場合、プロセス400は、ブロックに適用すべき変換サイズが8×8であるかどうかが判定されるステップ442に進む。適用すべき変換サイズが8×8であると判定される場合、プロセス400は、この所与のブロックに8×8変換が適用されるステップ446に進み、次に、値が00の2ビットフラグが復号器に送信されるように設定されるステップ450に進む。あるいは、適用すべき変換サイズは8×8ではないとステップ442で判定される場合、プロセス442は、該ブロックに16×16変換を適用すべきかどうかが判定されるステップ454に進む。16×16変換を適用すべきである場合、プロセス400は、この所与のブロックに16×16変換が適用されるステップ458に進み、次に値が01の2ビットフラグが復号器に送信されるように設定されるステップ462に進む。一方、適用すべき変換サイズは16×16ではないとステップ454で判定される場合、プロセス400は、この所与のブロックに適用すべき変換サイズが16×8であるかどうかが判定されるステップ466に進む。適用すべき変換サイズが16×8である場合、プロセス400は、この所与のブロックに16×8変換が適用されるステップ470に進み、次に値が10の2ビットフラグが復号器に送信されるように設定されるステップ474に進む。代替形態において、該ブロックに適用すべき変換サイズは16×8ではないとステップ466で判定される場合、プロセス400は、この所与のブロックに8×16変換が適用されるステップ478に進み、次に値が11の2ビットフラグが復号器に送信されるように設定されるステップ482に進む。
If it is determined at
予測ブロックサイズが16×16ではないとステップ438で判定される場合、プロセス400は、この所与のブロックに適用すべき変換サイズが8×8であるかどうかが判定されるステップ484に進む。適用すべき変換が8×8である場合、プロセス400は、該ブロックに8×8変換が適用されるステップ492に進み、次に、1ビットフラグ値0が復号器に送信されるように設定されるステップ426に進む。代替形態において、該ブロックに適用すべき変換サイズは8×8ではないとステップ484で判定される場合、プロセスは、予測ブロックサイズが16×8であるかどうかが判定されるステップ486に進む。予測ブロックサイズが16×8である場合、プロセス400は、該ブロックに16×8変換が実行されるステップ488に進み、次にステップ434に進む。代替形態において、予測ブロックサイズは16×8ではないとステップ486で判定される場合、プロセス400は、該ブロックに8×16変換が実行されるステップ490に進み、次にステップ434に進む。ステップ434では、値が1の1ビットフラグが復号器に送信されるように設定される。
If it is determined at
プロセス400によれば、フラグ値は以下の変換タイプに対応する。
当業者には、プロセス400のステップのいくつかを省略するかあるいは新しいステップを追加しても同じ結果を実現できることが認識される。さらに、ステップのいくつかを異なる順序で実行することができる。フラグ値を再構成する(たとえば、00を16×16変換とし、01を8×8変換とする)ことができることにも留意されたい。 Those skilled in the art will recognize that some of the steps of process 400 may be omitted or new steps added to achieve the same result. In addition, some of the steps can be performed in a different order. Note also that the flag value can be reconstructed (eg, 00 is a 16 × 16 transform and 01 is an 8 × 8 transform).
図5は、プロセス300を使用して符号器20によって符号化されたブロックに対して復号器26で逆変換を実行するためのプロセス500の例示的な実施形態である。他の構成要素として、エントロピー復号ユニット、空間予測ユニット、動き補償ユニット、逆量子化ユニット、逆変換ユニット、エントロピー復号ユニット、および加算器を含んでよい復号器6は、プロセス500の各ステップを実行する一手段である。さらに、復号器26の様々な構成要素を使用してプロセス500の様々なステップを実行することができる。ステップ502では、予測ブロックサイズが8×8より大きいかどうかが判定される。予測ブロックサイズが8×8よりも大きい場合、プロセスは、復号器が、1ビットまたは2ビットフラグ値を探し、このフラグ値および予測ブロックサイズに基づいて逆変換を実行するステップ518に進む。使用すべき逆変換の種類は表1に示されている。あるいは、予測ブロックサイズは8×8以下であるとステップ502で判定される場合、プロセス500は、予測ブロックサイズが8×8よりも小さいかどうかが判定されるステップ506に進む。予測ブロックサイズが8×8よりも小さい場合、プロセス500は、4×4逆変換が実行される次のステップ510に進む。一方、予測ブロックサイズが8×8以上であるとステップ506で判定される場合、プロセスは、復号器が、1ビットフラグ値を探し、フラグ値に基づいて逆変換を実行するステップ514に進む。使用すべき逆変換の種類は表1に示されている。
FIG. 5 is an exemplary embodiment of a
図6は、プロセス400を使用して符号器20によって符号化されたブロックに対して復号器26で逆変換を実行するためのプロセス600の例示的な実施形態である。プロセッサであってよい復号器26は、他の構成要素として、プロセス600の各ステップを実行する一手段である。ステップ602では、予測ブロックサイズが8×8より大きいかどうかが判定される。予測ブロックサイズが8×8よりも大きい場合、プロセスは、予測ブロックサイズが16×16であるかどうかが判定されるステップ618に進む。予測ブロックサイズが16×16である場合、プロセス600は、復号器が2ビットフラグ値を探し、このフラグ値に従って該ブロックに逆変換が実行されるステップ622に進む。使用すべき逆変換の種類は表2に示されている。あるいは、予測ブロックサイズは16×16ではないとステップ618で判定される場合、プロセス600は、復号器が1ビットフラグ値を探し、この1ビット値およびモーションパーティションサイズに基づいて逆変換が実行されるステップ626に進む。使用すべき逆変換の種類は表2に示されている。
FIG. 6 is an exemplary embodiment of a
予測ブロックサイズが8×8以下であるとステップ602で判定される場合、プロセス600は、予測ブロックサイズが8×8よりも小さいかどうかが判定されるステップ606に進む。予測ブロックサイズが8×8よりも小さい場合、プロセス600は、4×4逆変換が実行される次のステップ610に進む。一方、予測ブロックサイズは8×8以上であるとステップ606で判定される場合、プロセスは、復号器が、1ビットフラグ値を探し、フラグ値に基づいて逆変換を実行するステップ614に進む。使用すべき逆変換の種類は表2に示されている。
If it is determined at
プロセス300、400、500、および600は、ビデオのあるブロックに使用すべき変換のサイズを判定するための特定の構文を表している。当業者には、各プロセスが、各ブロックの符号化および復号を行い、かつ各フラグ値を設定する例示的なプロセスに過ぎないことが認識される。追加的なステップ、より少ないステップ、または再構成されたステップを含む他のプロセスを使用しても表1または表2に示されているのと同じ構文を実現することができることに留意されたい。さらに、当業者には、各変換表示に割り当てられた特定のフラグ値を変更できることが認識される。また、表1および表2に示されているのと同様の構文を形成することができる。
追加的な変換サイズ(たとえば、32×32)および予測ブロックサイズ(たとえば、32×32)を使用して各ブロックの符号化および復号を行い、かつ各フラグ値を設定することができることにも留意されたい。たとえば、フラグは、上述のようにフラグ値に2ビットしか使用しない場合でも、フラグは、32×32の変換サイズを示すことができる。たとえば、プロセス300では、ステップ362は、予測ブロックサイズが32×32に等しいかどうか判定することができ、ステップ370は、予測ブロックサイズが16×32に等しいかどうか判定することができる。次に、各ステップでそれぞれ、当該ブロックに32×32変換、16×32変換、または32×16変換が実行されるようにステップ366、374、および378を修正することができる。したがって、ステップ358で設定されるフラグ値は、16×16、8×16、または16×8の変換ではなく、32×32、16×32、または32×16の変換を示す。フラグ値と予測ブロックサイズの組合せを使用して追加的な変換サイズを示すように追加的な修正を施すことができる。
Note also that additional transform sizes (eg, 32 × 32) and predicted block sizes (eg, 32 × 32) can be used to encode and decode each block and set each flag value. I want to be. For example, even if the flag uses only 2 bits for the flag value as described above, the flag can indicate a conversion size of 32 × 32. For example, in
フラグ値の各ビットは、符号化されたビデオデータの一部として通信チャネル16に沿って送信される。フラグ値の各ビットの配置は、符号化方式に応じて、送信されるビットストリームに沿って異なっていてよい。フラグ値は、復号器に送信されるヘッダの一部であってよい。ヘッダは、ブロックタイプ、予測モード、輝度および彩度についての符号化されたブロックパターン(CBP)、予測ブロックサイズ、および1つまたは複数の動きベクトルのような、現在のビデオブロックの特定の特性を識別することができる追加的なヘッダ構文要素を含んでよい。これらのヘッダ構文要素は、たとえば、ビデオ符号器20内のエントロピー符号化ユニット37で生成することができる。
Each bit of the flag value is transmitted along the
一実施形態では、ヘッダは、符号化されたブロック内に非零係数があるかどうかを示すビットを含む。非零係数が存在する場合、変換サイズを示すビットもヘッダに含められる。非零係数が存在しない場合、変換サイズビットは送信されない。他の実施形態では、非零係数が存在するかどうかとは無関係に各ヘッダにおいて変換サイズ要素が送信される。 In one embodiment, the header includes a bit that indicates whether there are non-zero coefficients in the encoded block. If non-zero coefficients are present, a bit indicating the transform size is also included in the header. If there are no non-zero coefficients, no transform size bits are transmitted. In other embodiments, a transform size element is transmitted in each header regardless of whether non-zero coefficients are present.
本開示で説明した技術は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実施することができる。ユニットまたは構成要素として説明したあらゆる特徴を集積論理装置として一緒に実現するか、あるいは互いに離散しているが相互運用可能な論理装置として別個に実現することができる。各技術は、ソフトウェアで実施される場合、実行時に上述の方法のうちの1つまたは複数を実行する指示を備えるコンピュータ読み取り可能媒体によって少なくとも部分的に実現することができる。コンピュータ読み取り可能媒体は、パッケージ材料を含んでよいコンピュータプログラム製品の一部を形成することができる。コンピュータ読み取り可能な媒体は、シンクロナスDRAM(SDRAM)、読み取り専用メモリ(ROM)、非揮発性ランダムアクセスメモリ(NVRAM)、電気的に消去可能なプログラマブルROM(EEPROM)、フラッシュメモリ、磁気または光学データ記憶媒体などのランダムアクセスメモリ(RAM)を備えてよい。上記に加えてあるいは代替として、これらの技術を少なくとも部分的に、指示またはデータ構造の形でコードを運ぶかあるいは伝達し、かつコンピュータによってアクセスし、読み取り、かつ/あるいは実行することができるコンピュータ読み取り可能な通信媒体によって実現することができる。 The techniques described in this disclosure may be implemented in hardware, software, firmware, or any combination thereof. Any feature described as a unit or component may be implemented together as an integrated logic device or separately as discrete but interoperable logic devices. Each technique, when implemented in software, can be implemented at least in part by a computer-readable medium comprising instructions that when executed execute one or more of the above-described methods. The computer readable medium may form part of a computer program product that may include packaging material. Computer readable media include synchronous DRAM (SDRAM), read only memory (ROM), non-volatile random access memory (NVRAM), electrically erasable programmable ROM (EEPROM), flash memory, magnetic or optical data A random access memory (RAM) such as a storage medium may be provided. In addition to or in the alternative, a computer readable medium capable of carrying or transmitting code in the form of instructions or data structures and accessed, read and / or executed by a computer, at least in part. It can be realized by a possible communication medium.
コードは、1つまたは複数のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルロジックアレイ(FPGA)、または他の同等の集積論理回路または離散論理回路のような1つまたは複数のプロセッサによって実行することができる。したがって、本明細書で使用される用語「プロセッサ」は、前述の構造のいずれかまたは本明細書で説明した技術を実施するのに適した任意の他の構造を指すことがある。また、いくつかの態様では、符号化および復号用に構成されるかあるいは複合ビデオ符号器復号器(CODEC)に組み込まれた専用のソフトウェアユニットまたはハードウェアユニット内に本明細書で説明した機能を設けることができる。様々な特徴をユニットとして示したのは、例示した装置の様々な機能態様を強調するためであり、このようなユニットが別個のハードウェア構成要素またはソフトウェア構成要素によって実現されなければならないことを必ずしも示唆するものではない。むしろ、1つまたは複数のユニットに関連する機能を共通または別個のハードウェア構成要素またはソフトウェア構成要素内に一体化することができる。 The code is like one or more digital signal processors (DSPs), general purpose microprocessors, application specific integrated circuits (ASICs), field programmable logic arrays (FPGAs), or other equivalent integrated or discrete logic circuits Can be executed by one or more processors. Thus, the term “processor” as used herein may refer to any of the foregoing structures or any other structure suitable for implementing the techniques described herein. Also, in some aspects, the functionality described herein may be implemented in a dedicated software unit or hardware unit that is configured for encoding and decoding or that is incorporated into a composite video encoder decoder (CODEC). Can be provided. The various features are shown as units in order to emphasize various functional aspects of the illustrated apparatus, and it is not necessarily that such units must be implemented by separate hardware or software components. It is not a suggestion. Rather, functionality associated with one or more units can be integrated within a common or separate hardware or software component.
本開示の様々な実施形態について説明した。これらの実施形態および他の実施形態は以下の特許請求の範囲内である。
以下に本件出願当初の特許請求の範囲に記載された発明を付記する。
(1)
ビデオデータを符号化する方法において、
予測モードに基づく予測ビデオブロックを生成するためにビデオフレーム内の元のビデオブロックに空間予測または動き補償を適用することと、
残余ブロックを形成するために前記ビデオフレーム内の前記元のビデオブロックから前記予測ビデオブロックを減算することと、
前記残余ブロックに適用するための第1の変換サイズを有する変換を選択することと、
前記選択された変換を示すヘッダデータを生成することであって、前記ヘッダデータが少なくとも1つの変換サイズを示す第1の値を有する第1の構文要素および前記予測ビデオブロックの予測ブロックサイズを示す第2の構文要素を備えており、一緒になった前記第1の構文要素と前記第2の構文要素が前記第1の変換サイズを示しているように前記ヘッダデータを生成することと、
残余変換係数を生成するために前記選択された変換を前記残余ブロックに適用することと、
前記ヘッダデータおよび前記残余変換係数に基づいてビデオ信号を生成することを備える方法。
(2)
前記ヘッダデータは、符号化されたブロックパターンを示す第3の構文要素をさらに備え、前記第3の構文要素は第2の値を備え、前記第1の構文要素は前記第2の値が非零である場合順次前記第3の構文要素の後に続く、(1)に記載の方法。
(3)
前記第1の構文要素の前記第1の値は複数の変換サイズに対応する、(1)に記載の方法。
(4)
前記第1の値は、前記予測ビデオブロックの前記予測ブロックサイズに基づいて前記第1の変換サイズにマップされる、(3)に記載の方法。
(5)
前記第1の変換サイズはサイズX×Yであり、XはYに等しくない、(3)に記載の方法。
(6)
XとYの少なくとも一方は8に等しく、XとYの少なくとも一方は16に等しい、(5)に記載の方法。
(7)
前記第1の変換サイズは前記予測ビデオブロックの前記予測ブロックサイズに等しい、(1)に記載の方法。
(8)
前記第1の変換サイズはN×Mであり、MとNの少なくとも一方は16以上である、(1)に記載の方法。
(9)
前記選択された変換を示すヘッダデータを生成することは、
前記予測ブロックサイズが第1のしきい値よりも大きいかどうかを判定することと、
前記予測ブロックサイズが第2のしきい値より小さいかどうかを判定することを備える、(1)に記載の方法。
(10)
前記第1のしきい値は8×8であり、前記第2のしきい値は8×8である、(9)に記載の方法。
(11)
前記選択された変換を示すヘッダデータを生成することは、
前記予測ブロックサイズが第1のしきい値よりも大きいかどうかを判定することと、
前記予測ブロックサイズが第2の値に等しいかどうかを判定することを備える、(1)に記載の方法。
(12)
前記第1のしきい値は8×8であり、前記第2の値は16×16である、(11)に記載の方法。
(13)
前記第1のしきい値は8×8であり、前記第2の値は16×8である、(11)に記載の方法。
(14)
前記選択された変換は整数変換である、(1)に記載の方法。
(15)
前記選択された変換は離散余弦変換である、(1)に記載の方法。
(16)
前記選択された変換は方向性変換である、(1)に記載の方法。
(17)
ビデオデータを復号する方法において、
少なくとも1つのブロックについてのヘッダデータ及び前記少なくとも1つのブロックについての残余変換係数を備えており、ビデオのフレーム内の前記少なくとも1つのブロックを示すビデオ信号を受信することであって、前記ヘッダデータが、少なくとも1つの変換サイズを示す第1の値を有する第1の構文要素および前記少なくとも1つのブロックの予測ブロックサイズを示す第2の構文要素を備えており、一緒になった前記第1の構文要素と前記第2の構文要素が前記少なくとも1つのブロックを符号化するのに使用される第1の変換サイズを有する変換を示している、前記ビデオ信号を受信することと、
前記少なくとも1つのブロックの前記予測ブロックサイズの予測ビデオブロックを生成するために、前記少なくとも1つのブロックに空間予測または動き補償を適用することと、
前記第1の構文要素および前記第2の構文要素に基づいて前記少なくとも1つのブロックを符号化するのに使用される前記第1の変換サイズを判定すること、
復号された残余ブロックを得るために、前記判定された第1の変換サイズの逆変換を前記残余変換係数に適用することと、
復号されたビデオブロックを得るために、前記復号された残余ブロックを前記予測ビデオブロックに加算することを備える方法。
(18)
前記ヘッダデータは、符号化されたブロックパターンを示す第3の構文要素をさらに備え、該第3の構文要素は第2の値を備え、前記第1の構文要素は、前記第2の値が非零である場合、順次前記第3の構文要素の後に続いている、(17)に記載の方法。
(19)
前記第1の構文要素の前記第1の値は複数の変換サイズに対応する、(17)に記載の方法。
(20)
前記第1の値は、前記少なくとも1つのブロックの前記予測ブロックサイズに基づいて前記第1の変換サイズにマップされる、(19)に記載の方法。
(21)
前記第1の変換サイズはサイズX×Yであり、XはYに等しくない、(17)に記載の方法。
(22)
XとYの少なくとも一方は8に等しく、XとYの少なくとも一方は16に等しい、(21)に記載の方法。
(23)
前記第1の変換サイズは前記少なくとも1つのブロックの前記予測ブロックサイズに等しい、(17)に記載の方法。
(24)
前記第1の変換サイズはN×Mであり、MとNの少なくとも一方は16以上である、(17)に記載の方法。
(25)
前記第1の変換サイズを判定することは、
前記予測ブロックサイズが第1のしきい値よりも大きいかどうかを判定することと、
前記予測ブロックサイズが第2のしきい値より小さいかどうかを判定することとを備える、(17)に記載の方法。
(26)
前記第1のしきい値は8×8であり、前記第2のしきい値は8×8である、(25)に記載の方法。
(27)
前記第1の変換サイズを判定することは、
前記予測ブロックサイズが第1のしきい値よりも大きいかどうかを判定することと、
前記予測ブロックサイズが第2の値に等しいかどうかを判定することを備える、(17)に記載の方法。
(28)
前記第1のしきい値は8×8であり、前記第2の値は16×16である、(27)に記載の方法。
(29)
前記第1のしきい値は8×8であり、前記第2の値は16×8である、(27)に記載の方法。
(30)
前記逆変換は整数変換である、(17)に記載の方法。
(31)
前記逆変換は離散余弦変換である、(17)に記載の方法。
(32)
前記逆変換は方向性変換である、(17)に記載の方法。
(33)
ビデオデータを符号化する装置において、
予測モードに基づく予測ビデオブロックを生成するために、ビデオフレーム内の元のビデオブロックに空間予測または動き補償を適用する手段と、
残余ブロックを形成するために、前記ビデオフレーム内の前記元のビデオブロックから前記予測ビデオブロックを減算する手段と、
前記残余ブロックに適用するために、第1の変換サイズを有する変換を選択して手段と、
前記選択された変換を示すヘッダデータを生成するための手段であって、
前記ヘッダデータが、少なくとも1つの変換サイズを示す第1の値を有する第1の構文要素および前記予測ビデオブロックの予測ブロックサイズを示す第2の構文要素を備えており、一緒になった前記第1の構文要素と前記第2の構文要素が前記第1の変換サイズを示している、前記ヘッダデータを生成するための手段と、
残余変換係数を生成するために前記選択された変換を前記残余ブロックに適用する手段と、
前記ヘッダデータおよび前記残余変換係数に基づいてビデオ信号を生成するための手段を備える装置。
(34)
空間予測または動き補償を適用するための前記手段は予測ユニットを備え、減算するための前記手段は加算器を備え、前記変換サイズを選択するための前記手段はモード決定ユニットを備え、ヘッダデータを生成するための前記手段はエントロピー符号化ユニットを備え、前記選択された変換を適用するための前記手段はブロック変換ユニットを備え、ビデオ信号を生成するための前記手段は前記エントロピー符号化ユニットを備える、(33)に記載の装置。
(35)
ビデオデータを復号する装置において、
少なくとも1つのブロックについてのヘッダデータおよび前記少なくとも1つのブロックについての残余変換係数を備えており、ビデオのフレーム内の前記少なくとも1つのブロックを示すビデオ信号を受信するための手段であって、前記ヘッダデータが、少なくとも1つの変換サイズを示す第1の値を有する第1の構文要素および前記少なくとも1つのブロックのモーションパーティションサイズを示す第2の構文要素を備えており、一緒になった前記第1の構文要素と前記第2の構文要素が前記少なくとも1つのブロックを符号化するのに使用される第1の変換サイズを有する変換を示している、前記ビデオ信号を受信するための手段と、
前記少なくとも1つのブロックの前記予測ブロックサイズの予測ビデオブロックを生成するために、前記少なくとも1つのブロックに空間予測または動き補償を適用するための手段と、
前記第1の構文要素および前記第2の構文要素に基づいて、前記少なくとも1つのブロックを符号化するのに使用される前記第1の変換サイズを判定するための手段と、
復号された残余ブロックを得るために、前記判定された第1の変換サイズの逆変換を前記残余変換係数に適用するための手段と、
復号されたビデオブロックを得るために、前記復号された残余ブロックを前記予測ビデオブロックに加算するための手段を備える装置。
(36)
受信のための前記手段は受信器を備え、空間予測または動き補償を適用するための前記手段は予測ユニットを備え、前記第1の変換サイズを判定するための前記手段はエントロピー復号ユニットを備え、逆変換を適用するための前記手段は逆変換ユニットを備え、加算するための前記手段は加算器を備える、(35)に記載の装置。
(37)
ビデオデータを符号化するシステムにおいて、
予測ビデオブロックを生成するために、ビデオフレーム内の元のビデオブロックに空間予測または動き補償を適用するように構成された予測ユニットと、
残余ブロックを形成するために、前記ビデオフレーム内の前記元のビデオブロックから前記予測ビデオブロックを減算するように構成された加算器と、
前記残余ブロックに適用する第1の変換サイズを有する変換を選択するように構成されたモード決定ユニットと、
残余変換係数を生成するために、前記選択された変換を前記残余ブロックに適用するように構成されたブロック変換ユニットと、
前記選択された変換を示すヘッダデータを生成するものであり、前記ヘッダデータが、少なくとも1つの変換サイズを示す第1の値を有する第1の構文要素および前記予測ビデオブロックの予測ブロックサイズを示す第2の構文要素を備えており、一緒になった前記第1の構文要素と前記第2の構文要素が前記第1の変換サイズを示しており、そして、
前記ヘッダデータおよび前記残余変換係数に基づいてビデオ信号を生成するように構成されたエントロピー符号化ユニットを備えるシステム。
(38)
前記ヘッダデータは、符号化されたブロックパターンを示す第3の構文要素をさらに備え、前記第3の構文要素は第2の値を備え、前記第1の構文要素は、前記第2の値が非零である場合、順次前記第3の構文要素の後に続く、(37)に記載のシステム。
(39)
前記第1の構文要素の前記第1の値は複数の変換サイズに対応する、(37)に記載のシステム。
(40)
前記第1の値は、前記予測ビデオブロックの前記予測ブロックサイズに基づいて前記第1の変換サイズにマップされる、(39)に記載のシステム。
(41)
前記第1の変換サイズはサイズX×Yであり、XはYに等しくない、(37)に記載のシステム。
(42)
XとYの少なくとも一方は8に等しく、XとYの少なくとも一方は16に等しい、(41)に記載のシステム。
(43)
前記第1の変換サイズは前記予測ビデオブロックの前記予測ブロックサイズに等しい、(37)に記載のシステム。
(44)
前記第1の変換サイズはN×Mであり、MとNの少なくとも一方は16以上である、(37)に記載のシステム。
(45)
前記エントロピー符号化ユニットはさらに、前記予測ブロックサイズが第1のしきい値よりも大きいかどうかを判定し、かつ前記予測ブロックサイズが第2のしきい値より小さいかどうかを判定するように構成される、(37)に記載のシステム。
(46)
前記第1のしきい値は8×8であり、前記第2のしきい値は8×8である、(45)に記載のシステム。
(47)
前記エントロピー符号化ユニットはさらに、前記予測ブロックサイズが第1のしきい値よりも大きいかどうかを判定し、かつ前記予測ブロックサイズが第2の値に等しいかどうかを判定するように構成される、(37)に記載のシステム。
(48)
前記第1のしきい値は8×8であり、前記第2の値は16×16である、請求項47)に記載のシステム。
(49)
前記第1のしきい値は8×8であり、前記第2の値は16×8である、(47)に記載のシステム。
(50)
前記選択された変換は整数変換である、(37)に記載のシステム。
(51)
前記選択された変換は離散余弦変換である、(37)に記載のシステム。
(52)
前記選択された変換は方向性変換である、(37)に記載のシステム。
(53)
ビデオデータを復号するシステムにおいて、
少なくとも1つのブロックについてのヘッダデータおよび前記少なくとも1つのブロックについての残余変換係数を備えており、ビデオのフレーム内の前記少なくとも1つのブロックを示すビデオ信号を受信するように構成された受信器であって、前記ヘッダデータが、少なくとも1つの変換サイズを示す第1の値を有する第1の構文要素および前記少なくとも1つのブロックの予測ブロックサイズを示す第2の構文要素を備えており、一緒になった前記第1の構文要素と前記第2の構文要素が前記少なくとも1つのブロックを符号化するのに使用される第1の変換サイズを有する変換を示している、前記受信器と、
前記少なくとも1つのブロックの前記予測ブロックサイズの予測ビデオブロックを生成するために、前記少なくとも1つのブロックに空間予測または動き補償を適用するように構成された予測ユニットと、
前記第1の構文要素および前記第2の構文要素に基づいて前記少なくとも1つのブロックを符号化するのに使用される前記第1の変換サイズを判定するように構成されたエントロピー復号ユニットと、
復号された残余ブロックを得るよために、前記判定された第1の変換サイズの逆変換を前記残余変換係数に適用するように構成された逆変換ユニットと、
復号されたビデオブロックを得るために、前記復号された残余ブロックを前記予測ビデオブロックに加算するように構成された加算器を備えるシステム。
(54)
前記ヘッダデータは、符号化されたブロックパターンを示し、第2の値を備える第3の構文要素をさらに備え、前記第1の構文要素は、前記第2の値が非零である場合、順次前記第3の構文要素の後に続く、(53)に記載のシステム。
(55)
前記第1の構文要素の前記第1の値は複数の変換サイズに相当する、(53)に記載のシステム。
(56)
前記第1の値は、前記少なくとも1つのブロックの前記予測ブロックサイズに基づいて前記第1の変換サイズにマップされる、(55)に記載のシステム。
(57)
前記第1の変換サイズはサイズX×Yであり、XはYに等しくない、(53)に記載のシステム。
(58)
XとYの少なくとも一方は8に等しく、XとYの少なくとも一方は16に等しい、(57)に記載のシステム。
(59)
前記第1の変換サイズは前記少なくとも1つのブロックの前記予測ブロックサイズに等しい、(53)に記載のシステム。
(60)
前記第1の変換サイズはN×Mであり、MとNの少なくとも一方は16以上である、(53)に記載のシステム。
(61)
前記エントロピー復号ユニットはさらに、前記予測ブロックサイズが第1のしきい値よりも大きいかどうかを判定し、かつ前記予測ブロックサイズが第2のしきい値より小さいかどうかを判定するように構成される、(53)に記載のシステム。
(62)
前記第1のしきい値は8×8であり、前記第2のしきい値は8×8である、(61)に記載のシステム。
(63)
前記エントロピー復号ユニットはさらに、前記予測ブロックサイズが第1のしきい値よりも大きいかどうかを判定し、かつ前記予測ブロックサイズが第2の値に等しいかどうかを判定するように構成される、(53)に記載のシステム。
(64)
前記第1のしきい値は8×8であり、前記第2の値は16×16である、(63)に記載のシステム。
(65)
前記第1のしきい値は8×8であり、前記第2の値は16×8である、(63)に記載のシステム。
(66)
前記逆変換は整数変換である、(53)に記載のシステム。
(67)
前記逆変換は離散余弦変換である、(53)に記載のシステム。
(68)
前記逆変換は方向性変換である、(53)に記載のシステム。
(69)
実行時に、
予測モードに基づく予測ビデオブロックを生成するために、ビデオフレーム内の元のビデオブロックに空間予測または動き補償を適用することと、
残余ブロックを形成するために、前記ビデオフレーム内の前記元のビデオブロックから前記予測ビデオブロックを減算することと、
前記残余ブロックに適用するために、第1の変換サイズを有する変換を選択することと、
前記選択された変換を示すヘッダデータを生成することであって、前記ヘッダデータが、少なくとも1つの変換サイズを示す第1の値を有する第1の構文要素および前記予測ビデオブロックの予測ブロックサイズを示す第2の構文要素を備えており、一緒になって前記第1の構文要素と前記第2の構文要素が前記第1の変換サイズを示すように、前記ヘッダデータを生成することと、
残余変換係数を生成するために、前記選択された変換を前記残余ブロックに適用することと、
前記ヘッダデータおよび前記残余変換係数に基づいてビデオ信号を生成することを備える方法を実行する命令を備えるコンピュータ読み取り可能な媒体。
(70)
実行時に、
少なくとも1つのブロックについてのヘッダデータおよび前記少なくとも1つのブロックについての残余変換係数を備えており、ビデオのフレーム内の前記少なくとも1つのブロックを示すビデオ信号を受信することであって、前記ヘッダデータが、少なくとも1つの変換サイズを示す第1の値を有する第1の構文要素および前記少なくとも1つのブロックの予測ブロックサイズを示す第2の構文要素を備えており、一緒になった前記第1の構文要素と前記第2の構文要素が前記少なくとも1つのブロックを符号化するのに使用される第1の変換サイズを有する変換を示している、前記ビデオ信号を受信することと、
前記少なくとも1つのブロックの前記予測ブロックサイズの予測ビデオブロックを生成するために、前記少なくとも1つのブロックに空間予測または動き補償を適用することと、
前記第1の構文要素および前記第2の構文要素に基づいて前記少なくとも1つのブロックを符号化するのに使用される前記第1の変換サイズを判定することと、
復号された残余ブロックを得るために、前記判定された第1の変換サイズの逆変換を前記残余変換係数に適用することと、
復号されたビデオブロックを得るために、前記復号された残余ブロックを前記予測ビデオブロックに加算することを備えた、方法を実行する命令を備えるコンピュータ読み取り可能な媒体。
Various embodiments of the disclosure have been described. These and other embodiments are within the scope of the following claims.
The invention described in the scope of the claims at the beginning of the present application is added below.
(1)
In a method of encoding video data,
Applying spatial prediction or motion compensation to the original video block in the video frame to generate a predictive video block based on the prediction mode;
Subtracting the predicted video block from the original video block in the video frame to form a residual block;
Selecting a transform having a first transform size to apply to the residual block;
Generating header data indicating the selected transform, wherein the header data indicates a first syntax element having a first value indicating at least one transform size and a predicted block size of the predicted video block; Generating the header data such that the first syntax element and the second syntax element together comprise a second syntax element and the second syntax element indicates the first transformation size;
Applying the selected transform to the residual block to generate residual transform coefficients;
Generating a video signal based on the header data and the residual transform coefficients.
(2)
The header data further includes a third syntax element indicating an encoded block pattern, the third syntax element includes a second value, and the first syntax element includes a non-second value. The method according to (1), wherein if zero, the third syntax element is sequentially followed.
(3)
The method of (1), wherein the first value of the first syntax element corresponds to a plurality of transform sizes.
(4)
The method of (3), wherein the first value is mapped to the first transform size based on the predicted block size of the predicted video block.
(5)
The method of (3), wherein the first transform size is size X × Y, where X is not equal to Y.
(6)
The method of (5), wherein at least one of X and Y is equal to 8, and at least one of X and Y is equal to 16.
(7)
The method of (1), wherein the first transform size is equal to the predicted block size of the predicted video block.
(8)
The method according to (1), wherein the first transformation size is N × M, and at least one of M and N is 16 or more.
(9)
Generating header data indicative of the selected transformation;
Determining whether the predicted block size is greater than a first threshold;
The method of (1), comprising determining whether the predicted block size is less than a second threshold.
(10)
The method according to (9), wherein the first threshold value is 8 × 8 and the second threshold value is 8 × 8.
(11)
Generating header data indicative of the selected transformation;
Determining whether the predicted block size is greater than a first threshold;
The method of (1), comprising determining whether the predicted block size is equal to a second value.
(12)
The method according to (11), wherein the first threshold value is 8 × 8 and the second value is 16 × 16.
(13)
The method according to (11), wherein the first threshold value is 8 × 8 and the second value is 16 × 8.
(14)
The method of (1), wherein the selected transformation is an integer transformation.
(15)
The method of (1), wherein the selected transform is a discrete cosine transform.
(16)
The method of (1), wherein the selected transformation is a directional transformation.
(17)
In a method for decoding video data,
Receiving header data for at least one block and residual transform coefficients for the at least one block, receiving a video signal indicative of the at least one block in a frame of video, wherein the header data is A first syntax element having a first value indicating at least one transform size and a second syntax element indicating a predicted block size of the at least one block, the first syntax combined Receiving the video signal, wherein an element and the second syntax element indicate a transform having a first transform size used to encode the at least one block;
Applying spatial prediction or motion compensation to the at least one block to generate a predicted video block of the predicted block size of the at least one block;
Determining the first transform size used to encode the at least one block based on the first syntax element and the second syntax element;
Applying an inverse transform of the determined first transform size to the residual transform coefficients to obtain a decoded residual block;
A method comprising adding the decoded residual block to the predicted video block to obtain a decoded video block.
(18)
The header data further includes a third syntax element indicating an encoded block pattern, the third syntax element includes a second value, and the first syntax element includes the second value. The method according to (17), wherein when non-zero, the third syntax element is sequentially followed.
(19)
The method of (17), wherein the first value of the first syntax element corresponds to a plurality of transform sizes.
(20)
The method of (19), wherein the first value is mapped to the first transform size based on the predicted block size of the at least one block.
(21)
The method of (17), wherein the first transform size is size X × Y, where X is not equal to Y.
(22)
The method of (21), wherein at least one of X and Y is equal to 8, and at least one of X and Y is equal to 16.
(23)
The method of (17), wherein the first transform size is equal to the predicted block size of the at least one block.
(24)
The method according to (17), wherein the first transformation size is N × M, and at least one of M and N is 16 or more.
(25)
Determining the first transform size includes
Determining whether the predicted block size is greater than a first threshold;
Determining whether the predicted block size is less than a second threshold.
(26)
The method according to (25), wherein the first threshold value is 8 × 8 and the second threshold value is 8 × 8.
(27)
Determining the first transform size includes
Determining whether the predicted block size is greater than a first threshold;
The method of (17), comprising determining whether the predicted block size is equal to a second value.
(28)
The method according to (27), wherein the first threshold value is 8 × 8 and the second value is 16 × 16.
(29)
The method according to (27), wherein the first threshold value is 8 × 8 and the second value is 16 × 8.
(30)
The method according to (17), wherein the inverse transformation is an integer transformation.
(31)
The method according to (17), wherein the inverse transform is a discrete cosine transform.
(32)
The method according to (17), wherein the inverse transformation is a directional transformation.
(33)
In an apparatus for encoding video data,
Means for applying spatial prediction or motion compensation to the original video block in the video frame to generate a predictive video block based on the prediction mode;
Means for subtracting the predicted video block from the original video block in the video frame to form a residual block;
Means for selecting a transform having a first transform size to apply to the residual block;
Means for generating header data indicative of the selected transformation comprising:
The header data comprises a first syntax element having a first value indicative of at least one transform size and a second syntax element indicative of a prediction block size of the prediction video block, together with the first syntax element Means for generating the header data, wherein one syntax element and the second syntax element indicate the first transform size;
Means for applying the selected transform to the residual block to generate residual transform coefficients;
An apparatus comprising means for generating a video signal based on the header data and the residual transform coefficients.
(34)
The means for applying spatial prediction or motion compensation comprises a prediction unit, the means for subtracting comprises an adder, the means for selecting the transform size comprises a mode determination unit, and header data The means for generating comprises an entropy coding unit, the means for applying the selected transform comprises a block transform unit, and the means for generating a video signal comprises the entropy coding unit. (33) The apparatus.
(35)
In an apparatus for decoding video data,
Means for receiving a video signal indicative of said at least one block in a frame of video comprising header data for at least one block and a residual transform coefficient for said at least one block, comprising: The data comprises a first syntax element having a first value indicative of at least one transform size and a second syntax element indicative of a motion partition size of the at least one block, the first syntax element together Means for receiving the video signal, wherein the syntax element and the second syntax element indicate a transform having a first transform size used to encode the at least one block;
Means for applying spatial prediction or motion compensation to the at least one block to generate a predictive video block of the predictive block size of the at least one block;
Means for determining the first transform size used to encode the at least one block based on the first syntax element and the second syntax element;
Means for applying an inverse transform of the determined first transform size to the residual transform coefficients to obtain a decoded residual block;
An apparatus comprising means for adding the decoded residual block to the predicted video block to obtain a decoded video block.
(36)
The means for receiving comprises a receiver, the means for applying spatial prediction or motion compensation comprises a prediction unit, and the means for determining the first transform size comprises an entropy decoding unit; The apparatus of (35), wherein said means for applying an inverse transform comprises an inverse transform unit, and said means for adding comprises an adder.
(37)
In a system for encoding video data,
A prediction unit configured to apply spatial prediction or motion compensation to the original video block in the video frame to generate a predictive video block;
An adder configured to subtract the predicted video block from the original video block in the video frame to form a residual block;
A mode determination unit configured to select a transform having a first transform size to apply to the residual block;
A block transform unit configured to apply the selected transform to the residual block to generate a residual transform coefficient;
Generating header data indicating the selected transform, wherein the header data indicates a first syntax element having a first value indicating at least one transform size and a predicted block size of the predicted video block; A first syntax element, the combined first syntax element and the second syntax element indicate the first transform size; and
A system comprising an entropy coding unit configured to generate a video signal based on the header data and the residual transform coefficients.
(38)
The header data further includes a third syntax element indicating an encoded block pattern, the third syntax element includes a second value, and the first syntax element includes the second value. The system according to (37), wherein when non-zero, the third syntax element is sequentially followed.
(39)
The system of (37), wherein the first value of the first syntax element corresponds to a plurality of transform sizes.
(40)
The system of (39), wherein the first value is mapped to the first transform size based on the predicted block size of the predicted video block.
(41)
The system of (37), wherein the first transform size is size X × Y, where X is not equal to Y.
(42)
The system according to (41), wherein at least one of X and Y is equal to 8, and at least one of X and Y is equal to 16.
(43)
The system of (37), wherein the first transform size is equal to the predicted block size of the predicted video block.
(44)
The system according to (37), wherein the first transformation size is N × M, and at least one of M and N is 16 or more.
(45)
The entropy encoding unit is further configured to determine whether the predicted block size is greater than a first threshold and whether the predicted block size is less than a second threshold. The system according to (37).
(46)
The system according to (45), wherein the first threshold value is 8x8 and the second threshold value is 8x8.
(47)
The entropy encoding unit is further configured to determine whether the predicted block size is greater than a first threshold and whether the predicted block size is equal to a second value. (37).
(48)
48. The system of
(49)
The system according to (47), wherein the first threshold value is 8 × 8 and the second value is 16 × 8.
(50)
The system of (37), wherein the selected transform is an integer transform.
(51)
The system of (37), wherein the selected transform is a discrete cosine transform.
(52)
The system of (37), wherein the selected transformation is a directional transformation.
(53)
In a system for decoding video data,
A receiver configured to receive a video signal indicative of the at least one block in a frame of video, comprising header data for at least one block and a residual transform coefficient for the at least one block. The header data comprises a first syntax element having a first value indicating at least one transform size and a second syntax element indicating a predicted block size of the at least one block, together The receiver wherein the first syntax element and the second syntax element are indicative of a transform having a first transform size used to encode the at least one block;
A prediction unit configured to apply spatial prediction or motion compensation to the at least one block to generate a prediction video block of the prediction block size of the at least one block;
An entropy decoding unit configured to determine the first transform size used to encode the at least one block based on the first syntax element and the second syntax element;
An inverse transform unit configured to apply an inverse transform of the determined first transform size to the residual transform coefficients to obtain a decoded residual block;
A system comprising an adder configured to add the decoded residual block to the predicted video block to obtain a decoded video block.
(54)
The header data indicates an encoded block pattern and further includes a third syntax element having a second value, and the first syntax element is sequentially updated when the second value is non-zero. The system according to (53), which follows the third syntax element.
(55)
The system according to (53), wherein the first value of the first syntax element corresponds to a plurality of transform sizes.
(56)
The system of claim 55, wherein the first value is mapped to the first transform size based on the predicted block size of the at least one block.
(57)
The system of (53), wherein the first transform size is size X × Y, where X is not equal to Y.
(58)
The system of (57), wherein at least one of X and Y is equal to 8, and at least one of X and Y is equal to 16.
(59)
The system of (53), wherein the first transform size is equal to the predicted block size of the at least one block.
(60)
The system according to (53), wherein the first transformation size is N × M, and at least one of M and N is 16 or more.
(61)
The entropy decoding unit is further configured to determine whether the predicted block size is greater than a first threshold and whether the predicted block size is less than a second threshold. The system according to (53).
(62)
The system of (61), wherein the first threshold is 8x8 and the second threshold is 8x8.
(63)
The entropy decoding unit is further configured to determine whether the predicted block size is greater than a first threshold and determine whether the predicted block size is equal to a second value. The system according to (53).
(64)
The system of (63), wherein the first threshold value is 8x8 and the second value is 16x16.
(65)
The system of (63), wherein the first threshold value is 8x8 and the second value is 16x8.
(66)
The system according to (53), wherein the inverse transform is an integer transform.
(67)
The system according to (53), wherein the inverse transform is a discrete cosine transform.
(68)
The system according to (53), wherein the inverse transformation is a directional transformation.
(69)
At runtime,
Applying spatial prediction or motion compensation to the original video block in the video frame to generate a predictive video block based on the prediction mode;
Subtracting the predicted video block from the original video block in the video frame to form a residual block;
Selecting a transform having a first transform size to apply to the residual block;
Generating header data indicating the selected transform, wherein the header data includes a first syntax element having a first value indicating at least one transform size and a predicted block size of the predicted video block; Generating the header data such that together the first syntax element and the second syntax element indicate the first transform size, the second syntax element indicating:
Applying the selected transform to the residual block to generate a residual transform coefficient;
A computer readable medium comprising instructions for performing a method comprising generating a video signal based on the header data and the residual transform coefficients.
(70)
At runtime,
Receiving a video signal indicative of the at least one block in a frame of video comprising header data for at least one block and a residual transform coefficient for the at least one block, wherein the header data comprises: A first syntax element having a first value indicating at least one transform size and a second syntax element indicating a predicted block size of the at least one block, the first syntax combined Receiving the video signal, wherein an element and the second syntax element indicate a transform having a first transform size used to encode the at least one block;
Applying spatial prediction or motion compensation to the at least one block to generate a predicted video block of the predicted block size of the at least one block;
Determining the first transform size used to encode the at least one block based on the first syntax element and the second syntax element;
Applying an inverse transform of the determined first transform size to the residual transform coefficients to obtain a decoded residual block;
A computer readable medium comprising instructions for performing a method comprising adding the decoded residual block to the predicted video block to obtain a decoded video block.
Claims (62)
予測モードに基づく予測ビデオブロックを生成するためにビデオフレーム内の元のビデオブロックに空間予測または動き補償を適用することと、
残余ブロックを形成するために前記ビデオフレーム内の前記元のビデオブロックから前記予測ビデオブロックを減算することと、
前記残余ブロックに適用するための第1の変換サイズを有する変換を選択することと、
残余変換係数を生成するために、前記選択された変換を前記残余ブロックに適用することと、
前記選択された変換を示すヘッダデータを生成することであって、
前記ヘッダデータが、少なくとも3つの変換サイズを示す第1の値を有する第1の構文要素および前記予測ビデオブロックの予測ブロックサイズを示す第2の構文要素を備えており、ここで前記少なくとも3つの変換サイズは、少なくとも1つのN×M変換サイズを備え、そしてMとNの少なくとも1つは16より大きいか又は等しく、ここで前記第2の構文要素と一緒になった場合のみ前記第1の構文要素の前記第1の値が前記第1の変換サイズを示し、ここで前記ヘッダデータはさらに、前記残余変換係数が1又は複数の非零係数を含むかどうかを示す第3の構文要素を備える、
前記ヘッダデータを生成することと、
前記ヘッダデータおよび前記残余変換係数に基づいてビデオ信号を生成すること、
を備える方法。 In a method for encoding video data by an encoder , the method comprises:
Applying spatial prediction or motion compensation to the original video block in the video frame to generate a predictive video block based on the prediction mode;
Subtracting the predicted video block from the original video block in the video frame to form a residual block;
Selecting a transform having a first transform size to apply to the residual block;
Applying the selected transform to the residual block to generate a residual transform coefficient;
Generating header data indicating the selected transformation, comprising:
The header data comprises a first syntax element having a first value indicating at least three transform sizes and a second syntax element indicating a prediction block size of the prediction video block , wherein the at least three The transform size comprises at least one N × M transform size, and at least one of M and N is greater than or equal to 16, where the first only when combined with the second syntax element The first value of the syntax element indicates the first transform size, where the header data further includes a third syntax element indicating whether the residual transform coefficient includes one or more non-zero coefficients. Prepare
Generating the header data ;
Generating a video signal based on the header data and the residual transform coefficient;
A method comprising:
前記予測ブロックサイズが第1のしきい値よりも大きいかどうかを判定することと、
前記予測ブロックサイズが第2のしきい値より小さいかどうかを判定することを備える、請求項1に記載の方法。 Generating header data indicative of the selected transformation;
Determining whether the predicted block size is greater than a first threshold;
The method of claim 1, comprising determining whether the predicted block size is less than a second threshold.
前記予測ブロックサイズが第1のしきい値よりも大きいかどうかを判定することと、
前記予測ブロックサイズが第2の値に等しいかどうかを判定することを備える、請求項1に記載の方法。 Generating header data indicative of the selected transformation;
Determining whether the predicted block size is greater than a first threshold;
The method of claim 1, comprising determining whether the predicted block size is equal to a second value.
少なくとも1つのブロックについてのヘッダデータ及び前記少なくとも1つのブロックについての残余変換係数を備えており、ビデオのフレーム内の前記少なくとも1つのブロックを示すビデオ信号を受信することであって、前記ヘッダデータが、少なくとも3つの変換サイズを示す第1の値を有する第1の構文要素および前記少なくとも1つのブロックの予測ブロックサイズを示す第2の構文要素を備えており、ここで前記少なくとも3つの変換サイズは、少なくとも1つのN×M変換サイズを備え、そしてMとNの少なくとも1つは16より大きいか又は等しく、ここで前記第2の構文要素と一緒になった場合のみ前記第1の構文要素の前記第1の値が前記第1の変換サイズを示し、ここで前記ヘッダデータはさらに、前記残余変換係数が1又は複数の非零係数を含むかどうかを示す第3の構文要素を備える、前記ビデオ信号を受信することと、
前記少なくとも1つのブロックの前記予測ブロックサイズの予測ビデオブロックを生成するために、前記少なくとも1つのブロックに空間予測または動き補償を適用することと、
前記第1の構文要素および前記第2の構文要素に基づいて前記少なくとも1つのブロックを符号化するのに使用された前記第1の変換サイズを判定すること、
復号された残余ブロックを得るために、前記判定された第1の変換サイズの逆変換を前記残余変換係数に適用することと、
復号されたビデオブロックを得るために、前記復号された残余ブロックを前記予測ビデオブロックに加算することを備える方法。 In a method for decoding video data by a decoder , the method comprises:
Receiving header data for at least one block and residual transform coefficients for the at least one block, receiving a video signal indicative of the at least one block in a frame of video, wherein the header data is A first syntax element having a first value indicative of at least three transform sizes and a second syntax element indicative of a predicted block size of the at least one block , wherein the at least three transform sizes are , At least one N × M transform size, and at least one of M and N is greater than or equal to 16, wherein only when combined with the second syntax element is the first syntax element The first value indicates the first transform size, wherein the header data further includes the residual transform coefficient A third syntax element indicating whether to include one or more non-zero coefficients, the method comprising: receiving the video signal,
Applying spatial prediction or motion compensation to the at least one block to generate a predicted video block of the predicted block size of the at least one block;
Determining the first transform size used to encode the at least one block based on the first syntax element and the second syntax element,
Applying an inverse transform of the determined first transform size to the residual transform coefficients to obtain a decoded residual block;
A method comprising adding the decoded residual block to the predicted video block to obtain a decoded video block.
前記予測ブロックサイズが第1のしきい値よりも大きいかどうかを判定することと、
前記予測ブロックサイズが第2のしきい値より小さいかどうかを判定することを備える、請求項15に記載の方法。 Determining the first transform size includes
Determining whether the predicted block size is greater than a first threshold;
16. The method of claim 15, comprising determining whether the predicted block size is less than a second threshold.
前記予測ブロックサイズが第1のしきい値よりも大きいかどうかを判定することと、
前記予測ブロックサイズが第2の値に等しいかどうかを判定することを備える、請求項15に記載の方法。 Determining the first transform size includes
Determining whether the predicted block size is greater than a first threshold;
16. The method of claim 15, comprising determining whether the predicted block size is equal to a second value.
予測モードに基づく予測ビデオブロックを生成するために、ビデオフレーム内の元のビデオブロックに空間予測または動き補償を適用する手段と、
残余ブロックを形成するために、前記ビデオフレーム内の前記元のビデオブロックから前記予測ビデオブロックを減算する手段と、
前記残余ブロックに適用するために、第1の変換サイズを有する変換を選択して手段と、
残余変換係数を生成するために、前記選択された変換を前記残余ブロックに適用する手段と、
前記選択された変換を示すヘッダデータを生成するための手段であって、
前記ヘッダデータが、少なくとも3つの変換サイズを示す第1の値を有する第1の構文要素および前記予測ビデオブロックの予測ブロックサイズを示す第2の構文要素を備えており、ここで前記少なくとも3つの変換サイズは、少なくとも1つのN×M変換サイズを備え、そしてMとNの少なくとも1つは16より大きいか又は等しく、ここで前記第2の構文要素と一緒になった場合のみ前記第1の構文要素の前記第1の値が前記第1の変換サイズを示し、ここで前記ヘッダデータはさらに、前記残余変換係数が1又は複数の非零係数を含むかどうかを示す第3の構文要素を備える、前記ヘッダデータを生成するための手段と、
前記ヘッダデータおよび前記残余変換係数に基づいてビデオ信号を生成するための手段を備える装置。 In an apparatus for encoding video data,
Means for applying spatial prediction or motion compensation to the original video block in the video frame to generate a predictive video block based on the prediction mode;
Means for subtracting the predicted video block from the original video block in the video frame to form a residual block;
Means for selecting a transform having a first transform size to apply to the residual block;
Means for applying the selected transform to the residual block to generate a residual transform coefficient;
Means for generating header data indicative of the selected transformation comprising:
The header data comprises a first syntax element having a first value indicating at least three transform sizes and a second syntax element indicating a prediction block size of the prediction video block , wherein the at least three The transform size comprises at least one N × M transform size, and at least one of M and N is greater than or equal to 16, where the first only when combined with the second syntax element The first value of the syntax element indicates the first transform size, where the header data further includes a third syntax element indicating whether the residual transform coefficient includes one or more non-zero coefficients. comprising, means for generating the header data,
An apparatus comprising means for generating a video signal based on the header data and the residual transform coefficients.
少なくとも1つのブロックについてのヘッダデータおよび前記少なくとも1つのブロックについての残余変換係数を備えており、ビデオのフレーム内の前記少なくとも1つのブロックを示すビデオ信号を受信するための手段であって、前記ヘッダデータが、少なくとも3つの変換サイズを示す第1の値を有する第1の構文要素および前記予測ビデオブロックの予測ブロックサイズを示す第2の構文要素を備えており、ここで前記少なくとも3つの変換サイズは、少なくとも1つのN×M変換サイズを備え、そしてMとNの少なくとも1つは16より大きいか又は等しく、ここで前記第2の構文要素と一緒になった場合のみ前記第1の構文要素の前記第1の値が、前記少なくとも1つのブロックを符号化するために使用された第1の変換サイズを示し、ここで前記ヘッダデータはさらに、前記残余変換係数が1又は複数の非零係数を含むかどうかを示す第3の構文要素を備える、前記ビデオ信号を受信するための手段と、
前記少なくとも1つのブロックの前記予測ブロックサイズの予測ビデオブロックを生成するために、前記少なくとも1つのブロックに空間予測または動き補償を適用するための手段と、
前記第1の構文要素および前記第2の構文要素に基づいて、前記少なくとも1つのブロックを符号化するのに使用された前記第1の変換サイズを判定するための手段と、
復号された残余ブロックを得るために、前記判定された第1の変換サイズの逆変換を前記残余変換係数に適用するための手段と、
復号されたビデオブロックを得るために、前記復号された残余ブロックを前記予測ビデオブロックに加算するための手段を備える装置。 In an apparatus for decoding video data,
Means for receiving a video signal indicative of said at least one block in a frame of video comprising header data for at least one block and a residual transform coefficient for said at least one block, comprising: The data comprises a first syntax element having a first value indicative of at least three transform sizes and a second syntax element indicative of a predicted block size of the predictive video block , wherein the at least three transform sizes Comprises at least one N × M transform size, and at least one of M and N is greater than or equal to 16, wherein the first syntax element only when combined with the second syntax element The first value of the first transform size used to encode the at least one block Shown, wherein the header data further comprises a third syntax element in which the residual transform coefficients indicate whether to include one or more non-zero coefficients, and means for receiving said video signal,
Means for applying spatial prediction or motion compensation to the at least one block to generate a predictive video block of the predictive block size of the at least one block;
It means for determining on the basis of the first syntax element and the second syntax element, wherein the at least one block is used to encode the first transform size,
Means for applying an inverse transform of the determined first transform size to the residual transform coefficients to obtain a decoded residual block;
An apparatus comprising means for adding the decoded residual block to the predicted video block to obtain a decoded video block.
予測ビデオブロックを生成するために、ビデオフレーム内の元のビデオブロックに空間予測または動き補償を適用するように構成された予測ユニットと、
残余ブロックを形成するために、前記ビデオフレーム内の前記元のビデオブロックから前記予測ビデオブロックを減算するように構成された加算器と、
前記残余ブロックに適用する第1の変換サイズを有する変換を選択するように構成されたモード決定ユニットと、
残余変換係数を生成するために、前記選択された変換を前記残余ブロックに適用するように構成されたブロック変換ユニットと、
前記選択された変換を示すヘッダデータを生成するエントロピー符号化ユニットであり、
前記ヘッダデータが、少なくとも3つの変換サイズを示す第1の値を有する第1の構文要素および前記予測ビデオブロックの予測ブロックサイズを示す第2の構文要素を備えており、ここで前記少なくとも3つの変換サイズは、少なくとも1つのN×M変換サイズを備え、そしてMとNの少なくとも1つは16より大きいか又は等しく、ここで前記第2の構文要素と一緒になった場合のみ前記第1の構文要素の前記第1の値が前記第1の変換サイズを示し、そして、前記ヘッダデータおよび前記残余変換係数に基づいてビデオ信号を生成するように構成されている、ここで前記ヘッダデータはさらに、前記残余変換係数が1又は複数の非零係数を含むかどうかを示す第3の構文要素を備える、前記エントロピー符号化ユニットと、
を備えるシステム。 In a system for encoding video data,
A prediction unit configured to apply spatial prediction or motion compensation to the original video block in the video frame to generate a predictive video block;
An adder configured to subtract the predicted video block from the original video block in the video frame to form a residual block;
A mode determination unit configured to select a transform having a first transform size to apply to the residual block;
A block transform unit configured to apply the selected transform to the residual block to generate a residual transform coefficient;
An entropy encoding unit that generates header data indicative of the selected transform;
The header data comprises a first syntax element having a first value indicating at least three transform sizes and a second syntax element indicating a prediction block size of the prediction video block , wherein the at least three The transform size comprises at least one N × M transform size, and at least one of M and N is greater than or equal to 16, where the first only when combined with the second syntax element The first value of the syntax element indicates the first transform size, and is configured to generate a video signal based on the header data and the residual transform coefficient , wherein the header data further includes The entropy coding unit comprising a third syntax element that indicates whether the residual transform coefficients include one or more non-zero coefficients ;
A system comprising:
少なくとも1つのブロックについてのヘッダデータおよび前記少なくとも1つのブロックについての残余変換係数を備えており、ビデオのフレーム内の前記少なくとも1つのブロックを示すビデオ信号を受信するように構成された受信器であって、
前記ヘッダデータが、少なくとも3つの変換サイズを示す第1の値を有する第1の構文要素および前記予測ビデオブロックの予測ブロックサイズを示す第2の構文要素を備えており、ここで前記少なくとも3つの変換サイズは、少なくとも1つのN×M変換サイズを備え、そしてMとNの少なくとも1つは16より大きいか又は等しく、ここで前記第2の構文要素と一緒になった場合のみ前記第1の構文要素の前記第1の値が、前記少なくとも1つのブロックを符号化するために使用された第1の変換サイズを示し、ここで前記ヘッダデータはさらに、前記残余変換係数が1又は複数の非零係数を含むかどうかを示す第3の構文要素を備える、前記受信器と、
前記少なくとも1つのブロックの前記予測ブロックサイズの予測ビデオブロックを生成するために、前記少なくとも1つのブロックに空間予測または動き補償を適用するように構成された予測ユニットと、
前記第1の構文要素および前記第2の構文要素に基づいて前記少なくとも1つのブロックを符号化するのに使用される前記第1の変換サイズを判定するように構成されたエントロピー復号ユニットと、
復号された残余ブロックを得るために、前記判定された第1の変換サイズの逆変換を前記残余変換係数に適用するように構成された逆変換ユニットと、
復号されたビデオブロックを得るために、前記復号された残余ブロックを前記予測ビデオブロックに加算するように構成された加算器を備えるシステム。 In a system for decoding video data,
A receiver configured to receive a video signal indicative of the at least one block in a frame of video, comprising header data for at least one block and a residual transform coefficient for the at least one block. And
The header data comprises a first syntax element having a first value indicating at least three transform sizes and a second syntax element indicating a prediction block size of the prediction video block , wherein the at least three The transform size comprises at least one N × M transform size, and at least one of M and N is greater than or equal to 16, where the first only when combined with the second syntax element The first value of the syntax element indicates a first transform size used to encode the at least one block, wherein the header data further includes one or more non-residue transform coefficients. The receiver comprising a third syntax element indicating whether to include a zero coefficient ;
A prediction unit configured to apply spatial prediction or motion compensation to the at least one block to generate a prediction video block of the prediction block size of the at least one block;
An entropy decoding unit configured to determine the first transform size used to encode the at least one block based on the first syntax element and the second syntax element;
An inverse transform unit configured to apply an inverse transform of the determined first transform size to the residual transform coefficients to obtain a decoded residual block;
A system comprising an adder configured to add the decoded residual block to the predicted video block to obtain a decoded video block.
前記命令に基づいて前記方法は、
予測モードに基づく予測ビデオブロックを生成するために、ビデオフレーム内の元のビデオブロックに空間予測または動き補償を適用することと、
残余ブロックを形成するために、前記ビデオフレーム内の前記元のビデオブロックから前記予測ビデオブロックを減算することと、
前記残余ブロックに適用するために、第1の変換サイズを有する変換を選択することと、
残余変換係数を生成するために、前記選択された変換を前記残余ブロックに適用することと、
前記選択された変換を示すヘッダデータを生成すること、であって、
前記ヘッダデータが、少なくとも3つの変換サイズを示す第1の値を有する第1の構文要素および前記予測ビデオブロックの予測ブロックサイズを示す第2の構文要素を備えており、ここで前記少なくとも3つの変換サイズは、少なくとも1つのN×M変換サイズを備え、そしてMとNの少なくとも1つは16より大きいか又は等しく、ここで前記第2の構文要素と一緒になった場合のみ前記第1の構文要素の前記第1の値が前記第1の変換サイズを示し、そして、
前記ヘッダデータおよび前記残余変換係数に基づいてビデオ信号を生成すること、を実行する、
前記コンピュータ読み取り可能な記憶媒体。 A computer-readable storage medium that stores instructions for one or more computers to perform a process, said instructions causing a method to be executed;
Based on the instructions, the method includes:
Applying spatial prediction or motion compensation to the original video block in the video frame to generate a predictive video block based on the prediction mode;
Subtracting the predicted video block from the original video block in the video frame to form a residual block;
Selecting a transform having a first transform size to apply to the residual block;
Applying the selected transform to the residual block to generate a residual transform coefficient;
Generating header data indicating the selected transformation, comprising:
The header data comprises a first syntax element having a first value indicating at least three transform sizes and a second syntax element indicating a prediction block size of the prediction video block , wherein the at least three The transform size comprises at least one N × M transform size, and at least one of M and N is greater than or equal to 16, where the first only when combined with the second syntax element The first value of the syntax element indicates the first transform size; and
Generating a video signal based on the header data and the residual transform coefficient ;
The computer-readable storage medium.
前記命令に基づいて前記方法は、
少なくとも1つのブロックについてのヘッダデータおよび前記少なくとも1つのブロックについての残余変換係数を備えており、ビデオのフレーム内の前記少なくとも1つのブロックを示すビデオ信号を受信することであって、前記ヘッダデータが、少なくとも3つの変換サイズを示す第1の値を有する第1の構文要素および前記予測ビデオブロックの予測ブロックサイズを示す第2の構文要素を備えており、ここで前記少なくとも3つの変換サイズは、少なくとも1つのN×M変換サイズを備え、そしてMとNの少なくとも1つは16より大きいか又は等しく、ここで前記第2の構文要素と一緒になった場合のみ前記第1の構文要素の前記第1の値が、前記少なくとも1つのブロックを符号化するために使用された第1の変換サイズを示し、ここで前記ヘッダデータはさらに、前記残余変換係数が1又は複数の非零係数を含むかどうかを示す第3の構文要素を備える、前記ビデオ信号を受信することと、
前記少なくとも1つのブロックの前記予測ブロックサイズの予測ビデオブロックを生成するために、前記少なくとも1つのブロックに空間予測または動き補償を適用することと、
前記第1の構文要素および前記第2の構文要素に基づいて前記少なくとも1つのブロックを符号化するのに使用される前記第1の変換サイズを判定することと、
復号された残余ブロックを得るために、前記判定された第1の変換サイズの逆変換を前記残余変換係数に適用することと、
復号されたビデオブロックを得るために、前記復号された残余ブロックを前記予測ビデオブロックに加算すること、を実行する、
前記コンピュータ読み取り可能な記憶媒体。 A computer-readable storage medium that stores instructions for one or more computers to perform a process, said instructions causing a method to be executed;
Based on the instructions, the method includes:
Receiving a video signal indicative of the at least one block in a frame of video comprising header data for at least one block and a residual transform coefficient for the at least one block, wherein the header data comprises: , A first syntax element having a first value indicating at least three transform sizes, and a second syntax element indicating a predicted block size of the predicted video block , wherein the at least three transform sizes are: At least one N × M transform size, and at least one of M and N is greater than or equal to 16, wherein the first syntax element of the first syntax element only when combined with the second syntax element A first value indicates a first transform size used to encode the at least one block; Wherein said header data further includes said residual transform coefficients comprises a third syntax element indicating whether to include one or more non-zero coefficients, for receiving said video signal,
Applying spatial prediction or motion compensation to the at least one block to generate a predicted video block of the predicted block size of the at least one block;
Determining the first transform size used to encode the at least one block based on the first syntax element and the second syntax element;
Applying an inverse transform of the determined first transform size to the residual transform coefficients to obtain a decoded residual block;
Adding the decoded residual block to the predicted video block to obtain a decoded video block ;
The computer-readable storage medium.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10278308P | 2008-10-03 | 2008-10-03 | |
US61/102,783 | 2008-10-03 | ||
US16663109P | 2009-04-03 | 2009-04-03 | |
US61/166,631 | 2009-04-03 | ||
US12/508,434 US8483285B2 (en) | 2008-10-03 | 2009-07-23 | Video coding using transforms bigger than 4×4 and 8×8 |
US12/508,434 | 2009-07-23 | ||
PCT/US2009/059014 WO2010039822A2 (en) | 2008-10-03 | 2009-09-30 | VIDEO CODING USING TRANSFORMS BIGGER THAN 4x4 AND 8x8 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012504915A JP2012504915A (en) | 2012-02-23 |
JP5259828B2 true JP5259828B2 (en) | 2013-08-07 |
Family
ID=44122717
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011530171A Active JP5259828B2 (en) | 2008-10-03 | 2009-09-30 | Video coding using transforms larger than 4x4 and 8x8 |
Country Status (7)
Country | Link |
---|---|
JP (1) | JP5259828B2 (en) |
KR (1) | KR101247923B1 (en) |
AU (1) | AU2009298559B2 (en) |
CA (1) | CA2742390C (en) |
RU (1) | RU2497303C2 (en) |
WO (1) | WO2010039822A2 (en) |
ZA (1) | ZA201103208B (en) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104717502B (en) * | 2009-04-08 | 2018-06-22 | 夏普株式会社 | Dynamic image encoding device and moving image decoding apparatus |
KR20140010192A (en) * | 2010-04-09 | 2014-01-23 | 미쓰비시덴키 가부시키가이샤 | Image encoding device |
US8942282B2 (en) * | 2010-04-12 | 2015-01-27 | Qualcomm Incorporated | Variable length coding of coded block pattern (CBP) in video compression |
HUE040296T2 (en) * | 2010-04-13 | 2019-02-28 | Ge Video Compression Llc | Coding of significance maps and transform coefficient blocks |
KR20110125153A (en) | 2010-05-12 | 2011-11-18 | 에스케이 텔레콤주식회사 | Method and apparatus for filtering image and encoding/decoding of video data using thereof |
US20120082225A1 (en) * | 2010-10-01 | 2012-04-05 | Qualcomm Incorporated | Selective indication of transform sizes |
US9824066B2 (en) | 2011-01-10 | 2017-11-21 | Qualcomm Incorporated | 32-point transform for media data coding |
US9210442B2 (en) | 2011-01-12 | 2015-12-08 | Google Technology Holdings LLC | Efficient transform unit representation |
CN102595116B (en) * | 2011-01-14 | 2014-03-12 | 华为技术有限公司 | Encoding and decoding methods and devices for multiple image block division ways |
US9788019B2 (en) | 2011-03-09 | 2017-10-10 | Hfi Innovation Inc. | Method and apparatus of transform unit partition with reduced complexity |
EP2735154A1 (en) * | 2011-07-22 | 2014-05-28 | Motorola Mobility LLC | Device and methods for scanning rectangular-shaped transforms in video coding |
US9787982B2 (en) | 2011-09-12 | 2017-10-10 | Qualcomm Incorporated | Non-square transform units and prediction units in video coding |
US9247254B2 (en) * | 2011-10-27 | 2016-01-26 | Qualcomm Incorporated | Non-square transforms in intra-prediction video coding |
US10412414B2 (en) | 2012-08-13 | 2019-09-10 | Gurulogic Microsystems Oy | Decoder and method for decoding encoded input data containing a plurality of blocks or packets |
GB2505169B (en) * | 2012-08-13 | 2016-03-16 | Gurulogic Microsystems Oy | decoder and method |
US9774879B2 (en) * | 2013-08-16 | 2017-09-26 | Sony Corporation | Intra-block copying enhancements for HEVC in-range-extension (RExt) |
US9860540B2 (en) * | 2014-01-03 | 2018-01-02 | Qualcomm Incorporated | Inference of nooutputofpriorpicsflag in video coding |
CN114339228B (en) * | 2016-05-04 | 2024-04-12 | 夏普株式会社 | System and method for encoding transform data |
US10694205B2 (en) * | 2017-12-18 | 2020-06-23 | Google Llc | Entropy coding of motion vectors using categories of transform blocks |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10022331A1 (en) * | 2000-05-10 | 2001-11-15 | Bosch Gmbh Robert | Method for transformation coding of moving image sequences e.g. for audio-visual objects, involves block-wise assessing movement vectors between reference- and actual- image signals of image sequence |
US20030123738A1 (en) * | 2001-11-30 | 2003-07-03 | Per Frojdh | Global motion compensation for video pictures |
CN101448162B (en) * | 2001-12-17 | 2013-01-02 | 微软公司 | Method for processing video image |
JP2003319394A (en) * | 2002-04-26 | 2003-11-07 | Sony Corp | Encoding apparatus and method, decoding apparatus and method, recording medium, and program |
US6795584B2 (en) * | 2002-10-03 | 2004-09-21 | Nokia Corporation | Context-based adaptive variable length coding for adaptive block transforms |
US8116374B2 (en) | 2004-05-07 | 2012-02-14 | Broadcom Corporation | Method and system for generating a transform size syntax element for video decoding |
WO2006028088A1 (en) * | 2004-09-08 | 2006-03-16 | Matsushita Electric Industrial Co., Ltd. | Motion image encoding method and motion image decoding method |
DE102004056446A1 (en) | 2004-11-23 | 2006-06-29 | Siemens Ag | Method for transcoding and transcoding device |
JP2007243427A (en) * | 2006-03-07 | 2007-09-20 | Nippon Hoso Kyokai <Nhk> | Encoder and decoder |
CN101507280B (en) * | 2006-08-25 | 2012-12-26 | 汤姆逊许可公司 | Methods and apparatus for reduced resolution partitioning |
JP4901772B2 (en) * | 2007-02-09 | 2012-03-21 | パナソニック株式会社 | Moving picture coding method and moving picture coding apparatus |
-
2009
- 2009-09-30 KR KR1020117010112A patent/KR101247923B1/en active IP Right Grant
- 2009-09-30 WO PCT/US2009/059014 patent/WO2010039822A2/en active Application Filing
- 2009-09-30 CA CA2742390A patent/CA2742390C/en active Active
- 2009-09-30 AU AU2009298559A patent/AU2009298559B2/en active Active
- 2009-09-30 RU RU2011117669/07A patent/RU2497303C2/en active
- 2009-09-30 JP JP2011530171A patent/JP5259828B2/en active Active
-
2011
- 2011-05-03 ZA ZA2011/03208A patent/ZA201103208B/en unknown
Also Published As
Publication number | Publication date |
---|---|
CA2742390A1 (en) | 2010-04-08 |
AU2009298559B2 (en) | 2014-08-21 |
WO2010039822A3 (en) | 2010-05-27 |
AU2009298559A1 (en) | 2010-04-08 |
RU2011117669A (en) | 2012-11-10 |
RU2497303C2 (en) | 2013-10-27 |
WO2010039822A2 (en) | 2010-04-08 |
KR101247923B1 (en) | 2013-03-26 |
JP2012504915A (en) | 2012-02-23 |
KR20110063856A (en) | 2011-06-14 |
ZA201103208B (en) | 2012-01-25 |
CA2742390C (en) | 2015-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5259828B2 (en) | Video coding using transforms larger than 4x4 and 8x8 | |
US8483285B2 (en) | Video coding using transforms bigger than 4×4 and 8×8 | |
KR101135293B1 (en) | Adaptive coding of video block header information | |
US9288501B2 (en) | Motion vector predictors (MVPs) for bi-predictive inter mode in video coding | |
CA2828556C (en) | Quantized pulse code modulation in video coding | |
KR101339878B1 (en) | Texture compression in a video decoder for efficient 2d-3d rendering | |
KR101168843B1 (en) | Video coding of filter coefficients based on horizontal and vertical symmetry | |
US20120243609A1 (en) | Bi-predictive merge mode based on uni-predictive neighbors in video coding | |
JP2012515514A (en) | Filter prediction based on activity metrics when coding video |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120821 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121120 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130326 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130424 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160502 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5259828 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |