WO2014045515A1 - 映像符号化装置、映像符号化方法および映像符号化プログラム - Google Patents

映像符号化装置、映像符号化方法および映像符号化プログラム Download PDF

Info

Publication number
WO2014045515A1
WO2014045515A1 PCT/JP2013/004876 JP2013004876W WO2014045515A1 WO 2014045515 A1 WO2014045515 A1 WO 2014045515A1 JP 2013004876 W JP2013004876 W JP 2013004876W WO 2014045515 A1 WO2014045515 A1 WO 2014045515A1
Authority
WO
WIPO (PCT)
Prior art keywords
node
child
representative
cost
processing target
Prior art date
Application number
PCT/JP2013/004876
Other languages
English (en)
French (fr)
Inventor
慶一 蝶野
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to US14/428,505 priority Critical patent/US20150237345A1/en
Priority to JP2014536569A priority patent/JP6191609B2/ja
Priority to EP13838663.6A priority patent/EP2899974A4/en
Priority to BR112015005387A priority patent/BR112015005387A2/pt
Publication of WO2014045515A1 publication Critical patent/WO2014045515A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Definitions

  • the present invention is a quadtree structure determination technique of a video coding scheme based on a recursive quadtree structure such as HEVC, and is suitably applied to, for example, a video coding apparatus.
  • Non-Patent Document 1 divides each frame of a digitized video into coding tree units (CTU: Coding Tree Unit), and encodes each CTU in the raster scan order.
  • CTU Coding Tree Unit
  • Each CTU is divided into coding units (CU: Coding Unit) in a quad tree structure and encoded.
  • CU is predicted by being divided into prediction units (PU: Prediction Unit).
  • PU Prediction Unit
  • the prediction error of each CU is divided into transform units (TU: Transform Unit) in a quadtree structure, and is subjected to frequency conversion.
  • CU is a coding unit for intra prediction / interframe prediction.
  • intra prediction and interframe prediction will be described.
  • Intra prediction is prediction generated from the reconstructed image of the encoding target frame.
  • Non-Patent Document 1 defines 33 types of angle intra prediction shown in FIG.
  • an intra prediction signal is generated by extrapolating the reconstructed pixels around the encoding target block in any of the 33 types of directions shown in FIG.
  • a CU used for intra prediction is referred to as an intra CU.
  • Inter-frame prediction is prediction based on an image of a reconstructed frame (reference picture) having a display time different from that of an encoding target frame.
  • inter-frame prediction is also referred to as inter prediction.
  • FIG. 7 is an explanatory diagram illustrating an example of inter-frame prediction.
  • the motion vector MV (mv x , mv y ) indicates the parallel movement amount of the reconstructed image block of the reference picture with respect to the encoding target block.
  • an inter prediction signal is generated based on a reconstructed image block of a reference picture (using pixel interpolation if necessary).
  • a CU that uses inter prediction is referred to as an inter CU.
  • a frame encoded only by an intra CU is called an I frame (or I picture).
  • a frame encoded including not only an intra CU but also an inter CU is called a P frame (or P picture).
  • a frame that is encoded including an inter CU that uses two reference pictures at the same time as well as one reference picture for inter prediction of a block is called a B frame (or B picture).
  • a frequency transform / quantizer 101 includes a frequency transform / quantizer 101, an entropy encoder 102, an inverse frequency transform / inverse quantizer 103, a buffer 104, a predictor 105, and an estimator 106.
  • FIG. 9 is an explanatory diagram showing an example of CTU partitioning of frame t and a CU partitioning example of CTU8 of frame t when the spatial resolution of the frame is CIF (CIF: Common Intermediate Format) and the CTU size is 64.
  • FIG. 10 is an explanatory diagram showing a quadtree structure corresponding to the CU partitioning example of CTU8.
  • FIG. 11 is an explanatory view showing the PU division shape of the CU. If the CU is intra prediction, a square PU partition can be selected (but only 2Nx2N can be selected if the CU is larger than the minimum size). When CU is inter prediction, when CU is larger than 8, PU partition other than NxN can be selected (however, when CU is 8, only 2Nx2N, 2NxN, and Nx2N can be selected).
  • FIG. 12 is an explanatory diagram showing an example of TU partitioning of a CU.
  • the top row shows an example of intra prediction 2Nx2N PU CU TU partitioning.
  • the CU is an intra prediction
  • the root of the quad tree is arranged in the PU, and the prediction error is expressed by a quad tree structure.
  • the lower row shows an example of inter prediction ⁇ 2NxN PU CU TU partitioning.
  • the root of the quad tree is placed in the CU, and the prediction error is expressed by a quad tree structure.
  • the estimator 106 determines, for each CTU, a CU quadtree structure / PU partition shape / TU quadtree structure that minimizes the coding cost.
  • Non-Patent Document 2 the CU quadtree structure / PU split shape determination process described in Non-Patent Document 2 will be described.
  • Non-Patent Document 2 4.8.3 Intra / Inter / PCM mode decision, discloses a CU level mode decision process.
  • the CU level mode determination process is a process for determining the PU partition shape and intra / inter prediction of the CU.
  • the above-mentioned location discloses a CU quadtree structure determination process that recursively executes a CU level mode determination process for each CU quadtree depth (CUDepthep).
  • a set of inter prediction PU partition shape candidates InterCandidate, a set of intra prediction PU partition shape candidates IntraCandidate, and the sum of square error (SSE) coding cost J SSE (mode) for a mode (mode) are as follows: Define as follows.
  • InterCandidate ⁇ INTER_2Nx2N, INTER_2NxN, INTER_Nx2N, INTER_2NxN, INTER_2NxN, INTER_2NxnU, INTER_2NxnD, INTER_nLx2N, INTER_nRx2N, INTER_NxN ⁇ .
  • IntraCandidate ⁇ INTRA_2Nx2N, INTRA_NxN ⁇ .
  • D SSE mode
  • R mode mode
  • QP QP
  • the PU partition shape and the intra prediction / inter prediction bestPUmode that minimize the SSE encoding cost J SSE (mode) are selected from InterCandidate and IntraCandidate.
  • the CU level mode decision process can be expressed as follows:
  • the SSE encoding cost of a CUDepth CU (hereinafter referred to as a node) is the SSE encoding cost of the best PU mode of that CU. That is, the node SSE encoding cost J SSE (node, CUDepth) is defined as follows.
  • the SSE encoding cost of the i-th (1 ⁇ i ⁇ 4) child CU (hereinafter referred to as a child node or leaf) of the CUDepth CU is the SSE encoding cost of the CUDepth + 1 CU. That is, the i-th leaf SSE encoding cost J SSE (leaf (i), CUDepth) is defined below.
  • the above-described comparison is recursively performed for each CUDepth cell to determine the quad tree structure of the CTU (that is, the cu_split_flag of the leaf is determined for each CUDepth cell).
  • the TU quadtree structure can be determined by a process similar to the CU quadtree structure determination process described above.
  • the predictor 105 generates a prediction signal for the input image signal of the CU based on the CU quadtree structure and the PU shape determined by the estimator 106.
  • the prediction signal is generated based on the above-described intra prediction or inter prediction.
  • the frequency transformer / quantizer 101 performs frequency transformation on the prediction error image obtained by subtracting the prediction signal from the input image signal based on the TU quadtree structure determined by the estimator 106.
  • the frequency converter / quantizer 101 quantizes the frequency-converted prediction error image (frequency conversion coefficient).
  • the quantized frequency transform coefficient is referred to as a transform quantization value.
  • the entropy encoder 102 entropy-encodes cu_split_flag indicating a quad tree structure of CTU, a prediction parameter, and a transform quantization value.
  • the inverse frequency transform / inverse quantizer 103 inversely quantizes the transform quantized value. Further, the inverse frequency transform / inverse quantizer 103 performs inverse frequency transform on the inversely quantized frequency transform coefficient. The reconstructed prediction error image subjected to inverse frequency conversion is added with a prediction signal and supplied to the buffer 104.
  • the buffer 104 stores the reconstructed image.
  • a general video encoding device Based on the above-described operation, a general video encoding device generates a bit stream.
  • HM7 High Efficiency Video Coding (HEVC) Test Model 7 Encoder Description, JCTVC-I1002, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO / IEC JTC1 / SC29 / WG11 9th et CH, 27 April-7 May 2012.
  • J SAD (mode) D SAD (mode) + ⁇ motion ⁇ R motion (mode)
  • D SAD mode
  • R mode mode
  • D SATD mode
  • SAD Sum of Absolute Difference
  • CU header bits not including the number of transformed quantization values
  • SSD Sum of Absolute Hadamard
  • An object of the present invention is to provide a video encoding device, a video encoding method, and a video encoding program that can prevent the occurrence of ringing noise.
  • a video encoding apparatus is a video encoding apparatus that performs video encoding based on a recursive quadtree structure, and determines a node encoding cost of a node image block corresponding to a processing target node; Means for determining a child node encoding cost of each of the child node image blocks corresponding to the four child nodes of the processing target node; means for selecting one or more representative child nodes from the four child nodes of the processing target node; The means for normalizing the node coding cost based on the selected number of one or more representative child nodes, comparing the normalized node coding cost with the child node coding cost of the representative child node, Means for determining whether or not to divide.
  • a video encoding method is a video encoding method that performs video encoding based on a recursive quadtree structure, and determines a node encoding cost of a node image block corresponding to a processing target node, The child node encoding cost of each child node image block corresponding to the four child nodes of the node is determined, one or more representative child nodes are selected from the four child nodes of the processing target node, and the selected one or more Normalize the node coding cost based on the number of representative child nodes, compare the normalized node coding cost with the child node coding cost of the representative child node, and decide whether to divide the processing target node It is characterized by doing.
  • a video encoding program is a video encoding program applied to a computer that performs video encoding based on a recursive quadtree structure, and includes a node code of a node image block corresponding to a processing target node. Processing for determining the conversion cost, processing for determining the child node encoding cost of each of the child node image blocks corresponding to the four child nodes of the processing target node, and one or more representative child nodes from the four child nodes of the processing target node The node encoding cost based on the selected number of one or more representative child nodes, and the normalized node encoding cost and the child node encoding cost of the representative node are compared. Thus, a process for determining whether to divide the processing target node is executed.
  • the encoding cost of the representative child node of the four child nodes of the processing target node is compared with the encoding cost of the processing target node normalized based on the number of representative child nodes. Determine split / non-split of nodes.
  • the coding cost sum of the representative child node is smaller than the normalized coding cost. That is, when the prediction error of the processing target node includes a large value locally, the division of the processing target node is selected. Since the video encoding apparatus using the present invention determines the CU quadtree structure in consideration of a large prediction error locally, generation of ringing noise can be prevented.
  • FIG. 1 It is a block diagram which shows one Embodiment of the video coding apparatus by this invention. It is explanatory drawing which shows the structural example of the estimator of this invention. It is explanatory drawing which shows the operation example of the estimator of this invention. It is a block diagram which shows the example of the information processing system using the program by this invention. It is a block diagram which shows the principal part of the video coding apparatus by this invention. It is explanatory drawing which shows the example of 33 types of angle intra prediction. It is explanatory drawing which shows the example of inter-frame prediction. It is explanatory drawing which shows the structure of a general video coding apparatus. FIG.
  • FIG. 6 is an explanatory diagram showing an example of CTU partitioning of frame t and a CU partitioning example of CTU8 of frame t. It is explanatory drawing which shows a quadtree structure. It is explanatory drawing which shows PU division
  • the video encoding device shown in FIG. 1 is similar to the video encoding device shown in FIG. 6, the frequency conversion / quantization unit 101, the entropy encoding unit 102, the inverse frequency conversion / inverse quantization unit 103 ⁇ ⁇ ⁇ ⁇ , and the buffer 104. And a predictor 105. Furthermore, the video encoding apparatus according to the present embodiment includes an estimator 1060.
  • estimator 1060 showing the features of the present invention will be described.
  • the estimator 1060 includes a node cost calculator 10601, a first leaf cost calculator 10602, a second leaf cost calculator 10603, a third leaf cost calculator 10604, a fourth leaf cost calculator 10605, a representative leaf selector 10606, The cost normalizer 10607? And the node division determiner 10608? The estimator 1060 determines the CU quadtree structure / PU partition shape of CTU.
  • the node cost calculator 10601 selects the PU partition shape and the intra prediction / inter prediction bestPUmode that minimize the SATD coding cost J SATD (mode) described above for the current CUDepth CU. The following formula is shown.
  • the node cost calculator 10601 sets the SATD encoding cost of bestPUmode to the SATD encoding cost J SATD (node, CUDepth) of the CU. The following formula is shown.
  • the SATD encoding cost of the i-th (1 ⁇ i ⁇ 4) child CU (hereinafter referred to as a child node or leaf) of the CU is the SATD encoding cost of the CUDepth + 1 CU.
  • the SATD encoding cost J SATD (leaf (i), CUDepth) of the i-th (1 ⁇ i ⁇ 4) leaf CU is defined as follows.
  • J SATD (leaf (i), CUDepth) J SATD (node, CUDepth + 1)
  • the representative leaf selector 10606 selects K (1 ⁇ K ⁇ 4) representative leaves based on the SATD encoding cost J SATD (leaf (i), CUDepth) of each leaf. Specifically, the representative leaf selector 10606 selects the Lth (1 ⁇ L ⁇ 4) to Mth (L ⁇ M ⁇ 4) leaves as the representative leaves in the order of decreasing SATD encoding cost.
  • the SATD encoding cost sorted in ascending order is defined as J ′ SATD (leaf (i), CUDepth).
  • the representative leaf selector 10606 sends the representative leaf number K and the representative leaf J ' SATD (leaf (i), CUDepth) (L ⁇ i ⁇ M) to the node cost normalizer 10607 and the node division determiner 10608, respectively. Supply.
  • the node cost normalizer 10607 normalizes the node SATD encoding cost J SATD (node, CUDepth) supplied from the node cost calculator 10601 with the representative leaf number K.
  • J SATD node, CUDepth
  • J ′ SATD node, CUDepth
  • the estimator 1060 recursively performs the above-described comparison for each CUDepth cell to determine the CU quadtree structure / PU partition shape of the CTU cell.
  • step S101 the node cost calculator 10601 calculates the SATD encoding cost J SATD (node, CUDepth) of the current CUDepth CU.
  • the first leaf cost calculator 10602, the second leaf cost calculator 10603, the third leaf cost calculator 10604, and the fourth leaf cost calculator 10605 are the SATD encoding costs of the child CU (leaf) of the CU. J SATD (leaf (i), CUDepth) (1 ⁇ i ⁇ 4) is calculated.
  • step S103 the representative leaf selector 10606 determines K (1 ⁇ K ⁇ 4) based on the SATD coding cost J SATD (leaf (i), CUDepth) (1 ⁇ i ⁇ 4) of each leaf. Select a representative leaf.
  • step S104 the node division determination unit 10608 calculates the sum of the SATD coding costs of the representative leaf (see Equation 2 shown above).
  • step S105 the node cost normalizer 10607 calculates a normalized node SATD encoding cost J ′ SATD (node, CUDepth) based on the representative leaf number K 1.
  • step S106 node division determination unit 10608 determines whether J ′ SATD (node, CUDepth) is larger than the value of Expression 2 shown above. If larger, the process proceeds to step S107. Otherwise, the process proceeds to step S108.
  • the estimator 1060 of the present embodiment described above is a processing target node normalized based on the encoding cost of the representative child node (representative leaf) of the four child nodes (leafs) of the processing target node and the number of representative child nodes. Are compared with the coding cost of the node to determine whether the node to be processed is divided or not divided.
  • the coding cost sum of the representative leaf is normalized coding cost (J ' SATD (node, CUDepth)).
  • the video encoding apparatus determines the CU quadtree structure in consideration of a large prediction error locally, generation of ringing noise can be prevented.
  • the TU quadtree structure can be determined in consideration of a large prediction error locally.
  • each of the above embodiments can be configured by hardware, it can also be realized by a computer program.
  • the information processing system shown in FIG. 4 includes a processor 1001, a program memory 1002, a storage medium 1003 for storing video data, and a storage medium 1004 for storing a bitstream.
  • the storage medium 1003 and the storage medium 1004 may be separate storage media, or may be storage areas composed of the same storage medium.
  • a magnetic storage medium such as a hard disk can be used as the storage medium.
  • the program memory 1002 stores a program for realizing the function of each block shown in FIG.
  • the processor 1001 implements the function of the video encoding device shown in FIG. 1 by executing processing according to the program stored in the program memory 1002.
  • FIG. 5 is a block diagram showing the main part of the video encoding apparatus according to the present invention.
  • a video encoding apparatus according to the present invention is a video encoding apparatus that performs video encoding based on a recursive quadtree structure, and performs node encoding of a node image block corresponding to a processing target node.
  • An encoding cost determination unit 11 that determines a cost
  • a child node encoding cost determination unit 12 that determines a child node encoding cost of each of the child node image blocks corresponding to the four child nodes of the processing target node, and a processing target node
  • a representative node selection unit 13 that selects one or more representative child nodes from the four child nodes
  • a normalization unit 14 that normalizes the node encoding cost based on the selected number of one or more representative child nodes.
  • a division determination unit 15 that compares the normalized node encoding cost with the child node encoding cost of the representative child node to determine whether to divide the processing target node; Provided.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

 再帰的クアッドツリー構造に基づいた映像符号化を行う映像符号化装置は、処理対象ノードに対応するノード画像ブロックのノード符号化コストを決定する符号化コスト決定部11と、処理対象ノードの4つの子ノードに対応する子ノード画像ブロックそれぞれの子ノード符号化コストを決定する子ノード符号化コスト決定部12と、処理対象ノードの4つの子ノードから1つ以上の代表子ノードを選択する代表子ノード選択部13と、選択した1つ以上の代表子ノード数に基づいてノード符号化コストを正規化する正規化部14と、正規化したノード符号化コストと代表子ノードの子ノード符号化コストを比較して、処理対象ノードを分割するか否かを決定する分割決定部15とを備える。

Description

映像符号化装置、映像符号化方法および映像符号化プログラム
 本発明は、HEVCなどの再帰的クアッドツリー構造に基づいた映像符号化方式のクアッドツリー構造決定技術であって、例えば映像符号化装置に好適に適用される。
 非特許文献1の記載に基づいた映像符号化方式は、ディジタル化された映像の各フレームを符号化ツリーユニット(CTU :Coding Tree Unit)に分割し、ラスタスキャン順に各CTU を符号化する。各CTU は、クアッドツリー構造で、符号化ユニット(CU:Coding Unit )に分割されて符号化される。各CUは、予測ユニット(PU:Prediction Unit )に分割されて予測される。また、各CUの予測誤差は、クアッドツリー構造で、変換ユニット(TU:Transform Unit)に分割されて周波数変換される。
 CUは、イントラ予測/フレーム間予測の符号化単位である。以下では、イントラ予測およびフレーム間予測を説明する。
 イントラ予測は、符号化対象フレームの再構築画像から生成する予測である。非特許文献1には、図6に示す33種類の角度イントラ予測などが定義されている。角度イントラ予測では、符号化対象ブロック周辺の再構築画素を図6に示す33種類の方向のいずれかに外挿して、イントラ予測信号が生成される。以後、イントラ予測に用いられるCUをイントラCUと呼ぶ。
 フレーム間予測は、符号化対象フレームと表示時刻が異なる再構築フレーム(参照ピクチャ)の画像に基づく予測である。以下、フレーム間予測をインター予測とも呼ぶ。図7は、フレーム間予測の例を示す説明図である。動きベクトルMV=(mvx, mvy)は、符号化対象ブロックに対する参照ピクチャの再構築画像ブロックの平行移動量を示す。インター予測では、参照ピクチャの再構築画像ブロックに基づいて(必要であれば画素補間を用いて)、インター予測信号を生成する。以後、インター予測を用いるCUをインターCUと呼ぶ。
 なお、イントラCUのみで符号化されたフレームはIフレーム(もしくはIピクチャ)と呼ばれる。イントラCUだけでなくインターCUも含めて符号化されたフレームはPフレーム(もしくはPピクチャ)と呼ばれる。ブロックのインター予測に1枚の参照ピクチャだけでなく、さらに同時に2枚の参照ピクチャを用いるインターCUを含めて符号化されたフレームはBフレーム(もしくはBピクチャ)と呼ばれる。
 以上で、イントラ予測およびフレーム間予測の説明を終了する。
 次に、図8を参照して、ディジタル化された映像の各フレームの各CUを入力画像としてビットストリームを出力する一般的な映像符号化装置の構成と動作を説明する。
 図8に示す映像符号化装置は、周波数変換/量子化器101 、エントロピー符号化器102 、逆周波数変換/逆量子化器103 、バッファ104 、予測器105 、および推定器106 を備える。
 図9は、フレームの空間解像度がCIF (CIF :Common Intermediate Format)、CTU サイズが64の場合のフレームt のCTU 分割例、および、フレームt のCTU8のCU分割例を示す説明図である。また、図10は、CTU8のCU分割例に対応する、クアッドツリー構造を示す説明図である。
 CTU8のクアッドツリー構造は、64x64 領域を分割することを示すCUDepth=0 のcu_split_flag=1 、最初の3つの32x32 CU(CU0, CU1、およびCU2 )を分割しないことを示す3つのCUDepth=1 のcu_split_flag=0 、最後の32x32 CUを分割することを示すCUDepth=1 のcu_split_flag=1 、最初の3つの16x16 CU(CU3, CU4, およびCU5 )を分割しないことを示す3つのCUDepth=2 のcu_split_flag=0 、最後の16x16 CUを分割することを示すCUDepth=2 のcu_split_flag=1 、すべての8x8 CU(CU6, CU7, CU8 、およびCU9 )を分割しないことを示す4つのCUDepth=3 のcu_split_flag=0 で表現できる。
 図11は、CUのPU分割形状を示す説明図である。CUがイントラ予測の場合、正方形のPU分割を選択できる(ただし、CUが最小サイズよりも大きい場合、2Nx2N のみを選択できる)。CUがインター予測の場合、CUが8よりも大きい場合、NxN 以外のPU分割を選択できる(ただし、CUが8の場合、2Nx2N 、2NxN、およびNx2Nのいずれかのみを選択できる)。
 図12は、CUのTU分割例を示す説明図である。上段は、イントラ予測2Nx2N PUのCUのTU分割例を示す。CUがイントラ予測の場合、クアッドツリーの根(Root)をPUに配置し、予測誤差をクアッドツリー構造で表現する。下段は、インター予測 2NxN PUのCUのTU分割例を示す。CUがインター予測の場合、クアッドツリーの根(Root)をCUに配置し、予測誤差をクアッドツリー構造で表現する。
 推定器106 は、CTU 毎に、符号化コストを最小とするCUクアッドツリー構造/PU分割形状/TUクアッドツリー構造を決定する。
 以下では、非特許文献2に記載されたCUクアッドツリー構造/PU分割形状決定プロセスを説明する。
 非特許文献2の4.8.3 Intra/Inter/PCM mode decisionには、CUレベルモード決定プロセスが開示されている。CUレベルモード決定プロセスは、CUのPU分割形状およびイントラ予測/インター予測を決定するプロセスである。また、上記箇所には、CUクアッドツリーのデプス(CUDepth )毎にCUレベルモード決定プロセスを再帰的に実行する、CUクアッドツリー構造決定プロセスが開示されている。
 まず、CUレベルモード決定プロセスを説明する。インター予測のPU分割形状候補の集合InterCandidate、イントラ予測のPU分割形状候補の集合IntraCandidate、あるモード(mode)の2乗誤差和(SSE :Sum of Square Error )符号化コストJSSE(mode)を以下のように定義する。
 InterCandidate = { INTER_2Nx2N, INTER_2NxN, INTER_Nx2N, INTER_2NxN, INTER_Nx2N, INTER_2NxnU, INTER_2NxnD, INTER_nLx2N, INTER_nRx2N, INTER_NxN }.
 IntraCandidate = {INTRA_2Nx2N, INTRA_NxN}.
 JSSE(mode) = DSSE(mode) + λmode・Rmode (mode)
 λmode = 2(QP-12)/3
 ただし、DSSE(mode)、Rmode(mode)、QPは、それぞれ、CUの入力画像信号とmodeを用いた再構築画像信号との2乗誤差和、modeを用いて符号化したCUのビット数(後述する変換量子化値のビット数も含む)、量子化パラメータを示す。
 CUレベルモード決定プロセスでは、InterCandidateおよびIntraCandidateから、SSE 符号化コストJSSE(mode)を最小とするPU分割形状およびイントラ予測/インター予測bestPUmodeを選択する。定式的には、CUレベルモード決定プロセスを以下のように表現できる。
Figure JPOXMLDOC01-appb-M000001
 PUCandidate = { InterCandidate, IntraCandidate }
 以上で、CUレベルモード決定プロセスの説明を終了する。続いて、CUクアッドツリー構造決定プロセスを説明する。
 CUDepth のCU(以後、ノードと呼ぶ)のSSE 符号化コストは、そのCUのbestPUmodeのSSE 符号化コストである。つまり、ノードSSE 符号化コストJSSE(node, CUDepth) を以下のように定義する。
Figure JPOXMLDOC01-appb-M000002
 CUDepth のCUのi 番目(1≦i ≦4)の子CU(以後、子ノードやリーフなどと呼ぶ)のSSE 符号化コストは、CUDepth+1 のCUのSSE 符号化コストである。つまり、i 番目のリーフSSE 符号化コストJSSE(leaf(i), CUDepth)を以下で定義する。
 JSSE(leaf(i), CUDepth) = JSSE(node, CUDepth+1)
 ノードのSSE 符号化コストがそのリーフのSSE 符号化コストの和よりも大きいか否かを比較することによって、CUを子CUに分割するか否かを決定できる。JSSE(node, CUDepth) が以下に示す式1の値よりも大きい場合、CUを子CUに分割すると決定する(cu_split_flag=1 とする)。
Figure JPOXMLDOC01-appb-M000003
 そうでない場合(JSSE(node, CUDepth)が上記に示す式1の値以下の場合)、CUを子CUに分割しないと決定する(cu_split_flag=0 とする)。
 CUクアッドツリー構造決定プロセスでは、上述した比較をCUDepth 毎に再帰的に実行し、CTU のクアッドツリー構造を決定する(つまり、CUDepth 毎にリーフのcu_split_flag を決定する)。
 以上で、CUクアッドツリー構造決定プロセスの説明を終了する。
 なお、TUクアッドツリー構造は、上述したCUクアッドツリー構造決定プロセスと同様のプロセスによって決定できる。
 予測器105 は、推定器106 が決定したCUクアッドツリー構造およびPU形状に基づいて、CUの入力画像信号に対する予測信号を生成する。予測信号は、上述したイントラ予測もしくはインター予測に基づいて生成される。
 周波数変換/量子化器101 は、推定器106 が決定したTUクアッドツリー構造に基づいて、入力画像信号から予測信号を減じた予測誤差画像を周波数変換する。
 さらに、周波数変換/量子化器101 は、周波数変換した予測誤差画像(周波数変換係数)を量子化する。以下、量子化された周波数変換係数を変換量子化値と呼ぶ。
 エントロピー符号化器102 は、CTU のクアッドツリー構造を示すcu_split_flag 、予測パラメータ、および変換量子化値をエントロピー符号化する。
 逆周波数変換/逆量子化器103 は、変換量子化値を逆量子化する。さらに、逆周波数変換/逆量子化器103 は、逆量子化した周波数変換係数を逆周波数変換する。逆周波数変換された再構築予測誤差画像は、予測信号が加えられて、バッファ104 に供給される。
 バッファ104 は、再構築画像を格納する。
 上述した動作に基づいて、一般的な映像符号化装置はビットストリームを生成する。
High efficiency video coding (HEVC) text specification draft 7, JCTVC-I1003_d9, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 9th Meeting: Geneva, CH, 27 April-7 May 2012. HM7: High Efficiency Video Coding (HEVC) Test Model 7 Encoder Description, JCTVC-I1002, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 9th Meeting: Geneva, CH, 27 April-7 May 2012.
 ノードCUの予測誤差に局所的に大きな値が含まれる場合、周波数変換と量子化によってノードCU全体の再構築画像(2Nx2N サイズ)に量子化雑音が拡散してリンギングノイズが発生することが知られている。
 あるノードCUのSSE 符号化コストJSSE(node, CUDepth) とそのリーフCUのSSE 符号化コストの和(上記に示す式1参照。)を単純に比較する技術は、局所的に大きな予測誤差を考慮しないでCUクアッドツリー構造を決定するため、誤って非分割を多く選択し、リンギングノイズを発生させる。
 リンギングノイズ発生は、SSE 符号化コストの代わりに、再構築画像を用いない以下に示すSAD 符号化コストJSAD(mode)やSATD符号化コストJSATD(mode)を利用した場合に、より顕著になる。
 JSAD(mode) = DSAD(mode) + λmotion・Rmotion(mode)
 JSATD(mode) = DSATD(mode) + λmotion・Rmotion(mode)
 λmotion = 2(QP-12)/6
 ただし、DSAD(mode)、Rmode(mode)、DSATD(mode) は、それぞれ、CUの入力画像信号とmodeを用いた予測信号との絶対誤差和(SAD :Sum of Absolute Difference)、modeを用いて符号化したCUのヘッダビット数(変換量子化値のビット数を含まない)、CUの入力画像信号とmodeを用いた予測信号との絶対誤差アダマール変換和(SATD:Sum of Absolute Hadamard Transformed Difference )を示す。
 本発明は、リンギングノイズ発生を防止できる映像符号化装置、映像符号化方法および映像符号化プログラムを提供することを目的とする。
 本発明による映像符号化装置は、再帰的クアッドツリー構造に基づいた映像符号化を行う映像符号化装置であって、処理対象ノードに対応するノード画像ブロックのノード符号化コストを決定する手段と、処理対象ノードの4つの子ノードに対応する子ノード画像ブロックそれぞれの子ノード符号化コストを決定する手段と、処理対象ノードの4つの子ノードから1つ以上の代表子ノードを選択する手段と、選択した1つ以上の代表子ノード数に基づいてノード符号化コストを正規化する手段と、正規化したノード符号化コストと代表子ノードの子ノード符号化コストを比較して、処理対象ノードを分割するか否かを決定する手段とを備えたことを特徴とする。
 本発明による映像符号化方法は、再帰的クアッドツリー構造に基づいた映像符号化を行う映像符号化方法であって、処理対象ノードに対応するノード画像ブロックのノード符号化コストを決定し、処理対象ノードの4つの子ノードに対応する子ノード画像ブロックそれぞれの子ノード符号化コストを決定し、処理対象ノードの4つの子ノードから1つ以上の代表子ノードを選択し、選択された1つ以上の代表子ノード数に基づいてノード符号化コストを正規化し、正規化されたノード符号化コストと代表子ノードの子ノード符号化コストを比較して、処理対象ノードを分割するか否かを決定することを特徴とする。
 本発明による映像符号化プログラムは、再帰的クアッドツリー構造に基づいた映像符号化を行うコンピュータに適用される映像符号化プログラムであって、コンピュータに、処理対象ノードに対応するノード画像ブロックのノード符号化コストを決定する処理、処理対象ノードの4つの子ノードに対応する子ノード画像ブロックそれぞれの子ノード符号化コストを決定する処理、処理対象ノードの4つの子ノードから1つ以上の代表子ノードを選択する処理、選択した1つ以上の代表子ノード数に基づいてノード符号化コストを正規化する処理、および、正規化したノード符号化コストと代表子ノードの子ノード符号化コストを比較して、処理対象ノードを分割するか否かを決定する処理を実行させることを特徴とする。
 本発明によれば、処理対象ノードの4つの子ノードの代表子ノードの符号化コストと、代表子ノード数に基づいて正規化された処理対象ノードの符号化コストとを比較して、処理対象ノードの分割/非分割を決定する。処理対象ノードの予測誤差に局所的に大きな値が含まれている場合、代表子ノードの符号化コスト和は正規化された符号化コストよりも小さくなる。すなわち、処理対象ノードの予測誤差に局所的に大きな値が含まれている場合、処理対象ノードの分割を選択する。本発明を用いた映像符号化装置は、局所的に大きな予測誤差を考慮してCUクアッドツリー構造を決定するため、リンギングノイズ発生を防止できる。
本発明による映像符号化装置の一実施形態を示すブロック図である。 本発明の推定器の構成例を示す説明図である。 本発明の推定器の動作例を示す説明図である。 本発明によるプログラムを用いた情報処理システムの例を示すブロック図である。 本発明による映像符号化装置の主要部を示すブロック図である。 33種類の角度イントラ予測の例を示す説明図である。 フレーム間予測の例を示す説明図である。 一般的な映像符号化装置の構成を示す説明図である。 フレームt のCTU 分割例、および、フレームt のCTU8のCU分割例を示す説明図である。 クアッドツリー構造を示す説明図である。 CUのPU分割形状を示す説明図である。 CUのTU分割例を示す説明図である。
 図1を参照して、ディジタル化された映像の各フレームを入力画像としてビットストリームを出力する本実施形態の映像符号化装置の構成と動作を説明する。
 図1に示す映像符号化装置は、図6に示された映像符号化装置と同様に、周波数変換/量子化器101 、エントロピー符号化器102 、逆周波数変換/逆量子化器103 、バッファ104 、および予測器105を備える。さらに、本実施形態の映像符号化装置は、推定器1060を備える。
 図2を参照して、本発明の特徴を示す推定器1060の構成および動作を説明する。
 推定器1060は、ノードコスト計算器10601、第1リーフコスト計算器10602 、第2リーフコスト計算器10603 、第3リーフコスト計算器10604 、第4リーフコスト計算器10605 、代表リーフ選択器10606 、ノードコスト正規化器10607 、および、ノード分割判定器10608 によって構成される。推定器1060は、CTU のCUクアッドツリー構造/PU分割形状を決定する。
 ノードコスト計算器10601 は、現在のCUDepth のCUに対して、上述したSATD符号化コストJSATD(mode) を最小とするPU分割形状およびイントラ予測/インター予測bestPUmodeを選択する。定式的には以下のように示される。
Figure JPOXMLDOC01-appb-M000004
 さらに、ノードコスト計算器10601 は、CUのSATD符号化コストJSATD(node, CUDepth)にbestPUmodeのSATD符号化コストを設定する。定式的には以下のように示される。
Figure JPOXMLDOC01-appb-M000005
 なお、CUのi 番目(1≦i ≦4)の子CU(以後、子ノードやリーフなどと呼ぶ)のSATD符号化コストは、CUDepth+1 のCUのSATD符号化コストである。i 番目(1≦i ≦4)のリーフCUのSATD符号化コストJSATD(leaf(i), CUDepth) を以下のように定義する。
 JSATD(leaf(i), CUDepth) = JSATD(node, CUDepth+1)
 第1リーフコスト計算器10602 は、CUの最初のリーフ(i=1) のSATD符号化コストJSATD(leaf(1), CUDepth) を計算する。すなわち、CUの最初のリーフ(i=1) に対して、SATD符号化コストJSATD(mode) を最小とするPU分割形状およびイントラ予測/インター予測bestPUmodeを選択する。
 同様に、第2リーフコスト計算器10603 、第3リーフコスト計算器10604 、第4リーフコスト計算器10605 は、それぞれ、CUの第2リーフ(i=2) 、第3リーフ(i=3) 、第4リーフ(i=4) のSATD符号化コストJSATD(leaf(i), CUDepth) を計算する。
 例を用いて、ノードとリーフの関係(CUと子CUの関係)を補足する。CTU サイズを64と仮定すると、CUDepth=0 のノードの最初のリーフは、64x64 画像ブロック内の左上32x32 画像ブロックに対応する。同様に、CUDepth=0 のノードの第2リーフ、第3リーフ、第4リーフは、それぞれ、64x64 画像ブロック内の右上32x32 画像ブロック、左下32x32 画像ブロック、右下32x32 画像ブロックに対応する。
 代表リーフ選択器10606 は、各リーフのSATD符号化コストJSATD(leaf(i), CUDepth) に基づいて、K 個(1≦K ≦4)の代表リーフを選択する。具体的には、代表リーフ選択器10606 は、SATD符号化コストが小さい順で第L 番目(1≦L <4)から第M 番目(L<M ≦4)のリーフを代表リーフとして選択する。以後の説明のために、小さい順でソートされたSATD符号化コストをJ'SATD(leaf(i), CUDepth)と定義する。
 さらに、代表リーフ選択器10606 は、代表リーフ個数K と代表リーフのJ'SATD(leaf(i), CUDepth)  (L≦i ≦M)をノードコスト正規化器10607 とノード分割判定器10608 にそれぞれ供給する。
 ノードコスト正規化器10607 は、ノードコスト計算器10601 から供給されるノードSATD符号化コストJSATD(node, CUDepth) を代表リーフ個数K で正規化する。以後の説明のために、正規化されたノードSATD符号化コストをJ'SATD(node, CUDepth)と定義する。定式的には以下のように示される。
 J'SATD(leaf(i), CUDepth) = JSATD(leaf(i), CUDepth) / K
 ノード分割判定器10608 は、正規化されたノードSATD符号化コストと代表リーフのSATD符号化コストを比較して、現在のCUDepth のCUを分割するか否かを決定する(cu_split_flag を決定する)。具体的には、ノード分割判定器10608 は、J'SATD(node, CUDepth) が以下に示す式2の値よりも大きい場合、CUを分割すると決定する(cu_split_flag=1 )。
Figure JPOXMLDOC01-appb-M000006
 そうでない場合(J'SATD(node, CUDepth) が上記に示す式2の値以下の場合)、ノード分割判定器10608 は、CUを分割しないと決定する(cu_split_flag=0 )。
 推定器1060は、上述した比較をCUDepth 毎に再帰的に実行し、CTU のCUクアッドツリー構造/PU分割形状を決定する。
 続いて、図3を参照して、推定器1060の動作を説明する。
 ステップS101にて、ノードコスト計算器10601 は、現在のCUDepth のCUのSATD符号化コストJSATD(node, CUDepth)を計算する。
 ステップS102にて、第1リーフコスト計算器10602 、第2リーフコスト計算器10603 、第3リーフコスト計算器10604 、第4リーフコスト計算器10605 は、CUの子CU(リーフ)のSATD符号化コストJSATD(leaf(i), CUDepth) (1≦i ≦4)をそれぞれ計算する。
 ステップS103にて、代表リーフ選択器10606 は、各リーフのSATD符号化コストJSATD(leaf(i), CUDepth) (1≦i ≦4)に基づいて、K 個(1≦K ≦4)の代表リーフを選択する。
 ステップS104にて、ノード分割判定器10608 は、代表リーフのSATD符号化コストの和(上記に示す式2参照。)を計算する。
 ステップS105にて、ノードコスト正規化器10607 は、代表リーフ個数K に基づいて正規化ノードSATD符号化コストJ'SATD(node, CUDepth) を計算する。
 ステップS106にて、ノード分割判定器10608 は、J'SATD(node, CUDepth) が上記に示す式2の値よりも大きいか否かを判断する。大きい場合、ステップS107に進む。そうでない場合、ステップS108に進む。
 ステップS107にて、ノードコスト正規化器10607 は、現在のCUDepth のCUを分割すると決定し(cu_split_flag=1 )、現在のCUDepth のCUに対する分割/非分割決定を終了する。
 ステップS108にて、ノードコスト正規化器10607 は、現在のCUDepth のCUを分割しないと決定し(cu_split_flag=0 )、現在のCUDepth のCUに対する分割/非分割決定を終了する。
 以上で、発明の特徴を示す推定器1060の構成および動作の説明を終了する。
 上述した本実施形態の推定器1060は、処理対象ノードの4つの子ノード(リーフ)の代表子ノード(代表リーフ)の符号化コストと、代表子ノード数に基づいて正規化された処理対象ノードの符号化コストとを比較して、処理対象ノードの分割/非分割を決定する。処理対象ノードの予測誤差に局所的に大きな値が含まれている場合、代表リーフの符号化コスト和(上記に示す式2参照。)は正規化された符号化コスト(J'SATD(node, CUDepth) )よりも小さくなる。すなわち、処理対象ノードの予測誤差に局所的に大きな値が含まれている場合、処理対象ノードの分割を選択する(cu_split_flag=1 を選択する)。本実施形態の映像符号化装置は、局所的に大きな予測誤差を考慮してCUクアッドツリー構造を決定するため、リンギングノイズ発生を防止できる。
 なお、上述した実施形態において、CUサイズ(2Nx2N) とは関係なく、SATD符号化コストJSATD(mode) の計算に用いるアダマール変換のブロックサイズを8x8 もしくは4x4 に固定しても同等の効果が得られることは言うまでもない。
 また、上述した実施形態において、SATD符号化コストJSATD(mode) の代わりに、SAD 符号化コストJSAD(mode)やSSE 符号化コストJSSE(mode)を用いても同等の効果が得られることは言うまでもない。
 また、上述した実施形態において、代表リーフの個数K を現在のCUDepth のCUの大きさによって変えてもよい。例えば、より大きなCUほどリンギングノイズが目立つことを考慮して、所定サイズよりも大きなCUにおいてはK=1 (L=1 およびM=1 )、所定サイズよりも小さなCUにおいてはK=3 (L=1 およびM=3 )としてもよい。なお、K=1 (L=1 およびM=1 )は、代表リーフ選択器10606 が、最小のリーフ符号化コストに関連づけられたリーフを選択することと等価であることは言うまでもない。
 また、上述した推定器1060のCUクアッドツリー構造決定をTUクアッドツリー構造決定に用いることによって、局所的に大きな予測誤差を考慮してTUクアッドツリー構造を決定できることは言うまでもない。
 また、上記の各実施形態を、ハードウェアで構成することも可能であるが、コンピュータプログラムにより実現することも可能である。
 図4に示す情報処理システムは、プロセッサ1001、プログラムメモリ1002、映像データを格納するための記憶媒体1003及びビットストリームを格納するための記憶媒体1004を備える。記憶媒体1003と記憶媒体1004とは、別個の記憶媒体であってもよいし、同一の記憶媒体からなる記憶領域であってもよい。記憶媒体として、ハードディスク等の磁気記憶媒体を用いることができる。
 図4に示された情報処理システムにおいて、プログラムメモリ1002には、図1に示された各ブロックの機能を実現するためのプログラムが格納される。そして、プロセッサ1001は、プログラムメモリ1002に格納されているプログラムに従って処理を実行することによって、図1に示された映像符号化装置の機能を実現する。
 図5は、本発明による映像符号化装置の主要部を示すブロック図である。図5に示すように、本発明による映像符号化装置は、再帰的クアッドツリー構造に基づいた映像符号化を行う映像符号化装置であって、処理対象ノードに対応するノード画像ブロックのノード符号化コストを決定する符号化コスト決定部11と、処理対象ノードの4つの子ノードに対応する子ノード画像ブロックそれぞれの子ノード符号化コストを決定する子ノード符号化コスト決定部12と、処理対象ノードの4つの子ノードから1つ以上の代表子ノードを選択する代表子ノード選択部13と、選択した1つ以上の代表子ノード数に基づいてノード符号化コストを正規化する正規化部14と、正規化したノード符号化コストと代表子ノードの子ノード符号化コストを比較して、処理対象ノードを分割するか否かを決定する分割決定部15とを備える。
 以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 この出願は、2012年9月18日に出願された日本特許出願2012-203879を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 11  符号化コスト決定部
 12  子ノード符号化コスト決定部
 13  代表子ノード選択部
 14  正規化部
 15  分割決定部
 101 周波数変換/量子化器
 102 エントロピー符号化器
 103 逆周波数変換/逆量子化器
 104 バッファ
 105 予測器
 106,1060 推定器
 10601 ノードコスト計算器
 10602 第1リーフコスト計算器
 10603 第2リーフコスト計算器
 10604 第3リーフコスト計算器
 10605 第4リーフコスト計算器
 10606 代表リーフ選択器
 10607 ノードコスト正規化器
 10608 ノード分割判定器
 1001 プロセッサ
 1002 プログラムメモリ
 1003 記憶媒体
 1004 記憶媒体

Claims (9)

  1.  再帰的クアッドツリー構造に基づいた映像符号化を行う映像符号化装置であって、
     処理対象ノードに対応するノード画像ブロックのノード符号化コストを決定する手段と、
     処理対象ノードの4つの子ノードに対応する子ノード画像ブロックそれぞれの子ノード符号化コストを決定する手段と、
     処理対象ノードの4つの子ノードから1つ以上の代表子ノードを選択する手段と、
     前記選択した1つ以上の代表子ノード数に基づいてノード符号化コストを正規化する手段と、
     前記正規化したノード符号化コストと前記代表子ノードの子ノード符号化コストを比較して、処理対象ノードを分割するか否かを決定する手段とを備えた
     ことを特徴とする映像符号化装置。
  2.  前記代表子ノードを選択する手段が、子ノード符号化コストが小さい順に1以上4以下の個数の代表子ノードを選択する
     請求項1記載の映像符号化装置。
  3.  処理対象ノードに対応するノード画像ブロックの大きさに応じて、前記代表子ノード数を調整する
     請求項2記載の映像符号化装置。
  4.  再帰的クアッドツリー構造に基づいた映像符号化を行う映像符号化方法であって、
     処理対象ノードに対応するノード画像ブロックのノード符号化コストを決定し、
     処理対象ノードの4つの子ノードに対応する子ノード画像ブロックそれぞれの子ノード符号化コストを決定し、
     処理対象ノードの4つの子ノードから1つ以上の代表子ノードを選択し、
     選択された1つ以上の代表子ノード数に基づいてノード符号化コストを正規化し、
     正規化されたノード符号化コストと前記代表子ノードの子ノード符号化コストを比較して、処理対象ノードを分割するか否かを決定する
     ことを特徴とする映像符号化方法。
  5.  前記代表子ノードを選択する際、子ノード符号化コストが小さい順に1以上4以下の個数の代表子ノードを選択する
     請求項4記載の映像符号化方法。
  6.  処理対象ノードに対応するノード画像ブロックの大きさに応じて、代表子ノード数を調整する
     請求項5記載の映像符号化方法。
  7.  再帰的クアッドツリー構造に基づいた映像符号化を行うコンピュータに適用される映像符号化プログラムであって、
     前記コンピュータに、
     処理対象ノードに対応するノード画像ブロックのノード符号化コストを決定する処理、
     処理対象ノードの4つの子ノードに対応する子ノード画像ブロックそれぞれの子ノード符号化コストを決定する処理、
     処理対象ノードの4つの子ノードから1つ以上の代表子ノードを選択する処理、
     前記選択した1つ以上の代表子ノード数に基づいてノード符号化コストを正規化する処理、および、
     前記正規化したノード符号化コストと前記代表子ノードの子ノード符号化コストを比較して、処理対象ノードを分割するか否かを決定する処理
     を実行させるための映像符号化プログラム。
  8.  コンピュータに、
     前記代表子ノードを選択する処理で、子ノード符号化コストが小さい順に1以上4以下の個数の代表子ノードを選択させる
     請求項7記載の映像符号化プログラム。
  9.  コンピュータに、
     処理対象ノードに対応するノード画像ブロックの大きさに応じて、代表子ノード数を調整させる
     請求項8記載の映像符号化プログラム。
PCT/JP2013/004876 2012-09-18 2013-08-16 映像符号化装置、映像符号化方法および映像符号化プログラム WO2014045515A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US14/428,505 US20150237345A1 (en) 2012-09-18 2013-08-16 Video coding device, video coding method, and video coding program
JP2014536569A JP6191609B2 (ja) 2012-09-18 2013-08-16 映像符号化装置、映像符号化方法および映像符号化プログラム
EP13838663.6A EP2899974A4 (en) 2012-09-18 2013-08-16 VIDEO CODING DEVICE, VIDEO CODING METHOD, AND VIDEO CODING PROGRAM
BR112015005387A BR112015005387A2 (pt) 2012-09-18 2013-08-16 dispositivo de codificação de vídeo, método de codificação de vídeo e programa de codificação de vídeo

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012203879 2012-09-18
JP2012-203879 2012-09-18

Publications (1)

Publication Number Publication Date
WO2014045515A1 true WO2014045515A1 (ja) 2014-03-27

Family

ID=50340857

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/004876 WO2014045515A1 (ja) 2012-09-18 2013-08-16 映像符号化装置、映像符号化方法および映像符号化プログラム

Country Status (5)

Country Link
US (1) US20150237345A1 (ja)
EP (1) EP2899974A4 (ja)
JP (1) JP6191609B2 (ja)
BR (1) BR112015005387A2 (ja)
WO (1) WO2014045515A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105120291B (zh) * 2015-08-07 2018-04-10 中山大学 一种基于方差的自适应快速视频编码方法
US10805635B1 (en) * 2016-03-22 2020-10-13 NGCodec Inc. Apparatus and method for coding tree unit bit size limit management
US10506258B2 (en) * 2017-07-13 2019-12-10 Google Llc Coding video syntax elements using a context tree

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11164305A (ja) * 1997-04-24 1999-06-18 Mitsubishi Electric Corp 動画像符号化方法、動画像符号化装置および動画像復号装置
JP2000511366A (ja) * 1995-10-25 2000-08-29 サーノフ コーポレイション 4分割ツリーベースの可変ブロックサイズ動き推定装置および方法
WO2012077332A1 (ja) * 2010-12-06 2012-06-14 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5241395A (en) * 1989-08-07 1993-08-31 Bell Communications Research, Inc. Adaptive transform coding using variable block size
US7672377B2 (en) * 2006-04-21 2010-03-02 Dilithium Holdings, Inc. Method and system for video encoding and transcoding
US7456760B2 (en) * 2006-09-11 2008-11-25 Apple Inc. Complexity-aware encoding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000511366A (ja) * 1995-10-25 2000-08-29 サーノフ コーポレイション 4分割ツリーベースの可変ブロックサイズ動き推定装置および方法
JPH11164305A (ja) * 1997-04-24 1999-06-18 Mitsubishi Electric Corp 動画像符号化方法、動画像符号化装置および動画像復号装置
WO2012077332A1 (ja) * 2010-12-06 2012-06-14 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"High Efficiency Video Coding (HEVC) Test Model 7 Encoder Description, JCTVC-I1002", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 9TH MEETING, 27 April 2012 (2012-04-27)
"High efficiency video coding (HEVC) text specification draft 7, JCTVC-11003 d9", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 9TH MEETING: GENEVA, 27 April 2012 (2012-04-27)

Also Published As

Publication number Publication date
JPWO2014045515A1 (ja) 2016-08-18
US20150237345A1 (en) 2015-08-20
EP2899974A1 (en) 2015-07-29
BR112015005387A2 (pt) 2017-07-04
EP2899974A4 (en) 2016-03-09
JP6191609B2 (ja) 2017-09-06

Similar Documents

Publication Publication Date Title
KR102329587B1 (ko) 인트라 예측 방법 및 그 장치
US10848759B2 (en) Intra prediction mode-based image processing method and apparatus therefor
ES2699749B2 (es) Método y aparato para procesar una señal de vídeo
DK2752005T3 (en) PROCEDURE FOR DERIVING MOVEMENT INFORMATION
US20180184082A1 (en) Intra prediction mode based image processing method, and apparatus therefor
US10681354B2 (en) Image encoding/decoding method and apparatus therefor
US10904567B2 (en) Intra prediction mode-based image processing method, and apparatus therefor
KR20180037581A (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
KR20180029905A (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
KR102412934B1 (ko) 인트라 예측 방법 및 그 장치
JP6332275B2 (ja) 映像符号化装置、映像符号化方法及びプログラム
JP2015233306A (ja) 映像の符号化方法及び装置、並びに映像の復号化方法及び装置
US11812033B2 (en) Image encoding method/device, image decoding method/device, and recording medium in which bitstream is stored
US20200228831A1 (en) Intra prediction mode based image processing method, and apparatus therefor
JP6191609B2 (ja) 映像符号化装置、映像符号化方法および映像符号化プログラム
WO2015118835A1 (ja) 映像符号化装置、映像符号化方法及び映像符号化プログラム
JP6992825B2 (ja) 映像符号化装置、映像符号化方法、映像復号装置、映像復号方法、及び映像符号化システム
JP6390627B2 (ja) 映像符号化装置、映像符号化方法およびプログラム
KR101601856B1 (ko) 방향적 인트라 예측 장치 및 그 예측 방법
KR102069784B1 (ko) 두 개의 후보 인트라 예측 모드를 이용한 화면 내 예측 모드의 부/복호화 방법 및 이러한 방법을 사용하는 장치
KR102297268B1 (ko) 두 개의 후보 인트라 예측 모드를 이용한 화면 내 예측 모드의 부/복호화 방법 및 이러한 방법을 사용하는 장치
KR20180040827A (ko) 부호화 유닛의 그룹을 사용하는 비디오 코딩 방법 및 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13838663

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2014536569

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 2013838663

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 14428505

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

REG Reference to national code

Ref country code: BR

Ref legal event code: B01A

Ref document number: 112015005387

Country of ref document: BR

ENP Entry into the national phase

Ref document number: 112015005387

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20150311