WO2020122574A1 - 코딩 툴 설정 방법 및 영상 복호화 장치 - Google Patents

코딩 툴 설정 방법 및 영상 복호화 장치 Download PDF

Info

Publication number
WO2020122574A1
WO2020122574A1 PCT/KR2019/017444 KR2019017444W WO2020122574A1 WO 2020122574 A1 WO2020122574 A1 WO 2020122574A1 KR 2019017444 W KR2019017444 W KR 2019017444W WO 2020122574 A1 WO2020122574 A1 WO 2020122574A1
Authority
WO
WIPO (PCT)
Prior art keywords
syntax element
profile
coding
tool
target
Prior art date
Application number
PCT/KR2019/017444
Other languages
English (en)
French (fr)
Inventor
김재일
이선영
Original Assignee
에스케이텔레콤 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020190140653A external-priority patent/KR20200073117A/ko
Application filed by 에스케이텔레콤 주식회사 filed Critical 에스케이텔레콤 주식회사
Priority to CN201980081961.0A priority Critical patent/CN113170204B/zh
Publication of WO2020122574A1 publication Critical patent/WO2020122574A1/ko
Priority to US17/345,052 priority patent/US11616967B2/en
Priority to US18/106,688 priority patent/US20230188741A1/en
Priority to US18/106,626 priority patent/US11924453B2/en
Priority to US18/106,664 priority patent/US11991381B2/en
Priority to US18/106,639 priority patent/US11924454B2/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Definitions

  • the present invention relates to encoding and decoding of an image, and to a coding tool setting method and an image decoding apparatus that improve the efficiency of encoding and decoding.
  • video data Since video data has a large amount of data compared to audio data or still image data, it requires a lot of hardware resources including memory to store or transmit itself without processing for compression.
  • HVC High Efficiency Video Coding
  • the present invention aims to provide an improved image encoding and decoding technology.
  • one aspect of the present invention is to express information about a coding tool actually used among coding tools supported in a profile. It relates to a technique for improving the efficiency of encoding and decoding.
  • An aspect of the present invention is a method for setting whether to use a coding tool, a profile syntax element indicating a target profile among one or more assignable profiles from a bitstream, and one or more configurable ones Decoding a coding tool syntax element indicating whether to apply the coding tool; And based on the coding tool syntax element, setting on/off of one or more target coding tools included in the target profile.
  • a decoding unit for decoding the indicated coding tool syntax element; And control means for setting on/off of one or more target coding tools included in the target profile, based on the coding tool syntax element.
  • bit efficiency for setting a coding tool may be improved.
  • encoding and decoding can be implemented more adaptively.
  • FIG. 1 is an exemplary block diagram of an image encoding apparatus capable of implementing the techniques of the present disclosure.
  • FIG. 2 is a diagram for explaining a method of dividing a block using a QTBTTT structure.
  • 3 is a diagram for describing a plurality of intra prediction modes.
  • FIG. 4 is an exemplary block diagram of an image decoding apparatus capable of implementing the techniques of the present disclosure.
  • 5 to 12 are flowcharts illustrating various embodiments of the present invention for setting whether to use coding tools.
  • FIG. 13 is a flowchart illustrating a conventional method of determining an encoding mode.
  • FIG. 14 is a flowchart illustrating a coding mode determining method to which the coding tool setting method of the present invention is applied.
  • 15 is a flowchart for explaining an embodiment of the present invention for designating a sub-profile.
  • FIG. 1 is an exemplary block diagram of an image encoding apparatus capable of implementing the techniques of the present disclosure.
  • an image encoding apparatus and sub-components of the apparatus will be described with reference to FIG. 1.
  • the image encoding apparatus includes a block division unit 110, a prediction unit 120, a subtractor 130, a transformation unit 140, a quantization unit 145, an encoding unit 150, an inverse quantization unit 160, an inverse transformation unit ( 165), an adder 170, a filter unit 180 and a memory 190.
  • Each component of the video encoding device may be implemented in hardware or software, or a combination of hardware and software. Further, the function of each component may be implemented in software, and the microprocessor may be implemented to execute the function of software corresponding to each component.
  • One image is composed of a plurality of pictures. Each picture is divided into a plurality of regions, and encoding is performed for each region. For example, one picture is divided into one or more tiles or/and slices. Here, one or more tiles may be defined as a tile group. Each tile or/slice is divided into one or more coding tree units (CTUs). And each CTU is divided into one or more coding units (CUs) by a tree structure. Information applied to each CU is encoded as the syntax of the CU, and information commonly applied to CUs included in one CTU is encoded as the syntax of the CTU.
  • CTUs coding tree units
  • CUs coding units
  • information commonly applied to all blocks in one tile is encoded as the syntax of a tile or encoded as a syntax of a tile group in which a plurality of tiles are collected, and information applied to all blocks constituting one picture is It is encoded in a picture parameter set (PPS) or a picture header.
  • PPS picture parameter set
  • PPS picture parameter set
  • information commonly referred to by a plurality of pictures is encoded in a sequence parameter set (SPS).
  • SPS sequence parameter set
  • information commonly referenced by one or more SPSs is encoded in a video parameter set (VPS).
  • the block dividing unit 110 determines the size of a coding tree unit (CTU).
  • CTU size Information about the size of the CTU (CTU size) is encoded as a syntax of an SPS or a PPS and transmitted to an image decoding apparatus.
  • the block dividing unit 110 divides each picture constituting an image into a plurality of coding tree units (CTUs) having a predetermined size, and then repeatedly repeats the CTU using a tree structure. (recursively) split.
  • CTUs coding tree units
  • a leaf node in a tree structure becomes a coding unit (CU), which is a basic unit of encoding.
  • the tree structure includes a quad tree (QuadTree, QT) in which a parent node (or parent node) is divided into four sub-nodes (or child nodes) of the same size, or a binary tree (BinaryTree) in which a parent node is divided into two sub-nodes. , BT), or a ternary tree in which the upper node is divided into three lower nodes in a 1:2:1 ratio, or a structure using a mixture of two or more of these QT structures, BT structures, and TT structures. have.
  • QT quad tree
  • BinaryTree binary tree
  • a QTBT QuadTree plus BinaryTree
  • a QTBTTT QuadTree plus BinaryTree TernaryTree
  • MTT Multiple-Type Tree
  • the CTU may first be divided into a QT structure.
  • the quadtree split may be repeated until the size of the splitting block reaches the minimum block size (MinQTSize) of the leaf node allowed in QT.
  • the first flag (QT_split_flag) indicating whether each node of the QT structure is divided into 4 nodes of the lower layer is encoded by the encoder 150 and signaled to the video decoding apparatus. If the leaf node of QT is not larger than the maximum block size (MaxBTSize) of the root node allowed by BT, it may be further divided into any one or more of BT structure or TT structure.
  • MaxBTSize maximum block size
  • a plurality of split directions may exist. For example, there may be two directions in which a block of a corresponding node is horizontally divided and a vertically divided direction.
  • a second flag indicating whether nodes are split
  • a flag indicating additional splitting direction vertical or horizontal
  • splitting type Boary or Ternary
  • a CU split flag indicating that the block is split first and a QT split flag (split_qt_flag) indicating whether the split type is QT split is encoded 150 ) And signaled to the video decoding apparatus. If the CU split flag (split_cu_flag) value is not indicated, the block of the corresponding node becomes a leaf node in a split tree structure and becomes a coding unit (CU), which is a basic unit of encoding.
  • CU coding unit
  • the split type is QT or MTT through the QT split flag (split_qt_flag) value.
  • the split type is QT, there is no additional information, and when the split type is MTT, additionally, a flag indicating the MTT split direction (vertical or horizontal) (mtt_split_cu_vertical_flag) and/or a flag indicating the MTT split type (Binary or Ternary) (mtt_split_cu_binary_flag) is encoded by the encoding unit 150 and signaled to the video decoding apparatus.
  • split_flag indicating whether each node of the BT structure is divided into blocks of a lower layer and split type information indicating a split type are encoded by the encoder 150 and transmitted to the image decoding apparatus.
  • split_flag there may be additionally a type of dividing a block of a corresponding node into two blocks having an asymmetric shape.
  • the asymmetric form may include a form of dividing a block of a corresponding node into two rectangular blocks having a size ratio of 1:3, or a form of dividing a block of a corresponding node in a diagonal direction.
  • CU may have various sizes according to QTBT or QTBTTT division from CTU.
  • a block corresponding to a CU ie, a leaf node of QTBTTT
  • a'current block' a block corresponding to a CU (ie, a leaf node of QTBTTT) to be encoded or decoded.
  • the prediction unit 120 predicts the current block to generate a prediction block.
  • the prediction unit 120 includes an intra prediction unit 122 and an inter prediction unit 124.
  • the current blocks in a picture can each be predictively coded.
  • prediction of the current block may be performed using intra prediction technology (using data from a picture containing the current block) or inter prediction technology (using data from a picture coded before a picture containing the current block). Can be performed.
  • Inter prediction includes both one-way prediction and two-way prediction.
  • the intra prediction unit 122 predicts pixels in the current block using pixels (reference pixels) located around the current block in the current picture including the current block.
  • the plurality of intra prediction modes may include 65 non-directional modes including a planar mode and a DC mode. Peripheral pixels to be used and expressions are defined differently according to each prediction mode.
  • the intra prediction unit 122 may determine an intra prediction mode to be used to encode the current block.
  • the intra prediction unit 122 may encode the current block using various intra prediction modes, and select an appropriate intra prediction mode to use from the tested modes. For example, the intra prediction unit 122 calculates rate distortion values using rate-distortion analysis for various tested intra prediction modes, and has the best rate distortion characteristics among the tested modes. The intra prediction mode can also be selected.
  • the intra prediction unit 122 selects one intra prediction mode from a plurality of intra prediction modes, and predicts a current block by using a neighboring pixel (reference pixel) and an arithmetic expression determined according to the selected intra prediction mode.
  • Information about the selected intra prediction mode is encoded by the encoding unit 150 and transmitted to the image decoding apparatus.
  • the inter prediction unit 124 generates a prediction block for the current block through a motion compensation process.
  • the block most similar to the current block is searched in the reference picture that has been encoded and decoded before the current picture, and a predicted block for the current block is generated using the searched block. Then, a motion vector corresponding to displacement between the current block in the current picture and the prediction block in the reference picture is generated.
  • motion estimation is performed on luma components, and motion vectors calculated based on luma components are used for both luma components and chroma components.
  • Motion information including information on a reference picture and motion vector used to predict a current block is encoded by the encoder 150 and transmitted to an image decoding apparatus.
  • the subtractor 130 subtracts the prediction block generated by the intra prediction unit 122 or the inter prediction unit 124 from the current block to generate a residual block.
  • the transform unit 140 converts the residual signal in the residual block having pixel values in the spatial domain into a transform coefficient in the frequency domain.
  • the transform unit 140 may transform residual signals in the residual block using the entire size of the residual block as a transformation unit, or divide the residual block into two subblocks, which are a transform region and a non-transformed region, and convert the sub Residual signals can be transformed using only blocks as transform units.
  • the transform region sub-block may be one of two rectangular blocks having a size ratio of 1:1 on the horizontal axis (or vertical axis).
  • a flag (cu_sbt_flag), directional (vertical/horizontal) information (cu_sbt_horizontal_flag) and/or location information (cu_sbt_pos_flag) indicating that only the sub-block is converted is encoded by the encoder 150 and signaled to the video decoding apparatus.
  • the size of the transform region sub-block may have a size ratio of 1:3 based on the horizontal axis (or vertical axis).
  • a flag (cu_sbt_quad_flag) for classifying the split is additionally encoded by the encoder 150 to decode the image. Signaled to the device.
  • the quantization unit 145 quantizes transform coefficients output from the transform unit 140 and outputs the quantized transform coefficients to the encoder 150.
  • the encoding unit 150 generates a bitstream by encoding quantized transform coefficients using an encoding method such as CABAC (Context-based Adaptive Binary Arithmetic Code).
  • the encoder 150 encodes information such as a CTU size, a CU split flag, a QT split flag, an MTT split direction, and an MTT split type related to block splitting, so that the video decoding apparatus can split the block in the same way as the video coding apparatus. To make.
  • the encoder 150 encodes information about a prediction type indicating whether the current block is encoded by intra prediction or inter prediction, and intra prediction information (that is, intra prediction mode) according to the prediction type. Information) or inter prediction information (reference picture and motion vector information).
  • the inverse quantization unit 160 inverse quantizes the quantized transform coefficients output from the quantization unit 145 to generate transform coefficients.
  • the inverse transform unit 165 restores the residual block by transforming transform coefficients output from the inverse quantization unit 160 from the frequency domain to the spatial domain.
  • the adder 170 restores the current block by adding the reconstructed residual block and the predicted block generated by the predictor 120.
  • the pixels in the reconstructed current block are used as reference pixels when intra prediction of the next block.
  • the filter unit 180 filters the reconstructed pixels to reduce blocking artifacts, ringing artifacts, and blurring artifacts caused by block-based prediction and transformation/quantization. To perform.
  • the filter unit 180 may include a deblocking filter 182 and a sample adaptive offset (SAO) filter 184.
  • SAO sample adaptive offset
  • the deblocking filter 180 filters the boundary between the restored blocks to remove blocking artifacts caused by block-level coding/decoding, and the SAO filter 184 adds additional deblocking filtered images to the deblocking filter. Filtering is performed.
  • the SAO filter 184 is a filter used to compensate for a difference between a reconstructed pixel and an original pixel caused by lossy coding.
  • the reconstructed blocks filtered through the deblocking filter 182 and the SAO filter 184 are stored in the memory 190.
  • the reconstructed picture is used as a reference picture for inter prediction of a block in a picture to be encoded.
  • the image encoding apparatus may further include control means for setting whether to use or apply a coding tool for each profile using one or more syntax elements.
  • the control means may be implemented in the same physical configuration (processor, etc.) together with the sub-components represented in FIG. 1, or may be implemented in a different physical configuration from the sub-components represented in FIG. 1. Details of the control means will be described later.
  • FIG. 4 is an exemplary block diagram of an image decoding apparatus capable of implementing the techniques of the present disclosure.
  • an image decoding apparatus and sub-components of the apparatus will be described with reference to FIG. 4.
  • the image decoding apparatus may include a decoding unit 410, an inverse quantization unit 420, an inverse transform unit 430, a prediction unit 440, an adder 450, a filter unit 460, and a memory 470. have.
  • each component of the video decoding apparatus may be implemented in hardware or software, or a combination of hardware and software. Further, the function of each component may be implemented in software, and the microprocessor may be implemented to execute the function of software corresponding to each component.
  • the decoder 410 determines a current block to be decoded by decoding a bitstream received from an image encoding apparatus and extracting information related to block partitioning, prediction information necessary for restoring the current block, information about a residual signal, and the like. To extract.
  • the decoder 410 extracts information on the CTU size from the Sequence Parameter Set (SPS) or Picture Parameter Set (PSP) to determine the size of the CTU, and divides the picture into CTUs of the determined size. Then, the CTU is determined as the top layer of the tree structure, that is, the root node, and the CTU is partitioned using the tree structure by extracting the segmentation information for the CTU.
  • SPS Sequence Parameter Set
  • PSP Picture Parameter Set
  • the first flag (QT_split_flag) related to the splitting of the QT is extracted, and each node is divided into four nodes of a lower layer.
  • the second flag (MTT_split_flag) and the split direction (vertical / horizontal) and/or split type (binary / ternary) information related to the splitting of the MTT are extracted to extract the corresponding leaf node from the MTT. Divide into structures. Through this, each node below the leaf node of QT is recursively divided into a BT or TT structure.
  • a CU split flag indicating whether a CU is split is first extracted, and when the corresponding block is split, a QT split flag (split_qt_flag) is extracted.
  • a flag indicating the MTT splitting direction vertical or horizontal
  • mtt_split_cu_vertical_flag a flag indicating the MTT splitting type
  • mtt_split_cu_binary_flag a flag indicating the MTT splitting type (Binary or Ternary)
  • each node may have 0 or more repetitive MTT partitions after 0 or more repetitive QT partitions.
  • the CTU may directly generate an MTT split or, conversely, only multiple QT splits may occur.
  • the first flag (QT_split_flag) related to the splitting of the QT is extracted to divide each node into four nodes of a lower layer. Then, a split flag (split_flag) and split direction information indicating whether or not to be further split by BT is extracted for a node corresponding to a leaf node of QT.
  • the decoder 410 when determining a current block to be decoded through partitioning of a tree structure, extracts information on a prediction type indicating whether the current block is intra predicted or inter predicted. When the prediction type information indicates intra prediction, the decoder 410 extracts a syntax element for intra prediction information (intra prediction mode) of the current block. When the prediction type information indicates inter prediction, the decoder 410 extracts syntax elements for the inter prediction information, that is, information indicating a motion vector and a reference picture referenced by the motion vector.
  • the decoding unit 410 extracts information about quantized transform coefficients of the current block as information about the residual signal.
  • the inverse quantization unit 420 inverse quantizes the quantized transform coefficients, and the inverse transform unit 430 inversely transforms the inverse quantized transform coefficients from the frequency domain to the spatial domain to restore residual signals to generate a residual block for the current block. .
  • the inverse transform unit 430 when the inverse transform unit 430 inversely transforms only a partial region (subblock) of a transform block, a flag (cu_sbt_flag) indicating that only a subblock of the transform block is transformed, and vertical/horizontal information (cu_sbt_horizontal_flag) of the subblock ) And/or extracting the location information (cu_sbt_pos_flag) of the sub-blocks, and restoring the residual signals by inverse transforming the transform coefficients of the corresponding sub-blocks from the frequency domain to the spatial domain. By filling, we create the final residual block for the current block.
  • the prediction unit 440 may include an intra prediction unit 442 and an inter prediction unit 444.
  • the intra prediction unit 442 is activated when the prediction type of the current block is intra prediction
  • the inter prediction unit 444 is activated when the prediction type of the current block is inter prediction.
  • the intra prediction unit 442 determines an intra prediction mode of a current block among a plurality of intra prediction modes from syntax elements for an intra prediction mode extracted from the decoder 410, and according to the intra prediction mode, reference pixels around the current block Use to predict the current block.
  • the inter prediction unit 444 determines a motion vector of a current block and a reference picture referenced by the motion vector using a syntax element for the intra prediction mode extracted from the decoding unit 410, and uses the motion vector and the reference picture. To predict the current block.
  • the adder 450 restores the current block by adding the residual block output from the inverse transform unit and the prediction block output from the inter prediction unit or the intra prediction unit.
  • the pixels in the reconstructed current block are used as a reference pixel in intra prediction of a block to be decoded later.
  • the filter unit 460 may include a deblocking filter 462 and a SAO filter 464.
  • the deblocking filter 462 deblocks the boundary between the restored blocks in order to remove blocking artifacts caused by block-by-block decoding.
  • the SAO filter 464 performs additional filtering on the reconstructed block after deblocking filtering to compensate for the difference between the reconstructed pixel and the original pixel caused by lossy coding.
  • the reconstructed blocks filtered through the deblocking filter 462 and the SAO filter 464 are stored in the memory 470. When all blocks in one picture are reconstructed, the reconstructed picture is used as a reference picture for inter prediction of a block in a picture to be encoded.
  • the image decoding apparatus may further include control means for setting whether to use a coding tool for each profile using one or more syntax elements.
  • the control means may be implemented in the same physical configuration (processor, etc.) together with the sub-components represented in FIG. 4, or may be implemented in a different physical configuration from the sub-components represented in FIG. 4. Details of the control means will be described later.
  • control means included in the image decoding apparatus corresponds to the above-described control means included in the image encoding apparatus and corresponding configurations in terms of their functions.
  • control means included in the image decoding apparatus are referred to as decoding control means, and control included in the image encoding apparatus
  • the means will be referred to as encoding control means.
  • the profile means a set consisting of only specific coding tools for a specific application among a plurality of coding tools provided in the video standard.
  • Profiles such as'Main profile','Main10 profile','Main still picture profile','Format range extensions profiles','High throughput profiles', and'Screen content coding extensions profiles' are established in HEVC.
  • the coding tool may mean various functions provided in a video standard, such as a merge function, a cross-component prediction function, an adaptive motion vector resolution function, a transform skip function, a current picture referencing function, and a palette function.
  • Level is a concept used in consideration of a difference in performance that can be processed according to characteristics of an image decoding apparatus even if the profile is the same, and the maximum resolution and frame rate of a processable image may be determined according to a value of “level”.
  • the tier is a concept that is used because it is about the limitation on the maximum bit rate, and even if it is the same profile and the same level, there are cases where the image is compressed with high resolution and high image quality depending on the application, and there are cases where it is not. That is, the tier is a rule related to the memory 470 of the video decoding apparatus.
  • Table 1 summarizes the levels and tiers of HEVC.
  • syntax elements that specify a profile, level, and tier are located in a sequence parameter set (SPS).
  • SPS sequence parameter set
  • VPS video parameter set
  • VPS is header information used when coding one content into multiple layers for scalable coding.
  • profile information for a base layer and profile information for a sub layer may be set separately (separately).
  • one profile value can be assigned to one sequence.
  • the corresponding sequence may indicate compatibility with other profiles in addition to a predefined profile, and compatibility may be indicated using a syntax element general_profile_compatibility_flag[j].
  • one or more profiles that can be specified or applied to a specific sequence may be displayed by indicating whether they are compatible.
  • the conventional standard cannot display information about a coding tool actually used in a corresponding sequence among a plurality of coding tools included in a specified profile.
  • the encoding control means may designate or display a profile to be applied to a specific sequence among one or more assignable profiles (hereinafter referred to as'all profiles') using a syntax element.
  • the syntax element designating the profile may be referred to as a profile syntax element (general_profile_idc, hereinafter abbreviated as profile_idc for short), and a profile indicated by this profile syntax element (profile to be applied) may be referred to as a target profile.
  • the encoding control means may designate or display a coding tool applied or used in a corresponding sequence among one or more coding tools included in a designated profile (target profile) using a syntax element.
  • the syntax element that designates the coding tool may be referred to as a coding tool syntax element, and the coding tool included in the target profile may be referred to as a target coding tool.
  • the coding tool syntax element indicates whether to apply to the coding tool (target coding tool) included in the target profile, or expands the scope thereof to include the entire coding tool including the target coding tool (hereinafter referred to as'all coding tools'). It can also indicate whether or not to apply.
  • all the coding tools may mean all coding tools that may be included in all profiles, and whether or not they are applied may mean whether or not the coding tools are restricted, whether to be used, whether to be inactive, or to be on/off.
  • the video encoding device may signal the video decoding device by including the profile syntax element and the coding tool syntax element in the bitstream.
  • the profile syntax element and the coding tool syntax element may be signaled by being located in one or more of a picture-level header, a sequence-level header, or an upper header (eg, decoder-level header, decoding parameter set (DPS)).
  • the profile syntax element and the coding tool syntax element may be signaled by being located in the VPS for scalable coding.
  • the decoder 410 may decode the profile syntax element from the bitstream (S510) and decode the coding tool syntax element from the bitstream (S520).
  • the decoding control means may set whether to use the target coding tool included in the target profile among all coding tools based on the decoded coding tool syntax element (S530).
  • whether to use the coding tool may mean on/off of the corresponding coding tool
  • setting whether to use the coding tool may mean turning on/off the corresponding coding tool.
  • the target coding tool can be specified among all coding tools by designating the profile indicated by the profile syntax element as the target profile. By setting the target coding tool indicating that the coding tool syntax element is not applied to off, and setting the target coding tool indicating that the coding tool syntax element is applied to on, on/off for the target coding tool can be set. have.
  • Profile-A a total of four profiles
  • Profile-B a total of three coding tools
  • Profile-C a total of five coding tools
  • Profile-D a total of five coding tools
  • Profile-C includes 3 coding tools
  • Profile-D has 4 coding tools It is assumed that (tool-b, tool-c, tool-f, tool-g) is included. This is summarized in Table 5 below.
  • “-“ may mean that information does not exist in the corresponding array or information is not signaled.
  • max may mean the total number of coding tools that can be set (the number of all coding tools). The meaning of “-” and the meaning of max are commonly applied in this specification.
  • coding tools included in a specific profile may be arranged sequentially. Accordingly, the j-th coding tool syntax element may indicate whether to apply the coding tool arranged in the j-th.
  • j may correspond to an integer of 0 or more.
  • the first embodiment corresponds to a method of expressing whether to apply to coding tools using two syntax elements. That is, in Embodiment 1, the coding tool syntax element may include two different syntax elements.
  • One of the two syntax elements is a restriction syntax element indicating whether to restrict the coding tool, and the other is a usage syntax element indicating whether to enable the coding tool.
  • the restricted syntax element and the used syntax element may be defined at one or more different locations among a picture-level header, a sequence-level header, a decoder-level header, or a higher header.
  • the restrictive syntax element may indicate whether to restrict one or more coding tools or all coding tools.
  • the usage syntax element indicates whether or not to use one or more coding tools or all coding tools, or indicates whether or not to use the limited syntax element only for coding tools indicating that the restriction syntax element is not limited (not limited by the limited syntax element). It might be.
  • Embodiment 1 may be divided into the following specific embodiments according to a range of coding tools indicated by the limited syntax element and the used syntax element.
  • the restricted syntax element is set for all coding tools, and the used syntax element can be set for coding tools that are not restricted by the limited syntax element.
  • the video encoding apparatus may designate a target profile using a profile syntax element, and indicate whether all coding tools are restricted using the limiting syntax element. In addition, the video encoding apparatus may indicate whether to use unrestricted coding tools among all coding tools using a usage syntax element.
  • the restricted syntax element and the used syntax element may be signaled at the same location of one or more of a picture-level header, a sequence-level header, a decoder-level header, or an upper header.
  • the two syntax elements can be signaled at different locations, and the syntax structure for this is represented in Tables 7 and 8 below.
  • profile_idc represents a profile syntax element
  • coding_tool_constraint_flag[j] represents a restricted syntax element for the j-th coding tool
  • coding_tool_enabled_flag[j] represents a usage syntax element for the j-th coding tool.
  • the restricted syntax element and the used syntax element may be defined as flag values for each of all coding tools without using the [j] array.
  • A_constraint_flag and A_enabled_flag are defined for the A coding tool
  • B_constraint_flag and B_enabled_flag can be defined for the B coding tool.
  • the video encoding apparatus displays the target profile to be assigned to the corresponding sequence using profile_idc, and indicates whether or not the coding tools are limited by a size of max (for all coding tools) coding_tool_constraint_flag[j ], and whether to use unrestricted coding tools can be indicated using coding_tool_enabled_flag[j].
  • the limiting syntax element is set to a value of “1” indicating that it is limited for a limited coding tool, and is set to a value of “0” that is not limited for a non-restricted coding tool.
  • the limiting syntax element is set to a value of “1” indicating that the limiting is applied to coding tools not included in the target profile (arrays of positions exceeding the number of coding tools included in the target profile).
  • the limiting syntax element has a value of “0” for tool-a (index 0), tool-c (index 1), and tool-g (index 4) that are not limited among the target coding tools. Is set, and is set to “1” for the limited tool-d (index 2) and tool-e (index 3), and the coding tools (index 5 to max-1) that do not correspond to the target coding tool ) Is set to “1”.
  • the video encoding apparatus may signal the video decoding apparatus by including a profile syntax element and a coding tool syntax element (limited syntax element, used syntax element) in a bitstream.
  • the bitstream may include up to max limited syntax elements and up to max (down to the number of unrestricted coding tools) usage syntax elements.
  • the video decoding apparatus may decode the profile syntax element (S610). Also, the apparatus for decoding an image may decode limited syntax elements for all coding tools (max) (S620). For example, the apparatus for decoding an image decodes a restriction syntax element of a specific (j-th) and decodes a restriction syntax element of the next (j++) when a part of the restriction syntax element is not decoded, thereby limiting the syntax element. Can decode as many as max.
  • the video decoding apparatus may decode the used syntax element when it is not indicated that the limited syntax element is limited (S630). For example, the video decoding apparatus decodes the j-th use syntax element when it does not indicate that the j-th restriction syntax element is restricted, and the next (j++) when it indicates that the j-th restriction syntax element is restricted. Through the method of determining the limiting syntax element of, the used syntax element can be decoded (up to max).
  • the video decoding apparatus may set whether to turn on/off the target coding tool based on the restriction/use syntax element (S640). Specifically, the video decoding apparatus sets a coding tool indicating that the usage syntax element is used, and indicates that the restriction syntax element is restricted or does not indicate that the usage syntax element is used (indicating that it is not used). By setting to off, it is possible to set whether the target coding tool is on or off.
  • the limiting syntax element is set for one or more coding tools, and the usage syntax element can also be set for one or more coding tools.
  • a restricted syntax element for coding tools is first defined, and then a usage syntax element for coding tools can be defined.
  • the video encoding apparatus may designate a target profile using a profile syntax element, and set whether to limit one or more coding tools (max max) using the limiting syntax element.
  • the video encoding apparatus may set whether to use one or more coding tools (max max) using a usage syntax element. That is, the usage syntax element can be set for all coding tools regardless of whether they are restricted by the restriction syntax element. However, when the restriction syntax element for one coding tool limits the use of the corresponding coding tool, the usage syntax element for the corresponding coding tool should be set to a value not indicating that it is used (indicating that it is not used). On the contrary, if the restricted syntax element does not limit the use of the corresponding coding tool, the used syntax element for the corresponding coding tool may be set to any value.
  • the limited syntax element and the used syntax element may be signaled at the same location of one or more of a picture-level header, a sequence-level header, a decoder-level header, or an upper header.
  • the two syntax elements can be signaled at different locations, and the syntax structure for this is represented in Tables 11 and 12 below.
  • the limiting syntax element is set to a value of “1” indicating that it is limited for a limited coding tool, and is set to a value of “0” that is not limited for a non-restricted coding tool.
  • the limiting syntax element may be set to a value of “1” indicating that the coding tools (arrays of positions exceeding the number of coding tools included in the target profile) are not included in the target profile.
  • the usage syntax element is set to a value of “1” indicating that it is used for the coding tool used among all coding tools, and a value of “0” indicating that it is not used for the coding tools that are not used.
  • the used syntax element should be set to a value of “0” for a coding tool limited by the restricted syntax element.
  • the syntax element used is a value of “1” for tool-a (index 0), tool-c (index 1), and tool-g (index 4) that are not limited among the target coding tools. Is set, and is set to “0” for limited tool-d (index 2) and tool-e (index 3).
  • the coding tools arrays from index 5 to max-1) that do not correspond to the target coding tool are limited by the limiting syntax element, they are set to “0”.
  • the video encoding apparatus may signal the video decoding apparatus by including a profile syntax element and a coding tool syntax element (limited syntax element, used syntax element) in a bitstream.
  • the bitstream may include up to max limit syntax elements and up to max use syntax elements.
  • the image decoding apparatus may decode the profile syntax element (S710). Also, the apparatus for decoding an image may decode the limited syntax element by the number of coding tools (max max) (S720). Furthermore, the video decoding apparatus may decode the used syntax element by the number of coding tools (max max) regardless of whether the limited syntax element is limited (S730).
  • the video decoding apparatus may set whether to turn on/off the target coding tool based on the restriction/use syntax element (S740). Specifically, the video decoding apparatus sets a coding tool indicating that the used syntax element is used without indicating that the restricted syntax element is restricted, and indicates that the restricted syntax element is restricted or does not indicate that the used syntax element is used By setting the coding tool (which indicates that it is not used) to off, it is possible to set whether the target coding tool is on or off.
  • Embodiments 1-3 correspond to a method of setting the limited syntax element and/or the used syntax element only for the target coding tool included in the target profile, not for all coding tools.
  • resetting or resetting max to the same number as the number of target coding tools can set whether to limit and/or use only the target coding tools.
  • the redefinition of max can be implemented through Equation 1 below.
  • MaxofCodingTools[profile_idc] is an array indicating the number of coding tools (target coding tools) included in the i-th profile (profile_idc).
  • i may correspond to an integer of 0 or more.
  • the image decoding apparatus can decode the limited syntax element by the same number as the reset max (the same number as the target coding tool), and the used syntax element by the same number as the number of unrestricted coding tools It can be decrypted. Also, the apparatus for decoding an image may set whether to turn on/off target coding tools included in the target profile based on the limited syntax element and the used syntax element.
  • the embodiment described through Table 15 is an example in which the use syntax element is set only for a coding tool that is not limited by the limit syntax element (combination with embodiment 1-1). As described above, the usage syntax element can be set for all coding tools regardless of whether they are restricted by the limiting syntax element (combination with embodiments 1-2).
  • An example combined with Example 1-2 is represented in Table 16 below.
  • the usage syntax element may be set to the same number as the reset max, and may indicate whether to use all of the target coding tools included in the target profile regardless of whether or not it is restricted.
  • the usage syntax element may be set to a value of “0” for a coding tool whose usage is restricted by the restriction syntax element among coding tools included in the target profile.
  • the restriction syntax element may be set to a value of “0”.
  • the image decoding apparatus may decode the limited syntax element and the used syntax element by the same number as the reset max (the same number as the target coding tool). Also, the apparatus for decoding an image may set whether to turn on/off target coding tools included in the target profile based on the limited syntax element and the used syntax element.
  • the second embodiment corresponds to a method of expressing whether to apply to target coding tools using a single syntax element.
  • This one syntax element is an inactive syntax element indicating whether it is disabled for the coding tool, and whether it is inactive may mean whether to be restricted or used.
  • the inactive syntax element may be included in the coding tool syntax element, and may be defined at a position of one or more of a sequence-level header, a decoder-level header, or an upper header.
  • the inactive syntax element may indicate whether to be inactive for all coding tools or indicate whether to be inactive only for the target coding tool.
  • Embodiment 2 may be divided into the following embodiments according to the range of coding tools indicated by the inactive syntax element.
  • Example 2-1 corresponds to a method of expressing whether or not all coding tools are inactive using an inactive syntax element.
  • the video encoding apparatus may designate a target profile using a profile syntax element, and indicate whether all coding tools (max) are inactive using an inactive syntax element.
  • coding_tool_disabled_flag[j] represents an inactive syntax element.
  • the video encoding apparatus may set whether to disable all coding tools using an inactive syntax element. That is, max of inactive syntax elements can be set.
  • the inactive syntax element may be set to a value of “1” indicating inactivity for an unused coding tool among target coding tools, and may be set to a value of “0” indicating activity for the used coding tools.
  • the inactive syntax element may be set to a value of “1” indicating inactivity for coding tools other than the target coding tool (arrays of positions exceeding the number of coding tools included in the target profile).
  • the inactive syntax element is set to a value of “1” for 2 of the 5 targeted coding tools (tool-d and tool-e), and the remaining coding tools applied (tool-a, tool-c and tool-g) may be set to a value of “0”.
  • the inactive syntax element may be set to a value of “1” for coding tools (array from index 5 to (max-1)) excluding the target coding tool.
  • the video encoding device may signal the video decoding device by including the profile syntax element and the coding tool syntax element (inactive syntax element) in the bitstream.
  • the bitstream may include max inactive syntax elements.
  • the video decoding apparatus may decode the profile syntax element (S810). Also, the image decoding apparatus may decode inactive syntax elements by the number (max) of all coding tools (S820).
  • the video decoding apparatus may set whether to turn on/off the target coding tool based on the decoded inactive syntax element (S830). Specifically, the video decoding apparatus sets on/off whether the target coding tool is on or off by setting a coding tool that does not indicate that the inactive syntax element is inactive, and setting a coding tool that indicates that the inactive syntax element is inactive to off. Can be.
  • Example 2-2 corresponds to a method of displaying an inactive syntax element only for a target coding tool included in the target profile, not for all coding tools.
  • max is reset or re-assigned to the same number as the number of target coding tools, it is possible to set whether to disable the target coding tools only.
  • the redefinition of max can be implemented through Equation 1.
  • the encoding control means may specify a target profile using a profile syntax element and reset max equal to the number of target coding tools included in the target profile.
  • the encoding control means may set the inactive syntax element by the same number as the reset max.
  • inactive syntax element when the inactive syntax element is set to the same number as the reset max, it is possible to express whether only the target coding tools are inactive. For example, in the case of Profile-B, whether to be inactive can be expressed only for five coding tools (tool-a, tool-c, tool-d, tool-e, and tool-g). An inactive syntax element is not set for coding tools not included in the target coding tool.
  • the video decoding apparatus may decode the inactive syntax element by the same number as the reset max (the same number as the target coding tool). Also, the apparatus for decoding an image may set whether on/off target coding tools included in the target profile are based on the inactive syntax element.
  • the third embodiment corresponds to a method of setting whether a coding tool is on or off by dividing coding tools included in a profile into one or more subsets and separately expressing whether or not to restrict the subsets.
  • a subset can be understood as a subset of coding tools or a grouping of coding tools. Coding tools having similar functions can be included in the same subset.
  • the subset may be included in one or more of all assignable profiles (hereinafter referred to as'all profiles'), and each of the subsets may include one or more coding tools.
  • the subset can be defined or constructed in a variety of ways.
  • the subset may be defined based on 1) all coding tools regardless of the profile, or 2) coding tools included in the profile.
  • subset definition 1 an example in which a subset is defined based on all coding tools is represented in Table 21 below.
  • maxS represents the number of all subsets (hereinafter referred to as'all subsets') that can be determined or specified
  • maxC is all coding that can be included (which can be set) in each subset. The maximum number of tools.
  • Profile-A includes two subsets (Subset- ⁇ , Subset- ⁇ ), and Subset- ⁇ includes two coding tools (tool-a, tool-b), Subset- ⁇ may include one coding tool (tool-c).
  • Profile-B includes three subsets (Subset- ⁇ , Subset- ⁇ , Subset- ⁇ ), Subset- ⁇ includes one coding tool (tool-a), and Subset- ⁇ contains two Coding tools (tool-c, tool-d) are included, and Subset- ⁇ may include two coding tools (tool-e, tool-g).
  • subset definition 2) is a method of defining a subset based on coding tools included in the profile.
  • An example of applying subset definition 2) to the assumptions in Table 5 is shown in Table 23 below.
  • Profile-A includes two subsets (Subset-A1, Subset-A2), and Subset-A1 includes two coding tools (tool-a, tool-b), Subset-A2 may include one coding tool (tool-c).
  • Profile-B includes two subsets (Subset-B1, Subset-B2), Subset-B1 includes two coding tools (tool-a, tool-c), and Subset-B2 contains three Coding tools (tool-d, tool-e, tool-g) may be included.
  • the subset in definition 2) may be defined as a subset of coding tools included in the profile to which it belongs.
  • the image encoding apparatus may designate a target profile using a profile syntax element, and determine or set whether to limit the subsets using the subset syntax element.
  • the subset syntax element can be set for all subsets (as many as maxS).
  • a subset not limited by the subset syntax element will be referred to as a target subset.
  • the video encoding apparatus may set whether to apply coding tools using a coding tool syntax element.
  • the coding tool syntax element may indicate whether or not to apply coding tools included in a subset not limited by the subset syntax element, and coding tools included in the unrestricted subset may correspond to a target coding tool.
  • the video encoding device may signal the video decoding device by including a profile syntax element, a subset syntax element, and a coding tool syntax element in a bitstream.
  • the video decoding apparatus may decode the profile syntax element and the subset syntax element from the bitstream (S910, S920).
  • the subset syntax elements may be decoded as many as masS.
  • the apparatus for decoding an image may decode the coding tool syntax element when it is not indicated that the subset syntax element is limited (S930 ).
  • the video decoding apparatus may set whether to turn on/off the target coding tool by setting on/off of the coding tools based on the coding tool syntax element (S940). Specifically, the video decoding apparatus sets on/off target coding tools indicating that the coding tool syntax element is applied, and sets target coding tools off which does not indicate that the coding tool syntax element is applied, to off/on the target coding tools. You can set whether to off.
  • the third embodiment may be divided into the following specific embodiments according to a range of subsets indicating whether the subset syntax element is restricted or a range of coding tools indicating whether the coding tool syntax element is applied.
  • Example 3-1 is a method of setting a subset syntax element for all subsets, setting a limiting syntax element when the subset is not limited, and setting a use syntax element when the coding tool is not limited Corresponds to
  • the video encoding apparatus sets the target profile by setting whether to limit all subsets (maxS) using a subset syntax element (eg, subset_constraint_flag[i]) Whether to limit the target subsets included in may be indicated.
  • a subset syntax element eg, subset_constraint_flag[i]
  • the video encoding apparatus may set whether to use or not to restrict the target coding tools by using the limited syntax element and the used syntax element.
  • the limiting syntax element is set when the subset is not limited by the subset syntax element, and can be set for all coding tools.
  • the usage syntax element can be set for coding tools that are not limited by the restriction syntax element.
  • Example 3-1 can be applied to both subset definitions 1) and 2).
  • An example of applying the method of Example 3-1 to subset definition 2) is shown in Table 25 below.
  • the restricted syntax element and the used syntax element are not set.
  • the video encoding device may signal the video decoding device by including a profile syntax element, a subset syntax element, and a coding tool syntax element (restricted syntax element, used syntax element) in the bitstream.
  • the bitstream may include maxS subset subset syntax elements, maxC restriction syntax elements, and maxC usage syntax elements.
  • the image decoding apparatus may decode the profile syntax element (S1010), and may decode a specific (i-th) subset syntax element of the maxS subset syntax elements (S1020). If it is not indicated that the i-th subset syntax element is limited, the image decoding apparatus may decode a specific (j-th) limited syntax element of the maxC limited syntax elements (S1030). If the j-th restriction syntax element is not indicated to be limited, the image decoding apparatus may decode the j-th usage syntax element (S1040).
  • the video decoding apparatus may decode all the restricted syntax elements and all the used syntax elements for the i-th subset by repeatedly performing steps S1030 and S1040 while sequentially increasing j.
  • the image decoding apparatus may decode all the restricted syntax elements and all the used syntax elements for all subsets by repeatedly performing steps S1030 and S1040 while sequentially increasing i.
  • the video decoding apparatus may set whether to turn on/off the target coding tool based on the limit/use syntax element (S1050).
  • Embodiment 3-1 described above corresponds to a method of sequentially setting the j-th restriction syntax element and the j-th usage syntax element for a specific (j-th) coding tool.
  • Example 3-2 corresponds to a method of setting the use syntax element after setting the limit syntax element by maxC.
  • Example 3-2 An example of the syntax structure of Example 3-2 is shown in Table 26 below.
  • the video encoding apparatus may set whether to limit the target subsets using a subset syntax element (eg, subset_constraint_flag[i]).
  • the subset syntax element can be set for all subsets maxS.
  • the video encoding apparatus may set whether to use or not to restrict the target coding tools by using the limited syntax element and the used syntax element.
  • the limiting syntax element is set when the subset is not limited by the subset syntax element, and can be set for all coding tools (maxC).
  • the use syntax element is set after the limit syntax element is set by maxC, and may be set for coding tools not limited by the limit syntax element.
  • Example 3-2 can be applied to both subset definitions 1) and 2).
  • An example in which the method of Example 3-2 is applied to subset definition 2) is shown in Table 27 below.
  • the restricted syntax element and the used syntax element are not set.
  • the restricted syntax element and the used syntax element may be set.
  • the third subset (Subset- ⁇ ) is also not limited, a limited syntax element and a used syntax element can be set.
  • the bitstream may include maxS subset subset syntax elements, maxC limit syntax elements, and maxC usage syntax elements or less.
  • the image decoding apparatus may decode the profile syntax element (S1110), and may decode a specific (i-th) subset syntax element of the maxS subset syntax elements (S1120). If it is not indicated that the i-th subset syntax element is limited, the video decoding apparatus may decode maxC number of limited syntax elements (S1130). The video decoding apparatus may decode all the restricted syntax elements for all subsets while sequentially increasing i.
  • the image decoding apparatus may decode the j-th usage syntax element when it is not indicated that the j-th restriction syntax element is restricted (S1140).
  • the image decoding apparatus may decode all of the use syntax elements for the i-th subset while sequentially increasing j.
  • the apparatus for decoding an image may decode all of the syntax elements used for all subsets while sequentially increasing i.
  • the video decoding apparatus may set whether to turn on/off the target coding tool based on the restriction/use syntax element (S1150).
  • Example 3-3 sets the subset syntax element for all subsets, sets the limited syntax element for all coding tools when the subset is not restricted, and uses syntax regardless of whether or not the coding tool is restricted Corresponds to how to configure elements for all coding tools.
  • the video encoding apparatus sets whether to limit the subset for all subsets (maxS) using a subset syntax element (eg, subset_constraint_flag[i]), and uses the limited syntax element
  • a subset syntax element eg, subset_constraint_flag[i]
  • the video encoding apparatus may set whether to use a coding tool for all coding tools maxC using a usage syntax element.
  • the bitstream may include as many as maxS subset syntax elements, and may each contain as many as maxC limit syntax elements and use syntax elements.
  • the image decoding apparatus may decode the profile syntax element (S1210), and may decode a specific (i-th) subset syntax element of the maxS subset syntax elements (S1220). If it is not indicated that the i-th subset syntax element is limited, the image decoding apparatus may decode maxC number of limited syntax elements (S1230) and decode up to maxC number of used syntax elements (S1240). The video decoding apparatus may decode all the restricted syntax elements and all the used syntax elements for all subsets while sequentially increasing i.
  • the video decoding apparatus may set whether to turn on/off the target coding tool based on the limited/used syntax element (S1250).
  • Embodiments 3-4 correspond to a method of indicating whether or not the coding tool is applied using one syntax element (inactive syntax element).
  • the video encoding apparatus specifies a target profile using a profile syntax element (eg, profile_idc), and sets the subset using a subset syntax element (eg, subset_constraint_flag[i]). Whether to limit or not can be set for all subsets (maxS), and if the subset is not restricted, whether to disable the coding tools by using an inactive syntax element (eg, coding_tool_disabled_flag[j]) for all coding tools (maxC) Dog).
  • a profile syntax element eg, profile_idc
  • subset_constraint_flag[i] e.g, subset_constraint_flag[i]
  • the image decoding apparatus may decode as many as maxS subset elements (the same number as all subsets), and when a specific subset is not limited, the number of inactive syntax elements equal to maxC (all The same number as the coding tool). Also, the apparatus for decoding an image may set whether on/off target coding tools included in the target profile are based on the inactive syntax element.
  • the embodiment 3-5 sets the subset syntax element only for the target subset or the coding tool syntax element (restricted/used syntax element or inactive syntax element only for the target coding tool) ).
  • MaxofSubSets[i] is an array indicating the number of subsets included in the i-th profile
  • MaxofCodingTools[i] is an array indicating the number of coding tools included in the i-th subset.
  • the encoding control means may specify a target profile using a profile syntax element, and reset maxS equal to the number of subsets included in the target profile.
  • the encoding control means may set the coding tool syntax element by the same number as the reset maxC. Accordingly, the subset syntax element can express whether or not the restriction is applied only to the target subset included in the target profile, and the coding tool syntax element can express whether to apply only to the target coding tool.
  • the video decoding apparatus may decode the subset syntax element by the same number as the reset maxS (the same number as the target subset), and the number of coding tool syntax elements equal to the reset maxC (the target coding tool And the same number). Also, the apparatus for decoding an image may set whether target coding tools are on or off based on a coding tool syntax element.
  • At least one profile (hereinafter referred to as'representative profile'), which is representative from all profiles, is predefined, and any one of the profiles included in the representative profile is designated using syntax elements, and included in the designated profile It corresponds to a method of designating a sub-profile.
  • Sub-profiles can also be defined and used by third-party organizations (eg ITU-T).
  • the sub-profile may correspond to a subset of coding tools included in the representative profile, and may be a group including specific-purpose coding tools.
  • the sub-profile may include only royalty-free coding tools.
  • the representative profile may be used as a decoding profile for the corresponding sequence, and the sub-profile may be used as information about a coding tool actually used in the corresponding sequence.
  • Profile-A.1 may be included as a sub-profile in Profile-A
  • Profile-B.1 and Profile-B.2 may be included as a sub-profile in Profile-B
  • Profile- Profile-C.1 may be included as a sub-profile in C
  • Profile-D.1 may be included as a sub-profile in Profile-D.
  • the video encoding apparatus may designate or define any one of the representative profiles using a profile syntax element (eg, profile_idc, representative profile syntax element).
  • the video encoding apparatus may designate one or more of the sub-profiles included in the designated profile (sub-profiles including actual used coding tools) using sub-profile syntax elements (eg, sub-profile_idc or general_sub_profile_idc) or Can be defined.
  • the sub-profile specified by the sub-profile syntax element may correspond to the target profile.
  • sub-profile syntax elements There may be multiple sub-profile syntax elements. That is, there may be multiple sub-profiles indicated by the sub-profile syntax element. In this case, information on the number of sub-profile syntax elements (eg, num_sub_profiles) may be additionally signaled.
  • the video decoding apparatus may decode the representative profile syntax element from the bitstream (S1510), and decode the sub-profile syntax element from the bitstream (S1530).
  • the sub-profile indicated by the sub-profile syntax element may be designated as the target profile.
  • the image decoding apparatus may first decode the number information of the sub-profile syntax elements (S1520), and then decode the sub-profile syntax elements as many as the number indicated by the decoded number information. There is (S1530).
  • Table 33 shows a process of setting a variable/flag using a profile syntax element (profile_idc) and a usage syntax element (coding_tool_enabled_flag[j])
  • Table 34 shows a profile syntax element (profile_idc) and an inactive syntax element (coding_tool_disabled_flag[j]) ) To indicate the process of setting the variable/flag.
  • the present invention can display information on a coding tool actually used among a plurality of coding tools, a specific coding tool can be selectively turned on/off in the image decoding apparatus.
  • the image decoding apparatus may turn on/off the merge function based on a coding tool syntax element (merge_enabled_flag in Table 33 and Table 34) indicating whether to apply the merge mode in the process of determining the encoding mode for the current block.
  • a coding tool syntax element (merge_enabled_flag in Table 33 and Table 34) indicating whether to apply the merge mode in the process of determining the encoding mode for the current block.
  • the conventional method includes parsing and decoding skip_flag (S1310), determining whether the encoding mode of the current block is skip mode as indicated by skip_flag (S1320), encoding of the current block When the mode is not the skip mode, parsing and decoding the pred_mode_flag (S1340), determining whether the encoding mode of the current block is the intra mode as indicated by the pred_mode_flag (S1350), and the encoding mode of the current block is intra When not in mode, the process of parsing and decoding part_mode (S1360), the process of parsing and decoding merge_flag (S1370), and the process of determining whether the encoding mode of the current block is a merge mode as indicated by merge_flag (S1380) It is possible to determine whether the current block coding mode is a merge mode.
  • the present invention may determine whether to merge on/off before the process of parsing and decoding merge_flag (S1480) by using a coding tool syntax element indicating whether to apply the merge mode.
  • a coding tool syntax element indicating whether to apply the merge mode.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

코딩 툴 설정 방법 및 영상 복호화 장치를 개시한다. 본 발명의 일 실시예에 의하면, 코딩 툴(coding tool)의 사용 여부를 설정하는 방법으로서, 비트스트림으로부터, 지정 가능한 하나 이상의 프로파일 중 대상 프로파일을 지시하는 프로파일 신택스 요소(syntax element) 및, 설정 가능한 하나 이상의 코딩 툴에 대한 적용 여부를 지시하는 코딩 툴 신택스 요소를 복호화하는 단계; 및 상기 코딩 툴 신택스 요소에 기초하여, 상기 대상 프로파일에 포함된 하나 이상의 대상 코딩 툴에 대한 on/off 여부를 설정하는 단계를 포함하는 것을 특징으로 하는 코딩 툴 설정 방법을 제공한다. 대표도: 도 4

Description

코딩 툴 설정 방법 및 영상 복호화 장치
본 발명은 영상의 부호화 및 복호화에 관한 것으로서, 부호화 및 복호화의 효율을 향상시킨 코딩 툴 설정 방법 및 영상 복호화 장치에 관한 것이다.
동영상 데이터는 음성 데이터나 정지 영상 데이터 등에 비하여 많은 데이터량을 가지기 때문에, 압축을 위한 처리 없이 그 자체를 저장하거나 전송하기 위해서는 메모리를 포함하여 많은 하드웨어 자원을 필요로 한다.
따라서, 통상적으로 동영상 데이터를 저장하거나 전송할 때에는 부호화기를 사용하여 동영상 데이터를 압축하여 저장하거나 전송하며, 복호화기에서는 압축된 동영상 데이터를 수신하여 압축을 해제하고 재생한다. 이러한 동영상 압축 기술로는 H.264/AVC를 비롯하여, H.264/AVC에 비해 약 40% 정도의 부호화 효율을 향상시킨 HEVC(High Efficiency Video Coding)가 존재한다.
그러나, 영상의 크기 및 해상도, 프레임율이 점차 증가하고 있고, 이에 따라 부호화해야 하는 데이터량도 증가하고 있으므로 기존의 압축 기술보다 더 부호화 효율이 좋고 화질 개선 효과도 높은 새로운 압축 기술이 요구된다.
이러한 요구에 부응하기 위해 본 발명은 개선된 영상 부호화 및 복호화 기술을 제공하는 것을 목적으로 하며, 특히, 본 발명의 일 측면은 프로파일에서 지원되는 코딩 툴들 중에서 실제 사용된 코딩 툴에 대한 정보를 표현함으로써 부호화 및 복호화의 효율을 향상시키는 기술과 관련된다.
본 발명의 일 측면은, 코딩 툴(coding tool)의 사용 여부를 설정하는 방법으로서, 비트스트림으로부터, 지정 가능한 하나 이상의 프로파일 중 대상 프로파일을 지시하는 프로파일 신택스 요소(syntax element) 및, 설정 가능한 하나 이상의 코딩 툴에 대한 적용 여부를 지시하는 코딩 툴 신택스 요소를 복호화하는 단계; 및 상기 코딩 툴 신택스 요소에 기초하여, 상기 대상 프로파일에 포함된 하나 이상의 대상 코딩 툴에 대한 on/off 여부를 설정하는 단계를 포함하는 것을 특징으로 하는 코딩 툴 설정 방법을 제공한다.
본 발명의 다른 일 측면은, 비트스트림으로부터, 지정 가능한 하나 이상의 프로파일 중 대상 프로파일을 지시하는 프로파일(profile) 신택스 요소(syntax element) 및, 설정 가능한 하나 이상의 코딩 툴(coding tool)에 대한 적용 여부를 지시하는 코딩 툴 신택스 요소를 복호화하는 복호화부; 및 상기 코딩 툴 신택스 요소에 기초하여, 상기 대상 프로파일에 포함된 하나 이상의 대상 코딩 툴에 대한 on/off 여부를 설정하는 제어수단을 포함하는 것을 특징으로 하는 영상 복호화 장치를 제공한다.
이상에서 설명한 바와 같이 본 발명의 일 실시예에 의하면, 프로파일에서 지원되는 코딩 툴들 중에서 실제 사용된 코딩 툴에 대한 정보만이 시그널링되므로, 코딩 툴 설정에 대한 비트 효율성이 향상될 수 있다.
또한, 본 발명의 다른 일 실시예에 의하면, 실제 사용된 코딩 툴이 파악될 수 있으므로, 부호화 및 복호화가 더욱 적응적으로 구현될 수 있다.
도 1은 본 개시의 기술들을 구현할 수 있는 영상 부호화 장치에 대한 예시적인 블록도이다.
도 2는 QTBTTT 구조를 이용하여 블록을 분할하는 방법을 설명하기 위한 도면이다.
도 3은 복수의 인트라 예측 모드들을 설명하기 위한 도면이다.
도 4는 본 개시의 기술들을 구현할 수 있는 영상 복호화 장치의 예시적인 블록도이다.
도 5 내지 도 12는 코딩 툴들에 대한 사용 여부를 설정하는 본 발명의 다양한 실시예들을 설명하는 순서도이다.
도 13은 부호화 모드를 결정하는 종래 방법을 설명하기 위한 순서도이다.
도 14는 본 발명의 코딩 툴 설정 방법이 적용된 부호화 모드 결정 방법을 설명하기 위한 순서도이다.
도 15는 서브 프로파일을 지정하는 본 발명의 일 실시예를 설명하기 위한 순서도이다.
이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성 요소들에 식별 부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
도 1은 본 개시의 기술들을 구현할 수 있는 영상 부호화 장치에 대한 예시적인 블록도이다. 이하에서는 도 1을 참조하여 영상 부호화 장치와 이 장치의 하위 구성들에 대하여 설명하도록 한다.
영상 부호화 장치는 블록 분할부(110), 예측부(120), 감산기(130), 변환부(140), 양자화부(145), 부호화부(150), 역양자화부(160), 역변환부(165), 가산기(170), 필터부(180) 및 메모리(190)를 포함하여 구성될 수 있다.
영상 부호화 장치의 각 구성요소는 하드웨어 또는 소프트웨어로 구현되거나, 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 각 구성요소의 기능이 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.
하나의 영상(비디오)는 복수의 픽처들로 구성된다. 각 픽처들은 복수의 영역으로 분할되고 각 영역마다 부호화가 수행된다. 예를 들어, 하나의 픽처는 하나 이상의 타일(Tile) 또는/및 슬라이스(Slice)로 분할된다. 여기서, 하나 이상의 타일을 타일 그룹(Tile Group)으로 정의할 수 있다. 각 타일 또는/슬라이스는 하나 이상의 CTU(Coding Tree Unit)로 분할된다. 그리고 각 CTU는 트리 구조에 의해 하나 이상의 CU(Coding Unit)들로 분할된다. 각 CU에 적용되는 정보들은 CU의 신택스로서 부호화되고, 하나의 CTU에 포함된 CU들에 공통적으로 적용되는 정보는 CTU의 신택스로서 부호화된다. 또한, 하나의 타일 내의 모든 블록들에 공통적으로 적용되는 정보는 타일의 신택스로서 부호화되거나 다수 개의 타일을 모아 놓은 타일 그룹의 신택스로서 부호화되며, 하나의 픽처들을 구성하는 모든 블록들에 적용되는 정보는 픽처 파라미터 셋(PPS, Picture Parameter Set) 혹은 픽처 헤더에 부호화된다. 나아가, 복수의 픽처가 공통으로 참조하는 정보들은 시퀀스 파라미터 셋(SPS, Sequence Parameter Set)에 부호화된다. 그리고, 하나 이상의 SPS가 공통으로 참조하는 정보들은 비디오 파라미터 셋(VPS, Video Parameter Set)에 부호화된다.
블록 분할부(110)는 CTU(Coding Tree Unit)의 크기를 결정한다. CTU의 크기에 대한 정보(CTU size)는 SPS 또는 PPS의 신택스로서 부호화되어 영상 복호화 장치로 전달된다.
블록 분할부(110)는 영상을 구성하는 각 픽처(picture)를 미리 결정된 크기를 가지는 복수의 CTU(Coding Tree Unit)들로 분할한 이후에, 트리 구조(tree structure)를 이용하여 CTU를 반복적으로(recursively) 분할한다. 트리 구조에서의 리프 노드(leaf node)가 부호화의 기본 단위인 CU(coding unit)가 된다.
트리 구조로는 상위 노드(혹은 부모 노드)가 동일한 크기의 네 개의 하위 노드(혹은 자식 노드)로 분할되는 쿼드트리(QuadTree, QT), 또는 상위 노드가 두 개의 하위 노드로 분할되는 바이너리트리(BinaryTree, BT), 또는 상위 노드가 1:2:1 비율로 세 개의 하위 노드로 분할되는 터너리트리(TernaryTree, TT), 또는 이러한 QT 구조, BT 구조 및 TT 구조 중 둘 이상을 혼용한 구조일 수 있다. 예컨대, QTBT(QuadTree plus BinaryTree) 구조가 사용될 수 있고, 또는 QTBTTT(QuadTree plus BinaryTree TernaryTree) 구조가 사용될 수 있다. 여기서, BTTT를 합쳐서 MTT(Multiple-Type Tree)라 칭할 수 있다.
도 2는 QTBTTT 분할 트리 구조를 보인다. 도 2에서 보는 바와 같이, CTU는 먼저 QT 구조로 분할될 수 있다. 쿼드트리 분할은 분할 블록(splitting block)의 크기가 QT에서 허용되는 리프 노드의 최소 블록 크기(MinQTSize)에 도달할 때까지 반복될 수 있다. QT 구조의 각 노드가 하위 레이어의 4개의 노드들로 분할되는지 여부를 지시하는 제1 플래그(QT_split_flag)는 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. QT의 리프 노드가 BT에서 허용되는 루트 노드의 최대 블록 크기(MaxBTSize)보다 크지 않은 경우, BT 구조 또는 TT 구조 중 어느 하나 이상으로 더 분할될 수 있다. BT 구조 및/또는 TT 구조에서는 복수의 분할 방향이 존재할 수 있다. 예컨대, 해당 노드의 블록이 가로로 분할되는 방향과 세로로 분할되는 방향 두 가지가 존재할 수 있다. 도 2와 같이, MTT 분할이 시작되면, 노드들이 분할되었는지 여부를 지시하는 제2 플래그(mtt_split_flag)와, 분할이 되었다면 추가적으로 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그 및/또는 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.
트리 구조의 다른 예로서, QTBTTT 구조를 사용하여 블록을 분할하는 경우, 먼저 분할 되었음을 나타내는 CU 분할 플래그(split_cu_flag) 및 분할 타입이 QT 분할인지를 지시하는 QT 분할 플래그(split_qt_flag) 정보가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. CU 분할 플래그(split_cu_flag) 값이 분할되지 않았음을 지시하지 않는 경우, 해당 노드의 블록이 분할 트리 구조에서의 리프 노드(leaf node)가 되어 부호화의 기본 단위인 CU(coding unit)가 된다. CU 분할 플래그(split_cu_flag) 값이 분할되었음을 지시하지 않는 경우, QT 분할 플래그(split_qt_flag) 값을 통해 분할 타입이 QT 혹은 MTT인지를 구분한다. 분할 타입이 QT인 경우에는 더 이상의 추가 정보가 없으며, 분할 타입이 MTT인 경우에는 추가적으로 MTT 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그(mtt_split_cu_vertical_flag) 및/또는 MTT 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그(mtt_split_cu_binary_flag)가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.
트리 구조의 다른 예시로서 QTBT가 사용되는 경우, 해당 노드의 블록을 동일 크기의 두 개 블록으로 가로로 분할하는 타입(즉, symmetric horizontal splitting)과 세로로 분할하는 타입(즉, symmetric vertical splitting) 두 가지가 존재할 수 있다. BT 구조의 각 노드가 하위 레이어의 블록으로 분할되는지 여부를 지시하는 분할 플래그(split_flag) 및 분할되는 타입을 지시하는 분할 타입 정보가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다. 한편, 해당 노드의 블록을 서로 비대칭 형태의 두 개의 블록으로 분할하는 타입이 추가로 더 존재할 수도 있다. 비대칭 형태에는 해당 노드의 블록을 1:3의 크기 비율을 가지는 두 개의 직사각형 블록으로 분할하는 형태가 포함될 수 있고, 혹은 해당 노드의 블록을 대각선 방향으로 분할하는 형태가 포함될 수도 있다.
CU는 CTU로부터의 QTBT 또는 QTBTTT 분할에 따라 다양한 크기를 가질 수 있다. 이하에서는, 부호화 또는 복호화하고자 하는 CU(즉, QTBTTT의 리프 노드)에 해당하는 블록을 '현재블록'이라 칭한다.
예측부(120)는 현재블록을 예측하여 예측블록을 생성한다. 예측부(120)는 인트라 예측부(122)와 인터 예측부(124)를 포함한다.
일반적으로, 픽처 내 현재블록들은 각각 예측적으로 코딩될 수 있다. 일반적으로 현재블록의 예측은 (현재블록을 포함하는 픽처로부터의 데이터를 사용하는) 인트라 예측 기술 또는 (현재블록을 포함하는 픽처 이전에 코딩된 픽처로부터의 데이터를 사용하는) 인터 예측 기술을 사용하여 수행될 수 있다. 인터 예측은 단방향 예측과 양방향 예측 모두를 포함한다.
인트라 예측부(122)는 현재블록이 포함된 현재 픽처 내에서 현재블록의 주변에 위치한 픽셀(참조 픽셀)들을 이용하여 현재블록 내의 픽셀들을 예측한다. 예측 방향에 따라 복수의 인트라 예측모드가 존재한다. 예컨대, 도 3에서 보는 바와 같이, 복수의 인트라 예측모드는 planar 모드와 DC 모드를 포함하는 비방향성 모드와 65개의 방향성 모드를 포함할 수 있다. 각 예측모드에 따라 사용할 주변 픽셀과 연산식이 다르게 정의된다.
인트라 예측부(122)는 현재블록을 부호화하는데 사용할 인트라 예측 모드를 결정할 수 있다. 일부 예들에서, 인트라 예측부(122)는 여러 인트라 예측 모드들을 사용하여 현재블록을 인코딩하고, 테스트된 모드들로부터 사용할 적절한 인트라 예측 모드를 선택할 수도 있다. 예를 들어, 인트라 예측부(122)는 여러 테스트된 인트라 예측 모드들에 대한 레이트 왜곡(rate-distortion) 분석을 사용하여 레이트 왜곡 값들을 계산하고, 테스트된 모드들 중 최선의 레이트 왜곡 특징들을 갖는 인트라 예측 모드를 선택할 수도 있다.
인트라 예측부(122)는 복수의 인트라 예측 모드 중에서 하나의 인트라 예측 모드를 선택하고, 선택된 인트라 예측 모드에 따라 결정되는 주변 픽셀(참조 픽셀)과 연산식을 사용하여 현재블록을 예측한다. 선택된 인트라 예측 모드에 대한 정보가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다.
인터 예측부(124)는 움직임 보상 과정을 통해 현재블록에 대한 예측블록을 생성한다. 현재 픽처보다 먼저 부호화 및 복호화된 참조픽처 내에서 현재블록과 가장 유사한 블록을 탐색하고, 그 탐색된 블록을 이용하여 현재블록에 대한 예측블록을 생성한다. 그리고, 현재 픽처 내의 현재블록과 참조픽처 내의 예측블록 간의 변위(displacement)에 해당하는 움직임벡터(motion vector)를 생성한다. 일반적으로, 움직임 추정은 루마(luma) 성분에 대해 수행되고, 루마 성분에 기초하여 계산된 모션 벡터는 루마 성분 및 크로마 성분 모두에 대해 사용된다. 현재블록을 예측하기 위해 사용된 참조픽처에 대한 정보 및 움직임벡터에 대한 정보를 포함하는 움직임 정보는 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다.
감산기(130)는 현재블록으로부터 인트라 예측부(122) 또는 인터 예측부(124)에 의해 생성된 예측블록을 감산하여 잔차블록을 생성한다.
변환부(140)는 공간 영역의 픽셀 값들을 가지는 잔차블록 내의 잔차 신호를 주파수 도메인의 변환 계수로 변환한다. 변환부(140)는 잔차블록의 전체 크기를 변환 단위로 사용하여 잔차블록 내의 잔차 신호들을 변환할 수 있으며, 또는 잔차블록을 변환 영역 및 비변환 영역인 두 개의 서브블록으로 구분하여, 변환 영역 서브블록만 변환 단위로 사용하여 잔차 신호들을 변환할 수 있다. 여기서, 변환 영역 서브블록은 가로축 (혹은 세로축) 기준 1:1의 크기 비율을 가지는 두 개의 직사각형 블록 중 하나일 수 있다. 이런 경우, 서브블록 만을 변환하였음을 지시하는 플래그(cu_sbt_flag), 방향성(vertical/horizontal) 정보(cu_sbt_horizontal_flag) 및/또는 위치 정보(cu_sbt_pos_flag)가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. 또한, 변환 영역 서브블록의 크기는 가로축 (혹은 세로축) 기준 1:3의 크기 비율을 가질 수 있으며, 이런 경우 해당 분할을 구분하는 플래그(cu_sbt_quad_flag)가 추가적으로 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.
양자화부(145)는 변환부(140)로부터 출력되는 변환 계수들을 양자화하고, 양자화된 변환 계수들을 부호화부(150)로 출력한다.
부호화부(150)는 양자화된 변환 계수들을 CABAC(Context-based Adaptive Binary Arithmetic Code) 등의 부호화 방식을 사용하여 부호화함으로써 비트스트림을 생성한다. 부호화부(150)는 블록 분할과 관련된 CTU size, CU 분할 플래그, QT 분할 플래그, MTT 분할 방향, MTT 분할 타입 등의 정보를 부호화하여, 영상 복호화 장치가 영상 부호화 장치와 동일하게 블록을 분할할 수 있도록 한다.
또한, 부호화부(150)는 현재블록이 인트라 예측에 의해 부호화되었는지 아니면 인터 예측에 의해 부호화되었는지 여부를 지시하는 예측 타입에 대한 정보를 부호화하고, 예측 타입에 따라 인트라 예측정보(즉, 인트라 예측 모드에 대한 정보) 또는 인터 예측정보(참조픽처 및 움직임벡터에 대한 정보)를 부호화한다.
역양자화부(160)는 양자화부(145)로부터 출력되는 양자화된 변환 계수들을 역양자화하여 변환 계수들을 생성한다. 역변환부(165)는 역양자화부(160)로부터 출력되는 변환 계수들을 주파수 도메인으로부터 공간 도메인으로 변환하여 잔차블록을 복원한다.
가산부(170)는 복원된 잔차블록과 예측부(120)에 의해 생성된 예측블록을 가산하여 현재블록을 복원한다. 복원된 현재블록 내의 픽셀들은 다음 순서의 블록을 인트라 예측할 때 참조 픽셀로서 사용된다.
필터부(180)는 블록 기반의 예측 및 변환/양자화로 인해 발생하는 블록킹 아티팩트(blocking artifacts), 링잉 아티팩트(ringing artifacts), 블러링 아티팩트(blurring artifacts) 등을 줄이기 위해 복원된 픽셀들에 대한 필터링을 수행한다. 필터부(180)는 디블록킹 필터(182)와 SAO(Sample Adaptive Offset) 필터(184)를 포함할 수 있다.
디블록킹 필터(180)는 블록 단위의 부호화/복호화로 인해 발생하는 블록킹 현상(blocking artifact)을 제거하기 위해 복원된 블록 간의 경계를 필터링하고, SAO 필터(184)는 디블록킹 필터링된 영상에 대해 추가적인 필터링을 수행한다. SAO 필터(184)는 손실 부호화(lossy coding)로 인해 발생하는 복원된 픽셀과 원본 픽셀 간의 차이를 보상하기 위해 사용되는 필터이다.
디블록킹 필터(182) 및 SAO 필터(184)를 통해 필터링된 복원블록은 메모리(190)에 저장된다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 부호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.
도 1에는 표현되지 않았으나, 영상 부호화 장치는 하나 이상의 신택스 요소를 이용하여 코딩 툴의 사용 또는 적용 여부를 프로파일 별로 설정하는 제어수단을 더 포함하여 구성될 수 있다. 이 제어수단은 도 1에 표현된 하위 구성들과 함께 동일한 물리적 구성(프로세서 등)에서 구현되거나, 도 1에 표현된 하위 구성들과는 다른 물리적 구성에서 구현될 수 있다. 제어수단에 대한 상세한 내용은 후술하도록 한다.
도 4는 본 개시의 기술들을 구현할 수 있는 영상 복호화 장치의 예시적인 블록도이다. 이하에서는 도 4를 참조하여 영상 복호화 장치와 이 장치의 하위 구성들에 대하여 설명하도록 한다.
영상 복호화 장치는 복호화부(410), 역양자화부(420), 역변환부(430), 예측부(440), 가산기(450), 필터부(460) 및 메모리(470)를 포함하여 구성될 수 있다.
도 1의 영상 부호화 장치와 마찬가지로, 영상 복호화 장치의 각 구성요소는 하드웨어 또는 소프트웨어로 구현되거나, 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 각 구성요소의 기능이 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.
복호화부(410)는 영상 부호화 장치로부터 수신한 비트스트림을 복호화하여 블록 분할과 관련된 정보를 추출함으로써 복호화하고자 하는 현재블록을 결정하고, 현재블록을 복원하기 위해 필요한 예측정보와 잔차신호에 대한 정보 등을 추출한다.
복호화부(410)는 SPS(Sequence Parameter Set) 또는 PPS(Picture Parameter Set)로부터 CTU size에 대한 정보를 추출하여 CTU의 크기를 결정하고, 픽처를 결정된 크기의 CTU로 분할한다. 그리고, CTU를 트리 구조의 최상위 레이어, 즉, 루트 노드로 결정하고, CTU에 대한 분할정보를 추출함으로써 트리 구조를 이용하여 CTU를 분할한다.
예컨대, QTBTTT 구조를 사용하여 CTU를 분할하는 경우, 먼저 QT의 분할과 관련된 제1 플래그(QT_split_flag)를 추출하여 각 노드를 하위 레이어의 네 개의 노드로 분할한다. 그리고, QT의 리프 노드에 해당하는 노드에 대해서는 MTT의 분할과 관련된 제2 플래그(MTT_split_flag) 및 분할 방향(vertical / horizontal) 및/또는 분할 타입(binary / ternary) 정보를 추출하여 해당 리프 노드를 MTT 구조로 분할한다. 이를 통해 QT의 리프 노드 이하의 각 노드들을 BT 또는 TT 구조로 반복적으로(recursively) 분할한다.
또 다른 예로서, QTBTTT 구조를 사용하여 CTU를 분할하는 경우, 먼저 CU의 분할 여부를 지시하는 CU 분할 플래그(split_cu_flag)를 추출하고, 해당 블록이 분할된 경우, QT 분할 플래그(split_qt_flag)를 추출한다. 분할 타입이 QT가 아니고 MTT인 경우, MTT 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그(mtt_split_cu_vertical_flag) 및/또는 MTT 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그(mtt_split_cu_binary_flag)를 추가적으로 추출한다. 분할 과정에서 각 노드는 0번 이상의 반복적인 QT 분할 후에 0번 이상의 반복적인 MTT 분할이 발생할 수 있다. 예컨대, CTU는 바로 MTT 분할이 발생하거나, 반대로 다수 번의 QT 분할만 발생할 수도 있다.
다른 예로서, QTBT 구조를 사용하여 CTU를 분할하는 경우, QT의 분할과 관련된 제1 플래그(QT_split_flag)를 추출하여 각 노드를 하위 레이어의 네 개의 노드로 분할한다. 그리고, QT의 리프 노드에 해당하는 노드에 대해서는 BT로 더 분할되는지 여부를 지시하는 분할 플래그(split_flag) 및 분할 방향 정보를 추출한다.
한편, 복호화부(410)는 트리 구조의 분할을 통해 복호화하고자 하는 현재블록을 결정하게 되면, 현재블록이 인트라 예측되었는지 아니면 인터 예측되었는지를 지시하는 예측 타입에 대한 정보를 추출한다. 예측 타입 정보가 인트라 예측을 지시하는 경우, 복호화부(410)는 현재블록의 인트라 예측정보(인트라 예측 모드)에 대한 신택스 요소를 추출한다. 예측 타입 정보가 인터 예측을 지시하는 경우, 복호화부(410)는 인터 예측정보에 대한 신택스 요소, 즉, 움직임벡터 및 그 움직임벡터가 참조하는 참조픽처를 나타내는 정보를 추출한다.
한편, 복호화부(410)는 잔차신호에 대한 정보로서 현재블록의 양자화된 변환계수들에 대한 정보를 추출한다.
역양자화부(420)는 양자화된 변환계수들을 역양자화하고, 역변환부(430)는 역양자화된 변환계수들을 주파수 도메인으로부터 공간 도메인으로 역변환하여 잔차신호들을 복원함으로써 현재블록에 대한 잔차블록을 생성한다.
또한, 역변환부(430)는 변환블록의 일부 영역(서브블록)만 역변환하는 경우, 변환블록의 서브블록만을 변환하였음을 지시하는 플래그(cu_sbt_flag), 서브블록의 방향성(vertical/horizontal) 정보(cu_sbt_horizontal_flag) 및/또는 서브블록의 위치 정보(cu_sbt_pos_flag)를 추출하여, 해당 서브블록의 변환계수들을 주파수 도메인으로부터 공간 도메인으로 역변환함으로써 잔차신호들을 복원하고, 역변환되지 않은 영역에 대해서는 잔차신호로 "0" 값을 채움으로써 현재블록에 대한 최종 잔차블록을 생성한다.
예측부(440)는 인트라 예측부(442) 및 인터 예측부(444)를 포함할 수 있다. 인트라 예측부(442)는 현재블록의 예측 타입이 인트라 예측일 때 활성화되고, 인터 예측부(444)는 현재블록의 예측 타입이 인터 예측일 때 활성화된다.
인트라 예측부(442)는 복호화부(410)로부터 추출된 인트라 예측 모드에 대한 신택스 요소로부터 복수의 인트라 예측 모드 중 현재블록의 인트라 예측 모드를 결정하고, 인트라 예측 모드에 따라 현재블록 주변의 참조 픽셀들을 이용하여 현재블록을 예측한다.
인터 예측부(444)는 복호화부(410)로부터 추출된 인트라 예측 모드에 대한 신택스 요소를 이용하여 현재블록의 움직임벡터와 그 움직임벡터가 참조하는 참조픽처를 결정하고, 움직임벡터와 참조픽처를 이용하여 현재블록을 예측한다.
가산기(450)는 역변환부로부터 출력되는 잔차블록과 인터 예측부 또는 인트라 예측부로부터 출력되는 예측블록을 가산하여 현재블록을 복원한다. 복원된 현재블록 내의 픽셀들은 이후에 복호화할 블록을 인트라 예측할 때의 참조픽셀로서 활용된다.
필터부(460)는 디블록킹 필터(462) 및 SAO 필터(464)를 포함할 수 있다. 디블록킹 필터(462)는 블록 단위의 복호화로 인해 발생하는 블록킹 현상(blocking artifact)를 제거하기 위해, 복원된 블록 간의 경계를 디블록킹 필터링한다. SAO 필터(464)는 손실 부호화(lossy coding)으로 인해 발생하는 복원된 픽셀과 원본 픽셀 간의 차이를 보상하기 위해, 디블록킹 필터링 이후의 복원된 블록에 대해 추가적인 필터링을 수행한다. 디블록킹 필터(462) 및 SAO 필터(464)를 통해 필터링된 복원블록은 메모리(470)에 저장된다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 부호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.
도 4에는 표현되지 않았으나, 영상 복호화 장치는 하나 이상의 신택스 요소를 이용하여 코딩 툴의 사용 여부를 프로파일 별로 설정하는 제어수단을 더 포함하여 구성될 수 있다. 이 제어수단은 도 4에 표현된 하위 구성들과 함께 동일한 물리적 구성(프로세서 등)에서 구현되거나, 도 4에 표현된 하위 구성들과는 다른 물리적 구성에서 구현될 수 있다. 제어수단에 대한 상세한 내용은 후술하도록 한다.
한편, 영상 복호화 장치에 포함되는 제어수단은 영상 부호화 장치에 포함되는 전술된 제어수단과 그 기능 측면에서 대응되는 구성에 해당한다. 이하에서는, 영상 복호화 장치에 포함되는 제어수단과 영상 부호화 장치에 포함되는 제어수단을 용이하게 구별하기 위하여, 영상 복호화 장치에 포함되는 제어수단을 복호화 제어수단으로 지칭하며, 영상 부호화 장치에 포함되는 제어수단을 부호화 제어수단으로 지칭하도록 한다.
HEVC 등과 같은 종래 표준은 표준 기술이 적용되는 분야(application), 영상 복호화 장치(복호화기)의 성능 등을 고려하여 프로파일(profile), 레벨(level), 티어(tier) 등과 같은 개념을 사용한다.
프로파일이란 비디오 표준에서 제공되는 다수 개의 코딩 툴(coding tool)들 중 특정 애플리케이션(service)을 위한 특정 코딩 툴들만으로 구성된 세트를 의미한다. HEVC에는 'Main profile', 'Main10 profile', 'Main still picture profile', 'Format range extensions profiles', 'High throughput profiles', 'Screen content coding extensions profiles' 등의 프로파일들이 제정되어 있다. 여기서, 코딩 툴은 merge 기능, cross-component prediction 기능, adaptive motion vector resolution 기능, transform skip 기능, current picture referencing 기능, palette 기능 등과 같이 비디오 표준에서 제공되는 다양한 기능들을 의미할 수 있다.
레벨이란 프로파일이 동일하더라도 영상 복호화 장치의 특성에 따라 처리할 수 있는 성능의 차이가 발생하는 것을 고려하여 사용하는 개념으로서, 레벨 값에 따라 처리 가능한 영상의 최대 해상도와 프레임률이 결정될 수 있다.
티어란 최대 비트율에 대한 제약에 관한 것으로서, 동일 프로파일과 동일 레벨이라 할지라도 애플리케이션에 따라서 고해상도, 고화질로 영상을 압축하는 경우와 그렇지 않은 경우가 존재하기 때문에 사용하는 개념이다. 즉, 티어란 영상 복호화 장치의 메모리(470)와 관련된 규정이다.
HEVC의 레벨 및 티어를 정리하면 아래 표 1과 같다.
Figure PCTKR2019017444-appb-img-000001
HEVC에서는 프로파일, 레벨 및 티어를 지정하는 신택스 요소들이 SPS(sequence parameter set)에 위치한다. SPS에 위치하는 이 신택스 요소들을 표현하면 아래 표 2 및 표 3과 같다.
Figure PCTKR2019017444-appb-img-000002
Figure PCTKR2019017444-appb-img-000003
또한, HEVC에서는 프로파일, 레벨 및 티어를 지정하는 신택스 요소들이 VPS (video parameter set)에도 위치한다. VPS에 위치하는 신택스 요소들을 표현하면 아래 표 4와 같다.
Figure PCTKR2019017444-appb-img-000004
VPS란 스케일러블 코딩(scalable coding)을 위해 하나의 컨텐츠를 다수의 레이어(multiple layer)로 부호화하는 경우에 사용되는 헤더 정보이다. 이 경우, 베이스 레이어(base layer)에 대한 프로파일 정보와 서브 레이어(sub layer)에 대한 프로파일 정보는 따로(별도로) 설정될 수 있다.
HEVC 표준에서는 하나의 시퀀스에 하나의 프로파일 값을 지정할 수 있다. 다만, 프로파일 별로 호환 가능성(compatibility)을 제공하기 위해, 해당 시퀀스가 미리 지정된 프로파일 이외에 다른 프로파일에서도 호환 가능함을 표시할 수 있으며, 호환 가능함은 general_profile_compatibility_flag[j] 신택스 요소를 이용하여 표시될 수 있다.
예를 들어, 하나의 시퀀스에 main profile이 지정되면 general_profile_idc에 “1”이 설정되고, general_profile_compatibility_flag[1] 에도 “1”이 설정된다. 이와 같은 상태에서, 해당 시퀀스가 다른 프로파일에 호환 가능한지 여부에 따라, index=1 이외의 j 값에 해당하는 general_profile_compatibility_flag[j] 신택스 요소에 “0” 또는 “1” 값이 설정될 수 있다. 일 예로, 해당 시퀀스가 main 10 profile(index=2)에 호환되는 경우, general_profile_compatibility_flag[2]에 “1” 값이 설정되어 호환 가능함이 표시될 수 있다.
이와 같이, 종래 표준에서는 호환 가능성 여부를 표시함으로써 특정 시퀀스에 지정 또는 적용될 수 있는 프로파일이 하나 이상 표시될 수 있다. 그러나, 종래 표준에서는 지정된 프로파일에 포함되어 있는 다수 개의 코딩 툴 중에서 해당 시퀀스에 실제로 사용된 코딩 툴에 대한 정보를 표시할 수는 없다.
본 명세서에서는 다수 개의 코딩 툴 중에서 해당 시퀀스에 실제로 사용된 코딩 툴에 대한 정보를 프로파일 별로 구분하여 표시할 수 있는 다양한 실시예들이 제안된다.
부호화 제어수단은 지정 가능한 하나 이상의 프로파일(이하 '모든 프로파일'이라 지칭한다) 중 특정 시퀀스에 적용될 프로파일을 신택스 요소를 이용하여 지정 또는 표시할 수 있다. 프로파일을 지정하는 신택스 요소는 프로파일 신택스 요소(general_profile_idc, 이하 간략하게 profile_idc로 표기함)로 지칭될 수 있으며, 이 프로파일 신택스 요소가 지시하는 프로파일(적용될 프로파일)은 대상 프로파일로 지칭될 수 있다.
부호화 제어수단은 지정된 프로파일(대상 프로파일)에 포함되어 있는 하나 이상의 코딩 툴 중 해당 시퀀스에 적용 또는 사용된 코딩 툴을 신택스 요소를 이용하여 지정 또는 표시할 수 있다. 코딩 툴을 지정하는 신택스 요소는 코딩 툴 신택스 요소로 지칭될 수 있으며, 대상 프로파일에 포함된 코딩 툴은 대상 코딩 툴로 지칭될 수 있다.
코딩 툴 신택스 요소는 대상 프로파일에 포함된 코딩 툴(대상 코딩 툴)에 대한 적용 여부를 지시하거나, 그 범위를 확장하여 대상 코딩 툴을 포함하는 전체 코딩 툴(이하 '모든 코딩 툴'이라 지칭한다)에 대한 적용 여부를 지시할 수도 있다. 여기서, 모든 코딩 툴이란 모든 프로파일에 포함될 수 있는 전체 코딩 툴들을 의미할 수 있으며, 적용 여부란 해당 코딩 툴의 제한 여부, 사용 여부, 비활성 여부, on/off 여부 등을 의미할 수 있다.
영상 부호화 장치는 프로파일 신택스 요소와 코딩 툴 신택스 요소를 비트스트림에 포함시켜 영상 복호화 장치로 시그널링할 수 있다. 프로파일 신택스 요소와 코딩 툴 신택스 요소는 picture-level header, sequence-level header 또는 그 상위 header(예: decoder-level header, decoding parameter set(DPS)) 중 하나 이상에 위치하여 시그널링될 수 있다. 또한, 프로파일 신택스 요소와 코딩 툴 신택스 요소는 스케일러블 코딩(scalable coding)을 위해 VPS에 위치하여 시그널링될 수도 있다.
복호화부(410)는 프로파일 신택스 요소를 비트스트림으로부터 복호화하고(S510), 코딩 툴 신택스 요소를 비트스트림으로부터 복호화할 수 있다(S520).
복호화 제어수단은 복호화된 코딩 툴 신택스 요소를 기초로, 모든 코딩 툴들 중 대상 프로파일에 포함된 대상 코딩 툴에 대한 사용 여부를 설정할 수 있다(S530). 여기서, 코딩 툴의 사용 여부는 해당 코딩 툴의 on/off를 의미할 수 있으며, 코딩 툴의 사용 여부 설정은 해당 코딩 툴을 on/off시키는 것을 의미할 수 있다.
프로파일 신택스 요소가 지시하는 프로파일을 대상 프로파일로 지정함으로써 모든 코딩 툴 중 대상 코딩 툴이 특정될 수 있다. 코딩 툴 신택스 요소가 적용되지 않음을 지시하는 대상 코딩 툴을 off로 설정하며, 코딩 툴 신택스 요소가 적용됨을 지시하는 대상 코딩 툴을 on으로 설정함으로써, 대상 코딩 툴에 대한 on/off가 설정될 수 있다.
이하에서는, 본 발명에서 제안하는 다양한 실시예들에 대해 구체적으로 설명하도록 한다.
구체적인 실시예들에 대해 설명하기에 앞서, 본 명세서에서는 총 4개의 프로파일들(Profile-A, Profile-B, Profile-C, Profile-D)을 가정한다. 또한, 본 명세서에서는 Profile-A에 총 3개의 코딩 툴들(tool-a, tool-b, tool-c)이 포함되며, Profile-B에 총 5개의 코딩 툴들(tool-a, tool-c, tool-d, tool-e, tool-g)이 포함되고, Profile-C에 총 3개의 코딩 툴들(tool-b, tool-d, tool-f)이 포함되며, Profile-D에 총 4개의 코딩 툴들(tool-b, tool-c, tool-f, tool-g)이 포함되는 것으로 가정한다. 이를 정리하면 아래 표 5와 같다.
Figure PCTKR2019017444-appb-img-000005
표 5에서, “-“은 해당 배열에 정보가 존재하지 않음 또는 정보가 시그널링되지 않음을 의미할 수 있다. max는 설정 가능한 전체 코딩 툴의 개수(모든 코딩 툴의 개수)를 의미할 수 있다. “-“의 의미와 max의 의미는 본 명세서에서 공통적으로 적용된다. 표 5에 표현된 바와 같이, 특정 프로파일에 포함된 코딩 툴들은 순차적으로 배열될 수 있다. 따라서, j-번째 코딩 툴 신택스 요소는 j-번째에 배열된 코딩 툴의 적용 여부를 지시할 수 있다. 여기서, j는 0 이상의 정수에 해당할 수 있다.
실시예 1
실시예 1은 코딩 툴들에 대한 적용 여부를 두 개의 신택스 요소를 이용하여 표현하는 방법에 해당한다. 즉, 실시예 1에서, 코딩 툴 신택스 요소에는 서로 다른 두 개의 신택스 요소들이 포함될 수 있다.
이 두 개의 신택스 요소들 중 하나는 코딩 툴에 대한 제한(constraint) 여부를 지시하는 제한 신택스 요소이며, 나머지 하나는 코딩 툴에 대한 사용(enabled) 여부를 지시하는 사용 신택스 요소이다. 제한 신택스 요소와 사용 신택스 요소는 picture-level header, sequence-level header, decoder-level header 또는 그 상위 header 중 서로 다른 하나 이상의 위치에서 정의될 수 있다.
제한 신택스 요소는 하나 이상의 코딩 툴들 또는 모든 코딩 툴들에 대한 제한 여부를 지시할 수 있다. 사용 신택스 요소는 하나 이상의 코딩 툴들 또는 모든 코딩 툴들에 대한 사용 여부를 지시하거나, 제한 신택스 요소가 제한되지 않음을 지시한(제한 신택스 요소에 의해 제한되지 않은) 코딩 툴들에 한해 그 사용 여부를 지시할 수도 있다. 실시예 1은 제한 신택스 요소와 사용 신택스 요소가 지시하는 코딩 툴들의 범위에 따라 아래와 같은 구체적인 실시예들로 구분될 수 있다.
실시예 1-1
실시예 1-1에서, 제한 신택스 요소는 모든 코딩 툴들에 대해 설정되며, 사용 신택스 요소는 제한 신택스 요소에 의해 제한되지 않은 코딩 툴들에 대해 설정될 수 있다.
영상 부호화 장치는 프로파일 신택스 요소를 이용하여 대상 프로파일을 지정하고, 제한 신택스 요소를 이용하여 모든 코딩 툴들의 제한 여부를 나타낼 수 있다. 또한, 영상 부호화 장치는 사용 신택스 요소를 이용하여, 모든 코딩 툴들 중에서 제한되지 않은 코딩 툴들의 사용 여부를 나타낼 수 있다.
본 실시예의 신택스 구조가 아래 표 6에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000006
표 6에 표현된 바와 같이, 제한 신택스 요소와 사용 신택스 요소는 picture-level header, sequence-level header, decoder-level header 또는 그 상위 header 중 하나 이상의 동일한 위치에서 시그널링될 수 있다. 실시형태에 따라, 두 신택스 요소들은 서로 다른 위치에서 시그널링될 수 있으며, 이에 대한 신택스 구조가 아래 표 7 및 표 8에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000007
Figure PCTKR2019017444-appb-img-000008
표 6 내지 표 8에서, profile_idc는 프로파일 신택스 요소를 나타내며, coding_tool_constraint_flag[j]는 j-번째 코딩 툴에 대한 제한 신택스 요소를 나타내고, coding_tool_enabled_flag[j]는 j-번째 코딩 툴에 대한 사용 신택스 요소를 나타낸다. 실시형태에 따라, 제한 신택스 요소와 사용 신택스 요소는 [j] 배열을 사용하지 않고, 모든 코딩 툴들 각각에 대한 플래그 값으로 정의될 수도 있다. 예를 들어, A 코딩 툴에 대해 A_constraint_flag 및 A_enabled_flag가 정의되며, B 코딩 툴에 대해 B_constraint_flag 및 B_enabled_flag가 정의될 수 있다.
표 6 내지 표 8에 표현된 바와 같이, 영상 부호화 장치는 해당 시퀀스에 지정될 대상 프로파일을 profile_idc를 이용하여 표시하고, 코딩 툴들의 제한 여부를 max의 크기만큼(모든 코딩 툴에 대해) coding_tool_constraint_flag[j]를 이용하여 나타내며, 제한되지 않은 코딩 툴들에 대한 사용 여부를 coding_tool_enabled_flag[j]를 이용하여 나타낼 수 있다.
표 5의 가정에 실시예 1-1의 방법을 적용한 예가 아래 표 9에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000009
표 9에서, coding_tool_constraint_flag[j]=0은 해당(j-번째) 코딩 툴이 제한되지 않음을 나타내며, coding_tool_constraint_flag[j]=1은 해당 코딩 툴이 제한됨을 나타낸다. coding_tool_enabled_flag[j]=0은 해당 코딩 툴이 사용되지 않음을 나타내고, coding_tool_enabled_flag[j]=1은 해당 코딩 툴이 사용됨을 나타낸다.
표 9에 표현된 바와 같이, 제한 신택스 요소는 제한되는 코딩 툴에 대해서는 제한함을 나타내는 “1” 값으로 설정되며, 제한되지 않는 코딩 툴에 대해서는 제한하지 않음을 나타내는 “0” 값으로 설정된다. 또한, 제한 신택스 요소는 대상 프로파일에 포함되지 않은 코딩 툴들(대상 프로파일에 포함된 코딩 툴의 개수를 초과하는 위치의 배열들)에 대해서는 제한함을 나타내는 “1” 값으로 설정된다.
예를 들어, Profile-B의 경우, 제한 신택스 요소는 대상 코딩 툴 중에서 제한되지 않는 tool-a(index 0), tool-c(index 1) 및 tool-g(index 4)에 대해서는 “0” 값으로 설정되고, 제한되는 tool-d(index 2) 및 tool-e(index 3)에 대해서는 “1” 값으로 설정되며, 대상 코딩 툴에 해당하지 않는 코딩 툴들(index 5부터 max-1까지의 배열)에 대해서는 “1” 값으로 설정된다.
사용 신택스 요소는 제한되지 않은(coding_tool_constraint_flag[j]=0) 코딩 툴들 중, 사용된 코딩 툴에 대해서는 사용됨을 나타내는 “1” 값으로 설정되며, 사용되지 않은 코딩 툴에 대해서는 사용되지 않음을 나타내는 “0” 값으로 설정된다. 예를 들어, Profile-A의 경우, 사용된 코딩 툴인 index 0 및 index 1의 배열에 “1” 값이 설정되며, 사용되지 않은 코딩 툴인 index 2의 배열에 “0” 값이 설정된다. 사용 신택스 요소는 제한된(coding_tool_constraint_flag[j]=1) 코딩 툴에 대해서는 설정되지 않으므로, 해당 배열은 “-“로 표현될 수 있다.
영상 부호화 장치는 프로파일 신택스 요소와 코딩 툴 신택스 요소(제한 신택스 요소, 사용 신택스 요소)를 비트스트림에 포함시켜 영상 복호화 장치로 시그널링할 수 있다. 비트스트림에는 max개만큼의 제한 신택스 요소와 max개 이하의(제한되지 않은 코딩 툴의 개수만큼의) 사용 신택스 요소가 포함될 수 있다.
영상 복호화 장치는 프로파일 신택스 요소를 복호화할 수 있다(S610). 또한, 영상 복호화 장치는 모든 코딩 툴(max개)에 대한 제한 신택스 요소를 복호화할 수 있다(S620). 예를 들어, 영상 복호화 장치는 특정 번째(j-번째)의 제한 신택스 요소를 복호화하고, 제한 신택스 요소의 일부가 복호화되지 않은 경우에 다음 번째(j++)의 제한 신택스 요소를 복호화함으로써, 제한 신택스 요소를 max개만큼 복호화할 수 있다.
영상 복호화 장치는 제한 신택스 요소가 제한됨을 지시하지 않는 경우에 사용 신택스 요소를 복호화할 수 있다(S630). 예를 들어, 영상 복호화 장치는 j-번째 제한 신택스 요소가 제한됨을 지시하지 않는 경우에 j-번째 사용 신택스 요소를 복호화하고, j-번째 제한 신택스 요소가 제한됨을 지시하는 경우에 다음 번째(j++)의 제한 신택스 요소를 판단하는 방법을 통해, 사용 신택스 요소를 (max개 이하만큼) 복호화할 수 있다.
영상 복호화 장치는 제한/사용 신택스 요소를 기초로 대상 코딩 툴에 대한 on/off 여부를 설정할 수 있다(S640). 구체적으로, 영상 복호화 장치는 사용 신택스 요소가 사용됨을 지시하는 코딩 툴을 on으로 설정하고, 제한 신택스 요소가 제한됨을 지시하거나 사용 신택스 요소가 사용됨을 지시하지 않는(사용되지 않음을 지시하는) 코딩 툴을 off로 설정함으로써, 대상 코딩 툴의 on/off 여부를 설정할 수 있다.
실시예 1-2
실시예 1-2에서, 제한 신택스 요소는 하나 이상의 코딩 툴들에 대해 설정되며, 사용 신택스 요소 또한 하나 이상의 코딩 툴들에 대해 설정될 수 있다. 또한, 실시예 1-2에서는, 코딩 툴들에 대한 제한 신택스 요소가 먼저 정의된 후에, 코딩 툴들에 대한 사용 신택스 요소가 정의될 수 있다.
영상 부호화 장치는 프로파일 신택스 요소를 이용하여 대상 프로파일을 지정하고, 제한 신택스 요소를 이용하여 하나 이상의 코딩 툴들(최대 max개)에 대한 제한 여부를 설정할 수 있다. 영상 부호화 장치는 사용 신택스 요소를 이용하여 하나 이상의 코딩 툴들(최대 max개)에 대한 사용 여부를 설정할 수 있다. 즉, 사용 신택스 요소는 제한 신택스 요소에 의해 제한되는지 여부와 무관하게 모든 코딩 툴들에 대해 설정될 수 있다. 다만, 하나의 코딩 툴에 대한 제한 신택스 요소가 해당 코딩 툴의 사용을 제한하는 경우, 해당 코딩 툴에 대한 사용 신택스 요소는 사용됨을 지시하지 않는(사용되지 않음을 지시하는) 값으로 설정되어야 한다. 이와 반대로, 제한 신택스 요소가 해당 코딩 툴의 사용을 제한하지 않는 경우, 해당 코딩 툴에 대한 사용 신택스 요소는 어떠한 값으로도 설정될 수 있다.
본 실시예의 신택스 구조가 아래 표 10에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000010
표 10에 표현된 바와 같이, 제한 신택스 요소와 사용 신택스 요소는 picture-level header, sequence-level header, decoder-level header 또는 그 상위 header 중 하나 이상의 동일한 위치에서 시그널링될 수 있다. 또한, 두 신택스 요소들은 서로 다른 위치에서 시그널링될 수 있으며, 이에 대한 신택스 구조가 아래 표 11 및 표 12에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000011
Figure PCTKR2019017444-appb-img-000012
표 10 내지 표 12에서, profile_idc, coding_tool_constraint_flag[j] 및 coding_tool_enabled_flag[j]의 의미는 앞서 언급된 표 6 내지 표 8에서의 의미와 동일할 수 있다.
표 5의 가정에 실시예 1-2의 방법을 적용한 예가 아래 표 13에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000013
표 13에 표현된 바와 같이, 제한 신택스 요소는 제한되는 코딩 툴에 대해서는 제한함을 나타내는 “1” 값으로 설정되며, 제한되지 않는 코딩 툴에 대해서는 제한하지 않음을 나타내는 “0” 값으로 설정된다. 여기서, 제한 신택스 요소는 대상 프로파일에 포함되지 않은 코딩 툴들(대상 프로파일에 포함된 코딩 툴의 개수를 초과하는 위치의 배열들)에 대해서는 제한함을 나타내는 “1” 값으로 설정될 수 있다.
사용 신택스 요소는 모든 코딩 툴들 중, 사용된 코딩 툴에 대해서는 사용됨을 나타내는 “1” 값으로 설정되며, 사용되지 않은 코딩 툴에 대해서는 사용되지 않음을 나타내는 “0” 값으로 설정된다. 여기서, 사용 신택스 요소는 제한 신택스 요소에 의해 제한된 코딩 툴에 대해서 “0” 값으로 설정되어야 한다.
예를 들어, Profile-B의 경우, 사용 신택스 요소는 대상 코딩 툴 중에서 제한되지 않은 tool-a(index 0), tool-c(index 1) 및 tool-g(index 4)에 대해서는 “1” 값으로 설정되고, 제한된 tool-d(index 2) 및 tool-e(index 3)에 대해서는 “0” 값으로 설정된다. 또한, 대상 코딩 툴에 해당하지 않는 코딩 툴들(index 5부터 max-1까지의 배열)은 제한 신택스 요소에 의해 제한되었으므로, 이들에 대해서는 “0” 값으로 설정된다.
영상 부호화 장치는 프로파일 신택스 요소와 코딩 툴 신택스 요소(제한 신택스 요소, 사용 신택스 요소)를 비트스트림에 포함시켜 영상 복호화 장치로 시그널링할 수 있다. 비트스트림에는 최대 max개만큼의 제한 신택스 요소와 최대 max개만큼의 사용 신택스 요소가 포함될 수 있다.
영상 복호화 장치는 프로파일 신택스 요소를 복호화할 수 있다(S710). 또한, 영상 복호화 장치는 제한 신택스 요소를 코딩 툴의 개수(최대 max개)만큼 복호화할 수 있다(S720). 나아가, 영상 복호화 장치는 제한 신택스 요소가 제한됨을 지시하는지 여부와 무관하게 사용 신택스 요소를 코딩 툴의 개수(최대 max개)만큼 복호화할 수 있다(S730).
영상 복호화 장치는 제한/사용 신택스 요소를 기초로 대상 코딩 툴에 대한 on/off 여부를 설정할 수 있다(S740). 구체적으로, 영상 복호화 장치는 제한 신택스 요소가 제한됨을 지시하지 않으면서 사용 신택스 요소가 사용됨을 지시하는 코딩 툴을 on으로 설정하고, 제한 신택스 요소가 제한됨을 지시하거나 사용 신택스 요소가 사용됨을 지시하지 않는(사용되지 않음을 지시하는) 코딩 툴을 off로 설정함으로써, 대상 코딩 툴의 on/off 여부를 설정할 수 있다.
실시예 1-3
실시예 1-3은 제한 신택스 요소 및/또는 사용 신택스 요소를 모든 코딩 툴들에 대하여 설정하는 것이 아닌, 대상 프로파일에 포함된 대상 코딩 툴에 대해서만 설정하는 방법에 해당한다.
전술된 바와 같이, 코딩 툴들은 자신이 속한 프로파일에 순차적으로 배열되므로, max를 대상 코딩 툴의 개수와 동일한 개수로 재설정 또는 재지정하면 대상 코딩 툴에 대해서만 제한 여부 및/또는 사용 여부를 설정할 수 있다. max의 재정의는 아래 수학식 1을 통해 구현될 수 있다.
Figure PCTKR2019017444-appb-img-000014
MaxofCodingTools[profile_idc]는 i-번째 프로파일(profile_idc)에 포함된 코딩 툴(대상 코딩 툴)의 개수를 지시하는 배열이다. 여기서, i는 0 이상의 정수에 해당할 수 있다.
본 실시예의 신택스 구조가 아래 표 14에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000015
표 5의 가정에 실시예 1-3의 방법을 적용한 예가 아래 표 15에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000016
표 15에 표현된 바와 같이, 재설정된 max와 동일한 개수의 제한 신택스 요소를 이용하여 코딩 툴들의 제한 여부를 나타내면, 대상 프로파일에 포함된 대상 코딩 툴들만의 제한 여부를 표현할 수 있다. 또한, 재설정된 max와 동일한 개수의 사용 신택스 요소를 이용하여 코딩 툴들의 사용 여부를 나타내면, 대상 프로파일에 포함된 대상 코딩 툴들만의 사용 여부를 표현할 수 있다. 예를 들어, Profile-B의 경우, 5개의 코딩 툴들(tool-a, tool-c, tool-d, tool-e 및 tool-g)에 대해서만 제한 여부가 표현될 수 있으며, 이 5개의 코딩 툴들 중 제한되지 않은 코딩 툴들(tool-a, tool-c, 및 tool-g)에 대해서만 사용 여부가 표현될 수 있다.
이와 같은 실시형태의 경우, 영상 복호화 장치는 제한 신택스 요소를 재설정된 max와 동일한 개수(대상 코딩 툴과 동일한 개수)만큼 복호화할 수 있으며, 사용 신택스 요소를 제한되지 않은 코딩 툴들의 개수와 동일한 개수만큼 복호화할 수 있다. 또한, 영상 복호화 장치는 제한 신택스 요소 및 사용 신택스 요소를 기초로, 대상 프로파일에 포함된 대상 코딩 툴들의 on/off 여부를 설정할 수 있다.
표 15를 통해 설명된 실시예는 제한 신택스 요소에 의해 제한되지 않은 코딩 툴에 대해서만 사용 신택스 요소가 설정되는 예이다(실시예 1-1과의 결합). 전술된 바와 같이, 사용 신택스 요소는 제한 신택스 요소에 의해 제한되는지 여부와 무관하게 모든 코딩 툴에 대하여 설정될 수 있다(실시예 1-2과의 결합). 실시예 1-2와 결합된 일 예가 아래 표 16에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000017
표 16에 표현된 바와 같이, 사용 신택스 요소는 재설정된 max와 동일한 개수만큼 설정될 수 있으며, 제한 여부와 무관하게 대상 프로파일에 포함된 대상 코딩 툴들 모두에 대한 사용 여부를 나타낼 수 있다. 여기서, 사용 신택스 요소는 대상 프로파일에 포함된 코딩 툴들 중 제한 신택스 요소에 의해 사용이 제한된 코딩 툴에 대해서는 “0” 값으로 설정될 수 있다. 예를 들어, Profile-B의 경우, 5개의 코딩 툴들(tool-a, tool-c, tool-d, tool-e 및 tool-g)에 대해서만 제한 여부가 표현될 수 있으며, 이 5개의 코딩 툴들 중 제한된 코딩 툴들(tool-d 및 tool-e)에 대해서는 사용 신택스 요소가 “0” 값으로 설정될 수 있다.
이와 같은 실시예의 경우, 영상 복호화 장치는 제한 신택스 요소와 사용 신택스 요소를 재설정된 max와 동일한 개수(대상 코딩 툴과 동일한 개수)만큼 복호화할 수 있다. 또한, 영상 복호화 장치는 제한 신택스 요소 및 사용 신택스 요소를 기초로, 대상 프로파일에 포함된 대상 코딩 툴들의 on/off 여부를 설정할 수 있다.
실시예 2
실시예 2는 대상 코딩 툴들에 대한 적용 여부를 한 개의 신택스 요소를 이용하여 표현하는 방법에 해당한다. 이 한 개의 신택스 요소는 코딩 툴에 대한 비활성(disabled) 여부를 지시하는 비활성 신택스 요소이며, 비활성 여부는 제한 여부 또는 사용 여부를 의미할 수 있다. 비활성 신택스 요소는 코딩 툴 신택스 요소에 포함될 수 있으며, sequence-level header, decoder-level header 또는 그 상위 header 중 하나 이상의 위치에서 정의될 수 있다.
비활성 신택스 요소는 모든 코딩 툴들에 대해 비활성 여부를 지시하거나 대상 코딩 툴에 대해서만 비활성 여부를 지시할 수 있다. 실시예 2는 비활성 신택스 요소가 지시하는 코딩 툴들의 범위에 따라 다음과 같은 실시예들로 구분될 수 있다.
실시예 2-1
실시예 2-1은 비활성 신택스 요소를 이용하여 모든 코딩 툴들에 대한 비활성 여부를 표현하는 방법에 해당한다. 영상 부호화 장치는 프로파일 신택스 요소를 이용하여 대상 프로파일을 지정하고, 비활성 신택스 요소를 이용하여 모든 코딩 툴들(max개)의 비활성 여부를 나타낼 수 있다.
본 실시예의 신택스 구조가 아래 표 17에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000018
coding_tool_disabled_flag[j]는 비활성 신택스 요소를 나타낸다. coding_tool_disabled_flag[j]=1은 해당 코딩 툴(j-번째 코딩 툴)이 비활성됨(제한됨 또는 사용되지 않음)을 나타내며, coding_tool_disabled_flag[j]=0은 해당 코딩 툴이 활성됨(제한되지 않음 또는 사용됨)을 나타낼 수 있다.
표 5의 가정에 실시예 2-1의 방법을 적용한 예가 아래 표 18에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000019
표 18에 표현된 바와 같이, 영상 부호화 장치는 비활성 신택스 요소를 이용하여 모든 코딩 툴들에 대한 비활성 여부를 설정할 수 있다. 즉, 비활성 신택스 요소는 max개만큼 설정될 수 있다. 비활성 신택스 요소는 대상 코딩 툴 중 사용되지 않은 코딩 툴에 대해서 비활성을 나타내는 “1” 값으로 설정되며, 사용된 코딩 툴에 대해서 활성을 나타내는 “0” 값으로 설정될 수 있다. 또한, 비활성 신택스 요소는 대상 코딩 툴 이외의 코딩 툴(대상 프로파일에 포함된 코딩 툴의 개수를 초과하는 위치의 배열들)에 대해서 비활성을 나타내는 “1” 값으로 설정될 수 있다.
예를 들어, Profile-B의 경우, 비활성 신택스 요소는 5개의 대상 코딩 툴들 중 적용되지 않은 2개의 코딩 툴들(tool-d 및 tool-e)에 대해서 “1” 값으로 설정되며, 적용된 나머지 코딩 툴들(tool-a, tool-c 및 tool-g)들에 대해서 “0” 값으로 설정될 수 있다. 비활성 신택스 요소는 대상 코딩 툴을 제외한 코딩 툴들(index 5부터 (max-1)까지의 배열)에 대해서 “1” 값으로 설정될 수 있다.
영상 부호화 장치는 프로파일 신택스 요소와 코딩 툴 신택스 요소(비활성 신택스 요소)를 비트스트림에 포함시켜 영상 복호화 장치로 시그널링할 수 있다. 비트스트림에는 max개만큼의 비활성 신택스 요소가 포함될 수 있다.
영상 복호화 장치는 프로파일 신택스 요소를 복호화할 수 있다(S810). 또한, 영상 복호화 장치는 비활성 신택스 요소를 모든 코딩 툴의 개수(max개) 만큼 복호화할 수 있다(S820).
영상 복호화 장치는 복호화된 비활성 신택스 요소를 기초로 대상 코딩 툴에 대한 on/off 여부를 설정할 수 있다(S830). 구체적으로, 영상 복호화 장치는 비활성 신택스 요소가 비활성됨을 지시하지 않는 코딩 툴을 on으로 설정하고, 비활성 신택스 요소가 비활성됨을 지시하는 코딩 툴을 off로 설정함으로써, 대상 코딩 툴의 on/off 여부를 설정할 수 있다.
실시예 2-2
실시예 2-2는 비활성 신택스 요소를 모든 코딩 툴들에 대하여 표시하는 것이 아닌, 대상 프로파일에 포함된 대상 코딩 툴에 대해서만 표시하는 방법에 해당한다.
max를 대상 코딩 툴의 개수와 동일한 개수로 재설정 또는 재지정하면 대상 코딩 툴에 대해서만 비활성 여부를 설정할 수 있다. max의 재정의는 수학식 1을 통해 구현될 수 있다.
부호화 제어수단은 프로파일 신택스 요소를 이용하여 대상 프로파일을 지정하고, 이 대상 프로파일에 포함된 대상 코딩 툴들의 개수와 동일하게 max를 재설정할 수 있다. 부호화 제어 수단은 재설정된 max와 동일한 개수만큼 비활성 신택스 요소를 설정할 수 있다.
본 실시예의 신택스 구조가 아래 표 19에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000020
표 5의 가정에 실시예 2-2의 방법을 적용한 예가 아래 표 20에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000021
표 20에 표현된 바와 같이, 비활성 신택스 요소를 재설정된 max와 동일한 개수만큼 설정하면, 대상 코딩 툴들만의 비활성 여부를 표현할 수 있다. 예를 들어, Profile-B의 경우, 5개의 코딩 툴들(tool-a, tool-c, tool-d, tool-e 및 tool-g)에 대해서만 비활성 여부가 표현될 수 있다. 대상 코딩 툴에 포함되지 않는 코딩 툴들에 대해서는 비활성 신택스 요소가 설정되지 않는다.
이와 같은 실시예의 경우, 영상 복호화 장치는 비활성 신택스 요소를 재설정된 max와 동일한 개수(대상 코딩 툴과 동일한 개수)만큼 복호화할 수 있다. 또한, 영상 복호화 장치는 비활성 신택스 요소를 기초로, 대상 프로파일에 포함된 대상 코딩 툴들의 on/off 여부를 설정할 수 있다.
실시예 3
실시예 3은 프로파일에 포함되어 있는 코딩 툴들을 하나 이상의 서브세트로 구분하고, 이 서브세트들에 대한 제한 여부를 별도로 표현함으로써, 코딩 툴의 on/off 여부를 설정하는 방법에 해당한다.
서브세트 정의
서브세트는 코딩 툴들의 부분 집합 또는 코딩 툴들이 그룹화된 그룹으로 이해될 수 있다. 유사한 기능을 가지는 코딩 툴들이 동일한 서브세트에 포함될 수 있다. 서브세트는 지정 가능한 모든 프로파일(이하 '모든 프로파일'이라 지칭한다)에 하나 이상 포함될 수 있으며, 이 서브세트들 각각에는 하나 이상의 코딩 툴이 포함될 수 있다.
서브세트는 다양한 방법으로 정의 또는 구성될 수 있다. 예를 들어, 서브세트는 1) 프로파일과 무관하게 모든 코딩 툴들을 기준으로 정의되거나, 2) 프로파일에 포함된 코딩 툴들을 기준으로 정의될 수 있다.
서브세트 정의 1)과 관련하여, 모든 코딩 툴들을 기준으로 서브세트를 정의한 일 예가 아래 표 21에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000022
표 21에서, maxS는 결정 또는 지정될 수 있는 모든 서브세트들(이하 '모든 서브세트'라 지칭한다)의 개수를 나타내며, maxC는 각 서브세트들에 포함될 수 있는(설정될 수 있는) 모든 코딩 툴들의 최대 개수를 나타낸다.
표 5의 가정에 서브세트 정의 1)을 적용한 예가 아래 표 22에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000023
표 22에 표현된 바와 같이, Profile-A에는 두 개의 서브세트(Subset-α, Subset-β)가 포함되며, Subset-α에는 두 개의 코딩 툴(tool-a, tool-b)이 포함되고, Subset-β에는 한 개의 코딩 툴(tool-c)이 포함될 수 있다. 또한, Profile-B에는 세 개의 서브세트(Subset-α, Subset-β, Subset-γ)가 포함되며, Subset-α에는 한 개의 코딩 툴(tool-a)이 포함되고, Subset-β에는 두 개의 코딩 툴(tool-c, tool-d)이 포함되며, Subset-γ에는 두 개의 코딩 툴(tool-e, tool-g)이 포함될 수 있다.
한편, 서브세트 정의 2)는 프로파일에 포함된 코딩 툴들을 기준으로 서브세트를 정의하는 방법이다. 표 5의 가정에 서브세트 정의 2)를 적용한 예가 아래 표 23에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000024
표 23에 표현된 바와 같이, Profile-A에는 두 개의 서브세트(Subset-A1, Subset-A2)가 포함되며, Subset-A1에는 두 개의 코딩 툴(tool-a, tool-b)이 포함되고, Subset-A2에는 한 개의 코딩 툴(tool-c)이 포함될 수 있다. 또한, Profile-B에는 두 개의 서브세트(Subset-B1, Subset-B2)가 포함되며, Subset-B1에는 두 개의 코딩 툴(tool-a, tool-c)이 포함되고, Subset-B2에는 세 개의 코딩 툴(tool-d, tool-e, tool-g)이 포함될 수 있다. 이와 같이, 정의 2)에서의 서브세트는 자신이 소속된 프로파일에 포함되어 있는 코딩 툴들의 부분 집합으로 정의될 수 있다.
서브세트가 표 22 또는 표 23과 같이 정의된 상태에서, 영상 부호화 장치는 프로파일 신택스 요소를 이용하여 대상 프로파일을 지정하고, 서브세트 신택스 요소를 이용하여 서브세트들의 제한 여부를 결정 또는 설정할 수 있다. 여기서, 서브세트 신택스 요소는 모든 서브세트들에 대해(maxS개만큼) 설정될 수 있다. 이하에서는, 서브세트 신택스 요소에 의해 제한되지 않는 서브세트를 대상 서브세트라 지칭하도록 한다.
영상 부호화 장치는 코딩 툴 신택스 요소를 이용하여 코딩 툴들의 적용 여부를 설정할 수 있다. 코딩 툴 신택스 요소는 서브세트 신택스 요소에 의해 제한되지 않은 서브세트에 포함된 코딩 툴들의 적용 여부를 표시할 수 있으며, 제한되지 않은 서브세트에 포함된 코딩 툴들은 대상 코딩 툴에 해당할 수 있다.
영상 부호화 장치는 프로파일 신택스 요소, 서브세트 신택스 요소 및 코딩 툴 신택스 요소를 비트스트림에 포함시켜 영상 복호화 장치로 시그널링할 수 있다.
영상 복호화 장치는 프로파일 신택스 요소와 서브세트 신택스 요소를 비트스트림으로부터 복호화할 수 있다(S910, S920). 서브세트 신택스 요소는 masS개만큼 복호화될 수 있다. 또한, 영상 복호화 장치는 서브세트 신택스 요소가 제한됨을 지시하지 않는 경우에 코딩 툴 신택스 요소를 복호화할 수 있다(S930).
코딩 툴 신택스 요소에 대한 복호화가 완료되면, 영상 복호화 장치는 코딩 툴 신택스 요소에 기초하여, 코딩 툴들의 on/off 여부를 설정함으로써, 대상 코딩 툴의 on/off 여부를 설정할 수 있다(S940). 구체적으로, 영상 복호화 장치는 코딩 툴 신택스 요소가 적용됨을 지시하는 대상 코딩 툴을 on으로 설정하고, 코딩 툴 신택스 요소가 적용됨을 지시하지 않는 대상 코딩 툴을 off로 설정함으로써, 대상 코딩 툴들의 on/off 여부를 설정할 수 있다.
실시예 3은 서브세트 신택스 요소가 제한 여부를 지시하는 서브세트들의 범위, 코딩 툴 신택스 요소가 적용 여부를 지시하는 코딩 툴들의 범위에 따라 아래와 같은 구체적인 실시예들로 구분될 수 있다.
실시예 3-1
실시예 3-1은 서브세트 신택스 요소를 모든 서브세트들에 대해 설정하고, 서브세트가 제한되지 않는 경우에 제한 신택스 요소를 설정하며, 코딩 툴이 제한되지 않는 경우에 사용 신택스 요소를 설정하는 방법에 해당한다.
본 실시예의 신택스 구조에 대한 예를 나타내면 아래 표 24와 같다.
Figure PCTKR2019017444-appb-img-000025
프로파일 신택스 요소(profile_idc)에 의해 대상 프로파일이 지정되면, 영상 부호화 장치는 서브세트 신택스 요소(예: subset_constraint_flag[i])를 이용하여 모든 서브세트들(maxS개)에 대한 제한 여부를 설정함으로써 대상 프로파일에 포함된 대상 서브세트들에 대한 제한 여부를 표시할 수 있다.
영상 부호화 장치는 제한 신택스 요소와 사용 신택스 요소를 이용하여, 대상 코딩 툴들에 대한 제한 여부와 사용 여부를 설정할 수 있다. 여기서, 제한 신택스 요소는 서브세트가 서브세트 신택스 요소에 의해 제한되지 않는 경우에 설정되며, 모든 코딩 툴들에 대해 설정될 수 있다. 사용 신택스 요소는 제한 신택스 요소에 의해 제한되지 않는 코딩 툴에 대해 설정될 수 있다.
실시예 3-1의 방법은 서브세트 정의 1) 및 2) 모두에 적용될 수 있다. 실시예 3-1의 방법을 서브세트 정의 2)에 적용한 일 예가 아래 표 25에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000026
표 25에 표현된 바와 같이, 서브세트 신택스 요소는 제한되는 서브세트에 대해 “1” 값으로 설정되며(subset_constraint_flag[i]=1), 제한되지 않는 서브세트에 대해 “0' 값으로 설정될 수 있다(subset_constraint_flag[i]=0). 제한 신택스 요소는 제한되는 코딩 툴들에 대해 “1” 값으로 설정되며(coding_tool_constraint_flag[j]=1), 제한되지 않는 코딩 툴들에 대해 “0” 값으로 설정될 수 있다(coding_tool_constraint_flag[j]=0). 사용 신택스 요소는 사용되지 않는 코딩 툴들에 대해 “0” 값으로 설정되며(coding_tool_enabled_flag[j]=0), 사용되는 코딩 툴들에 대해 “1” 값으로 설정되고, 제한된 코딩 툴에 대해서는 설정되지 않는다.
예를 들어, Profile-B의 경우, 첫 번째 서브세트(Subset-β1)가 제한되므로(subset_constraint_flag[0]=1), 제한 신택스 요소 및 사용 신택스 요소가 설정되지 않는다. 두 번째 서브세트(Subset-β2)는 제한되지 않으므로(subset_constraint_flag[1]=0), 제한 신택스 요소 및 사용 신택스 요소가 설정될 수 있다. 제한 신택스 요소는 두 번째 서브세트(Subset-β2)에 포함된 코딩 툴들(tool-d, tool-e, tool-g) 중 tool-d 및 tool-g에 대해 제한되지 않음(coding_tool_constraint_flag[j]=0)으로 설정되며, tool-e에 대해 제한됨(coding_tool_constraint_flag[j]=1)으로 설정될 수 있다. 사용 신택스 요소는 제한되지 않은 tool-d 및 tool-g에 대해 사용됨(coding_tool_enabled_flag[j]=1)으로 설정될 수 있으며, 제한된 tool-e에 대해 설정되지 않는다.
표 25의 결과를 종합하여 설명하면, Profile-A의 경우에 3개의 코딩 툴들(tool-a, tool-b, tool-c) 중 tool-a 및 tool-c만이 사용되며, Profile-B의 경우에 5개의 코딩 툴들(tool-a, tool-c, tool-d, tool-e, tool-g) 중 tool-d 및 tool-g만이 사용되고, Profile-C의 경우에 3개의 코딩 툴들(tool-b, tool-d, tool-f) 중 tool-b 및 tool-d만이 사용되며, Profile-D의 경우에 4개의 코딩 툴들(tool-b, tool-c, tool-f, tool-g) 중 모두가 사용된다.
영상 부호화 장치는 프로파일 신택스 요소, 서브세트 신택스 요소 및 코딩 툴 신택스 요소(제한 신택스 요소, 사용 신택스 요소)를 비트스트림에 포함시켜 영상 복호화 장치로 시그널링할 수 있다. 비트스트림에는 maxS개만큼의 서브세트 신택스 요소, maxC개만큼의 제한 신택스 요소 및 maxC개 이하의 사용 신택스 요소가 포함될 수 있다.
영상 복호화 장치는 프로파일 신택스 요소를 복호화하고(S1010), maxS개의 서브세트 신택스 요소들 중 특정 번째(i-번째) 서브세트 신택스 요소를 복호화할 수 있다(S1020). i-번째 서브세트 신택스 요소가 제한됨을 지시하지 않는 경우, 영상 복호화 장치는 maxC개의 제한 신택스 요소 중 특정 번째(j-번째)의 제한 신택스 요소를 복호화할 수 있다(S1030). j-번째 제한 신택스 요소가 제한됨을 지시하지 않는 경우, 영상 복호화 장치는 j-번째 사용 신택스 요소를 복호화할 수 있다(S1040).
영상 복호화 장치는 j를 순차적으로 증가시키면서 S1030 과정과 S1040 과정을 반복적으로 수행하여 i-번째 서브세트에 대한 모든 제한 신택스 요소와 모든 사용 신택스 요소를 복호화할 수 있다. 또한, 영상 복호화 장치는 i를 순차적으로 증가시키면서 S1030 과정과 S1040 과정을 반복적으로 수행하여 모든 서브세트에 대한 모든 제한 신택스 요소와 모든 사용 신택스 요소를 복호화할 수 있다.
영상 복호화 장치는 제한/사용 신택스 요소를 기초로 대상 코딩 툴에 대한 on/off 여부를 설정할 수 있다(S1050).
실시예 3-2
앞서 설명된 실시예 3-1은 특정 번째(j-번째)의 코딩 툴에 대해 j-번째 제한 신택스 요소와 j-번째 사용 신택스 요소를 순차적으로 설정하는 방법에 해당한다. 이와 달리, 실시예 3-2는 제한 신택스 요소를 maxC개만큼 설정한 후에, 사용 신택스 요소를 설정하는 방법에 해당한다.
실시예 3-2의 신택스 구조에 대한 일 예를 나타내면 아래 표 26과 같다.
Figure PCTKR2019017444-appb-img-000027
프로파일 신택스 요소(profile_idc)에 의해 대상 프로파일이 지정되면, 영상 부호화 장치는 서브세트 신택스 요소(예: subset_constraint_flag[i])를 이용하여, 대상 서브세트들에 대한 제한 여부를 설정할 수 있다. 서브세트 신택스 요소는 모든 서브세트들(maxS)에 대해 설정될 수 있다.
영상 부호화 장치는 제한 신택스 요소와 사용 신택스 요소를 이용하여, 대상 코딩 툴들에 대한 제한 여부와 사용 여부를 설정할 수 있다. 여기서, 제한 신택스 요소는 서브세트가 서브세트 신택스 요소에 의해 제한되지 않는 경우에 설정되며, 모든 코딩 툴들(maxC개)에 대해 설정될 수 있다. 사용 신택스 요소는 제한 신택스 요소가 maxC개만큼 설정된 후에 설정되며, 제한 신택스 요소에 의해 제한되지 않은 코딩 툴들에 대해 설정될 수 있다.
실시예 3-2의 방법은 서브세트 정의 1) 및 2) 모두에 적용될 수 있다. 실시예 3-2의 방법을 서브세트 정의 2)에 적용한 일 예가 아래 표 27에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000028
표 27에 표현된 바와 같이, 서브세트 신택스 요소는 제한되는 서브세트에 대해 “1” 값으로 설정되며(subset_constraint_flag[i]=1), 제한되지 않는 서브세트에 대해 “0' 값으로 설정될 수 있다(subset_constraint_flag[i]=0). 제한 신택스 요소는 제한되는 코딩 툴들에 대해 “1” 값으로 설정되며(coding_tool_constraint_flag[j]=1), 제한되지 않는 코딩 툴들에 대해 “0” 값으로 설정될 수 있다(coding_tool_constraint_flag[j]=0). 표 27에는 표현되지 않았으나, 사용 신택스 요소는 사용되지 않은 코딩 툴들에 대해 “0” 값으로 설정되며(coding_tool_enabled_flag[j]=0), 사용되는 코딩 툴들에 대해 “1” 값으로 설정되고, 제한된 코딩 툴에 대해서는 설정되지 않는다.
예를 들어, Profile-B의 경우, 첫 번째 서브세트(Subset-α)가 제한되므로(subset_constraint_flag[0]=1), 제한 신택스 요소 및 사용 신택스 요소가 설정되지 않는다. 두 번째 서브세트(Subset-β)는 제한되지 않으므로(subset_constraint_flag[1]=0), 제한 신택스 요소 및 사용 신택스 요소가 설정될 수 있다. 세 번째 서브세트(Subset-γ)도 제한되지 않으므로, 제한 신택스 요소 및 사용 신택스 요소가 설정될 수 있다.
이와 같은 실시예의 경우, 비트스트림에는 maxS개만큼의 서브세트 신택스 요소가 포함될 수 있으며, maxC개만큼의 제한 신택스 요소가 포함될 수 있고, maxC개 이하의 사용 신택스 요소가 포함될 수 있다.
영상 복호화 장치는 프로파일 신택스 요소를 복호화하고(S1110), maxS개의 서브세트 신택스 요소들 중 특정 번째(i-번째) 서브세트 신택스 요소를 복호화할 수 있다(S1120). i-번째 서브세트 신택스 요소가 제한됨을 지시하지 않는 경우, 영상 복호화 장치는 제한 신택스 요소를 maxC개만큼 복호화할 수 있다(S1130). 영상 복호화 장치는 i를 순차적으로 증가시키면서 모든 서브세트에 대한 모든 제한 신택스 요소를 복호화할 수 있다.
영상 복호화 장치는 j-번째 제한 신택스 요소가 제한됨을 지시하지 않는 경우에 j-번째 사용 신택스 요소를 복호화할 수 있다(S1140). 영상 복호화 장치는 j를 순차적으로 증가시키면서 i-번째 서브세트에 대한 사용 신택스 요소 모두를 복호화할 수 있다. 또한, 영상 복호화 장치는 i를 순차적으로 증가시키면서 모든 서브세트에 대한 사용 신택스 요소 모두를 복호화할 수 있다.
영상 복호화 장치는 제한/사용 신택스 요소를 기초로 대상 코딩 툴에 대한 on/off 여부를 설정할 수 있다(S1150).
실시예 3-3
실시예 3-3은 서브세트 신택스 요소를 모든 서브세트들에 대해 설정하고, 서브세트가 제한되지 않는 경우에 제한 신택스 요소를 모든 코딩 툴에 대해 설정하며, 코딩 툴의 제한 여부와 무관하게 사용 신택스 요소를 모든 코딩 툴에 대해 설정하는 방법에 해당한다.
실시예 3-3의 신택스 구조에 대한 일 예를 나타내면 아래 표 28과 같다.
Figure PCTKR2019017444-appb-img-000029
표 28에 표현된 바와 같이, 영상 부호화 장치는 서브세트 신택스 요소(예: subset_constraint_flag[i])를 이용하여 서브세트의 제한 여부를 모든 서브세트들(maxS)에 대해 설정하고, 제한 신택스 요소를 이용하여 코딩 툴의 제한 여부를 모든 코딩 툴들(maxC)에 대해 설정할 수 있다. 또한, 영상 부호화 장치는 사용 신택스 요소를 이용하여 코딩 툴에 대한 사용 여부를 모든 코딩 툴들(maxC)에 대해 설정할 수 있다.
이와 같은 실시예의 경우, 비트스트림에는 maxS개만큼의 서브세트 신택스 요소가 포함될 수 있으며, 각각 maxC개만큼의 제한 신택스 요소와 사용 신택스 요소가 포함될 수 있다.
영상 복호화 장치는 프로파일 신택스 요소를 복호화하고(S1210), maxS개의 서브세트 신택스 요소들 중 특정 번째(i-번째) 서브세트 신택스 요소를 복호화할 수 있다(S1220). i-번째 서브세트 신택스 요소가 제한됨을 지시하지 않는 경우, 영상 복호화 장치는 제한 신택스 요소를 maxC개만큼 복호화하고(S1230), 사용 신택스 요소 maxC개만큼 복호화할 수 있다(S1240). 영상 복호화 장치는 i를 순차적으로 증가시키면서 모든 서브세트에 대한 모든 제한 신택스 요소 및 모든 사용 신택스 요소를 복호화할 수 있다.
영상 복호화 장치는 제한/사용 신택스 요소를 기초로 대상 코딩 툴에 대한 on/off 여부를 설정할 수 있다(S1250).
실시예 3-4
실시예 3-4는 코딩 툴에 대한 적용 여부를 하나의 신택스 요소(비활성 신택스 요소)를 이용하여 표시하는 방법에 해당한다.
본 실시예의 신택스 구조가 아래 표 29 및 표 30에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000030
Figure PCTKR2019017444-appb-img-000031
표 29 및 표 30에 표현된 바와 같이, 영상 부호화 장치는 프로파일 신택스 요소(예: profile_idc)를 이용하여 대상 프로파일을 지정하고, 서브세트 신택스 요소(예: subset_constraint_flag[i])를 이용하여 서브세트의 제한 여부를 모든 서브세트들(maxS개)에 대해 설정할 수 있으며, 서브세트가 제한되지 않은 경우에 비활성 신택스 요소(예: coding_tool_disabled_flag[j])를 이용하여 코딩 툴들의 비활성 여부를 모든 코딩 툴들(maxC개)에 대해 설정할 수 있다.
이와 같은 실시예의 경우, 영상 복호화 장치는 서브세트 신택스 요소를 maxS개(모든 서브세트와 동일한 개수)만큼 복호화할 수 있으며, 특정 서브세트가 제한되지 않는 경우에 비활성 신택스 요소를 maxC와 동일한 개수(모든 코딩 툴과 동일한 개수)만큼 복호화할 수 있다. 또한, 영상 복호화 장치는 비활성 신택스 요소를 기초로, 대상 프로파일에 포함된 대상 코딩 툴들의 on/off 여부를 설정할 수 있다.
실시예 3-5
실시예 3-5는 전술된 실시에 3-1 내지 3-4에서, 대상 서브세트에 한하여 서브세트 신택스 요소를 설정하거나 대상 코딩 툴에 한하여 코딩 툴 신택스 요소(제한/사용 신택스 요소 또는 비활성 신택스 요소)를 설정하는 방법에 해당한다.
대상 서브세트 또는 대상 코딩 툴에 대해서만 신택스 요소를 설정하기 위하여, 실시예 3-1 내지 3-4에서 사용된 maxS 또는 maxC가 재지정 또는 재설정되어야 하며, 재설정은 아래 수학식 2 및 수학식 3를 통해 구현될 수 있다.
Figure PCTKR2019017444-appb-img-000032
Figure PCTKR2019017444-appb-img-000033
MaxofSubSets[i]는 i-번째 프로파일에 포함된 서브세트들의 개수를 알려주는 배열이고, MaxofCodingTools[i]는 i-번째 서브세트에 포함된 코딩 툴들의 개수를 알려주는 배열이다.
부호화 제어수단은 프로파일 신택스 요소를 이용하여 대상 프로파일을 지정하고, 이 대상 프로파일에 포함된 서브세트들의 개수와 동일하게 maxS를 재설정할 수 있다. 부호화 제어 수단은 재설정된 maxC와 동일한 개수만큼 코딩 툴 신택스 요소를 설정할 수 있다. 따라서, 서브세트 신택스 요소는 대상 프로파일에 포함된 대상 서브세트에 대해서만 제한 여부를 표현할 수 있게 되며, 코딩 툴 신택스 요소는 대상 코딩 툴에 대해서만 적용 여부를 표현할 수 있게 된다.
이와 같은 실시예의 경우, 영상 복호화 장치는 서브세트 신택스 요소를 재설정된 maxS와 동일한 개수(대상 서브세트와 동일한 개수)만큼 복호화할 수 있으며, 코딩 툴 신택스 요소를 재설정된 maxC와 동일한 개수(대상 코딩 툴과 동일한 개수)만큼 복호화할 수 있다. 또한, 영상 복호화 장치는 코딩 툴 신택스 요소를 기초로, 대상 코딩 툴들의 on/off 여부를 설정할 수 있다.
실시예 4
실시예 4는 모든 프로파일로부터 대표되는 프로파일(이하 '대표 프로파일'이라 지칭한다)을 하나 이상 미리 정의하고, 신택스 요소들을 이용하여 대표 프로파일에 포함된 프로파일들 중 어느 하나를 지정하고, 지정된 프로파일에 포함되어 있는 서브 프로파일(sub-profile)을 지정하는 방법에 해당한다. 서브 프로파일은 제3의 기관(예: ITU-T)에서 정의하여 사용할 수도 있다.
서브 프로파일은 대표 프로파일에 포함된 코딩 툴들의 부분 집합에 해당할 수 있으며, 특정 목적의 코딩 툴들을 포함하는 그룹일 수 있다. 예를 들어, 서브 프로파일에는 royalty-free에 해당하는 코딩 툴들만이 포함될 수 있다. 대표 프로파일은 해당하는 시퀀스에 대한 디코딩 프로파일로 사용될 수 있으며, 서브 프로파일은 해당하는 시퀀스에서 실제 사용된 코딩 툴에 대한 정보로 사용될 수 있다.
표 5에서 정의한 프로파일들(profile-A, profile-B, profile-C, profile-D)을 대표 프로파일로 가정한 상태에서, 서브 프로파일에 대한 일 예를 나타내면 아래 표 31과 같다.
Figure PCTKR2019017444-appb-img-000034
표 31에 표현된 바와 같이, Profile-A에는 Profile-A.1이 서브 프로파일로 포함될 수 있으며, Profile-B에는 Profile-B.1 및 Profile-B.2가 서브 프로파일로 포함될 수 있고, Profile-C에는 Profile-C.1이 서브 프로파일로 포함될 수 있으며, Profile-D에는 Profile-D.1이 서브 프로파일로 포함될 수 있다.
본 실시예의 신택스 구조가 아래 표 32에 표현되어 있다.
Figure PCTKR2019017444-appb-img-000035
표 32에 표현된 바와 같이, 영상 부호화 장치는 프로파일 신택스 요소(예: profile_idc, 대표 프로파일 신택스 요소)를 이용하여 대표 프로파일 중 어느 하나를 지정 또는 정의할 수 있다. 또한, 영상 부호화 장치는 지정된 프로파일에 포함되어 있는 서브 프로파일들 중 하나 이상(실제 사용된 코딩 툴이 포함되어 있는 서브 프로파일)을 서브 프로파일 신택스 요소(예: sub-profile_idc 또는 general_sub_profile_idc)를 이용하여 지정 또는 정의할 수 있다. 서브 프로파일 신택스 요소에 의해 지정되는 서브 프로파일은 대상 프로파일에 해당할 수 있다.
서브 프로파일 신택스 요소는 다수 개일 수 있다. 즉, 서브 프로파일 신택스 요소에 의해 지시되는 서브 프로파일들이 다수 개일 수 있다. 이 경우, 서브 프로파일 신택스 요소들의 개수정보(예: num_sub_profiles)가 추가적으로 시그널링될 수 있다.
이와 같은 실시형태의 경우, 영상 복호화 장치는 대표 프로파일 신택스 요소를 비트스트림으로부터 복호화하고(S1510), 서브 프로파일 신택스 요소를 비트스트림으로부터 복호화할 수 있다(S1530). 프로파일 신택스 요소가 지시하는 대표 프로파일에 포함되어 있는 서브 프로파일들 중 서브 프로파일 신택스 요소가 지시하는 서브 프로파일이 대상 프로파일로 지정될 수 있다. 서브 프로파일 신택스 요소가 다수 개 시그널링되는 실시예의 경우, 영상 복호화 장치는 서브 프로파일 신택스 요소들의 개수정보를 먼저 복호화한 후에(S1520), 복호화된 개수정보가 지시하는 개수만큼 서브 프로파일 신택스 요소들을 복호화할 수 있다(S1530).
이상에서 설명된 다양한 실시예들을 통해 코딩 툴들의 on/off 여부가 결정되면, 아래 표 33 및 표 34와 같은 변수/플래그 설정 과정이 수행될 수 있다. 표 33은 프로파일 신택스 요소(profile_idc)와 사용 신택스 요소(coding_tool_enabled_flag[j])를 이용하여 변수/플래그를 설정하는 과정을 나타내며, 표 34는 프로파일 신택스 요소(profile_idc)와 비활성 신택스 요소(coding_tool_disabled_flag[j])를 이용하여 변수/플래그를 설정하는 과정을 나타낸다.
Figure PCTKR2019017444-appb-img-000036
Figure PCTKR2019017444-appb-img-000037
이와 같이, 본 발명은 다수 개의 코딩 툴 중에서 실제로 사용된 코딩 툴에 대한 정보를 표시할 수 있으므로, 영상 복호화 장치에서 특정 코딩 툴을 선택적으로 on/off할 수 있다.
일 예로, 영상 복호화 장치는 현재블록에 대한 부호화 모드 결정 과정에서 merge 모드에 대한 적용 여부를 지시하는 코딩 툴 신택스 요소(표 33 및 표 34의 merge_enabled_flag)에 기초하여 merge 기능을 on/off할 수 있다. 이 일 예를 비교 설명하는 도면이 도 13 및 도 14에 도시되어 있다.
도 13에 도시된 바와 같이, 종래 방법은 skip_flag를 파싱 및 복호화하는 과정(S1310), skip_flag가 지시하는 바에 따라 현재블록의 부호화 모드가 skip 모드인지 여부를 판단하는 과정(S1320), 현재블록의 부호화 모드가 skip 모드가 아닌 경우에 pred_mode_flag를 파싱 및 복호화하는 과정(S1340), pred_mode_flag가 지시하는 바에 따라 현재블록의 부호화 모드가 intra 모드인지 여부를 판단하는 과정(S1350), 현재블록의 부호화 모드가 intra 모드가 아닌 경우에 part_mode를 파싱 및 복호화하는 과정(S1360), merge_flag를 파싱 및 복호화하는 과정(S1370), merge_flag가 지시하는 바에 따라 현재블록의 부호화 모드가 merge 모드인지 여부를 판단하는 과정(S1380) 등을 통해 현재블록의 부호화 모드가 merge 모드인지 여부를 결정할 수 있다.
이와 달리, 본 발명은(도 14) merge 모드의 적용 여부를 지시하는 코딩 툴 신택스 요소를 이용하여, merge_flag를 파싱 및 복호화하는 과정(S1480) 이전에 merge 기능의 on/off 여부를 결정할 수 있다. merge 기능이 off인 경우, merge 모드가 제외된 상태에서 현재블록의 부호화 모드를 결정하는 과정들이 수행될 수 있다. 따라서, merge_flag를 파싱 및 복호화하는 과정(S1480), merge_flag가 지시하는 바를 판단하는 과정(S1490), merge_idx를 파싱 및 복호화하는 과정(S1492)이 제외될 수 있으므로, 현재블록의 부호화 모드를 결정하는 과정에 대한 복잡도가 감소될 수 있다.
이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
CROSS-REFERENCE TO RELATED APPLICATION
본 특허출원은, 본 명세서에 그 전체가 참고로서 포함되는, 2018년 12월 13일에 한국에 출원한 특허출원번호 제10-2018-0161254호 및, 2019년 11월 6일에 한국에 출원한 특허출원번호 제10-2019-0140653호에 대해 우선권을 주장한다.

Claims (14)

  1. 코딩 툴(coding tool)의 사용 여부를 설정하는 방법으로서,
    비트스트림으로부터, 지정 가능한 하나 이상의 프로파일 중 대상 프로파일을 지시하는 프로파일 신택스 요소(syntax element) 및, 설정 가능한 하나 이상의 코딩 툴에 대한 적용 여부를 지시하는 코딩 툴 신택스 요소를 복호화하는 단계; 및
    상기 코딩 툴 신택스 요소에 기초하여, 상기 대상 프로파일에 포함된 하나 이상의 대상 코딩 툴에 대한 on/off 여부를 설정하는 단계를 포함하는 것을 특징으로 하는 코딩 툴 설정 방법.
  2. 제1항에 있어서,
    상기 코딩 툴 신택스 요소는,
    상기 코딩 툴에 대한 제한(constraint) 여부를 지시하는 제한 신택스 요소 및 상기 코딩 툴에 대한 사용(enabled) 여부를 지시하는 사용 신택스 요소를 포함하고,
    상기 설정하는 단계는,
    상기 대상 코딩 툴 중, 상기 제한 신택스 요소가 제한됨을 지시하지 않으면서 상기 사용 신택스 요소가 사용됨을 지시하는 대상 코딩 툴을 on으로 설정하고, 상기 제한 신택스 요소가 제한됨을 지시하거나 상기 사용 신택스 요소가 사용됨을 지시하지 않는 대상 코딩 툴을 off로 설정하는 것을 특징으로 하는 코딩 툴 설정 방법.
  3. 제2항에 있어서,
    상기 사용 신택스 요소는,
    상기 제한 신택스 요소가 제한됨을 지시하면, 사용되지 않음을 지시하는 것을 특징으로 하는 코딩 툴 설정 방법.
  4. 제2항에 있어서,
    상기 제한 신택스 요소는,
    상기 대상 코딩 툴에 대한 제한 여부를 지시하며,
    상기 사용 신택스 요소는,
    상기 대상 코딩 툴에 대한 사용 여부를 지시하는 것을 특징으로 하는 코딩 툴 설정 방법.
  5. 제1항에 있어서,
    상기 프로파일 신택스 요소는,
    상기 지정 가능한 하나 이상의 프로파일 중 대표 프로파일을 지시하는 대표 프로파일 신택스 요소 및, 상기 대표 프로파일에 포함된 하나 이상의 서브(sub) 프로파일 중에서 어느 하나를 지시하는 하나 이상의 서브 프로파일 신택스 요소를 포함하며,
    상기 서브 프로파일 신택스 요소에 의해 지시된 서브 프로파일은,
    상기 대상 프로파일인 것을 특징으로 하는 코딩 툴 설정 방법.
  6. 제5항에 있어서,
    상기 프로파일 신택스 요소는,
    상기 서브 프로파일 신택스 요소의 개수를 지시하는 개수정보를 더 포함하고,
    상기 복호화하는 단계는,
    상기 개수정보가 지시하는 개수에 따라, 상기 서브 프로파일 신택스 요소를 복호화하는 것을 특징으로 하는 코딩 툴 설정 방법.
  7. 비트스트림으로부터, 지정 가능한 하나 이상의 프로파일 중 대상 프로파일을 지시하는 프로파일(profile) 신택스 요소(syntax element) 및, 설정 가능한 하나 이상의 코딩 툴(coding tool)에 대한 적용 여부를 지시하는 코딩 툴 신택스 요소를 복호화하는 복호화부; 및
    상기 코딩 툴 신택스 요소에 기초하여, 상기 대상 프로파일에 포함된 하나 이상의 대상 코딩 툴에 대한 on/off 여부를 설정하는 제어수단을 포함하는 것을 특징으로 하는 영상 복호화 장치.
  8. 제7항에 있어서,
    상기 코딩 툴 신택스 요소는,
    상기 코딩 툴에 대한 제한(constraint) 여부를 지시하는 제한 신택스 요소 및 상기 코딩 툴에 대한 사용(enabled) 여부를 지시하는 사용 신택스 요소를 포함하고,
    상기 제어수단은,
    상기 대상 코딩 툴 중, 상기 제한 신택스 요소가 제한됨을 지시하지 않으면서 상기 사용 신택스 요소가 사용됨을 지시하는 대상 코딩 툴을 on으로 설정하고, 상기 제한 신택스 요소가 제한됨을 지시하거나 상기 사용 신택스 요소가 사용됨을 지시하지 않는 대상 코딩 툴을 off로 설정하는 것을 특징으로 하는 영상 복호화 장치.
  9. 제8항에 있어서,
    상기 사용 신택스 요소는,
    상기 제한 신택스 요소가 제한됨을 지시하면, 사용되지 않음을 지시하는 것을 특징으로 하는 영상 복호화 장치.
  10. 제8항에 있어서,
    상기 제한 신택스 요소는,
    상기 대상 코딩 툴에 대한 제한 여부를 지시하며,
    상기 사용 신택스 요소는,
    상기 대상 코딩 툴에 대한 사용 여부를 지시하는 것을 특징으로 하는 영상 복호화 장치.
  11. 제7항에 있어서,
    상기 프로파일 신택스 요소는,
    상기 지정 가능한 하나 이상의 프로파일 중 대표 프로파일을 지시하는 대표 프로파일 신택스 요소 및, 상기 대표 프로파일에 포함된 하나 이상의 서브(sub) 프로파일 중에서 어느 하나를 지시하는 하나 이상의 서브 프로파일 신택스 요소를 포함하며,
    상기 서브 프로파일 신택스 요소에 의해 지시된 서브 프로파일은,
    상기 대상 프로파일인 것을 특징으로 하는 영상 복호화 장치.
  12. 제11항에 있어서,
    상기 프로파일 신택스 요소는,
    상기 서브 프로파일 신택스 요소의 개수를 지시하는 개수정보를 더 포함하고,
    상기 복호화부는,
    상기 개수정보가 지시하는 개수에 따라, 상기 서브 프로파일 신택스 요소를 복호화하는 것을 특징으로 하는 영상 복호화 장치.
  13. 지정 가능한 하나 이상의 프로파일 중 시퀀스에 적용될 대상 프로파일을 프로파일 신택스 요소(syntax element)를 이용하여 지정하고, 설정 가능한 하나 이상의 코딩 툴에 대한 적용 여부를 코딩 툴 신택스 요소를 이용하여 지정하는 단계; 및
    상기 프로파일 신택스 요소 및 상기 코딩 툴 신택스 요소를 부호화하여 시그널링하는 단계를 포함하고,
    상기 설정 가능한 코딩 툴은,
    상기 대상 프로파일에 포함된 하나 이상의 대상 코딩 툴을 포함하는 것을 특징으로 하는 코딩 툴 설정 방법.
  14. 지정 가능한 하나 이상의 프로파일 중 시퀀스에 적용될 대상 프로파일을 프로파일 신택스 요소(syntax element)를 이용하여 지정하고, 설정 가능한 하나 이상의 코딩 툴에 대한 적용 여부를 코딩 툴 신택스 요소를 이용하여 지정하는 제어수단; 및
    상기 프로파일 신택스 요소 및 상기 코딩 툴 신택스 요소를 부호화하여 시그널링하는 부호화부를 포함하고,
    상기 설정 가능한 코딩 툴은,
    상기 대상 프로파일에 포함된 하나 이상의 대상 코딩 툴을 포함하는 것을 특징으로 하는 영상 부호화 장치.
PCT/KR2019/017444 2018-12-13 2019-12-11 코딩 툴 설정 방법 및 영상 복호화 장치 WO2020122574A1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201980081961.0A CN113170204B (zh) 2018-12-13 2019-12-11 编码工具设置方法和图像解码设备
US17/345,052 US11616967B2 (en) 2018-12-13 2021-06-11 Coding tool setting method and video decoding apparatus
US18/106,688 US20230188741A1 (en) 2018-12-13 2023-02-07 Coding tool setting method and video decoding apparatus
US18/106,626 US11924453B2 (en) 2018-12-13 2023-02-07 Coding tool setting method and video decoding apparatus
US18/106,664 US11991381B2 (en) 2018-12-13 2023-02-07 Coding tool setting method and video decoding apparatus
US18/106,639 US11924454B2 (en) 2018-12-13 2023-02-07 Coding tool setting method and video decoding apparatus

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20180161254 2018-12-13
KR10-2018-0161254 2018-12-13
KR10-2019-0140653 2019-11-06
KR1020190140653A KR20200073117A (ko) 2018-12-13 2019-11-06 코딩 툴 설정 방법 및 영상 복호화 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US17/345,052 Continuation US11616967B2 (en) 2018-12-13 2021-06-11 Coding tool setting method and video decoding apparatus

Publications (1)

Publication Number Publication Date
WO2020122574A1 true WO2020122574A1 (ko) 2020-06-18

Family

ID=71077313

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/017444 WO2020122574A1 (ko) 2018-12-13 2019-12-11 코딩 툴 설정 방법 및 영상 복호화 장치

Country Status (2)

Country Link
US (5) US11616967B2 (ko)
WO (1) WO2020122574A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021251878A1 (en) * 2020-06-08 2021-12-16 Telefonaktiebolaget Lm Ericsson (Publ) Determining capability to decode a first picture in a video bitstream

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020064899A (ko) * 1999-11-12 2002-08-10 제너럴 인스트루먼트 코포레이션 코딩 툴의 주문형 세트를 제공하기 위한 엠펙-4 비디오특정 제어패킷
KR20150036599A (ko) * 2012-07-20 2015-04-07 퀄컴 인코포레이티드 비디오 코딩에서의 파라미터 세트들
KR20150065838A (ko) * 2012-10-04 2015-06-15 퀄컴 인코포레이티드 비디오 특성들의 표시
US20160219275A1 (en) * 2013-10-15 2016-07-28 Sony Corporation Image processing device and method
KR20160105518A (ko) * 2014-01-03 2016-09-06 노키아 테크놀로지스 오와이 파라미터 세트 코딩

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9451256B2 (en) 2012-07-20 2016-09-20 Qualcomm Incorporated Reusing parameter sets for video coding
ES2962871T3 (es) * 2018-09-18 2024-03-21 Nokia Technologies Oy Método y aparato para señalización de restricción de perfil no binario para codificación de video
US11165847B2 (en) * 2018-10-23 2021-11-02 Tencent America LLC Techniques for multiple conformance points in media coding
EP3881541A1 (en) * 2018-11-12 2021-09-22 InterDigital VC Holdings, Inc. Virtual pipeline for video encoding and decoding
JP2022510120A (ja) * 2018-12-07 2022-01-26 インターデジタル ヴイシー ホールディングス, インコーポレイテッド コード化ツールの組み合わせおよび制限の管理

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020064899A (ko) * 1999-11-12 2002-08-10 제너럴 인스트루먼트 코포레이션 코딩 툴의 주문형 세트를 제공하기 위한 엠펙-4 비디오특정 제어패킷
KR20150036599A (ko) * 2012-07-20 2015-04-07 퀄컴 인코포레이티드 비디오 코딩에서의 파라미터 세트들
KR20150065838A (ko) * 2012-10-04 2015-06-15 퀄컴 인코포레이티드 비디오 특성들의 표시
US20160219275A1 (en) * 2013-10-15 2016-07-28 Sony Corporation Image processing device and method
KR20160105518A (ko) * 2014-01-03 2016-09-06 노키아 테크놀로지스 오와이 파라미터 세트 코딩

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021251878A1 (en) * 2020-06-08 2021-12-16 Telefonaktiebolaget Lm Ericsson (Publ) Determining capability to decode a first picture in a video bitstream

Also Published As

Publication number Publication date
US20230188740A1 (en) 2023-06-15
US20220159283A1 (en) 2022-05-19
US11924454B2 (en) 2024-03-05
US20230179788A1 (en) 2023-06-08
US11616967B2 (en) 2023-03-28
US11924453B2 (en) 2024-03-05
US20230188741A1 (en) 2023-06-15
US11991381B2 (en) 2024-05-21
US20230199210A1 (en) 2023-06-22

Similar Documents

Publication Publication Date Title
WO2018128322A1 (ko) 영상 처리 방법 및 이를 위한 장치
WO2018030599A1 (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2014003423A4 (ko) 영상 부호화/복호화 방법 및 장치
WO2018062788A1 (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2018236028A1 (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2013157825A1 (ko) 영상 부호화/복호화 방법 및 장치
WO2018070713A1 (ko) 크로마 성분에 대한 인트라 예측 모드를 유도하는 방법 및 장치
WO2020213944A1 (ko) 영상 코딩에서 매트릭스 기반의 인트라 예측을 위한 변환
WO2014010943A1 (ko) 영상 부호화/복호화 방법 및 장치
WO2020213946A1 (ko) 변환 인덱스를 이용하는 영상 코딩
WO2019203610A1 (ko) 영상의 처리 방법 및 이를 위한 장치
WO2019235891A1 (ko) 비디오 신호 처리 방법 및 장치
WO2021071183A1 (ko) 현재블록의 변환계수들을 역변환하는 방법 및 장치
WO2020213945A1 (ko) 인트라 예측 기반 영상 코딩에서의 변환
WO2020116961A1 (ko) 이차 변환에 기반한 영상 코딩 방법 및 그 장치
WO2019235822A1 (ko) 어파인 움직임 예측을 이용하여 비디오 신호를 처리하는 방법 및 장치
WO2019164306A1 (ko) 영상 부호화 방법/장치, 영상 복호화 방법/장치 및 비트스트림을 저장한 기록 매체
WO2019190204A1 (ko) 비디오 신호 처리 방법 및 장치
WO2019194463A1 (ko) 영상의 처리 방법 및 이를 위한 장치
WO2021141226A1 (ko) 루마 성분 및 크로마 성분에 대한 bdpcm 기반 영상 디코딩 방법 및 그 장치
WO2018034374A1 (ko) 인트라 예측 필터링을 이용하여 비디오 신호를 인코딩, 디코딩하는 방법 및 장치
WO2020197274A1 (ko) 변환에 기반한 영상 코딩 방법 및 그 장치
WO2017030270A1 (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2020242182A1 (ko) 인트라 예측 모드를 유도하는 방법 및 장치
WO2021040319A1 (ko) 비디오/영상 코딩 시스템에서 라이스 파라미터 도출 방법 및 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19895732

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19895732

Country of ref document: EP

Kind code of ref document: A1