WO2019009503A1 - 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 - Google Patents
비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 Download PDFInfo
- Publication number
- WO2019009503A1 WO2019009503A1 PCT/KR2018/003761 KR2018003761W WO2019009503A1 WO 2019009503 A1 WO2019009503 A1 WO 2019009503A1 KR 2018003761 W KR2018003761 W KR 2018003761W WO 2019009503 A1 WO2019009503 A1 WO 2019009503A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- encoding unit
- encoding
- decoding apparatus
- unit
- information
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
- H04N19/45—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder performing compensation of the inverse transform mismatch, e.g. Inverse Discrete Cosine Transform [IDCT] mismatch
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Definitions
- the method and apparatus according to an exemplary embodiment may encode or decode an image using various types of encoding units included in an image.
- the present disclosure provides an encoding method, apparatus, decoding method, and apparatus for adaptively selecting a context model used for entropy encoding and decoding a syntax element based on various types of encoding units.
- a method of decoding an image comprising: determining a context model based on block type information including at least one of a ratio, a size, and a shape of a coding unit; Information about the split mode mode for. From the bitstream based on the context model, and determining a division mode mode of the coding unit based on the information on the division mode mode.
- a method of decoding an image comprising: obtaining an arrangement for mapping at least one of a ratio and a size of a shape, direction, width and height of the coding unit to an index for the context model; Obtaining an index for the context model based on at least one of a ratio, or a size, of a shape, direction, width, and height of an encoding unit; and determining the context model based on an index for the context model .
- the shape of the encoding unit indicates whether the encoding unit is a square or a rectangle, and the direction of the encoding unit indicates whether the encoding unit is a horizontal direction or a vertical direction,
- a ratio of a width to a height of the encoding unit includes at least one of 1: 1, 1: 2, 1: 4, 1: 8, 2: 1, 4: 1, and 8: 1, And the length or width of one side of the coding unit.
- the method of decoding an image includes determining a context model based on block type information including at least one of a ratio, a size, and a size, a shape, a direction, a width and a height of a neighboring encoding unit adjacent to an encoding unit
- the peripheral encoding unit includes at least one of a left, a right, an upper left, an upper right, an upper right, and a lower right encoding unit of the encoding unit.
- an image decoding method comprising the steps of: comparing a length of a width of an upper peripheral encoding unit with a length of a width of the encoding unit; a length of a left and right peripheral encoding units; And determining the context model based on the comparison results.
- the information on the division mode mode includes at least one of information indicating division, division direction information, and division type information, and information indicating division or division may be divided into And the division direction information indicates division into one of a horizontal direction and a vertical direction and the division type information indicates that the encoding unit is one of binary split, tri split or quad split And dividing.
- An apparatus for decoding an image includes at least one processor, and the at least one processor includes block type information including at least one of a shape, a direction, a width, Determining a context model based on the information about the partition mode and the information about the partition mode for dividing the coding unit from the bit stream based on the context model, And a step of determining a division type mode of the coding unit.
- a method of encoding an image comprising: determining information on a split mode based on a split mode of a coding unit; determining at least one of a shape, a direction, Determining a context model based on the block type information including the context model, and generating information on a partition mode for dividing the coding unit based on the context model into a bit stream.
- a method of encoding an image comprising the steps of: obtaining an array for mapping at least one of a ratio, a size, and a shape of a coding unit, Obtaining an index for the context model based on at least one of a ratio or size of a shape, a direction, a width and a height of the unit, and determining the context model based on an index for the context model .
- the shape of an encoding unit indicates whether the encoding unit is a square or a rectangle
- the direction of the encoding unit indicates whether the encoding unit is a horizontal direction or a vertical direction
- the ratio of the width to the height of the unit comprises at least one of 1: 1, 1: 2, 1: 4, 1: 8, 2: 1, 4: 1 and 8: 1, And the length or width of one side of the unit.
- the image encoding method determines a context model based on block type information including at least one of a ratio, a size, and a size, a shape, a direction, a width, and a height of a neighboring encoding unit adjacent to the encoding unit
- the peripheral encoding unit includes at least one of a left, a right, an upper left, an upper right, an upper right, and a lower right of the encoding unit.
- a method of encoding an image comprising the steps of: comparing a length of a width of an upper peripheral encoding unit and a length of a width of the encoding unit; a length of a left and right peripheral encoding unit; And determining the context model based on the comparison results.
- the information on the divisional mode includes at least one of information indicating divisional division, divisional directional information, and divisional type information, Wherein the division type information indicates that the division direction information is divided into one of a horizontal direction and a vertical direction and the division type information indicates whether the encoding unit is a binary split, ). ≪ / RTI >
- the image encoding apparatus includes at least one processor, and the at least one processor includes: determining information on a split mode mode based on a split mode mode of an encoding unit; Determining a context model based on block type information including at least one of a ratio and a size of a shape, a direction, a width, and a height of a block type, And a step of generating information as a bitstream.
- the computer program for the image decoding method according to an embodiment of the present disclosure can be recorded in a computer-readable recording medium.
- FIG. 1 shows a schematic block diagram of an image decoding apparatus 100 according to an embodiment.
- FIG. 2 illustrates a flow diagram of a video decoding method in accordance with one embodiment.
- FIG. 3 illustrates a process in which an image decoding apparatus determines at least one encoding unit by dividing a current encoding unit according to an embodiment.
- FIG. 4 illustrates a process in which an image decoding apparatus determines at least one encoding unit by dividing a non-square encoding unit according to an embodiment.
- FIG. 5 illustrates a process in which an image decoding apparatus divides an encoding unit based on at least one of information on a block type information and a format mode according to an embodiment.
- FIG. 6 illustrates a method for an image decoding apparatus to determine a predetermined encoding unit among odd number of encoding units according to an embodiment.
- FIG. 7 illustrates a sequence in which a plurality of coding units are processed when an image decoding apparatus determines a plurality of coding units by dividing a current coding unit according to an exemplary embodiment.
- FIG. 8 illustrates a process of determining that the current encoding unit is divided into odd number of encoding units when the image decoding apparatus can not process the encoding units in a predetermined order according to an embodiment.
- FIG. 9 illustrates a process in which an image decoding apparatus determines at least one encoding unit by dividing a first encoding unit according to an embodiment.
- FIG. 10 illustrates a case where the second encoding unit is limited in a case where the non-square type second encoding unit determined by dividing the first encoding unit by the image decoding apparatus satisfies a predetermined condition according to an embodiment Lt; / RTI >
- FIG. 11 illustrates a process in which an image decoding apparatus divides a square-shaped encoding unit when the information on the split mode mode can not be divided into four square-shaped encoding units according to an exemplary embodiment.
- FIG. 12 illustrates that the processing order among a plurality of coding units may be changed according to a division process of a coding unit according to an exemplary embodiment.
- FIG. 13 illustrates a process of determining the depth of an encoding unit according to a change in type and size of an encoding unit when a plurality of encoding units are determined by recursively dividing an encoding unit according to an embodiment.
- FIG. 14 illustrates a depth index (hereinafter referred to as a PID) for classifying a depth and a coding unit that can be determined according to the type and size of coding units according to an exemplary embodiment.
- a PID depth index
- FIG. 15 illustrates that a plurality of coding units are determined according to a plurality of predetermined data units included in a picture according to an embodiment.
- FIG. 16 shows a processing block serving as a reference for determining a determination order of a reference encoding unit included in a picture according to an embodiment.
- 17 is a diagram for explaining block type information according to an embodiment.
- 18 is a diagram for explaining block type information according to an embodiment.
- 19 is a diagram for explaining a process of determining a context model according to block type information according to an embodiment.
- 20 is a diagram for explaining a method of determining a context model according to an embodiment.
- 21 is a diagram for explaining a method of determining a context model according to an embodiment.
- FIG. 22 shows a schematic block diagram of an image encoding apparatus according to an embodiment.
- FIG. 23 shows a flowchart of an image encoding method according to an embodiment.
- 24 is a view for explaining a method of indicating division of a current encoding unit according to an embodiment.
- part used in the specification means software or hardware component, and " part " However, “ part " is not meant to be limited to software or hardware. &Quot; Part " may be configured to reside on an addressable storage medium and may be configured to play back one or more processors.
- part (s) refers to components such as software components, object oriented software components, class components and task components, and processes, Subroutines, segments of program code, drivers, firmware, microcode, circuitry, data, databases, data structures, tables, arrays and variables.
- the functions provided in the components and " parts " may be combined into a smaller number of components and “ parts “ or further separated into additional components and " parts ".
- processor should be broadly interpreted to include a general purpose processor, a central processing unit (CPU), a microprocessor, a digital signal processor (DSP), a controller, a microcontroller, a state machine, In some circumstances, a “ processor " may refer to an application specific integrated circuit (ASIC), a programmable logic device (PLD), a field programmable gate array (FPGA)
- ASIC application specific integrated circuit
- PLD programmable logic device
- FPGA field programmable gate array
- processor refers to a combination of processing devices, such as, for example, a combination of a DSP and a microprocessor, a combination of a plurality of microprocessors, a combination of one or more microprocessors in conjunction with a DSP core, It can also be called.
- memory should be broadly interpreted to include any electronic component capable of storing electronic information.
- the terminology memory may be any suitable memory such as random access memory (RAM), read-only memory (ROM), non-volatile random access memory (NVRAM), programmable read-only memory (PROM), erase- May refer to various types of processor-readable media such as erasable programmable read-only memory (PROM), flash memory, magnetic or optical data storage devices, registers, and the like.
- RAM random access memory
- ROM read-only memory
- NVRAM non-volatile random access memory
- PROM programmable read-only memory
- erase- May to various types of processor-readable media such as erasable programmable read-only memory (PROM), flash memory, magnetic or optical data storage devices, registers, and the like.
- a memory is said to be in electronic communication with a processor if the processor can read information from and / or write information to the memory.
- the memory integrated in the processor is in electronic communication with the processor.
- the " image” may be a static image such as a still image of a video or a dynamic image such as a moving image, i.e., the video itself.
- sample means data to be processed as data assigned to a sampling position of an image.
- pixel values in the image of the spatial domain, and transform coefficients on the transform domain may be samples.
- a unit including at least one of these samples may be defined as a block.
- FIGS. 1 to 24 An image encoding apparatus, an image decoding apparatus, an image encoding method, and an image decoding method will be described below with reference to FIGS. 1 to 24 according to an embodiment.
- FIGS. 3 to 16 a method of determining a data unit of an image according to an exemplary embodiment will be described.
- FIGS. 1, 2, and 17 to 24 a context model ) Is adaptively selected based on various types of encoding units will be described.
- a method and apparatus for adaptively selecting a context model based on various types of encoding units according to one embodiment of the present disclosure will be described below with reference to FIGS. 1 and 2.
- FIG. 1 shows a schematic block diagram of an image decoding apparatus 100 according to an embodiment.
- the image decoding apparatus 100 may include a receiving unit 110 and a decoding unit 120.
- the receiving unit 110 and the decoding unit 120 may include at least one processor.
- the receiving unit 110 and the decoding unit 120 may include a memory for storing instructions to be executed by at least one processor.
- the receiving unit 110 may receive the bit stream.
- the bitstream includes information obtained by encoding an image by a video encoding apparatus 2200, which will be described later.
- the bit stream can be transmitted from the image encoding apparatus 2200.
- the image encoding apparatus 2200 and the image decoding apparatus 100 may be connected by wire or wireless, and the receiving unit 110 may receive a bit stream by wire or wireless.
- the receiving unit 110 may receive a bit stream from a storage medium such as an optical medium, a hard disk, or the like.
- the decoding unit 120 may obtain information based on the received bitstream and reconstruct the image.
- the decoding unit 120 can determine the context model based on at least one of the ratio or size of the shape, direction, width, and height of the coding unit.
- the decoding unit 120 can obtain a syntax element for restoring an image from a bitstream based on the context model.
- the decoding unit 120 can restore an image based on the syntax element.
- FIG. 2 illustrates a flow diagram of a video decoding method in accordance with one embodiment.
- the receiving unit 110 receives a bit stream.
- the image decoding apparatus 100 performs a step 210 of determining a context model based on at least one of a ratio or a size of a shape, a direction, a width, and a height of an encoding unit.
- the image decoding apparatus 100 stores information on a division type mode for dividing an encoding unit. (220) from the bitstream based on the context model.
- the video decoding apparatus 100 performs a step 230 of determining a division type mode of an encoding unit based on the information on the division mode mode.
- An image can be divided into a maximum number of coding units.
- the size of the maximum encoding unit may be determined based on information obtained from the bitstream.
- the shape of the largest encoding unit may have a square of the same size.
- the present invention is not limited thereto.
- the maximum encoding unit may be hierarchically divided into units of encoding based on information on the divisional format mode obtained from the bitstream.
- the encoding unit may be less than or equal to the maximum encoding unit. For example, if the information for the split mode mode indicates that the information is not divided, the coding unit has the same size as the maximum coding unit. If the information for the split mode mode indicates that the information is divided, the maximum encoding unit may be divided into encoding units.
- the encoding units can be divided into smaller-sized encoding units.
- the division of the image is not limited to this, and the maximum encoding unit and the encoding unit may not be distinguished. The division of encoding units will be described in more detail with reference to FIG. 3 to FIG.
- the encoding unit can be divided into prediction units for prediction of an image.
- the prediction unit may be equal to or smaller than the encoding unit.
- the encoding unit can also be divided into conversion units for image conversion.
- the conversion unit may be equal to or smaller than the encoding unit.
- the shape and size of the conversion unit and the prediction unit may not be related to each other.
- the encoding unit may be distinguished from the prediction unit and the conversion unit, but the encoding unit, the prediction unit, and the conversion unit may be the same.
- the division of the prediction unit and the conversion unit can be performed in the same manner as the division of the coding unit.
- the division of encoding units will be described in more detail with reference to FIG. 3 to FIG.
- the current block and the neighboring blocks of the present disclosure may represent one of a maximum encoding unit, an encoding unit, a prediction unit, and a conversion unit.
- the current block is a block in which decoding or encoding is currently performed.
- the neighboring block may be a block restored before the current block.
- the neighboring blocks may be spatially or temporally contiguous from the current block.
- the neighboring block may be located at one of the left lower side, the left side, the upper left side, the upper side, the upper right side, the right side, and the lower right side of the current block.
- FIG. 3 illustrates a process in which the image decoding apparatus 100 determines at least one encoding unit by dividing a current encoding unit according to an embodiment.
- the block shape may include 4Nx4N, 4Nx2N, 2Nx4N, 4NxN, or Nx4N. Where N may be a positive integer.
- the block type information is information indicating at least one of a ratio, or a size, of a shape, direction, width, and height of an encoding unit.
- the shape of the encoding unit may include a square and a non-square. If the width and height of the encoding unit are the same (4Nx4N), the image decoding apparatus 100 can determine the block type information of the encoding unit as a square. The image decoding apparatus 100 can determine the shape of the encoding unit as a non-square.
- the image decoding apparatus 100 can determine the block type information of the encoding unit as a non-square when the lengths of the widths and heights of the encoding units are different (4Nx2N, 2Nx4N, 4NxN, or Nx4N).
- the image decoding apparatus 100 sets the width and height ratio of the block type information of the coding unit to 1: 2, 2: 1, 1: 4, 4: Or 8: 1.
- the video decoding apparatus 100 can determine whether the coding unit is the horizontal direction or the vertical direction. Further, the image decoding apparatus 100 can determine the size of the encoding unit based on at least one of the width of the encoding unit, the length of the height, and the width.
- the image decoding apparatus 100 may determine the type of the encoding unit using the block type information and determine the type of the encoding unit to be divided using information on the division type mode. That is, according to which block type the block type information used by the video decoding apparatus 100 indicates, the division method of the encoding unit indicated by the information on the split mode mode can be determined.
- the image decoding apparatus 100 may obtain information on the split mode mode from the bit stream. However, the present invention is not limited thereto, and the image decoding apparatus 100 and the image encoding apparatus 2200 can obtain information on the promised split mode mode based on the block type information.
- the image decoding apparatus 100 may acquire information on the promised divided mode mode for the maximum encoding unit or the minimum encoding unit. For example, the image decoding apparatus 100 can determine the size of the maximum encoding unit to be 256x256.
- the image decoding apparatus 100 may determine the information about the promised division mode in advance as a quad split. Quad partitioning is a split mode mode that bisects both the width and the height of the encoding unit.
- the image decoding apparatus 100 can obtain a 128x128 encoding unit from the 256x256 maximum encoding unit based on the information on the split mode mode. Also, the image decoding apparatus 100 can determine the size of the minimum encoding unit to be 4x4. The image decoding apparatus 100 can acquire information on the split mode mode indicating " not split " for the minimum encoding unit.
- the image decoding apparatus 100 may use block type information indicating that the current encoding unit is a square type. For example, the image decoding apparatus 100 can determine whether to divide a square encoding unit according to information on the division mode, vertically or horizontally, or four encoding units. 3, if the block type information of the current encoding unit 300 indicates a square shape, the decoding unit 120 decodes the current encoding unit 300 and the current encoding unit 300 according to the information on the split mode mode, It is possible not to divide the coding unit 310a having the same size or to determine the divided coding units 310b, 310c and 310d based on the information on the division mode mode indicating the predetermined division method.
- the image decoding apparatus 100 includes two encoding units 310b, 320b, 320c, 320c, 320c, 320c, 320c, 320c, Can be determined.
- the image decoding apparatus 100 may determine two encoding units 310c in which the current encoding unit 300 is divided in the horizontal direction based on the information on the split mode mode indicating that the image is divided in the horizontal direction.
- the image decoding apparatus 100 can determine four encoding units 310d in which the current encoding unit 300 is divided into the vertical direction and the horizontal direction based on the information on the split mode mode indicating that the image is divided into the vertical direction and the horizontal direction have.
- the division type in which the square encoding unit can be divided should not be limited to the above-mentioned form, but may include various forms in which the information on the division type mode can be represented.
- the predetermined divisional form in which the square encoding unit is divided will be described in detail by way of various embodiments below.
- FIG. 4 illustrates a process in which the image decoding apparatus 100 determines at least one encoding unit by dividing a non-square encoding unit according to an embodiment.
- the image decoding apparatus 100 may use block type information indicating that the current encoding unit is a non-square format.
- the video decoding apparatus 100 may determine whether to divide the non-square current encoding unit according to the information on the split mode mode or not in a predetermined method.
- the image decoding apparatus 100 performs a current encoding process according to the information on the split mode mode,
- the encoding unit 410 or 460 having the same size as the unit 400 or 450 is determined or the encoding unit 420a, 420b, 430a, or 430b divided based on the information on the division mode mode indicating the predetermined division method , 430c, 470a, 470b, 480a, 480b, 480c.
- the predetermined division method in which the non-square coding unit is divided will be described in detail through various embodiments.
- the image decoding apparatus 100 may determine a type in which a coding unit is divided using information on a division type mode.
- information on the division type mode may include at least one Lt; / RTI > can be represented by the number of encoding units.
- the image decoding apparatus 100 performs a current encoding
- the unit 400 or 450 may be divided to determine two encoding units 420a, 420b, or 470a and 470b included in the current encoding unit.
- the image decoding apparatus 100 may divide the non- The current encoding unit can be divided in consideration of the position of the long side of the current encoding unit (400 or 450). For example, the image decoding apparatus 100 divides the current encoding unit 400 or 450 in the direction of dividing the long side of the current encoding unit 400 or 450 in consideration of the shape of the current encoding unit 400 or 450 So that a plurality of encoding units can be determined.
- the video decoding apparatus 100 when the information on the split mode mode indicates that an encoding unit is divided into an odd number of blocks (tri-split), the video decoding apparatus 100 includes the current encoding unit 400 or 450 An odd number of encoding units can be determined. For example, when the information on the split mode mode indicates that the current encoding unit 400 or 450 is divided into three encoding units, the video decoding apparatus 100 encodes the current encoding unit 400 or 450 into three encodings Can be divided into units 430a, 430b, 430c, 480a, 480b, and 480c.
- the ratio of the width and height of the current encoding unit 400 or 450 may be 4: 1 or 1: 4. If the ratio of width to height is 4: 1, the length of the width is longer than the length of the height, so the block type information may be horizontal. If the ratio of width to height is 1: 4, the block type information may be vertical because the length of the width is shorter than the length of the height.
- the image decoding apparatus 100 may determine to divide the current encoding unit into odd number blocks based on the information on the split mode mode. The image decoding apparatus 100 can determine the division direction of the current encoding unit 400 or 450 based on the block type information of the current encoding unit 400 or 450.
- the image decoding apparatus 100 can determine the encoding units 430a, 430b, and 430c by dividing the current encoding unit 400 in the horizontal direction. Also, when the current encoding unit 450 is in the horizontal direction, the image decoding apparatus 100 can determine the encoding units 480a, 480b, and 480c by dividing the current encoding unit 450 in the vertical direction.
- the image decoding apparatus 100 may determine an odd number of encoding units included in the current encoding unit 400 or 450, and the sizes of the determined encoding units may not be the same. For example, the size of a predetermined encoding unit 430b or 480b among the determined odd number of encoding units 430a, 430b, 430c, 480a, 480b, and 480c is different from the size of the other encoding units 430a, 430c, 480a, and 480c .
- an encoding unit that can be determined by dividing the current encoding unit (400 or 450) may have a plurality of types of sizes, and an odd number of encoding units (430a, 430b, 430c, 480a, 480b, 480c) May have different sizes.
- the image decoding apparatus 100 can determine an odd number of encoding units included in the current encoding unit 400 or 450 Further, the image decoding apparatus 100 may limit the encoding unit of at least one of odd number of encoding units generated by division.
- the image decoding apparatus 100 includes an encoding unit 430a, 430b, 430c, 480a, 480b, and 480c, which are generated by dividing a current encoding unit 400 or 450, The decoding process for the coding units 430b and 480b may be different from the coding units 430a, 430c, 480a, and 480c.
- the coding units 430b and 480b positioned at the center are restricted so as not to be further divided unlike the other coding units 430a, 430c, 480a, and 480c, It can be limited to be divided.
- FIG. 5 illustrates a process in which the image decoding apparatus 100 divides an encoding unit based on at least one of information on a block type information and a division mode mode according to an embodiment.
- the image decoding apparatus 100 determines whether to divide or not divide the square-shaped first coding unit 500 into coding units based on at least one of information on the block type information and the information on the division mode mode .
- the image decoding apparatus 100 divides the first encoding unit 500 in the horizontal direction, 2 encoding unit 510, as shown in FIG.
- the first encoding unit, the second encoding unit, and the third encoding unit used according to an embodiment are terms used to understand the relation before and after the division between encoding units.
- the second encoding unit can be determined, and if the second encoding unit is divided, the third encoding unit can be determined.
- the relationship between the first coding unit, the second coding unit and the third coding unit used can be understood to be in accordance with the above-mentioned characteristic.
- the image decoding apparatus 100 may determine that the determined second encoding unit 510 is not divided or divided into encoding units based on at least one of the block type information and the information on the split mode mode .
- the image decoding apparatus 100 includes a second encoding unit (not shown) of a non-square shape determined by dividing a first encoding unit 500 based on at least one of information on block type information and information on a split mode 510) may be divided into at least one third encoding unit 520a, 520b, 520c, 520d, or the second encoding unit 510 may not be divided.
- the image decoding apparatus 100 may acquire at least one of the block type information and the information on the split mode mode and the image decoding apparatus 100 may acquire at least one of the block type information and the split mode mode
- the second encoding unit 510 may divide the first encoding unit 500 into a plurality of second encoding units of various types (for example, 510), and the second encoding unit 510 may divide the block type information and the information
- the first encoding unit 500 may be divided according to a manner in which the first encoding unit 500 is divided.
- the first encoding unit 500 is divided into the second encoding units 510 based on at least one of the block type information for the first encoding unit 500 and the information about the split mode mode 520b, 520c, and 520d (e.g., 520a, 520b, 520c, and 520d) based on at least one of the block type information on the second encoding unit 510 and the information on the split mode mode, Etc.). That is, the encoding unit may be recursively divided based on at least one of the information on the split mode mode and the block type information associated with each of the encoding units. Therefore, a square encoding unit may be determined in a non-square encoding unit, and a non-square encoding unit may be determined by dividing the square encoding unit recursively.
- predetermined encoding units for example, An encoding unit or a square-shaped encoding unit
- the square-shaped third coding unit 520b which is one of the odd-numbered third coding units 520b, 520c, and 520d, may be divided in the horizontal direction and divided into a plurality of fourth coding units.
- the non-square fourth encoding unit 530b or 530d which is one of the plurality of fourth encoding units 530a, 530b, 530c, and 530d, may be further divided into a plurality of encoding units.
- the fourth encoding unit 530b or 530d in the non-square form may be divided again into odd number of encoding units.
- a method which can be used for recursive division of an encoding unit will be described later in various embodiments.
- the image decoding apparatus 100 divides each of the third encoding units 520a, 520b, 520c, and 520d into units of encoding based on at least one of information on the block type information and the information on the split mode mode . Also, the image decoding apparatus 100 may determine that the second encoding unit 510 is not divided based on at least one of the block type information and the information on the split mode mode. The image decoding apparatus 100 may divide the non-square second encoding unit 510 into odd third encoding units 520b, 520c and 520d according to an embodiment.
- the image decoding apparatus 100 may set a predetermined restriction on a predetermined third encoding unit among odd numbered third encoding units 520b, 520c, and 520d. For example, the image decoding apparatus 100 may limit the number of encoding units 520c located in the middle among odd numbered third encoding units 520b, 520c, and 520d to no longer be divided, or be divided into a set number of times .
- the image decoding apparatus 100 includes an encoding unit (not shown) located in the middle among odd third encoding units 520b, 520c, and 520d included in the second encoding unit 510 in the non- 520c may not be further divided or may be limited to being divided into a predetermined division form (for example, divided into four coding units only or divided into a form corresponding to a form in which the second coding units 510 are divided) (For example, dividing only n times, n > 0).
- a predetermined division form for example, divided into four coding units only or divided into a form corresponding to a form in which the second coding units 510 are divided
- the above restriction on the coding unit 520c positioned at the center is merely an example and should not be construed to be limited to the above embodiments and the coding unit 520c positioned at the center is not limited to the coding units 520b and 520d Quot;), < / RTI > which can be decoded differently.
- the image decoding apparatus 100 may acquire at least one of the block type information and the division type mode information used for dividing the current encoding unit at a predetermined position in the current encoding unit.
- FIG. 6 illustrates a method by which the image decoding apparatus 100 determines a predetermined encoding unit among odd number of encoding units according to an embodiment.
- At least one of the block type information of the current encoding units 600 and 650 and the information of the split mode mode is a sample of a predetermined position among a plurality of samples included in the current encoding units 600 and 650 For example, samples 640 and 690 positioned in the middle).
- the predetermined position in the current encoding unit 600 in which at least one of the block type information and the information on the split mode mode can be obtained should not be limited to the middle position shown in FIG. 6, It should be understood that various positions (e.g., top, bottom, left, right, top left, bottom left, top right, or bottom right, etc.) that may be included in unit 600 may be included.
- the image decoding apparatus 100 may determine that the current encoding unit is divided or not divided into the encoding units of various types and sizes by acquiring at least one of the block type information obtained from the predetermined position and the information on the division mode mode .
- the image decoding apparatus 100 may select one of the encoding units.
- the method for selecting one of the plurality of encoding units may be various, and description of these methods will be described later in various embodiments.
- the image decoding apparatus 100 may divide the current encoding unit into a plurality of encoding units and determine a predetermined encoding unit.
- the image decoding apparatus 100 may use information indicating the positions of odd-numbered encoding units in order to determine an encoding unit located in the middle among odd-numbered encoding units. 6, the image decoding apparatus 100 divides the current encoding unit 600 or the current encoding unit 650 into odd number of encoding units 620a, 620b, 620c or odd number of encoding units 660a, 660b, and 660c. The image decoding apparatus 100 may use the information on the positions of the odd-numbered encoding units 620a, 620b, and 620c or the odd-numbered encoding units 660a, 660b, and 660c, (660b).
- the image decoding apparatus 100 determines the positions of the encoding units 620a, 620b, and 620c based on information indicating the positions of predetermined samples included in the encoding units 620a, 620b, and 620c,
- the encoding unit 620b located in the encoding unit 620b can be determined.
- the video decoding apparatus 100 encodes the encoding units 620a, 620b, and 620c based on information indicating the positions of the upper left samples 630a, 630b, and 630c of the encoding units 620a, 620b, and 620c,
- the encoding unit 620b located in the center can be determined.
- Information indicating the positions of the upper left samples 630a, 630b, and 630c included in the coding units 620a, 620b, and 620c according to one embodiment is stored in the pictures of the coding units 620a, 620b, and 620c Or information about the position or coordinates of the object.
- Information indicating the positions of the upper left samples 630a, 630b, and 630c included in the coding units 620a, 620b, and 620c according to one embodiment is stored in the coding units 620a , 620b, and 620c, and the width or height may correspond to information indicating the difference between the coordinates of the encoding units 620a, 620b, and 620c in the picture.
- the image decoding apparatus 100 directly uses the information on the position or the coordinates in the picture of the coding units 620a, 620b, and 620c or the information on the width or height of the coding unit corresponding to the difference value between the coordinates
- the encoding unit 620b located in the center can be determined.
- the information indicating the position of the upper left sample 630a of the upper coding unit 620a may indicate the coordinates (xa, ya) and the upper left sample 530b of the middle coding unit 620b May indicate the coordinates (xb, yb), and the information indicating the position of the upper left sample 630c of the lower coding unit 620c may indicate the coordinates (xc, yc).
- the video decoding apparatus 100 can determine the center encoding unit 620b using the coordinates of the upper left samples 630a, 630b, and 630c included in the encoding units 620a, 620b, and 620c.
- the coding unit 620b including (xb, yb) coordinates of the sample 630b located at the center, Can be determined as a coding unit located in the middle of the coding units 620a, 620b, and 620c determined by dividing the current coding unit 600.
- the coordinates indicating the positions of the samples 630a, 630b and 630c in the upper left corner may indicate the coordinates indicating the absolute position in the picture
- the position of the upper left sample 630a of the upper coding unit 620a may be (Dxb, dyb), which is information indicating the relative position of the sample 630b at the upper left of the middle encoding unit 620b, and the relative position of the sample 630c at the upper left of the lower encoding unit 620c
- Information dyn (dxc, dyc) coordinates may also be used.
- the method of determining the coding unit at a predetermined position by using the coordinates of the sample as information indicating the position of the sample included in the coding unit should not be limited to the above-described method, and various arithmetic Should be interpreted as a method.
- the image decoding apparatus 100 may divide the current encoding unit 600 into a plurality of encoding units 620a, 620b, and 620c and may encode a predetermined one of the encoding units 620a, 620b, and 620c
- the encoding unit can be selected according to the criterion. For example, the image decoding apparatus 100 can select an encoding unit 620b having a different size from among the encoding units 620a, 620b, and 620c.
- the image decoding apparatus 100 may include (xa, ya) coordinates, which is information indicating the position of the upper left sample 630a of the upper encoding unit 620a, a sample of the upper left sample of the middle encoding unit 620b (Xc, yc) coordinates, which is information indicating the position of the lower-stage coding unit 630b and the position of the upper-left sample 630c of the lower-stage coding unit 620c, , 620b, and 620c, respectively.
- the image decoding apparatus 100 encodes the encoding units 620a and 620b using the coordinates (xa, ya), (xb, yb), (xc, yc) indicating the positions of the encoding units 620a, 620b and 620c , And 620c, respectively.
- the image decoding apparatus 100 may determine the width of the upper encoding unit 620a as the width of the current encoding unit 600.
- the image decoding apparatus 100 can determine the height of the upper encoding unit 620a as yb-ya.
- the image decoding apparatus 100 may determine the width of the middle encoding unit 620b as the width of the current encoding unit 600 according to an embodiment.
- the image decoding apparatus 100 can determine the height of the middle encoding unit 620b as yc-yb.
- the image decoding apparatus 100 may determine the width or height of the lower coding unit by using the width or height of the current coding unit and the width and height of the upper coding unit 620a and the middle coding unit 620b .
- the image decoding apparatus 100 may determine an encoding unit having a different size from other encoding units based on the widths and heights of the determined encoding units 620a, 620b, and 620c. Referring to FIG.
- the image decoding apparatus 100 may determine a coding unit 620b as a coding unit at a predetermined position while having a size different from that of the upper coding unit 620a and the lower coding unit 620c.
- the process of determining the encoding unit having a size different from that of the other encoding units by the video decoding apparatus 100 may be the same as that of the first embodiment in which the encoding unit of a predetermined position is determined using the size of the encoding unit determined based on the sample coordinates .
- Various processes may be used for determining the encoding unit at a predetermined position by comparing the sizes of the encoding units determined according to predetermined sample coordinates.
- the video decoding apparatus 100 determines the position (xd, yd) which is the information indicating the position of the upper left sample 670a of the left encoding unit 660a and the position (xd, yd) of the sample 670b at the upper left of the middle encoding unit 660b 660b and 660c using the (xf, yf) coordinates, which is information indicating the (xe, ye) coordinate which is the information indicating the position of the right encoding unit 660c and the position of the sample 670c at the upper left of the right encoding unit 660c, Each width or height can be determined.
- the image decoding apparatus 100 encodes the encoded units 660a and 660b using the coordinates (xd, yd), (xe, ye), (xf, yf) indicating the positions of the encoding units 660a, 660b and 660c And 660c, respectively.
- the image decoding apparatus 100 may determine the width of the left encoding unit 660a as xe-xd. The image decoding apparatus 100 can determine the height of the left encoding unit 660a as the height of the current encoding unit 650. [ According to an embodiment, the image decoding apparatus 100 may determine the width of the middle encoding unit 660b as xf-xe. The image decoding apparatus 100 can determine the height of the middle encoding unit 660b as the height of the current encoding unit 600.
- the image decoding apparatus 100 may determine that the width or height of the right encoding unit 660c is less than the width or height of the current encoding unit 650 and the width and height of the left encoding unit 660a and the middle encoding unit 660b . ≪ / RTI > The image decoding apparatus 100 may determine an encoding unit having a different size from the other encoding units based on the widths and heights of the determined encoding units 660a, 660b, and 660c. Referring to FIG.
- the image decoding apparatus 100 may determine a coding unit 660b as a coding unit at a predetermined position while having a size different from that of the left coding unit 660a and the right coding unit 660c.
- the process of determining the encoding unit having a size different from that of the other encoding units by the video decoding apparatus 100 may be the same as that of the first embodiment in which the encoding unit of a predetermined position is determined using the size of the encoding unit determined based on the sample coordinates .
- Various processes may be used for determining the encoding unit at a predetermined position by comparing the sizes of the encoding units determined according to predetermined sample coordinates.
- the position of the sample to be considered for determining the position of the coding unit should not be interpreted as being limited to the left upper end, and information about the position of any sample included in the coding unit can be interpreted as being available.
- the image decoding apparatus 100 can select a coding unit at a predetermined position among the odd number of coding units determined by dividing the current coding unit considering the type of the current coding unit. For example, if the current coding unit is a non-square shape having a width greater than the height, the image decoding apparatus 100 can determine a coding unit at a predetermined position along the horizontal direction. That is, the image decoding apparatus 100 may determine one of the encoding units which are located in the horizontal direction and limit the encoding unit. If the current coding unit is a non-square shape having a height greater than the width, the image decoding apparatus 100 can determine a coding unit at a predetermined position in the vertical direction. That is, the image decoding apparatus 100 may determine one of the encoding units having different positions in the vertical direction and set a restriction on the encoding unit.
- the image decoding apparatus 100 may use information indicating positions of even-numbered encoding units in order to determine an encoding unit at a predetermined position among the even-numbered encoding units.
- the image decoding apparatus 100 may determine an even number of coding units by binary coding the current coding unit and determine a coding unit at a predetermined position by using information on the positions of the even number of coding units.
- a concrete procedure for this is omitted because it may be a process corresponding to a process of determining a coding unit of a predetermined position (e.g., the middle position) among the odd number of coding units described with reference to FIG.
- the video decoding apparatus 100 may determine the block type information stored in the sample included in the middle coding unit, Mode may be used.
- the image decoding apparatus 100 divides the current encoding unit 600 into a plurality of encoding units 620a, 620b, and 620c based on at least one of information on the block type information and the information on the split mode mode And the encoding unit 620b located in the middle of the plurality of encoding units 620a, 620b, and 620c can be determined. Furthermore, the image decoding apparatus 100 may determine the coding unit 620b located at the center in consideration of the position at which at least one of the block type information and the division type mode information is obtained.
- At least one of the block type information of the current encoding unit 600 and the information of the division mode mode can be obtained in the sample 640 located in the middle of the current encoding unit 600, If the current encoding unit 600 is divided into a plurality of encoding units 620a, 620b, and 620c based on at least one of the information on the division mode mode and the encoding unit 620b including the sample 640, As shown in FIG.
- the information used for determining the encoding unit located in the middle should not be limited to at least one of the block type information and the information about the division mode mode, and a process of determining an encoding unit in which various types of information are located in the middle ≪ / RTI >
- predetermined information for identifying a coding unit at a predetermined position may be obtained from a predetermined sample included in a coding unit to be determined.
- the image decoding apparatus 100 includes a plurality of encoding units 620a, 620b, and 620c that are determined by dividing a current encoding unit 600, (For example, a sample located in the middle of the current encoding unit 600) at a predetermined position in the current encoding unit 600 in order to determine an encoding unit located in the middle of the encoding unit, And at least one of information on the split mode mode may be used.
- the image decoding apparatus 100 can determine the sample at the predetermined position in consideration of the block form of the current encoding unit 600, and the image decoding apparatus 100 can determine a plurality of A coding unit 620b including samples from which predetermined information (for example, at least one of information on the block type information and the division mode information) can be obtained from the plurality of coding units 620a, 620b, and 620c So that a predetermined limit can be set.
- the image decoding apparatus 100 may determine a sample 640 located in the center of a current encoding unit 600 as a sample from which predetermined information can be obtained,
- the coding unit 100 may limit the coding unit 620b including the sample 640 to a predetermined limit in the decoding process.
- the position of the sample from which the predetermined information can be obtained should not be construed to be limited to the above-mentioned position, but may be interpreted as samples at arbitrary positions included in the encoding unit 620b to be determined for limiting.
- the position of a sample from which predetermined information can be obtained may be determined according to the type of the current encoding unit 600.
- the block type information can determine whether the current encoding unit is a square or a non-square, and determine the position of a sample from which predetermined information can be obtained according to the shape.
- the video decoding apparatus 100 may use at least one of the information on the width of the current coding unit and the information on the height to position at least one of the width and the height of the current coding unit in half The sample can be determined as a sample from which predetermined information can be obtained.
- the image decoding apparatus 100 selects one of the samples adjacent to the boundary dividing the longer side of the current encoding unit into halves by a predetermined Can be determined as a sample from which the information of < / RTI >
- the image decoding apparatus 100 may determine the encoding unit of a predetermined position among the plurality of encoding units, Information can be used.
- the image decoding apparatus 100 may acquire at least one of information on the block type information and the information on the division mode mode from a sample of a predetermined position included in the encoding unit,
- the plurality of coding units generated by dividing the unit may be divided using at least one of the information on the division mode and the block type information obtained from the sample at the predetermined position included in each of the plurality of the coding units.
- the coding unit can be recursively divided using at least one of the block type information obtained in the sample at the predetermined position included in each of the coding units and the information about the division mode. Since the recursive division process of the encoding unit has been described with reference to FIG. 5, a detailed description thereof will be omitted.
- the image decoding apparatus 100 can determine at least one encoding unit by dividing the current encoding unit, and the order in which the at least one encoding unit is decoded is determined as a predetermined block (for example, ). ≪ / RTI >
- FIG. 7 illustrates a sequence in which a plurality of coding units are processed when the image decoding apparatus 100 determines a plurality of coding units by dividing the current coding unit according to an embodiment.
- the image decoding apparatus 100 determines the second encoding units 710a and 710b by dividing the first encoding unit 700 in the vertical direction according to information on the block type information and the division mode,
- the second encoding units 730a and 730b may be determined by dividing the first encoding units 700a to 750c by dividing the first encoding units 700a and 750b in the horizontal direction to divide the first encoding units 700 in the vertical direction and the horizontal direction, , 750d can be determined.
- the image decoding apparatus 100 may determine the order in which the second encoding units 710a and 710b determined by dividing the first encoding unit 700 in the vertical direction are processed in the horizontal direction 710c .
- the image decoding apparatus 100 may determine the processing order of the second encoding units 730a and 730b determined by dividing the first encoding unit 700 in the horizontal direction as the vertical direction 730c.
- the image decoding apparatus 100 processes the encoding units located in one row of the second encoding units 750a, 750b, 750c and 750d determined by dividing the first encoding unit 700 in the vertical direction and the horizontal direction, (For example, a raster scan order or a z scan order 750e) in which the encoding units located in the next row are processed.
- the image decoding apparatus 100 may recursively divide encoding units. 7, the image decoding apparatus 100 may determine a plurality of encoding units 710a, 710b, 730a, 730b, 750a, 750b, 750c and 750d by dividing the first encoding unit 700, The determined plurality of encoding units 710a, 710b, 730a, 730b, 750a, 750b, 750c, and 750d can be recursively divided.
- the method of dividing the plurality of encoding units 710a, 710b, 730a, 730b, 750a, 750b, 750c, and 750d may be a method corresponding to the method of dividing the first encoding unit 700.
- the plurality of encoding units 710a, 710b, 730a, 730b, 750a, 750b, 750c, and 750d may be independently divided into a plurality of encoding units.
- the image decoding apparatus 100 may determine the second encoding units 710a and 710b by dividing the first encoding unit 700 in the vertical direction, and may further determine the second encoding units 710a and 710b Can be determined not to divide or separate independently.
- the image decoding apparatus 100 may divide the second encoding unit 710a on the left side in the horizontal direction into the third encoding units 720a and 720b and the second encoding units 710b ) May not be divided.
- the processing order of the encoding units may be determined based on the division process of the encoding units.
- the processing order of the divided coding units can be determined based on the processing order of the coding units immediately before being divided.
- the image decoding apparatus 100 can determine the order in which the third encoding units 720a and 720b determined by dividing the second encoding unit 710a on the left side are processed independently of the second encoding unit 710b on the right side.
- the third encoding units 720a and 720b may be processed in the vertical direction 720c because the second encoding units 710a on the left side are divided in the horizontal direction and the third encoding units 720a and 720b are determined.
- the order in which the left second encoding unit 710a and the right second encoding unit 710b are processed corresponds to the horizontal direction 710c
- the right encoding unit 710b can be processed after the blocks 720a and 720b are processed in the vertical direction 720c.
- the above description is intended to explain the process sequence in which encoding units are determined according to the encoding units before division. Therefore, it should not be construed to be limited to the above-described embodiments, It should be construed as being used in various ways that can be handled independently in sequence.
- FIG. 8 illustrates a process of determining that the current encoding unit is divided into odd number of encoding units when the image decoding apparatus 100 can not process the encoding units in a predetermined order according to an embodiment.
- the image decoding apparatus 100 may determine that the current encoding unit is divided into odd number of encoding units based on the obtained block type information and information on the split mode mode.
- the first encoding unit 800 in the form of a square may be divided into second non-square encoding units 810a and 810b, and the second encoding units 810a and 810b may be independently 3 encoding units 820a, 820b, 820c, 820d, and 820e.
- the image decoding apparatus 100 can determine the plurality of third encoding units 820a and 820b by dividing the left encoding unit 810a of the second encoding unit in the horizontal direction, and the right encoding unit 810b Can be divided into an odd number of third encoding units 820c, 820d, and 820e.
- the image decoding apparatus 100 determines whether or not the third encoding units 820a, 820b, 820c, 820d, and 820e can be processed in a predetermined order and determines whether there are odd- You can decide. Referring to FIG. 8, the image decoding apparatus 100 may recursively divide the first encoding unit 800 to determine the third encoding units 820a, 820b, 820c, 820d, and 820e.
- the video decoding apparatus 100 may further include a first coding unit 800, a second coding unit 810a and 810b or a third coding unit 820a and 820b based on at least one of information on the block type information and the information on the division mode mode , 820c, 820d, and 820e are divided into odd number of coding units among the divided types. For example, an encoding unit located on the right of the second encoding units 810a and 810b may be divided into odd third encoding units 820c, 820d, and 820e.
- the order in which the plurality of coding units included in the first coding unit 800 are processed may be a predetermined order (for example, a z-scan order 830) 100 can determine whether the third encoding units 820c, 820d, and 820e determined by dividing the right second encoding unit 810b into odd numbers satisfy the condition that the third encoding units 820c, 820d, and 820e can be processed according to the predetermined order.
- a predetermined order for example, a z-scan order 830
- the image decoding apparatus 100 satisfies a condition that third encoding units 820a, 820b, 820c, 820d, and 820e included in the first encoding unit 800 can be processed in a predetermined order And it is determined whether or not at least one of the widths and heights of the second encoding units 810a and 810b is divided in half according to the boundaries of the third encoding units 820a, 820b, 820c, 820d, and 820e, .
- the third encoding units 820a and 820b which are determined by dividing the height of the left second encoding unit 810a in the non-square shape by half, can satisfy the condition.
- the boundaries of the third encoding units 820c, 820d, and 820e determined by dividing the right second encoding unit 810b into three encoding units do not divide the width or height of the right second encoding unit 810b in half ,
- the third encoding units 820c, 820d, and 820e may be determined as not satisfying the condition.
- the image decoding apparatus 100 may determine that the scan order is disconnection in the case of such unsatisfactory condition and determine that the right second encoding unit 810b is divided into odd number of encoding units based on the determination result.
- the image decoding apparatus 100 may limit a coding unit of a predetermined position among the divided coding units when the coding unit is divided into odd number of coding units. Since the embodiment has been described above, a detailed description thereof will be omitted.
- FIG. 9 illustrates a process in which the image decoding apparatus 100 determines at least one encoding unit by dividing a first encoding unit 900 according to an embodiment.
- the image decoding apparatus 100 may divide the first encoding unit 900 based on at least one of the block type information obtained through the receiving unit 110 and the information on the division mode.
- the first coding unit 900 in the form of a square may be divided into four coding units having a square form, or may be divided into a plurality of non-square coding units.
- the image decoding apparatus 100 1 encoding unit 900 into a plurality of non-square encoding units.
- the image decoding apparatus 100 performs a first encoding
- the unit 900 can be divided into the second coding units 910a, 910b and 910c divided in the vertical direction as the odd number of coding units or the second coding units 920a, 920b and 920c divided in the horizontal direction .
- the image decoding apparatus 100 may be configured such that the second encoding units 910a, 910b, 910c, 920a, 920b, and 920c included in the first encoding unit 900 are processed in a predetermined order And the condition is that at least one of the width and the height of the first encoding unit 900 is divided in half according to the boundaries of the second encoding units 910a, 910b, 910c, 920a, 920b, and 920c .
- the boundaries of the second encoding units 910a, 910b, and 910c which are determined by vertically dividing the first encoding unit 900 in a square shape, are divided in half by the width of the first encoding unit 900
- the first encoding unit 900 can be determined as not satisfying a condition that can be processed in a predetermined order.
- the boundaries of the second encoding units 920a, 920b, and 920c which are determined by dividing the first encoding unit 900 in the horizontal direction into the horizontal direction, can not divide the width of the first encoding unit 900 in half, 1 encoding unit 900 may be determined as not satisfying a condition that can be processed in a predetermined order.
- the image decoding apparatus 100 may determine that the scan sequence is disconnection in the case of such unsatisfactory condition and determine that the first encoding unit 900 is divided into odd number of encoding units based on the determination result. According to an embodiment, the image decoding apparatus 100 may limit a coding unit of a predetermined position among the divided coding units when the coding unit is divided into odd number of coding units. Since the embodiment has been described above, a detailed description thereof will be omitted.
- the image decoding apparatus 100 may determine the encoding units of various types by dividing the first encoding unit.
- the image decoding apparatus 100 may divide a first coding unit 900 in a square form and a first coding unit 930 or 950 in a non-square form into various types of coding units .
- the image decoding apparatus 100 may divide the first encoding unit 1000 in a square form into a non-square shape (e.g., a square shape) on the basis of at least one of the block type information and the division type mode information acquired through the receiving unit 110 1010b, 1020a, and 1020b of the second encoding units 1010a, 1010b, 1020a, and 1020b.
- the second encoding units 1010a, 1010b, 1020a, and 1020b may be independently divided.
- the image decoding apparatus 100 divides or divides the image data into a plurality of encoding units based on at least one of the block type information and the division type mode information related to each of the second encoding units 1010a, 1010b, 1020a, and 1020b You can decide not to.
- the image decoding apparatus 100 divides the left second encoding unit 1010a in a non-square form determined by dividing the first encoding unit 1000 in the vertical direction into a horizontal direction, 1012a, and 1012b.
- the right-side second encoding unit 1010b is arranged in the horizontal direction in the same manner as the direction in which the left second encoding unit 1010a is divided, As shown in Fig. If the right second encoding unit 1010b is divided in the same direction and the third encoding units 1014a and 1014b are determined, the left second encoding unit 1010a and the right second encoding unit 1010b are arranged in the horizontal direction
- the third encoding units 1012a, 1012b, 1014a, and 1014b can be determined by being independently divided.
- the image decoding apparatus 100 may divide the first encoding unit 1000 into four square-shaped second encoding units 1030a, 1030b, 1030c, and 1030d based on at least one of the block type information and the information on the split mode mode ), which may be inefficient in terms of image decoding.
- the image decoding apparatus 100 divides a second encoding unit 1020a or 1020b in a non-square form determined by dividing a first encoding unit 1000 in a horizontal direction into a vertical direction, (1022a, 1022b, 1024a, 1024b).
- the image decoding apparatus 100 may be configured to encode the second encoding unit (for example, The encoding unit 1020b) can be restricted such that the upper second encoding unit 1020a can not be divided vertically in the same direction as the divided direction.
- FIG. 11 illustrates a process in which the image decoding apparatus 100 divides a square-shaped encoding unit when the information on the split mode mode can not be shown to be divided into four square-shaped encoding units according to an embodiment .
- the image decoding apparatus 100 divides the first encoding unit 1100 based on at least one of information on the block type information and the information on the split mode mode to generate second encoding units 1110a, 1110b, 1120a, and 1120b Etc.) can be determined.
- the information on the division type mode may include information on various types in which the coding unit can be divided, but information on various types may not include information for dividing into four square units of coding units.
- the image decoding apparatus 100 can not divide the first encoding unit 1100 in the square form into the second encoding units 1130a, 1130b, 1130c, and 1130d in the form of four squares .
- the image decoding apparatus 100 may determine the second encoding units 1110a, 1110b, 1120a, and 1120b in the non-square form based on the information on the split mode mode.
- the image decoding apparatus 100 may independently divide the non-square second encoding units 1110a, 1110b, 1120a, and 1120b, respectively.
- Each of the second encoding units 1110a, 1110b, 1120a, and 1120b may be divided in a predetermined order through a recursive method, and the first encoding units 1110a, 1110b, 1120a, and 1120b may be divided according to at least one of the block type information, May be a division method corresponding to how the unit 1100 is divided.
- the image decoding apparatus 100 can determine the third encoding units 1112a and 1112b in the form of a square by dividing the left second encoding unit 1110a in the horizontal direction and the right second encoding unit 1110b It is possible to determine the third encoding units 1114a and 1114b in the form of a square by being divided in the horizontal direction. Furthermore, the image decoding apparatus 100 may divide the left second encoding unit 1110a and the right second encoding unit 1110b in the horizontal direction to determine the third encoding units 1116a, 1116b, 1116c, and 1116d in the form of a square have. In this case, the encoding unit can be determined in the same manner as the first encoding unit 1100 is divided into the four second square encoding units 1130a, 1130b, 1130c, and 1130d.
- the image decoding apparatus 100 can determine the third encoding units 1122a and 1122b in the form of a square by dividing the upper second encoding unit 1120a in the vertical direction, and the lower second encoding units 1120b May be divided in the vertical direction to determine the third encoding units 1124a and 1124b in the form of a square. Further, the image decoding apparatus 100 may divide the upper second encoding unit 1120a and the lower second encoding unit 1120b in the vertical direction to determine the square-shaped third encoding units 1126a, 1126b, 1126a, and 1126b have. In this case, the encoding unit can be determined in the same manner as the first encoding unit 1100 is divided into the four second square encoding units 1130a, 1130b, 1130c, and 1130d.
- FIG. 12 illustrates that the processing order among a plurality of coding units may be changed according to a division process of a coding unit according to an exemplary embodiment.
- the image decoding apparatus 100 may divide the first encoding unit 1200 based on information on the block type information and the split mode mode.
- the block type information indicates a square shape and the information on the split mode mode indicates that the first encoding unit 1200 is divided into at least one of a horizontal direction and a vertical direction
- the unit 1200 can be divided to determine the second encoding unit (e.g., 1210a, 1210b, 1220a, 1220b, etc.). Referring to FIG.
- the non-square second encoding units 1210a, 1210b, 1220a, and 1220b which are determined by dividing the first encoding unit 1200 only in the horizontal direction or the vertical direction, Can be independently divided based on information on the < / RTI >
- the image decoding apparatus 100 divides the second encoding units 1210a and 1210b, which are generated by dividing the first encoding unit 1200 in the vertical direction, in the horizontal direction, and outputs the third encoding units 1216a, 1216b, 1216c and 1216d can be determined and the second encoding units 1220a and 1220b generated by dividing the first encoding unit 1200 in the horizontal direction are divided in the horizontal direction and the third encoding units 1226a, , 1226d. Since the process of dividing the second encoding units 1210a, 1210b, 1220a, and 1220b has been described above with reference to FIG. 11, a detailed description thereof will be omitted.
- the image decoding apparatus 100 may process an encoding unit in a predetermined order.
- the features of the processing of the encoding unit in the predetermined order have been described in detail with reference to FIG. 7, and a detailed description thereof will be omitted. 12, the image decoding apparatus 100 divides a first encoding unit 1200 of a square shape into 4 pieces of fourth encoding units 1216a, 1216b, 1216c, 1216d, 1226a, 1226b, 1226c, 1226d Can be determined.
- the image decoding apparatus 100 may process the third encoding units 1216a, 1216b, 1216c, 1216d, 1226a, 1226b, 1226c, and 1226d according to the form in which the first encoding unit 1200 is divided You can decide.
- the image decoding apparatus 100 divides the generated second encoding units 1210a and 1210b in the vertical direction and divides them in the horizontal direction to determine third encoding units 1216a, 1216b, 1216c, and 1216d And the image decoding apparatus 100 first processes the third encoding units 1216a and 1216c included in the left second encoding unit 1210a in the vertical direction and then processes the third encoding units 1216a and 1216c included in the second right encoding unit 1210b The third encoding units 1216a, 1216b, 1216c, and 1216d can be processed according to the order 1217 of processing the third encoding units 1216b and 1216d in the vertical direction.
- the image decoding apparatus 100 divides the second encoding units 1220a and 1220b generated in the horizontal direction into vertical directions to determine the third encoding units 1226a, 1226b, 1226c and 1226d And the image decoding apparatus 100 first processes the third encoding units 1226a and 1226b included in the upper second encoding unit 1220a in the horizontal direction and then encodes the third encoding units 1226a and 1226b included in the lower second encoding unit 1220b The third encoding units 1226a, 1226b, 1226c, and 1226d may be processed in accordance with an order 1227 for processing the third encoding units 1226c and 1226d in the horizontal direction.
- the second encoding units 1210a, 1210b, 1220a, and 1220b are divided to determine the third encoding units 1216a, 1216b, 1216c, 1216d, 1226a, 1226b, 1226c, and 1226d, have.
- the second encoding units 1210a and 1210b determined to be divided in the vertical direction and the second encoding units 1220a and 1220b determined to be divided in the horizontal direction are divided into different formats, but the third encoding units 1216a , 1216b, 1216c, 1216d, 1226a, 1226b, 1226c, and 1226d, the result is that the first encoding unit 1200 is divided into the same type of encoding units.
- the image decoding apparatus 100 recursively divides the encoding units based on at least one of the block type information and the information on the division type mode, thereby eventually determining the same type of encoding units, A plurality of encoding units may be processed in different orders.
- FIG. 13 illustrates a process of determining the depth of an encoding unit according to a change in type and size of an encoding unit when a plurality of encoding units are determined by recursively dividing an encoding unit according to an embodiment.
- the image decoding apparatus 100 may determine the depth of a coding unit according to a predetermined criterion.
- a predetermined criterion may be a length of a long side of a coding unit.
- the depth of the current encoding unit is smaller than the depth of the encoding unit before being divided it can be determined that the depth is increased by n.
- an encoding unit with an increased depth is expressed as a lower-depth encoding unit.
- the image decoding apparatus 100 may generate a square 1 encoding unit 1300 can be divided to determine the second encoding unit 1302, the third encoding unit 1304, etc. of the lower depth. If the size of the first encoding unit 1300 in the form of a square is 2Nx2N, the second encoding unit 1302 determined by dividing the width and height of the first encoding unit 1300 by 1/2 may have a size of NxN have.
- the third encoding unit 1304 determined by dividing the width and height of the second encoding unit 1302 by a half size may have a size of N / 2xN / 2.
- the width and height of the third encoding unit 1304 correspond to 1/4 of the first encoding unit 1300. If the depth of the first encoding unit 1300 is D, the depth of the second encoding unit 1302, which is half the width and height of the first encoding unit 1300, may be D + 1, The depth of the third encoding unit 1304, which is one fourth of the width and height of the third encoding unit 1300, may be D + 2.
- block type information indicating a non-square shape for example, block type information is' 1: NS_VER 'indicating that the height is a non-square having a width greater than the width or' 2 >
- the image decoding apparatus 100 divides the first coding unit 1310 or 1320 in a non-square form into a second coding unit 1312 or 1322 of a lower depth, The third encoding unit 1314 or 1324, or the like.
- the image decoding apparatus 100 may determine a second coding unit (for example, 1302, 1312, 1322, etc.) by dividing at least one of the width and the height of the first coding unit 1310 of Nx2N size. That is, the image decoding apparatus 100 can determine the second encoding unit 1302 of NxN size or the second encoding unit 1322 of NxN / 2 size by dividing the first encoding unit 1310 in the horizontal direction, It is also possible to determine the second encoding unit 1312 of N / 2xN size by dividing it in the horizontal direction and the vertical direction.
- a second coding unit for example, 1302, 1312, 1322, etc.
- the image decoding apparatus 100 divides at least one of a width and a height of a 2NxN first encoding unit 1320 to determine a second encoding unit (e.g., 1302, 1312, 1322, etc.) It is possible. That is, the image decoding apparatus 100 can determine the second encoding unit 1302 of NxN size or the second encoding unit 1312 of N / 2xN size by dividing the first encoding unit 1320 in the vertical direction, The second encoding unit 1322 of the NxN / 2 size may be determined by dividing the image data in the horizontal direction and the vertical direction.
- a second encoding unit e.g. 1302, 1312, 1322, etc.
- the image decoding apparatus 100 divides at least one of the width and the height of the second encoding unit 1302 of NxN size to determine a third encoding unit (for example, 1304, 1314, 1324, etc.) It is possible. That is, the image decoding apparatus 100 determines the third encoding unit 1304 of N / 2xN / 2 size by dividing the second encoding unit 1302 in the vertical direction and the horizontal direction, or determines the third encoding unit 1304 of N / 4xN / 3 encoding unit 1314 or a third encoding unit 1324 of N / 2xN / 4 size.
- a third encoding unit for example, 1304, 1314, 1324, etc.
- the image decoding apparatus 100 may divide at least one of the width and the height of the second encoding unit 1312 of N / 2xN size into a third encoding unit (e.g., 1304, 1314, 1324, etc.) . That is, the image decoding apparatus 100 divides the second encoding unit 1312 in the horizontal direction to generate a third encoding unit 1304 of N / 2xN / 2 or a third encoding unit 1324 of N / 2xN / 4 size ) Or may be divided in the vertical and horizontal directions to determine the third encoding unit 1314 of N / 4xN / 2 size.
- a third encoding unit e.g. 1304, 1314, 1324, etc.
- the image decoding apparatus 100 divides at least one of the width and the height of the second encoding unit 1322 of NxN / 2 size to generate a third encoding unit 1304, 1314, 1324, . That is, the image decoding apparatus 100 divides the second encoding unit 1322 in the vertical direction to generate a third encoding unit 1304 of N / 2xN / 2 or a third encoding unit 1314 of N / 4xN / 2 size ) Or may be divided in the vertical and horizontal directions to determine the third encoding unit 1324 of N / 2xN / 4 size.
- the image decoding apparatus 100 may divide a square-shaped encoding unit (for example, 1300, 1302, and 1304) into a horizontal direction or a vertical direction.
- a square-shaped encoding unit for example, 1300, 1302, and 1304
- the first encoding unit 1300 having a size of 2Nx2N is divided in the vertical direction to determine a first encoding unit 1310 having a size of Nx2N or the first encoding unit 1310 having a size of 2NxN to determine a first encoding unit 1320 having a size of 2NxN .
- the depth of the encoding unit when the depth is determined based on the length of the longest side of the encoding unit, the depth of the encoding unit, which is determined by dividing the first encoding unit 1300 of 2Nx2N size in the horizontal direction or the vertical direction, May be the same as the depth of the unit (1300).
- the width and height of the third encoding unit 1314 or 1324 may correspond to one fourth of the first encoding unit 1310 or 1320.
- the depth of the first coding unit 1310 or 1320 is D
- the depth of the second coding unit 1312 or 1322 which is half the width and height of the first coding unit 1310 or 1320 is D +
- the depth of the third encoding unit 1314 or 1324, which is one fourth of the width and height of the first encoding unit 1310 or 1320 may be D + 2.
- FIG. 14 illustrates a depth index (hereinafter referred to as a PID) for classifying a depth and a coding unit that can be determined according to the type and size of coding units according to an exemplary embodiment.
- a PID depth index
- the image decoding apparatus 100 may divide the first encoding unit 1400 in a square form to determine various types of second encoding units. 14, the image decoding apparatus 100 divides a first encoding unit 1400 into at least one of a vertical direction and a horizontal direction according to information on a division mode mode, and outputs the second encoding units 1402a and 1402b , 1404a, 1404b, 1406a, 1406b, 1406c, 1406d. That is, the image decoding apparatus 100 determines the second encoding units 1402a, 1402b, 1404a, 1404b, 1406a, 1406b, 1406c, and 1406d based on the information on the split mode mode for the first encoding unit 1400 .
- the second encoding units 1402a, 1402b, 1404a, 1404b, 1406a, 1406b, 1406c, and 1406d which are determined according to the information on the split mode mode for the first encoding unit 1400 in the square form.
- the depth can be determined based on the length of the sides. For example, since the length of one side of the first encoding unit 1400 in the square form is the same as the length of long sides of the second encoding units 1402a, 1402b, 1404a, and 1404b in the non-square form, 1400) and the non-square type second encoding units 1402a, 1402b, 1404a, 1404b are denoted by D in the same manner.
- the length of one side of the second encoding units 1406a, 1406b, 1406c and 1406d in the form of the second encoding units 1406a, 1406b, 1406c and 1406d is 1/2 of the length of one side of the first encoding unit 1400, May be a depth of D + 1 that is one depth lower than D, which is the depth of the first encoding unit 1400.
- the image decoding apparatus 100 divides a first encoding unit 1410 having a height greater than a width in a horizontal direction according to information on a split mode, and generates a plurality of second encoding units 1412a and 1412b , 1414a, 1414b, and 1414c.
- the image decoding apparatus 100 divides a first encoding unit 1420 of a shape whose width is longer than a height in a vertical direction according to information on a division mode, and generates a plurality of second encoding units 1422a and 1422b , 1424a, 1424b, 1424c.
- 1412b, 1414a, 1414b, 1414c. 1422a, 1422b, 1414c, 1414b, 1414c, 1414b, 1414c, 1414b, 1414c, 1414b, 1414c, 1424a, 1424b, 1424c can be determined in depth based on the length of the long side. For example, since the length of one side of the square-shaped second encoding units 1412a and 1412b is 1/2 times the length of one side of the non-square first encoding unit 1410 whose height is longer than the width, The depth of the second encoding units 1412a and 1412b of the form is D + 1 which is one depth lower than the depth D of the first encoding unit 1410 of the non-square form.
- the image decoding apparatus 100 may divide the non-square first coding unit 1410 into odd second coding units 1414a, 1414b and 1414c based on the information on the division mode mode.
- the odd number of second encoding units 1414a, 1414b and 1414c may include non-square second encoding units 1414a and 1414c and a square second encoding unit 1414b.
- the length of the long sides of the non-square type second encoding units 1414a and 1414c and the length of one side of the second encoding unit 1414b in the square form are set to 1/10 of the length of one side of the first encoding unit 1410
- the depth of the second encoding units 1414a, 1414b, and 1414c may be a depth of D + 1 which is one depth lower than D, which is the depth of the first encoding unit 1410.
- the image decoding apparatus 100 is connected to the first encoding unit 1420 in the form of a non-square shape whose width is longer than the height in a manner corresponding to the scheme for determining the depths of the encoding units associated with the first encoding unit 1410 The depth of the encoding units can be determined.
- the image decoding apparatus 100 determines an index (PID) for distinguishing the divided coding units. If the odd-numbered coding units are not the same size, The index can be determined based on the index. 14, an encoding unit 1414b positioned at the center among the odd-numbered encoding units 1414a, 1414b, and 1414c has the same width as other encoding units 1414a and 1414c, Lt; / RTI > 1414a and 1414c. That is, in this case, the encoding unit 1414b positioned in the middle may include two of the other encoding units 1414a and 1414c.
- PID index
- the coding unit 1414c positioned next to the coding unit 1414c may be three days in which the index is increased by two. That is, there may be a discontinuity in the value of the index.
- the image decoding apparatus 100 may determine whether odd-numbered encoding units are not the same size based on the presence or absence of an index discontinuity for distinguishing between the divided encoding units.
- the image decoding apparatus 100 may determine whether the image is divided into a specific division form based on an index value for distinguishing a plurality of coding units divided from the current coding unit. 14, the image decoding apparatus 100 divides a first coding unit 1410 of a rectangular shape whose height is longer than the width to determine an even number of coding units 1412a and 1412b or an odd number of coding units 1414a and 1414b , And 1414c.
- the image decoding apparatus 100 may use an index (PID) indicating each coding unit in order to distinguish each of the plurality of coding units.
- the PID may be obtained at a sample of a predetermined position of each coding unit (e.g., the upper left sample).
- the image decoding apparatus 100 may determine a coding unit of a predetermined position among the coding units determined by using the index for classifying the coding unit. According to an embodiment, when the information on the division type mode for the rectangular first type encoding unit 1410 whose height is longer than the width is divided into three encoding units, the image decoding apparatus 100 may encode the first encoding unit 1410 can be divided into three coding units 1414a, 1414b, 1414c. The image decoding apparatus 100 can assign an index to each of the three encoding units 1414a, 1414b, and 1414c. The image decoding apparatus 100 may compare the indexes of the respective encoding units in order to determine the middle encoding unit among the encoding units divided into odd numbers.
- the image decoding apparatus 100 encodes an encoding unit 1414b having an index corresponding to a middle value among the indices based on the indices of the encoding units by encoding the middle position among the encoding units determined by dividing the first encoding unit 1410 Can be determined as a unit.
- the image decoding apparatus 100 may determine an index based on a size ratio between coding units when the coding units are not the same size in determining the index for dividing the divided coding units .
- the coding unit 1414b generated by dividing the first coding unit 1410 is divided into coding units 1414a and 1414c having the same width as the other coding units 1414a and 1414c but different in height Can be double the height.
- the image decoding apparatus 100 may determine that the image decoding apparatus 100 is divided into a plurality of encoding units including encoding units having different sizes from other encoding units. , The image decoding apparatus 100 determines that the encoding unit (for example, the middle encoding unit) at a predetermined position among the odd number of encoding units is different from the encoding unit for the odd number of encoding units and the size Can divide the current encoding unit into other forms.
- the encoding unit for example, the middle encoding unit
- the image decoding apparatus 100 may determine an encoding unit having a different size by using an index (PID) for the encoding unit.
- PID index
- the index and the size or position of the encoding unit at a predetermined position to be determined are specific for explaining an embodiment, and thus should not be construed to be limited thereto, and various indexes, positions and sizes of encoding units can be used Should be interpreted.
- the image decoding apparatus 100 may use a predetermined data unit in which a recursive division of an encoding unit starts.
- FIG. 15 illustrates that a plurality of coding units are determined according to a plurality of predetermined data units included in a picture according to an embodiment.
- a predetermined data unit may be defined as a unit of data in which an encoding unit starts to be recursively segmented using at least one of block type information and information on a division mode mode. That is, it may correspond to a coding unit of the highest depth used in the process of determining a plurality of coding units for dividing the current picture.
- a predetermined data unit is referred to as a reference data unit for convenience of explanation.
- the reference data unit may represent a predetermined size and shape.
- the reference encoding unit may comprise samples of MxN.
- M and N may be equal to each other, or may be an integer represented by a multiplier of 2. That is, the reference data unit may represent a square or a non-square shape, and may be divided into an integer number of encoding units.
- the image decoding apparatus 100 may divide the current picture into a plurality of reference data units. According to an exemplary embodiment, the image decoding apparatus 100 may divide a plurality of reference data units for dividing a current picture into pieces using information on a division type mode for each reference data unit. The segmentation process of the reference data unit may correspond to the segmentation process using a quad-tree structure.
- the image decoding apparatus 100 may determine in advance a minimum size that the reference data unit included in the current picture can have. Accordingly, the image decoding apparatus 100 can determine reference data units of various sizes having a size of a minimum size or more, and use at least one of the block type information and the division mode mode information based on the determined reference data unit The encoding unit can be determined.
- the image decoding apparatus 100 may use a square-shaped reference encoding unit 1500 or a non-square-shaped reference encoding unit 1502.
- the type and size of the reference encoding unit may include various data units (e.g., a sequence, a picture, a slice, a slice segment a slice segment, a maximum encoding unit, and the like).
- the receiving unit 110 of the image decoding apparatus 100 may acquire at least one of information on the type of the reference encoding unit and information on the size of the reference encoding unit from the bitstream for each of the various data units .
- the process of determining at least one encoding unit included in the reference type encoding unit 1500 is described in detail in the process of dividing the current encoding unit 300 of FIG. 3, and the non- Is determined in the process of dividing the current encoding unit 400 or 450 of FIG. 4, so that a detailed description thereof will be omitted.
- the image decoding apparatus 100 may include an index for identifying the size and type of the reference encoding unit Can be used. That is, the receiving unit 110 extracts a predetermined condition (for example, a data unit having a size smaller than a slice) among the various data units (e.g., a sequence, a picture, a slice, a slice segment, It is possible to obtain only an index for identifying the size and type of the reference encoding unit for each slice, slice segment, maximum encoding unit, and the like.
- a predetermined condition for example, a data unit having a size smaller than a slice
- the various data units e.g., a sequence, a picture, a slice, a slice segment, It is possible to obtain only an index for identifying the size and type of the reference encoding unit for each slice, slice segment, maximum encoding unit, and the like.
- the image decoding apparatus 100 can determine the size and shape of the reference data unit for each data unit satisfying the predetermined condition by using the index.
- the information on the type of the reference encoding unit and the information on the size of the reference encoding unit are obtained from the bitstream for each relatively small data unit and used, the use efficiency of the bitstream may not be good. Therefore, Information on the size of the reference encoding unit and information on the size of the reference encoding unit can be acquired and used. In this case, at least one of the size and the type of the reference encoding unit corresponding to the index indicating the size and type of the reference encoding unit may be predetermined.
- the image decoding apparatus 100 selects at least one of the size and the type of the reference encoding unit in accordance with the index, thereby obtaining at least one of the size and the type of the reference encoding unit included in the data unit, You can decide.
- the image decoding apparatus 100 may use at least one reference encoding unit included in one maximum encoding unit. That is, the maximum encoding unit for dividing an image may include at least one reference encoding unit, and the encoding unit may be determined through a recursive division process of each reference encoding unit. According to an exemplary embodiment, at least one of the width and the height of the maximum encoding unit may correspond to at least one integer multiple of the width and height of the reference encoding unit. According to an exemplary embodiment, the size of the reference encoding unit may be a size obtained by dividing the maximum encoding unit n times according to a quadtree structure.
- the image decoding apparatus 100 can determine the reference encoding unit by dividing the maximum encoding unit n times according to the quad tree structure, and determine the reference encoding unit as the block type information and the information about the split mode Based on at least one of them.
- FIG. 16 shows a processing block serving as a reference for determining a determination order of a reference encoding unit included in a picture 1600 according to an embodiment.
- the image decoding apparatus 100 may determine at least one processing block for dividing a picture.
- the processing block is a data unit including at least one reference encoding unit for dividing an image, and at least one reference encoding unit included in the processing block may be determined in a specific order. That is, the order of determination of at least one reference encoding unit determined in each processing block may correspond to one of various kinds of order in which the reference encoding unit can be determined, and the reference encoding unit determination order determined in each processing block May be different for each processing block.
- the order of determination of the reference encoding unit determined for each processing block is a raster scan, a Z scan, an N scan, an up-right diagonal scan, a horizontal scan a horizontal scan, and a vertical scan. However, the order that can be determined should not be limited to the scan orders.
- the image decoding apparatus 100 may obtain information on the size of the processing block and determine the size of the at least one processing block included in the image.
- the image decoding apparatus 100 may obtain information on the size of the processing block from the bitstream to determine the size of the at least one processing block included in the image.
- the size of such a processing block may be a predetermined size of a data unit represented by information on the size of the processing block.
- the receiving unit 110 of the image decoding apparatus 100 may obtain information on the size of a processing block from a bitstream for each specific data unit.
- information on the size of a processing block can be obtained from a bitstream in units of data such as an image, a sequence, a picture, a slice, a slice segment, and the like. That is, the receiving unit 110 may acquire information on the size of the processing block from the bitstream for each of the plurality of data units, and the image decoding apparatus 100 may use at least information on the size of the obtained processing block
- the size of one processing block may be determined, and the size of the processing block may be an integer multiple of the reference encoding unit.
- the image decoding apparatus 100 may determine the sizes of the processing blocks 1602 and 1612 included in the picture 1600.
- the video decoding apparatus 100 can determine the size of the processing block based on information on the size of the processing block obtained from the bitstream.
- the image decoding apparatus 100 according to an exemplary embodiment of the present invention may be configured such that the horizontal size of the processing blocks 1602 and 1612 is four times the horizontal size of the reference encoding unit, four times the vertical size of the reference encoding unit, You can decide.
- the image decoding apparatus 100 may determine an order in which at least one reference encoding unit is determined in at least one processing block.
- the video decoding apparatus 100 may determine each processing block 1602, 1612 included in the picture 1600 based on the size of the processing block, and may include in the processing blocks 1602, 1612 The determination order of at least one reference encoding unit is determined.
- the determination of the reference encoding unit may include determining the size of the reference encoding unit according to an embodiment.
- the image decoding apparatus 100 may obtain information on a determination order of at least one reference encoding unit included in at least one processing block from a bitstream, So that the order in which at least one reference encoding unit is determined can be determined.
- the information on the decision order can be defined in the order or direction in which the reference encoding units are determined in the processing block. That is, the order in which the reference encoding units are determined may be independently determined for each processing block.
- the image decoding apparatus 100 may obtain information on a determination order of a reference encoding unit from a bitstream for each specific data unit.
- the receiving unit 110 may acquire information on a determination order of a reference encoding unit from a bitstream for each data unit such as an image, a sequence, a picture, a slice, a slice segment, and a processing block. Since the information on the determination order of the reference encoding unit indicates the reference encoding unit determination order in the processing block, the information on the determination order can be obtained for each specific data unit including an integer number of processing blocks.
- the image decoding apparatus 100 may determine at least one reference encoding unit based on the determined order according to an embodiment.
- the receiving unit 110 may obtain information on the reference encoding unit determination order from the bitstream as the information related to the processing blocks 1602 and 1612, and the video decoding apparatus 100 may obtain the information 1602, and 1612, and determine at least one reference encoding unit included in the picture 1600 according to the determination order of the encoding units.
- the image decoding apparatus 100 may determine a determination order 1604 and 1614 of at least one reference encoding unit associated with each of the processing blocks 1602 and 1612. For example, when information on the order of determination of the reference encoding unit is obtained for each processing block, the reference encoding unit determination order associated with each processing block 1602, 1612 may be different for each processing block.
- the reference encoding unit determination order 1604 related to the processing block 1602 is a raster scan order
- the reference encoding unit included in the processing block 1602 can be determined according to the raster scan order.
- the reference encoding unit determination order 1614 related to the other processing block 1612 is a reverse order of the raster scan order
- the reference encoding unit included in the processing block 1612 can be determined according to the reverse order of the raster scan order.
- the image decoding apparatus 100 may decode the determined at least one reference encoding unit according to an embodiment.
- the image decoding apparatus 100 can decode an image based on the reference encoding unit determined through the above-described embodiment.
- the method of decoding the reference encoding unit may include various methods of decoding the image.
- the image decoding apparatus 100 may obtain block type information indicating a type of a current encoding unit or information on a split mode mode indicating a method of dividing a current encoding unit from a bitstream.
- Information about the block type information or the split mode mode may be included in a bitstream related to various data units.
- the video decoding apparatus 100 may include a sequence parameter set, a picture parameter set, a video parameter set, a slice header, a slice segment header slice block type information included in the segment header or information on the split mode mode can be used.
- the image decoding apparatus 100 may obtain a syntax element corresponding to information on the maximum encoding unit, the reference encoding unit, the block format information from the bit stream, or the split format mode for each processing block from the bit stream and use the syntax element.
- 17 is a diagram for explaining block type information according to an embodiment.
- the block type information may include the ratio or size of the shape, direction, width, and height of the encoding unit.
- the shape of the encoding unit may include a square and a non-square. If the width and height of the encoding unit are the same, the image decoding apparatus 100 can determine the shape of the encoding unit as a square. Also, the image decoding apparatus 100 can determine the ratio of the width and the height of the encoding unit to 1: 1 when the shape of the encoding unit is a square.
- the image decoding apparatus 100 can determine the shape of the encoding unit as a non-square. If the shape of the coding unit is non-square, the ratio of the width and height of the coding unit may include at least one of 1: 2, 2: 1, 1: 4, 4: 1, 1: 8, 8: .
- the image decoding apparatus 100 can determine the shape of the coding unit to be non-square. Also, the image decoding apparatus 100 can determine the ratio of the width and the height of the coding unit to 1: 2. Since the length of the width of the coding unit is shorter than the length of the height, the image decoding apparatus 100 can determine the direction of the coding unit in the vertical direction.
- the image decoding apparatus 100 can determine the shape of the coding unit as a non-square. Also, the image decoding apparatus 100 can determine the ratio of the width and the height of the coding unit to 2: 1. Further, since the length of the width of the encoding unit is longer than the length of the height, the image decoding apparatus 100 can determine the direction of the encoding unit in the horizontal direction.
- the image decoding apparatus 100 can determine the shape of the coding unit to be non-square. Also, the image decoding apparatus 100 can determine the ratio of the width and the height of the coding unit to 1: 4. Since the length of the width of the coding unit is shorter than the length of the height, the image decoding apparatus 100 can determine the direction of the coding unit in the vertical direction.
- the image decoding apparatus 100 can determine the shape of the encoding unit as a non-square. Also, the image decoding apparatus 100 can determine the ratio of the width and the height of the encoding unit to 4: 1. Further, since the length of the width of the encoding unit is longer than the length of the height, the image decoding apparatus 100 can determine the direction of the encoding unit in the horizontal direction.
- the image decoding apparatus 100 can determine the shape of the coding unit as a non-square. Also, the image decoding apparatus 100 can determine the ratio of the width and height of the encoding unit to 1: 8. Since the length of the width of the coding unit is shorter than the length of the height, the image decoding apparatus 100 can determine the direction of the coding unit in the vertical direction.
- the image decoding apparatus 100 can determine the shape of the encoding unit as a non-square. Also, the image decoding apparatus 100 can determine the ratio of the width and height of the encoding unit to 8: 1. Further, since the length of the width of the encoding unit is longer than the length of the height, the image decoding apparatus 100 can determine the direction of the encoding unit in the horizontal direction.
- 18 is a diagram for explaining block type information according to an embodiment.
- the encoding unit may have various sizes.
- the video decoding apparatus 100 can determine that the length of the coding unit width is at least one of 4, 8, 16, 32, 64 and 128. [
- the video decoding apparatus 100 can determine that the ratio of the width and height of the coding unit is at least one of 8: 1, 4: 1, 2: 1, 1: 1, 1: 2, 1: 4, have.
- the image decoding apparatus 100 can determine the size of the encoding unit based on the length of the long side of the encoding unit and the ratio of the width and height of the encoding unit. For example, the image decoding apparatus 100 can determine the length of the coding unit to be 4. Also, the image decoding apparatus 100 can determine the ratio of the width and height of the coding unit to 1: 1.
- the image decoding apparatus 100 can determine the size of the encoding unit to be 4x4 based on the length of the long side of the encoding unit and the ratio of the width and height of the encoding unit.
- the present invention is not limited to this, and the length of the width of the encoding unit and the length of the height may be equal to or larger than 256.
- the ratio of the width and height of the encoding unit may include 16: 1, 1:16, and the like.
- the image decoding apparatus 100 may not allow the encoding unit of a specific size.
- an encoding unit not permitted by the video decoding apparatus 100 is indicated by " X ".
- the width of the encoding unit is 4, and the ratio of the width to the height is 4: 1, the size of the encoding unit is 4x1.
- the image decoding apparatus 100 may not allow a 4x1 coding unit.
- the video decoding apparatus 100 receives a bit stream from the video encoding apparatus 2200.
- the image decoding apparatus 100 can determine the context model based on the block type information including at least one of the ratio or the size of the shape, direction, width, and height of the encoding unit.
- the video decoding apparatus 100 may perform entropy decoding based on the context model to obtain a syntax element from the bitstream.
- the image decoding apparatus 100 can restore the encoding unit based on the syntax element.
- the syntax element is various information used for decoding the image.
- the syntax element includes a skip flag, a prediction mode, a motion vector difference, a motion vector prediction method or a transform quantized coefficient, a coded block pattern, a coded block flag, an intra prediction mode, prediction direction, transform index, and the like.
- the skip flag is a syntax element used to predict the encoding unit.
- the image decoding apparatus 100 can determine whether to predict the encoding unit in the skip mode or the other mode according to the skip flag.
- skip mode is a mode for predicting a current block by using the similarity between the current block and neighboring blocks adjacent to the current block.
- the neighboring block can be restored before the current block.
- the neighboring blocks may include the lower left, left, upper left, upper, upper right, right, and lower right blocks of the current block.
- the image decoding apparatus 100 may obtain a syntax reference element for selecting a reference image from the bitstream.
- the image decoding apparatus 100 can acquire the reference image based on the obtained syntax index.
- the video decoding apparatus 100 can determine the motion vector of the current block using the motion vector of the neighboring block.
- the image decoding apparatus 100 may obtain a reference block included in the reference image based on the motion vector of the current block. In the skip mode, the video decoding apparatus 100 can recover the current block based on the obtained reference block without acquiring information related to the residual from the bitstream.
- the prediction mode is a syntax element indicating whether the current block is predicted in inter mode or intra mode.
- the prediction mode can be obtained from the bitstream when the skip flag indicates that the skip is not skip.
- the video decoding apparatus 100 receives the differential motion vector from the received bit stream to predict the current image based on a syntax element (merge flag or direct flag) Can be determined.
- the merge flag is a syntax element indicating whether to receive a differential motion vector to predict the current block.
- the video decoding apparatus 100 receives a motion vector difference ) To obtain a difference motion vector.
- the image decoding apparatus 100 can determine the neighboring blocks of the current block as candidate blocks.
- the image decoding apparatus 100 may select one of the candidate blocks based on a motion vector prediction index obtained from the bitstream.
- the image decoding apparatus 100 may obtain a motion vector of a selected candidate block as a predicted motion vector.
- the image decoding apparatus 100 may obtain the motion vector of the current block based on the differential motion vector and the predictive motion vector received from the bitstream.
- the image decoding apparatus 100 may acquire a reference index for selecting a reference image from the received bitstream.
- the image decoding apparatus 100 can acquire the reference image based on the syntax element.
- the image decoding apparatus 100 may obtain a reference block included in the reference image based on the motion vector of the current block.
- the image decoding apparatus 100 can obtain the predicted current block based on the reference block.
- the video decoding apparatus 100 can obtain residual based on the quantized transform coefficient obtained from the bit stream.
- the image decoding apparatus 100 can restore the current block based on the predicted current block and the residual.
- the video decoding apparatus 100 may acquire neighboring blocks of the current block as candidate blocks.
- the image decoding apparatus 100 may select one of the candidate blocks based on a motion vector prediction index obtained from the bitstream.
- the image decoding apparatus 100 may obtain the motion vector of the selected candidate block as a motion vector of the current block.
- the image decoding apparatus 100 can restore the current block based on the motion vector of the current block similarly to the case where the merge flag indicates that the differential motion vector is received.
- the video decoding apparatus 100 may obtain a syntax element (intra prediction mode) related to the intra prediction mode from the bitstream.
- the video decoding apparatus 100 can select the intra prediction mode based on the syntax element related to the intra prediction mode.
- the intra-prediction mode may include 33 directional prediction modes, a DC mode, and a planar mode.
- the present invention is not limited thereto, and the direction prediction mode of the intra prediction mode can be subdivided into 62 direction prediction modes.
- the intra-prediction mode may include at least one of a DC mode, a vertical mode, a horizontal mode, a planar mode, a diagonal mode in an upper left and lower right direction, and a diagonal mode in an upper right and lower left direction .
- the video decoding apparatus 100 may receive a syntax prediction element indicating a prediction direction from the bitstream.
- the video decoding apparatus 100 can select at least one direction from a plurality of directions based on the syntax element.
- the coded block flag is a syntax element indicating whether or not one or more non-zero quantized transform coefficients exist in an encoding unit (or a conversion unit). For example, when the CBF value for the coding unit is 1, the image decoding apparatus 100 reads the quantized transform coefficients of the coding unit from the bit stream and performs inverse transform. Also, when the CBF value for the encoding unit is 0, the image decoding apparatus 100 can determine that the value of all the quantized transform coefficients in the encoding unit is zero. Therefore, the image decoding apparatus 100 may not perform an inverse conversion process on the encoding unit.
- a coded block pattern (CBP) is a syntactic element that collectively represents a CBF.
- Quantization is a process of approximating a transform coefficient to a plurality of representative values.
- the image encoding apparatus can obtain the quantized transform coefficient by dividing the transform coefficient by the quantization rate.
- the image decoding apparatus 100 may acquire the transform coefficients obtained from the bit stream and multiply the quantized transform coefficients by the quantization rates. Since the quantization rate has a real value, an integer value corresponding to the quantization rate can be defined in order to reduce the complexity of implementation of the codec.
- the quantization parameter may have an integer value as a syntax element corresponding to the quantization rate. Since the image decoding apparatus 100 may have 52 quantization rates, the quantization parameter may have a value from 0 to 51. [ However, the present invention is not limited thereto.
- the image decoding apparatus 100 can generate a residue which is a value of the spatial domain by inversely transforming the transform coefficient of the value of the frequency domain.
- the video decoding apparatus 100 may use a plurality of kernels for inverse transformation.
- the image decoding apparatus 100 may perform a reverse conversion by selecting one of the plurality of kernels based on a transform index obtained from the bitstream.
- the transform index may be a syntax element obtained from the bitstream.
- the image decoding apparatus 100 can obtain the quantization parameter from the bit stream for each encoding unit. In order to remove the redundancy of the information between the reconstructed encoding unit and the quantization parameter of the current encoding unit, the image decoding apparatus 100 performs a quantization process on the quantization parameter of the reconstructed encoding unit and the quantization parameter of the current encoding unit Can be obtained from the bitstream.
- delta QP is a syntax element indicating the difference between the quantization parameter of the reconstructed encoding unit and the quantization parameter of the current encoding unit.
- Entropy coding is a lossless compression technique that operates based on the probability of occurrence of a syntax element to be coded.
- entropy coding When entropy coding is performed in the image coding apparatus 2200, it is called entropy coding, and the image coding apparatus 2200 compresses the syntax element based on entropy coding.
- entropy decoding When entropy coding is performed in the video decoding apparatus 100, it is called entropy decoding, and the video decoding apparatus 100 acquires a syntax element from the bitstream based on entropy decoding.
- entropy coding With entropy coding, a short bit can be assigned to a syntax element that appears frequently, and a long bit can be assigned to a syntax element that does not appear frequently, using statistics of a syntax element. According to entropy coding, since the same information can be transmitted in a short bit, the bit transmission efficiency can be improved.
- the type of entropy coding may be CABAC (Context-Adaptive Binary Arithmetic Coding) or CAVLC (Context-Adaptive Variable Length Coding).
- a context model that applies a probability value to the bean to be decoded is assigned, and the bean can be coded (entropy encoding / entropy decoding) based on the assigned context model. After coding for each bin, the context model may be updated.
- 19 is a diagram for explaining a process of determining a context model according to block type information according to an embodiment.
- the block type information may include at least one of the ratio, or the size, of the shape, direction, width, and height of the encoding unit.
- the image decoding apparatus 100 can determine the context model of the syntax element according to the shape of the encoding unit. Referring to Table 1910, the image decoding apparatus 100 can individually determine a context model for the square encoding unit 1911 and the non-square encoding unit 1915.
- the square shape 1911 may have a ratio of the width to the height of 1: 1.
- the non-square shape may be at least one of a ratio of the width to the height of 8: 1, 4: 1, 2: 1, 1: 2, 1: 4 and 1:
- the image decoding apparatus 100 may use different context models for the square encoding unit 1911 and the non-square encoding unit 1915. [ The image decoding apparatus 100 may use the same context model for at least one of the ratios of the width and the height of the non-square encoding unit 1915 and the square encoding unit 1911 .
- the image decoding apparatus 100 may assign an index for a predetermined context model to the square encoding unit 1911 and the non-square encoding unit 1915, respectively.
- the image decoding apparatus 100 can determine the block type information of the current encoding unit. For example, the image decoding apparatus 100 may determine that the block type information of the current encoding unit is a square encoding unit or a non-square encoding unit.
- the image decoding apparatus 100 can determine the index for the context model based on the block type information of the current encoding unit.
- the image decoding apparatus 100 can determine the context model based on the index for the context model.
- the image decoding apparatus 100 can determine the context model of the syntax element according to the direction of the encoding unit. Referring to Table 1920, the image decoding apparatus 100 can individually determine a context model for a horizontal encoding unit 1921, a vertical encoding unit 1923, and a square-shaped encoding unit 1922 have. For example, the image decoding apparatus 100 can use the first context model for the horizontal encoding unit 1921. [ Also, the image decoding apparatus 100 can use the second context model for the vertical encoding unit 1923. [ In addition, the third context model can be used for the square-shaped encoding unit 1922. However, the present invention is not limited to this, and the image decoding apparatus 100 can use the same context model for a part of the horizontal direction encoding unit 1921, the vertical direction encoding unit 1923, or the square shape encoding unit 1922 have.
- the image decoding apparatus 100 can assign an index for a predetermined context model to each of a horizontal encoding unit 1921, a vertical encoding unit 1923, and a square-shaped encoding unit 1922.
- the image decoding apparatus 100 can determine the block type information of the current encoding unit. For example, the image decoding apparatus 100 can determine that the block type information of the current encoding unit is one of a horizontal encoding unit, a vertical encoding unit, and a square encoding unit.
- the image decoding apparatus 100 can determine the index for the context model based on the block type information of the current encoding unit.
- the image decoding apparatus 100 can determine the context model based on the index for the context model.
- the video decoding apparatus 100 can determine the context model of the syntax element according to the ratio of the width of the coding unit and the length of the height.
- the ratio of the widths of the coding units to the lengths of the heights is at least one of 8: 1, 4: 1, 2: 1, 1: 1, 1: 2, 1: 4, .
- the present invention is not limited to this, and the ratio of the width and height of the encoding unit may include 1: 2 ⁇ M and 2 ⁇ M: 1. Where M is a positive integer.
- the video decoding apparatus 100 includes a coding unit 1931 having a ratio of the width to the height of 8: 1, a coding unit 1932 having the ratio of the width to the height of 4: 1, a ratio of the width to the height
- a coding unit 1933 having a ratio of the length of the width to a height of the coding unit 1933; a coding unit 1935 having a ratio of the length of the width to the height of 1: 2;
- the coding unit 1936 having a length ratio of 1: 4 and the coding unit 1937 having a ratio of the width to the height of 1: 8 can independently determine the context model.
- the image decoding apparatus 100 may use different context models according to the ratios. In addition, the same context model can be used for the ratios of lengths of some of the width and height of the image decoding apparatus 100.
- the image decoding apparatus 100 may assign an index to a predetermined context model in accordance with the ratio of encoding units.
- the image decoding apparatus 100 can determine the block type information of the current encoding unit. For example, the image decoding apparatus 100 may determine that the block type information of the current encoding unit is one of 8: 1, 4: 1, 2: 1, 1: 1, 1: 2, 1: You can decide.
- the image decoding apparatus 100 can determine the index for the context model based on the block type information of the current encoding unit.
- the image decoding apparatus 100 can determine the context model based on the index for the context model.
- the video decoding apparatus 100 can determine the context model based on the arithmetic relationship of the width and the height of the coding unit.
- the image decoding apparatus 100 can determine the difference between the value obtained by taking log2 as the length of the width and the value obtained by taking the length of the height as log2 as the index for the context model.
- the image decoding apparatus 100 can determine the context model based on the index for the context model.
- the image decoding apparatus 100 can determine the context model of the syntax element according to the size of the encoding unit. For example, the image decoding apparatus 100 can determine the context model based on at least one of a length of a coding unit, a length of a coding unit, a length of a long side, a length of a short side, or an area of an encoding unit.
- the video decoding apparatus 100 can individually determine the context model based on the length of one side of the encoding unit. Referring to the table 1940, the video decoding apparatus 100 can use the same context model for the same length of coding units of long sides.
- the coding units 1941 have a length of 4 on the long side.
- the coding units 1942 have a length of 8 on the long side.
- the encoding units 1943 are 16 long sides.
- the coding units 1944 have a length of 32 on the long side.
- the coding units 1945 have a long side of 64 in length.
- the encoding units 1946 are 128 long sides long.
- the image decoding apparatus 100 may use another context model when the length of the long side is different. However, the present invention is not limited thereto, and the image decoding apparatus 100 may use the same context model for some long side lengths. Also, the video decoding apparatus 100 can determine the context model individually according to the length of the short side.
- the image decoding apparatus 100 may assign an index to a predetermined context model according to the length of the long side of the encoding unit.
- the image decoding apparatus 100 can determine the block type information of the current encoding unit. For example, the image decoding apparatus 100 can determine that the length of the long side of the current encoding unit is any one of 4 to 258. [
- the image decoding apparatus 100 can determine the index for the context model based on the block type information of the current encoding unit.
- the image decoding apparatus 100 can determine the context model based on the index for the context model. For convenience of description, the length of the long side has been described as a reference, but the image decoding apparatus 100 can determine the index of the context model based on the length of the short side.
- the video decoding apparatus 100 can determine the context model based on the length of the longer side of the encoding unit.
- the image decoding apparatus 100 can determine a value obtained by taking log2 as the length of the longer side of the current encoding unit as an index for the context model.
- the image decoding apparatus 100 can determine the context model based on the index for the context model.
- the image decoding apparatus 100 may determine the index of the context model based on the length of the short side of the image decoding apparatus 100.
- the context model can be determined individually.
- the image decoding apparatus 100 may use different context models for different encoding units.
- the present invention is not limited thereto, and the image decoding apparatus 100 may use the same context model for different areas.
- the video decoding apparatus 100 can individually determine the context model based on the area range. For example, when the area of the coding unit is smaller than or equal to 64, the image decoding apparatus 100 can decide to use the first context model. Also, when the area of the coding unit is larger than 64 and smaller than or equal to 256, the image decoding apparatus 100 can decide to use the second context model. Also, when the area of the coding unit is larger than 256 and smaller than or equal to 1024, the image decoding apparatus 100 can decide to use the third context model. Also, when the area of the coding unit is larger than 1024 and smaller than or equal to 4096, the image decoding apparatus 100 can decide to use the fourth context model. Also, when the area of the coding unit is larger than 4096, the image decoding apparatus 100 can decide to use the fifth context model.
- the image decoding apparatus 100 may assign an index for a predetermined context model according to the width of the encoding unit.
- the image decoding apparatus 100 can determine the block type information of the current encoding unit. For example, the image decoding apparatus 100 can determine that the width of the current encoding unit is one of 16 to 65536.
- the image decoding apparatus 100 can determine the index for the context model based on the block type information of the current encoding unit.
- the image decoding apparatus 100 can determine the context model based on the index for the context model.
- the video decoding apparatus 100 can determine the context model based on the width of the encoding unit.
- the image decoding apparatus 100 can determine a value obtained by taking log2 as the width of the current encoding unit as an index for the context model.
- the image decoding apparatus 100 can determine the context model based on the index for the context model.
- the video decoding apparatus 100 can determine the context models of the syntax elements by grouping them.
- the video decoding apparatus 100 can set a plurality of block type information into the same group.
- the image decoding apparatus 100 can set a plurality of shapes of coding units into one group.
- the image decoding apparatus 100 can set a plurality of directions of the encoding units into one group.
- the image decoding apparatus 100 can set a plurality of widths and height ratios of the encoding units into one group. Or the image decoding apparatus 100 may set a plurality of sizes of encoding units into one group.
- One group can correspond to one context model.
- the video decoding apparatus 100 can determine the context model based on the group.
- the video decoding apparatus 100 can determine to use the same context model for a plurality of widths and heights of encoding units. Also, the video decoding apparatus 100 can determine to use the same context model for a plurality of sizes of coding units. For example, for an encoding unit where the ratio of the width to the height is 1: 2 or 2: 1, the image decoding apparatus 100 may decide to use the same context model. Also, for a coding unit whose ratio of width to height is 1: 2 or 1: 4, the image decoding apparatus 100 can decide to use the same context model.
- the image decoding apparatus 100 can determine the context model based on a combination of the ratio or the size of the shape, direction, width, and height of the encoding unit.
- the image decoding apparatus 100 can obtain an index of the context model according to a combination of the shape, the direction, the width, and the height ratio or the size of the coding unit in an array (or table).
- the image decoding apparatus 100 can receive the arrangement from the image encoding apparatus 2200. [ Alternatively, the image decoding apparatus 100 and the image encoding apparatus 2200 may use a predetermined arrangement. The arrangement may be more than two dimensions.
- the video decoding apparatus 100 can determine the context model based on the index of the context model and acquire the syntax based on the context model.
- the first block type information may be a shape of an encoding unit.
- the second block type may be the size of an encoding unit.
- the video decoding apparatus 100 can determine the context model based on the combination of the first block type and the second block type.
- the first block type information indicates a square and the length of the long side included in the second block type information indicates 16
- the video decoding apparatus 100 can select the first context model.
- the length of the long side included in the second block type information is 16
- the first block type information indicates non-square
- the video decoding apparatus 100 can select the second context model.
- the image decoding apparatus 100 can select the third context model.
- the mapping relationship between the combination of the block type information and the context model can be represented by a two-dimensional array (or table).
- a context model based on two pieces of block type information has been described.
- the present invention is not limited thereto, and the video decoding apparatus 100 may determine a context model based on three or more pieces of block type information.
- the arrangement for mapping the three or more block type information and the context model may be three dimensional or more.
- the video decoding apparatus 100 may use the context model for the syntax element of the neighboring encoding unit adjacent to the current encoding unit to determine the context model for the syntax element of the current encoding unit. Since the surrounding encoding unit is restored before the current encoding unit, the image decoding apparatus 100 may have information on the context model of the surrounding encoding unit. For example, the video decoding apparatus 100 can determine the context model of the surrounding encoding unit as the context model of the current encoding unit.
- the image decoding apparatus 100 may use the syntax element of the neighboring encoding unit adjacent to the current encoding unit to determine the context model for the syntax element of the current encoding unit.
- the surrounding code and the syntax element of the unit may be similar to the syntax element of the current coding unit. For example, when the surrounding encoding unit is divided based on the information on the split mode mode, it is possible that the current encoding unit is also divided based on the information on the similar split mode mode.
- the video decoding apparatus 100 can determine the context model of the current encoding unit based on the arrangement (or table) for mapping the syntax element of the surrounding encoding unit and the context model of the current encoding unit. Also, the image decoding apparatus 100 can acquire the syntax element based on the context model of the current encoding unit.
- the syntax element may include information on the division type mode of the current encoding unit.
- 20 is a diagram for explaining a method of determining a context model according to an embodiment.
- the image decoding apparatus 100 may obtain an arrangement for mapping an index to the context model and at least one of the ratio or size of the shape, direction, width, and height of the encoding unit to determine the context model.
- the image decoding apparatus 100 and the image encoding apparatus 2200 may store an array.
- the image encoding apparatus 2200 can transmit the array to the image decoding apparatus 100 through the bit stream.
- the array can be a one-dimensional array. That is, the array can correspond one-to-one with the indexes of the context model, either the ratio or size of the shape, direction, width, and height of the coding unit.
- an array may include an index for the context model for each of the 4x4, 4x8, 8x4, 8x8, 16x4, 16,8, 16x16 ... sized units of coding.
- the array can be a two-dimensional array. That is, the arrangement may include an index for the context model for a combination of two or more of the shape, direction, width and height of the coding unit or size.
- the array is not limited to two dimensions, and the array may be more than three dimensions.
- the arrangement may be the same as table 2000.
- the horizontal axis of the table 2000 indicates the length of the height.
- the vertical axis of table 2000 may indicate the length of the width.
- the axis may be one of width, height, length of long side, length of short side, ratio of length of width and height, and width.
- the first axis may be a length of a long side
- the second axis other than the first axis may be a ratio of a width and a height.
- the array 2000 may include indices for the context model according to at least one of the ratio, or size, of the shape, direction, width, and height of the encoding unit.
- the array may contain indices according to the size of the encoding unit. Referring to table 2000, the index for the 4x8, 4x16, 8x4, 8x8 and 16x8 encoding units may be '4'. Also, the index for encoding units of 8x16, 8x32, 16x8, 16x16 and 32x16 sizes may be '3'. Also, the index for the 16x32, 16x64, 32x16, 32x32, and 64x16 encoding units may be '2'.
- index for 32x64, 32x128, 64x32, 64x64 and 128x32 size coding units may be '1'.
- index for 64x128, 128x64, and 128x128 encoding units may be '0'.
- the image decoding apparatus 100 may obtain an index for the context model based on at least one of the ratio, or the size, of the shape, direction, width, and height of the encoding unit in the arrangement. Referring to Table 2000, the image decoding apparatus 100 can determine '1' as an index for a 64x64 encoding unit.
- the image decoding apparatus 100 may not define an index for the context model of the encoding unit with respect to the predetermined block type information. Referring to Table 2000, the image decoding apparatus 100 may not define an index for the context model for 4x4, 4x32, 4x64, 4x128, 32x4, 64x4, 64x8, 128x4, 128x8, .
- the image decoding apparatus 100 may not define an index for the context model. For example, the image decoding apparatus 100 may not allow a 4x1 encoding unit. In this case, the image decoding apparatus 100 may not define an index for a 4x1 encoding unit.
- the image decoding apparatus 100 may not define an index.
- the syntax element may include information about the split mode mode.
- the image decoding apparatus 100 can always divide a 256x256 size coding unit into quad divisions. That is, the image decoding apparatus 100 can divide a 256x256-size encoding unit without a syntax element. Therefore, the image decoding apparatus 100 may not define an index for the context model for a syntax unit of a coding unit having a size of 256x256.
- the video decoding apparatus 100 can determine the context model of the encoding unit based on the index of the context model.
- the video decoding apparatus 100 may determine the context model based on a sum of an index and a predetermined offset to the context model in order to avoid interference between different syntax elements.
- the image decoding apparatus 100 can determine the context model of the current encoding unit based on the syntax element or the context model of the neighboring block adjacent to the current encoding unit.
- FIG. 24 is a view for explaining a method of indicating the division of the current encoding unit.
- split_unit can represent the syntax for dividing the current encoding unit.
- the information on the split mode mode may include at least one of information indicating whether to split, split direction information, and split type information.
- the information indicating whether to divide or not indicates whether to divide the current encoding unit.
- the division direction information indicates division into one of a horizontal direction and a vertical direction.
- the division type information indicates that the encoding unit is divided into one of a binary split, a triple split, or a quad split.
- Binary segmentation means dividing one of the height or width of an encoding unit by half.
- the trie segmentation means that one of the height or the width of the encoding unit is divided into 1: 2: 1.
- Quad division also means dividing the height and width of the encoding unit by half.
- split_mode the information about the split mode into information indicating split, division direction, and split type information
- the information on the split mode mode may be expressed by a combination of information indicating whether the split mode is used, split direction information, or split type information.
- the split mode information (split_mode) may indicate that the current encoding unit is not segmented (NO_SPLIT).
- Information about the split mode mode may also represent a quad split (QUAD_SPLIT).
- the information on the split mode mode may also represent a binary vertical split (BI_VER_SPLIT).
- BI_VER_SPLIT binary vertical split
- the information on the split mode mode may also represent a binary vertical split (BI_VER_SPLIT).
- the information on the split mode mode may indicate a binary horizontal split (BI_HOR_SPLIT).
- the information on the split mode mode may also indicate a trie vertical split (TRI_VER_SPLIT).
- the information on the split mode mode may also indicate a TRI_HOR_SPLIT.
- the image decoding apparatus 100 can acquire information on the split mode mode based on the bin string.
- the video decoding apparatus 100 can determine whether to divide a coding unit, a dividing direction and a dividing type based on an empty string.
- An empty string is a binary sequence of information.
- the empty string may consist of at least one bit.
- the image decoding apparatus 100 can determine the number of bits of the bin string based on the number of division mode modes that are acceptable for the current encoding unit. For example, the image decoding apparatus 100 can determine that there is a mode in which the current encoding unit is divided or not divided. That is, the number of divide mode modes that can be accepted from the current encoding unit may be two.
- the image decoding apparatus 100 may determine the information on the division type mode of the encoding unit based on the bin string of information on the division mode including one bit roll. One bit may indicate whether to split. The bit may indicate not partition (NO_SPLIT). When the bit indicates division, the video decoding apparatus 100 can determine the division direction or the division type based on the allowable division mode of the current coding unit.
- the image decoding apparatus 100 can determine information on the division mode mode of the encoding unit based on the bin string including two bit rolls.
- the first bit of the empty string may indicate whether or not to divide.
- the second bit of the empty string may indicate the split type or the split direction.
- the image decoding apparatus 100 can determine the division direction or the division type based on the allowable division mode of the current coding unit.
- the image decoding apparatus 100 can divide the encoding unit based on the empty string including three bit rolls.
- the first bit of the empty string may indicate whether or not to divide.
- the second bit of the empty string may indicate the split type or the split direction.
- the third bit of the bin string may indicate a split direction or a split type.
- the video decoding apparatus 100 may determine a split direction or a split type based on an allowable split mode mode of the current encoding unit.
- the image decoding apparatus 100 can acquire information on the partition mode from the bitstream, but the present invention is not limited thereto.
- the image decoding apparatus 100 can acquire information on the split mode mode based on the partition rule prearranged with the image encoding apparatus 2200.
- the image decoding apparatus 100 can acquire information on the promised divided mode mode based on the size of the current encoding unit. For example, the image decoding apparatus 100 may determine the information on the split mode mode as quad split (QUAD_SPLIT) for the coding unit of the maximum size. Also, the image decoding apparatus 100 may determine not to divide information on the split mode mode (NO_SPLIT) for the minimum size encoding unit.
- 21 is a diagram for explaining a method of determining a context model according to an embodiment.
- Block 2110 defines an arrangement for mapping at least one of the ratio, or size, of the shape, direction, width, and height of the encoding unit to an index for the context model.
- ifvc_tbl_split_flag_ctx indicates an index for the context model for determining a predetermined bit included in the information on the division type mode of the coding unit. More specifically, ifvc_tbl_split_flag_ctx may be related to information indicating whether to divide the current encoding unit among pieces of information on the split mode mode.
- the array of blocks 2110 is a two-dimensional array of 6X6.
- NB, NC, ⁇ 4, 3, 3, 2, 2, NB ⁇ , ⁇ 4, 4, NB, 3, 2, 2, 1, 1 ⁇ , ⁇ NC, NB, 2, 1, 1, 0 ⁇ and ⁇ NC, NC, NB, 1, 0, 0 ⁇ . NA, NB, and NC indicate that information on the split mode mode is not defined.
- the image decoding apparatus 100 may not need to define a context model.
- the context model may not be defined for the sizes of encoding units that are not allowed in the video decoding apparatus 100.
- the arrangement of block 2110 may be the same as table 2000 of FIG.
- the image decoding apparatus 100 and the image encoding apparatus 2200 may store an array in advance. Also, the image decoding apparatus 100 can obtain an array from a bitstream.
- the video decoding apparatus 100 may determine the context model based on the block type information including at least one of the ratio, or the size, of the shape, direction, width, and height of the surrounding encoding unit adjacent to the encoding unit.
- the surrounding encoding unit may include at least one of a left, a left, an upper left, an upper right, an upper right, and a lower right encoding unit of the encoding unit.
- the surrounding encoding unit can be restored before the current encoding unit. Since the surrounding encoding unit is adjacent to the current encoding unit spatially or temporally, there is a possibility of using a similar context model. Therefore, when determining the context model based on the block type information of the surrounding encoding unit, fewer bits can be used to entropy code the syntax element.
- the image decoding apparatus 100 can compare the length of the width of the surrounding encoding unit and the length of the width of the current encoding unit. Also, the image decoding apparatus 100 can compare the lengths of the left and right neighboring blocks with the lengths of the encoding units. Also, the image decoding apparatus 100 can determine the context model based on the comparison results. The case where the context model is determined based on at least one of the ratio, or the size, of the shape, direction, width and height of the surrounding encoding unit will be described in detail together with the block 2120.
- w [i] may represent the width of the surrounding encoding unit.
- h [i] may represent the height of the surrounding encoding unit. If i is '0', the upper surrounding encoding unit can be represented. If i is '1', it can represent the left surround encoding unit. If i is '2', it can indicate the right surrounding encoding unit.
- the video decoding apparatus 100 can compare the width of the current encoding unit with the width of the upper surrounding encoding unit. Also, the image decoding apparatus 100 can obtain comparison result information (smaller [0]). For example, if the width of the current encoding unit is larger than the width of the upper surrounding encoding unit, the image decoding apparatus 100 may set the comparison result information (smaller [0]) to '1'. If the width of the current encoding unit is not larger than the width of the upper surrounding encoding unit, the image decoding apparatus 100 may set the comparison result information (smaller [0]) to '0'.
- the image decoding apparatus 100 can compare the height of the current encoding unit with the height of the left or right surrounding encoding unit. Also, the image decoding apparatus 100 can obtain comparison result information (smaller [1] or smaller [2]). For example, if the height of the current encoding unit is greater than the height of the left or right neighbor encoding unit, the image decoding apparatus 100 may set the comparison result information (smaller [1] or smaller [2]) to '1' . If the height of the current encoding unit is not greater than the height of the left or right neighbor encoding unit, the image decoding apparatus 100 may set the comparison result information (smaller [1] or smaller [2]) to '0'.
- the image decoding apparatus 100 can acquire the context model ctx based on the comparison results.
- the context model ctx can be determined based on the smaller of the sum of the comparison result information (smaller [0] + smaller [1] + smaller [1]) and 2 smaller.
- the video decoding apparatus 100 may obtain an index (ifvc_tbl_split_flag_ctx) for the context model based on the arrangement of the block 2110.
- [ log2_cuw is the value obtained by taking log2 as the width of the current encoding unit.
- log2_cuh is the value obtained by taking log2 as the height of the current encoding unit.
- the video decoding apparatus 100 can obtain an index (ifvc_tbl_split_flag_ctx [log2_cuw-2] [log2_cuh-2]) for the context model from the arrangement of the blocks 2110 based on the size of the current encoding unit.
- the video decoding apparatus 100 can determine the context model ctx based on the index for the context model.
- the video decoding apparatus 100 can entropy-decode the bitstream based on the context model ctx to acquire the syntax element.
- the syntax element may be information indicating whether or not the current encoding unit is divided.
- the video decoding apparatus 100 can determine the context model (ctx_dir) for the dividing direction information based on the size of the coding unit. Referring to block 2130, log2_cuw is the value obtained by taking log2 as the width of the current encoding unit. Also, log2_cuh is the value obtained by taking log2 as the height of the current encoding unit. The video decoding apparatus 100 can determine the context model (ctx_dir) for the dividing direction information based on the length of the width and the height of the coding unit. Specifically, the video decoding apparatus 100 can determine the context model (ctx_dir) for the dividing direction information based on the value related to the ratio of the width and the height of the coding unit.
- log2_cuw-log2_cuh is the value obtained by dividing the width of the encoding unit by the height and taking log2. That is, log2_cuw-log2_cuh may be a value related to the ratio of the width and the height of the encoding unit.
- the video decoding apparatus 100 may obtain the context model ctx_dir based on the offset dir_ctx_offset.
- the offset (dir_ctx_offset) may be a value to avoid duplication with the context model for other syntaxes.
- the offset may be an integer including zero.
- the video decoding apparatus 100 can entropy-decode the bitstream based on the context model (ctx_dir) to acquire a syntax element related to the division direction information.
- the video decoding apparatus 100 can determine the division type mode of the current coding unit based on the division direction information. For example, the division type mode of the current encoding unit may be horizontal division or vertical division.
- the video decoding apparatus 100 can divide an encoding unit based on the division direction information.
- the video decoding apparatus 100 may determine the context model (ctx_typ) for the partition type information based on the offset (typ_ctx_offset). Referring to block 2140, the video decoding apparatus 100 may obtain the context model ctx_typ based on an offset (typ_ctx_offset).
- the offset (typ_ctx_offset) is a value to avoid duplication with other context models.
- the offset (typ_ctx_offset) may be a value to be determined in advance between the image encoding apparatus 2200 and the image decoding apparatus 100. Or the image encoding apparatus 2200 can transmit information on the offset (typ_ctx_offset) to the image decoding apparatus 100.
- the video decoding apparatus 100 may obtain an offset (typ_ctx_offset) from the bit stream.
- the video decoding apparatus 100 can determine the division type mode of the current encoding unit based on the division type information.
- the division type mode of the current encoding unit may be one of a binary split, a triple split, or a quad split.
- the video decoding apparatus 100 can divide the encoding unit based on the division type information.
- FIG. 22 shows a schematic block diagram of an image encoding apparatus according to an embodiment.
- the image encoding apparatus 2200 may include a coding unit 2210 and a bitstream generating unit 2220.
- the encoding unit 2210 can encode the input image by receiving the input image.
- the encoding unit 2210 may encode the input image to obtain at least one syntax element.
- the syntax element includes a skip flag, a prediction mode, a motion vector difference, a motion vector prediction method or a transform quantized coefficient, a coded block pattern, a coded block flag, an intra prediction mode, a prediction direction, and a transform index.
- the encoding unit 2210 can determine the context model based on the block type information including at least one of the ratio, or the size, of the shape, direction, width, and height of the encoding unit.
- the bitstream generator 2220 can generate a bitstream based on the encoded input image. For example, the bitstream generator 2220 can generate a bitstream by entropy encoding the syntax element based on the context model. In addition, the image encoding apparatus 2200 can transmit the bit stream to the image decoding apparatus 100. The detailed operation of the image encoding apparatus 2200 will be described with reference to FIG.
- FIG. 23 shows a flowchart of an image encoding method according to an embodiment.
- FIG. 23 relates to a video encoding method and includes contents similar to those of the video decoding method and apparatus described with reference to FIGS. 3 to 21, and a duplicate description will be omitted.
- the image encoding apparatus 2200 performs a step 2310 of determining information on the split mode mode based on the split mode mode of the encoding unit.
- the image encoding apparatus 2200 performs a step 2320 of determining a context model based on at least one of the ratio, or the size, of the shape, direction, width, and height of the encoding unit.
- the image encoding apparatus 2200 performs a step 2330 of generating a bit stream based on the context model and information on a split mode for dividing an encoding unit.
- the image encoding apparatus 2200 may obtain an arrangement for mapping at least one of the ratio, or the size, of the shape, direction, width, and height of the encoding unit to the index for the context model, in order to determine the context model.
- the image encoding apparatus 2200 can obtain an index for the context model based on at least one of the ratio, or the size, of the shape, direction, width, and height of the encoding unit in the arrangement.
- the image encoding device 2200 can determine the context model based on the index for the context model.
- the image encoding device 2200 performs a context model based on block type information including at least one of the ratio, or the size, of the shape, direction, width, and height of the neighboring encoding units adjacent to the encoding unit You can decide.
- the surrounding encoding unit may include at least one of a left side, a left side, an upper left side, an upper side, an upper right side, a right side, or a lower right side encoding unit of an encoding unit.
- the image coding apparatus 2200 can compare the length of the width of the upper peripheral encoding unit and the length of the width of the encoding unit. In addition, the image encoding device 2200 can compare the lengths of the heights of the left and right peripheral encoding units and the lengths of the encoding units. Also, the image encoding device 2200 can determine the context model based on the comparison results.
- the above-described embodiments of the present disclosure can be embodied in a general-purpose digital computer that can be created as a program that can be executed by a computer and operates the program using a computer-readable recording medium.
- the computer readable recording medium includes a storage medium such as a magnetic storage medium (e.g., ROM, floppy disk, hard disk, etc.), optical reading medium (e.g., CD ROM, DVD, etc.).
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
본 개시는 신택스 엘리먼트를 엔트로피 부호화 및 복호화하기 위하여 사용되는 컨텍스트 모델(context model)을 다양한 형태의 부호화 단위에 기초하여 적응적으로 선택하기 위한 부호화 방법 및 장치, 복호화 방법 및 장치를 제공한다. 영상 복호화 방법은 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 포함하는 블록 형태 정보에 기초하여 컨텍스트 모델을 결정하는 단계, 부호화 단위를 분할하기 위한 분할 형태 모드에 대한 정보를. 컨텍스트 모델에 기초하여 비트스트림으로부터, 획득하는 단계, 및 분할 형태 모드에 대한 정보에 기초하여 부호화 단위의 분할 형태 모드를 결정하는 단계를 포함할 수 있다.
Description
일 실시예에 따른 방법 및 장치는 영상에 포함되는 다양한 형태의 부호화 단위를 이용하여, 영상을 부호화 또는 복호화 할 수 있다.
종래의 압축방식의 경우, 픽쳐에 포함되는 부호화 단위의 크기를 결정하는 과정에서 분할할지 여부를 결정한 후 획일적으로 4개의 동일한 크기의 부호화 단위들로 분할하는 재귀적 분할 과정을 통해 정사각형의 부호화 단위들을 결정하였다. 하지만 최근 고해상도의 영상에 대하여 정사각형이라는 획일적인 형태의 부호화 단위 이용에 의해 야기되는 복원 영상의 화질열화가 문제되고 있다. 따라서, 고해상도 영상을 다양한 형태의 부호화 단위로 분할하는 방법 및 장치들이 제안되고 있다.
본 개시는 신택스 엘리먼트를 엔트로피 부호화 및 복호화하기 위하여 사용되는 컨텍스트 모델(context model)을 다양한 형태의 부호화 단위에 기초하여 적응적으로 선택하기 위한 부호화 방법 및 장치, 복호화 방법 및 장치를 제공한다.
본 개시의 일 실시예에 따른 영상 복호화 방법은 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 포함하는 블록 형태 정보에 기초하여 컨텍스트 모델을 결정하는 단계, 상기 부호화 단위를 분할하기 위한 분할 형태 모드에 대한 정보를. 상기 컨텍스트 모델에 기초하여 비트스트림으로부터, 획득하는 단계, 및 상기 분할 형태 모드에 대한 정보에 기초하여 상기 부호화 단위의 분할 형태 모드를 결정하는 단계를 포함하는 것을 특징으로 한다.
본 개시의 일 실시예에 따른 영상 복호화 방법은 상기 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나와 컨텍스트 모델에 대한 인덱스를 대응시키기 위한 배열 을 획득하는 단계, 상기 배열에서 상기 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나에 기초하여 상기 컨텍스트 모델에 대한 인덱스를 획득하는 단계, 및 상기 컨텍스트 모델에 대한 인덱스에 기초하여 상기 컨텍스트 모델을 결정하는 단계를 포함하는 것을 특징으로 한다.
본 개시의 일 실시예에 따른 영상 복호화 방법에서 상기 부호화 단위의 모양은 상기 부호화 단위가 정사각형인지 또는 직사각형인지를 나타내고, 상기 부호화 단위의 방향은 상기 부호화 단위가 수평 방향인지 또는 수직 방향인지를 나타내고, 상기 부호화 단위의 너비 및 높이의 비율은 1:1, 1:2, 1:4, 1:8, 2:1, 4:1 및 8:1 중 적어도 하나를 포함하고, 상기 부호화 단위의 크기는 상기 부호화 단위의 한 변의 길이 또는 넓이를 나타내는 것을 특징으로 한다.
본 개시의 일 실시예에 따른 영상 복호화 방법은 부호화 단위에 인접한 주변 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 포함하는 블록 형태 정보에 더 기초하여 컨텍스트 모델을 결정하는 단계를 포함하고, 상기 주변 부호화 단위는 상기 부호화 단위의 좌하측, 좌측, 좌상측, 상측, 우상측, 우측 또는 우하측에 위치한 부호화 단위 중 적어도 하나를 포함하는 것을 특징으로 한다.
본 개시의 일 실시예에 따른 영상 복호화 방법은 상측 주변 부호화 단위의 너비의 길이와 상기 부호화 단위의 너비의 길이를 비교하는 단계, 좌측 및 우측의 주변 부호화 단위의 높이의 길이와 상기 부호화 단위의 높이의 길이를 비교하는 단계, 및 비교 결과들에 기초하여 상기 컨텍스트 모델을 결정하는 단계를 포함하는 것을 특징으로 한다.
본 개시의 일 실시예에 따른 영상 복호화 방법에서 분할 형태 모드에 대한 정보는 분할 여부를 나타내는 정보, 분할 방향 정보 및 분할 타입 정보 중 적어도 하나를 포함하고, 분할 여부를 나타내는 정보는 부호화 단위를 분할할지 여부를 나타내고, 분할 방향 정보는 수평 방향 또는 수직 방향 중 하나로 분할함을 나타내고, 분할 타입 정보는 상기 부호화 단위를 바이너리 분할(binary split), 트라이 분할(tri split) 또는 쿼드 분할(quad split) 중 하나로 분할함을 나타내는 것을 특징으로 한다.
본 개시의 일 실시예에 따른 영상 복호화 장치는 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는, 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 포함하는 블록 형태 정보에 기초하여 컨텍스트 모델을 결정하는 단계, 상기 부호화 단위를 분할하기 위한 분할 형태 모드에 대한 정보를, 상기 컨텍스트 모델에 기초하여 비트스트림으로부터, 획득하는 단계, 및 상기 분할 형태 모드에 대한 정보에 기초하여 상기 부호화 단위의 분할 형태 모드를 결정하는 단계를 수행하도록 구성되는 것을 특징으로 한다.
본 개시의 일 실시예에 따른 영상 부호화 방법은 부호화 단위의 분할 형태 모드에 기초하여 분할 형태 모드에 대한 정보를 결정하는 단계, 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 포함하는 블록 형태 정보에 기초하여 컨텍스트 모델을 결정하는 단계, 및 상기 컨텍스트 모델에 기초하여 상기 부호화 단위를 분할하기 위한 분할 형태 모드에 대한 정보를 비트스트림으로 생성하는 단계를 포함하는 것을 특징으로 한다.
본 개시의 일 실시예에 따른 영상 부호화 방법은 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나와 컨텍스트 모델에 대한 인덱스를 대응시키기 위한 배열을 획득하는 단계, 상기 배열에서 상기 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나에 기초하여 상기 컨텍스트 모델에 대한 인덱스를 획득하는 단계, 및 컨텍스트 모델에 대한 인덱스에 기초하여 상기 컨텍스트 모델을 결정하는 단계를 포함하는 것을 특징으로 한다.
본 개시의 일 실시예에 따른 영상 부호화 방법에서 부호화 단위의 모양은 상기 부호화 단위가 정사각형인지 또는 직사각형인지를 나타내고, 부호화 단위의 방향은 상기 부호화 단위가 수평 방향인지 또는 수직 방향인지를 나타내고, 상기 부호화 단위의 너비 및 높이의 비율은 1:1, 1:2, 1:4, 1:8, 2:1, 4:1 및 8:1 중 적어도 하나를 포함하고, 상기 부호화 단위의 크기는 상기 부호화 단위의 한 변의 길이 또는 넓이를 나타내는 것을 특징으로 한다.
본 개시의 일 실시예에 따른 영상 부호화 방법은 상기 부호화 단위에 인접한 주변 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 포함하는 블록 형태 정보에 더 기초하여 컨텍스트 모델을 결정하는 단계를 포함하고, 상기 주변 부호화 단위는 상기 부호화 단위의 좌하측, 좌측, 좌상측, 상측, 우상측, 우측 또는 우하측에 위치한 부호화 단위 중 적어도 하나를 포함하는 것을 특징으로 한다.
본 개시의 일 실시예에 따른 영상 부호화 방법은 상측 주변 부호화 단위의 너비의 길이와 상기 부호화 단위의 너비의 길이를 비교하는 단계, 좌측 및 우측의 주변 부호화 단위의 높이의 길이와 상기 부호화 단위의 높이의 길이를 비교하는 단계, 비교 결과들에 기초하여 상기 컨텍스트 모델을 결정하는 단계를 포함하는 것을 특징으로 한다.
본 개시의 일 실시예에 따른 영상 부호화 방법에서 분할 형태 모드에 대한 정보는 분할 여부를 나타내는 정보, 분할 방향 정보 및 분할 타입 정보 중 적어도 하나를 포함하고, 상기 분할 여부를 나타내는 정보는 부호화 단위를 분할할지 여부를 나타내고, 상기 분할 방향 정보는 수평 방향 또는 수직 방향 중 하나로 분할함을 나타내고, 상기 분할 타입 정보는 상기 부호화 단위를 바이너리 분할(binary split), 트라이 분할(tri split) 또는 쿼드 분할(quad split) 중 하나로 분할함을 나타내는 것을 특징으로 한다.
본 개시의 일 실시예에 따른 영상 부호화 장치는 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는, 부호화 단위의 분할 형태 모드에 기초하여 분할 형태 모드에 대한 정보를 결정하는 단계, 상기 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 포함하는 블록 형태 정보에 기초하여 컨텍스트 모델을 결정하는 단계, 및 상기 컨텍스트 모델에 기초하여 상기 부호화 단위를 분할하기 위한 분할 형태 모드에 대한 정보를 비트스트림으로 생성하는 단계를 수행하도록 구성되는 것을 특징으로 한다.
본 개시의 일 실시예에 따른 영상 복호화 방법에 대한 컴퓨터 프로그램은 컴퓨터로 판독 가능한 기록매체에 기록될 수 있다.
도 1은 일 실시예에 따라 영상 복호화 장치(100)의 개략적인 블록도를 도시한다.
도 2는 일 실시예에 따라 영상 복호화 방법의 흐름도를 도시한다.
도 3은 일 실시예에 따라 영상 복호화 장치가 현재 부호화 단위를 분할하여 적어도 하나의 부호화 단위를 결정하는 과정을 도시한다.
도 4는 일 실시예에 따라 영상 복호화 장치가 비-정사각형의 형태인 부호화 단위를 분할하여 적어도 하나의 부호화 단위를 결정하는 과정을 도시한다.
도 5는 일 실시예에 따라 영상 복호화 장치가 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 부호화 단위를 분할하는 과정을 도시한다.
도 6은 일 실시예에 따라 영상 복호화 장치가 홀수개의 부호화 단위들 중 소정의 부호화 단위를 결정하기 위한 방법을 도시한다.
도 7은 일 실시예에 따라 영상 복호화 장치가 현재 부호화 단위를 분할하여 복수개의 부호화 단위들을 결정하는 경우, 복수개의 부호화 단위들이 처리되는 순서를 도시한다.
도 8은 일 실시예에 따라 영상 복호화 장치가 소정의 순서로 부호화 단위가 처리될 수 없는 경우, 현재 부호화 단위가 홀수개의 부호화 단위로 분할되는 것임을 결정하는 과정을 도시한다.
도 9는 일 실시예에 따라 영상 복호화 장치가 제1 부호화 단위를 분할하여 적어도 하나의 부호화 단위를 결정하는 과정을 도시한다.
도 10은 일 실시예에 따라 영상 복호화 장치가 제1 부호화 단위가 분할되어 결정된 비-정사각형 형태의 제2 부호화 단위가 소정의 조건을 만족하는 경우 제2 부호화 단위가 분할될 수 있는 형태가 제한되는 것을 도시한다.
도 11은 일 실시예에 따라 분할 형태 모드에 대한 정보가 4개의 정사각형 형태의 부호화 단위로 분할하는 것을 나타낼 수 없는 경우, 영상 복호화 장치가 정사각형 형태의 부호화 단위를 분할하는 과정을 도시한다.
도 12는 일 실시예에 따라 복수개의 부호화 단위들 간의 처리 순서가 부호화 단위의 분할 과정에 따라 달라질 수 있음을 도시한 것이다.
도 13은 일 실시예에 따라 부호화 단위가 재귀적으로 분할되어 복수개의 부호화 단위가 결정되는 경우, 부호화 단위의 형태 및 크기가 변함에 따라 부호화 단위의 심도가 결정되는 과정을 도시한다.
도 14은 일 실시예에 따라 부호화 단위들의 형태 및 크기에 따라 결정될 수 있는 심도 및 부호화 단위 구분을 위한 인덱스(part index, 이하 PID)를 도시한다.
도 15는 일 실시예에 따라 픽쳐에 포함되는 복수개의 소정의 데이터 단위에 따라 복수개의 부호화 단위들이 결정된 것을 도시한다.
도 16은 일 실시예에 따라 픽쳐에 포함되는 기준 부호화 단위의 결정 순서를 결정하는 기준이 되는 프로세싱 블록을 도시한다.
도 17 은 일 실시예에 따라 블록 형태 정보를 설명하기 위한 도면이다.
도 18 은 일 실시예에 따라 블록 형태 정보를 설명하기 위한 도면이다.
도 19 는 일 실시예에 따라 블록 형태 정보에 따른 컨텍스트 모델을 결정하는 과정을 설명하기 위한 도면이다.
도 20 은 일 실시예에 따라 컨텍스트 모델을 결정하는 방법을 설명하기 위한 도면이다.
도 21 은 일 실시예에 따라 컨텍스트 모델을 결정하는 방법을 설명하기 위한 도면이다.
도 22 는 일 실시예에 따라 영상 부호화 장치의 개략적인 블록도를 도시한다.
도 23은 일 실시예에 따라 영상 부호화 방법의 흐름도를 도시한다.
도 24는 일 실시예에 따라 현재 부호화 단위의 분할을 나타내는 방법을 설명하는 도면이다.
개시된 실시예의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 개시는 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 개시가 완전하도록 하고, 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것일 뿐이다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 개시된 실시예에 대해 구체적으로 설명하기로 한다.
본 명세서에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 관련 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.
본 명세서에서의 단수의 표현은 문맥상 명백하게 단수인 것으로 특정하지 않는 한, 복수의 표현을 포함한다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다.
또한, 명세서에서 사용되는 "부"라는 용어는 소프트웨어 또는 하드웨어 구성요소를 의미하며, "부"는 어떤 역할들을 수행한다. 그렇지만 "부"는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. "부"는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 "부"는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 "부"들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 "부"들로 결합되거나 추가적인 구성요소들과 "부"들로 더 분리될 수 있다.
본 개시의 일 실시예에 따르면 "부"는 프로세서 및 메모리로 구현될 수 있다. 용어 "프로세서" 는 범용 프로세서, 중앙 처리 장치 (CPU), 마이크로프로세서, 디지털 신호 프로세서 (DSP), 제어기, 마이크로제어기, 상태 머신, 및 등을 포함하도록 넓게 해석되어야 한다. 몇몇 환경에서는, "프로세서" 는 주문형 반도체 (ASIC), 프로그램가능 로직 디바이스 (PLD), 필드 프로그램가능 게이트 어레이 (FPGA), 등을 지칭할 수도 있다. 용어 "프로세서" 는, 예를 들어, DSP 와 마이크로프로세서의 조합, 복수의 마이크로프로세서들의 조합, DSP 코어와 결합한 하나 이상의 마이크로프로세서들의 조합, 또는 임의의 다른 그러한 구성들의 조합과 같은 처리 디바이스들의 조합을 지칭할 수도 있다.
용어 "메모리" 는 전자 정보를 저장 가능한 임의의 전자 컴포넌트를 포함하도록 넓게 해석되어야 한다. 용어 메모리는 임의 액세스 메모리 (RAM), 판독-전용 메모리 (ROM), 비-휘발성 임의 액세스 메모리 (NVRAM), 프로그램가능 판독-전용 메모리 (PROM), 소거-프로그램가능 판독 전용 메모리 (EPROM), 전기적으로 소거가능 PROM (EEPROM), 플래쉬 메모리, 자기 또는 광학 데이터 저장장치, 레지스터들, 등과 같은 프로세서-판독가능 매체의 다양한 유형들을 지칭할 수도 있다. 프로세서가 메모리에 메모리로부터 정보를 판독하고/하거나 메모리에 정보를 기록할 수 있다면 메모리는 프로세서와 전자 통신 상태에 있다고 불린다. 프로세서에 집적된 메모리는 프로세서와 전자 통신 상태에 있다.
이하, "영상"은 비디오의 정지영상와 같은 정적 이미지이거나 동영상, 즉 비디오 그 자체와 같은 동적 이미지를 나타낼 수 있다.
이하 "샘플"은, 영상의 샘플링 위치에 할당된 데이터로서 프로세싱 대상이 되는 데이터를 의미한다. 예를 들어, 공간영역의 영상에서 픽셀값, 변환 영역 상의 변환 계수들이 샘플들일 수 있다. 이러한 적어도 하나의 샘플들을 포함하는 단위를 블록이라고 정의할 수 있다.
아래에서는 첨부한 도면을 참고하여 실시예에 대하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그리고 도면에서 본 개시를을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략한다.
이하 도 1 내지 도 24를 참조하여 일 실시예에 따라 영상 부호화 장치 및 영상 복호화 장치, 영상 부호화 방법 및 영상 복호화 방법이 상술된다. 도 3 내지 도 16을 참조하여 일 실시예에 따라 영상의 데이터 단위를 결정하는 방법이 설명되고, 도 1, 도 2 및, 도 17 내지 도 24을 참조하여 일 실시예에 따라 컨텍스트 모델(context model)을 다양한 형태의 부호화 단위에 기초하여 적응적으로 선택하기 위한 부호화 또는 복호화 방법 및 장치가 설명된다.
이하 도 1 및 도 2를 참조하여 본 개시의 일 실시예에 따라 컨텍스트 모델을 다양한 형태의 부호화 단위에 기초하여 적응적으로 선택하기 위한 방법 및 장치가 상술된다.
도 1은 일 실시예에 따라 영상 복호화 장치(100)의 개략적인 블록도를 도시한다.
영상 복호화 장치(100)는 수신부(110) 및 복호화부(120)를 포함할 수 있다. 수신부(110) 및 복호화부(120)는 적어도 하나의 프로세서를 포함할 수 있다. 또한 수신부(110) 및 복호화부(120)는 적어도 하나의 프로세서가 수행할 명령어들을 저장하는 메모리를 포함할 수 있다.
수신부(110)는 비트스트림을 수신할 수 있다. 비트스트림은 후술되는 영상 부호화 장치(2200)가 영상을 부호화한 정보를 포함한다. 또한 비트스트림은 영상 부호화 장치(2200)로부터 송신될 수 있다. 영상 부호화 장치(2200) 및 영상 복호화 장치(100)는 유선 또는 무선으로 연결될 수 있으며, 수신부(110)는 유선 또는 무선을 통하여 비트스트림을 수신할 수 있다. 수신부(110)는 광학미디어, 하드디스크 등과 같은 저장매체로부터 비트스트림을 수신할 수 있다. 복호화부(120)는 수신된 비트스트림에 기초하여 정보를 획득하여 영상을 복원할 수 있다. 복호화부(120)는 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나에 기초하여 컨텍스트 모델을 결정할 수 있다. 복호화부(120)는 영상을 복원하기 위한 신택스 엘리먼트를 컨텍스트 모델에 기초하여 비트스트림으로부터 획득할 수 있다. 복호화부(120)는 신택스 엘리먼트에 기초하여 영상을 복원할 수 있다.
영상 복호화 장치(100)의 동작에 대해서는 도 2와 함께 보다 자세히 설명한다.
도 2는 일 실시예에 따라 영상 복호화 방법의 흐름도를 도시한다.
본 개시의 일 실시예에 따르면 수신부(110)는 비트스트림을 수신한다. 영상 복호화 장치(100)는 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나에 기초하여 컨텍스트 모델을 결정하는 단계(210)를 수행한다. 영상 복호화 장치(100)는 부호화 단위를 분할하기 위한 분할 형태 모드에 대한 정보를. 컨텍스트 모델에 기초하여 비트스트림으로부터, 획득하는 단계(220)를 수행한다. 영상 복호화 장치(100)는 분할 형태 모드에 대한 정보에 기초하여 부호화 단위의 분할 형태 모드를 결정하는 단계(230)를 수행한다.
영상은 최대 부호화 단위로 분할될 수 있다. 최대 부호화 단위의 크기는 비트스트림으로부터 획득된 정보에 기초하여 결정될 수 있다. 최대 부호화 단위의 모양은 동일 크기의 정사각형을 가질 수 있다. 하지만 이에 한정되는 것은 아니다. 또한 최대 부호화 단위는 비트스트림으로부터 획득된 분할 형태 모드에 대한 정보에 기초하여 부호화 단위로 계층적으로 분할될 수 있다. 부호화 단위는 최대 부호화 단위보다 작거나 같을 수 있다. 예를 들어 분할 형태 모드에 대한 정보가 분할되지 않음을 나타내는 경우 부호화 단위는 최대 부호화 단위와 같은 크기를 가진다. 분할 형태 모드에 대한 정보가 분할됨을 나타내는 경우 최대 부호화 단위는 부호화 단위들로 분할 될 수 있다. 또한 부호화 단위에 대한 분할 형태 모드에 대한 정보가 분할을 나타내는 경우 부호화 단위들은 더 작은 크기의 부호화 단위들로 분할 될 수 있다. 다만, 영상의 분할은 이에 한정되는 것은 아니며 최대 부호화 단위 및 부호화 단위는 구별되지 않을 수 있다. 부호화 단위의 분할에 대해서는 도 3 내지 도 16에서 보다 자세히 설명한다.
또한 부호화 단위는 영상의 예측을 위한 예측 단위로 분할될 수 있다. 예측 단위는 부호화 단위와 같거나 작을 수 있다. 또한 부호화 단위는 영상의 변환을 위한 변환 단위로 분할될 수 있다. 변환 단위는 부호화 단위와 같거나 작을 수 있다. 변환 단위와 예측 단위의 모양 및 크기는 서로 관련 없을 수 있다. 부호화 단위는 예측 단위 및 변환 단위와 구별될 수도 있지만, 부호화 단위, 예측 단위 및 변환 단위는 서로 동일할 수 있다. 예측 단위 및 변환 단위의 분할은 부호화 단위의 분할과 동일한 방식으로 수행될 수 있다. 부호화 단위의 분할에 대해서는 도 3 내지 도 16에서 보다 자세히 설명한다. 본 개시의 현재 블록 및 주변 블록은 최대 부호화 단위, 부호화 단위, 예측 단위 및 변환 단위 중 하나를 나타낼 수 있다. 또한, 현재 블록은 현재 복호화 또는 부호화가 진행되는 블록이다. 주변 블록은 현재 블록 이전에 복원된 블록일 수 있다. 주변 블록은 현재 블록으로부터 공간적 또는 시간적으로 인접할 수 있다. 주변 블록은 현재 블록의 좌하측, 좌측, 좌상측, 상측, 우상측, 우측, 우하측 중 하나에 위치할 수 있다.
도 3은 일 실시예에 따라 영상 복호화 장치(100)가 현재 부호화 단위를 분할하여 적어도 하나의 부호화 단위를 결정하는 과정을 도시한다.
블록 형태는 4Nx4N,4Nx2N, 2Nx4N, 4NxN 또는 Nx4N을 포함할 수 있다. 여기서 N은 양의 정수일 수 있다. 블록 형태 정보는 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 나타내는 정보이다.
부호화 단위의 모양은 정사각형(square) 및 비-정사각형(non-square)을 포함할 수 있다. 부호화 단위의 너비 및 높이의 길이가 같은 경우(4Nx4N), 영상 복호화 장치(100)는 부호화 단위의 블록 형태 정보를 정사각형으로 결정할 수 있다. 영상 복호화 장치(100)는 부호화 단위의 모양을 비-정사각형으로 결정할 수 있다.
부호화 단위의 너비 및 높이의 길이가 다른 경우(4Nx2N, 2Nx4N, 4NxN 또는 Nx4N), 영상 복호화 장치(100)는 부호화 단위의 블록 형태 정보를 비-정사각형으로 결정할 수 있다. 부호화 단위의 모양이 비-정사각형인 경우, 영상 복호화 장치(100)는 부호화 단위의 블록 형태 정보 중 너비 및 높이의 비율을 1:2, 2:1, 1:4, 4:1, 1:8 또는 8:1 중 적어도 하나로 결정할 수 있다. 또한, 부호화 단위의 너비의 길이 및 높이의 길이에 기초하여, 영상 복호화 장치(100)는 부호화 단위가 수평 방향인지 수직 방향인지 결정할 수 있다. 또한, 부호화 단위의 너비의 길이, 높이의 길이, 넓이 중 적어도 하나에 기초하여, 영상 복호화 장치(100)는 부호화 단위의 크기를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 블록 형태 정보를 이용하여 부호화 단위의 형태를 결정할 수 있고, 분할 형태 모드에 대한 정보를 이용하여 부호화 단위가 어떤 형태로 분할되는지를 결정할 수 있다. 즉, 영상 복호화 장치(100)가 이용하는 블록 형태 정보가 어떤 블록 형태를 나타내는지에 따라 분할 형태 모드에 대한 정보가 나타내는 부호화 단위의 분할 방법이 결정될 수 있다.
영상 복호화 장치(100)는 비트스트림으로부터 분할 형태 모드에 대한 정보를 획득할 수 있다. 하지만 이에 한정되는 것은 아니며, 영상 복호화 장치(100) 및 영상 부호화 장치(2200)는 블록 형태 정보에 기초하여 미리 약속된 분할 형태 모드에 대한 정보를 획득할 수 있다. 영상 복호화 장치(100)는 최대 부호화 단위 또는 최소 부호화 단위에 대하여 미리 약속된 분할 형태 모드에 대한 정보를 획득할 수 있다. 예를 들어 영상 복호화 장치(100)는 최대 부호화 단위의 크기를 256x256으로 결정할 수 있다. 영상 복호화 장치(100)는 미리 약속된 분할 형태 모드에 대한 정보를 쿼드 분할(quad split)로 결정할 수 있다. 쿼드 분할은 부호화 단위의 너비 및 높이를 모두 이등분하는 분할 형태 모드이다. 영상 복호화 장치(100)는 분할 형태 모드에 대한 정보에 기초하여 256x256 크기의 최대 부호화 단위로부터 128x128 크기의 부호화 단위를 획득할 수 있다. 또한 영상 복호화 장치(100)는 최소 부호화 단위의 크기를 4x4로 결정할 수 있다. 영상 복호화 장치(100)는 최소 부호화 단위에 대하여 "분할하지 않음"을 나타내는 분할 형태 모드에 대한 정보를 획득할 수 있다.
일 실시예에 따라, 영상 복호화 장치(100)는 현재 부호화 단위가 정사각형 형태임을 나타내는 블록 형태 정보를 이용할 수 있다. 예를 들어 영상 복호화 장치(100)는 분할 형태 모드에 대한 정보에 따라 정사각형의 부호화 단위를 분할하지 않을지, 수직으로 분할할지, 수평으로 분할할지, 4개의 부호화 단위로 분할할지 등을 결정할 수 있다. 도 3을 참조하면, 현재 부호화 단위(300)의 블록 형태 정보가 정사각형의 형태를 나타내는 경우, 복호화부(120)는 분할되지 않음을 나타내는 분할 형태 모드에 대한 정보에 따라 현재 부호화 단위(300)와 동일한 크기를 가지는 부호화 단위(310a)를 분할하지 않거나, 소정의 분할방법을 나타내는 분할 형태 모드에 대한 정보에 기초하여 분할된 부호화 단위(310b, 310c, 310d 등)를 결정할 수 있다.
도 3을 참조하면 영상 복호화 장치(100)는 일 실시예에 따라 수직방향으로 분할됨을 나타내는 분할 형태 모드에 대한 정보에 기초하여 현재 부호화 단위(300)를 수직방향으로 분할한 두 개의 부호화 단위(310b)를 결정할 수 있다. 영상 복호화 장치(100)는 수평방향으로 분할됨을 나타내는 분할 형태 모드에 대한 정보에 기초하여 현재 부호화 단위(300)를 수평방향으로 분할한 두 개의 부호화 단위(310c)를 결정할 수 있다. 영상 복호화 장치(100)는 수직방향 및 수평방향으로 분할됨을 나타내는 분할 형태 모드에 대한 정보에 기초하여 현재 부호화 단위(300)를 수직방향 및 수평방향으로 분할한 네 개의 부호화 단위(310d)를 결정할 수 있다. 다만 정사각형의 부호화 단위가 분할될 수 있는 분할 형태는 상술한 형태로 한정하여 해석되어서는 안되고, 분할 형태 모드에 대한 정보가 나타낼 수 있는 다양한 형태가 포함될 수 있다. 정사각형의 부호화 단위가 분할되는 소정의 분할 형태들은 이하에서 다양한 실시예를 통해 구체적으로 설명하도록 한다.
도 4는 일 실시예에 따라 영상 복호화 장치(100)가 비-정사각형의 형태인 부호화 단위를 분할하여 적어도 하나의 부호화 단위를 결정하는 과정을 도시한다.
일 실시예에 따라 영상 복호화 장치(100)는 현재 부호화 단위가 비-정사각형 형태임을 나타내는 블록 형태 정보를 이용할 수 있다. 영상 복호화 장치(100)는 분할 형태 모드에 대한 정보에 따라 비-정사각형의 현재 부호화 단위를 분할하지 않을지 소정의 방법으로 분할할지 여부를 결정할 수 있다. 도 4를 참조하면, 현재 부호화 단위(400 또는 450)의 블록 형태 정보가 비-정사각형의 형태를 나타내는 경우, 영상 복호화 장치(100)는 분할되지 않음을 나타내는 분할 형태 모드에 대한 정보에 따라 현재 부호화 단위(400 또는 450)와 동일한 크기를 가지는 부호화 단위(410 또는 460)를 결정하거나, 소정의 분할방법을 나타내는 분할 형태 모드에 대한 정보에 따라 기초하여 분할된 부호화 단위(420a, 420b, 430a, 430b, 430c, 470a, 470b, 480a, 480b, 480c)를 결정할 수 있다. 비-정사각형의 부호화 단위가 분할되는 소정의 분할 방법은 이하에서 다양한 실시예를 통해 구체적으로 설명하도록 한다.
일 실시예에 따라 영상 복호화 장치(100)는 분할 형태 모드에 대한 정보를 이용하여 부호화 단위가 분할되는 형태를 결정할 수 있고, 이 경우 분할 형태 모드에 대한 정보는 부호화 단위가 분할되어 생성되는 적어도 하나의 부호화 단위의 개수를 나타낼 수 있다. 도 4를 참조하면 분할 형태 모드에 대한 정보가 두 개의 부호화 단위로 현재 부호화 단위(400 또는 450)가 분할되는 것을 나타내는 경우, 영상 복호화 장치(100)는 분할 형태 모드에 대한 정보에 기초하여 현재 부호화 단위(400 또는 450)를 분할하여 현재 부호화 단위에 포함되는 두 개의 부호화 단위(420a, 420b, 또는 470a, 470b)를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)가 분할 형태 모드에 대한 정보에 기초하여 비-정사각형의 형태의 현재 부호화 단위(400 또는 450)를 분할하는 경우, 영상 복호화 장치(100)는 비-정사각형의 현재 부호화 단위(400 또는 450)의 긴 변의 위치를 고려하여 현재 부호화 단위를 분할할 수 있다. 예를 들면, 영상 복호화 장치(100)는 현재 부호화 단위(400 또는 450)의 형태를 고려하여 현재 부호화 단위(400 또는 450)의 긴 변을 분할하는 방향으로 현재 부호화 단위(400 또는 450)를 분할하여 복수개의 부호화 단위를 결정할 수 있다.
일 실시예에 따라, 분할 형태 모드에 대한 정보가 홀수개의 블록으로 부호화 단위를 분할(트라이 분할; tri split)하는 것을 나타내는 경우, 영상 복호화 장치(100)는 현재 부호화 단위(400 또는 450)에 포함되는 홀수개의 부호화 단위를 결정할 수 있다. 예를 들면, 분할 형태 모드에 대한 정보가 3개의 부호화 단위로 현재 부호화 단위(400 또는 450)를 분할하는 것을 나타내는 경우, 영상 복호화 장치(100)는 현재 부호화 단위(400 또는 450)를 3개의 부호화 단위(430a, 430b, 430c, 480a, 480b, 480c)로 분할할 수 있다.
일 실시예에 따라, 현재 부호화 단위(400 또는 450)의 너비 및 높이의 비율이 4:1 또는 1:4 일 수 있다. 너비 및 높이의 비율이 4:1 인 경우, 너비의 길이가 높이의 길이보다 길므로 블록 형태 정보는 수평 방향일 수 있다. 너비 및 높이의 비율이 1:4 인 경우, 너비의 길이가 높이의 길이보다 짧으므로 블록 형태 정보는 수직 방향일 수 있다. 영상 복호화 장치(100)는 분할 형태 모드에 대한 정보에 기초하여 현재 부호화 단위를 홀수개의 블록으로 분할할 것을 결정할 수 있다. 또한 영상 복호화 장치(100)는 현재 부호화 단위(400 또는 450)의 블록 형태 정보에 기초하여 현재 부호화 단위(400 또는 450)의 분할 방향을 결정할 수 있다. 예를 들어 현재 부호화 단위(400)가 수직 방향인 경우, 영상 복호화 장치(100)는 현재 부호화 단위(400)를 수평 방향으로 분할 하여 부호화 단위(430a, 430b, 430c)를 결정할 수 있다. 또한 현재 부호화 단위(450)가 수평 방향인 경우, 영상 복호화 장치(100)는 현재 부호화 단위(450)를 수직 방향으로 분할 하여 부호화 단위(480a, 480b, 480c)를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 현재 부호화 단위(400 또는 450)에 포함되는 홀수개의 부호화 단위를 결정할 수 있으며, 결정된 부호화 단위들의 크기 모두가 동일하지는 않을 수 있다. 예를 들면, 결정된 홀수개의 부호화 단위(430a, 430b, 430c, 480a, 480b, 480c) 중 소정의 부호화 단위(430b 또는 480b)의 크기는 다른 부호화 단위(430a, 430c, 480a, 480c)들과는 다른 크기를 가질 수도 있다. 즉, 현재 부호화 단위(400 또는 450)가 분할되어 결정될 수 있는 부호화 단위는 복수의 종류의 크기를 가질 수 있고, 경우에 따라서는 홀수개의 부호화 단위(430a, 430b, 430c, 480a, 480b, 480c)가 각각 서로 다른 크기를 가질 수도 있다.
일 실시예에 따라 분할 형태 모드에 대한 정보가 홀수개의 블록으로 부호화 단위가 분할되는 것을 나타내는 경우, 영상 복호화 장치(100)는 현재 부호화 단위(400 또는 450)에 포함되는 홀수개의 부호화 단위를 결정할 수 있고, 나아가 영상 복호화 장치(100)는 분할하여 생성되는 홀수개의 부호화 단위들 중 적어도 하나의 부호화 단위에 대하여 소정의 제한을 둘 수 있다. 도 4을 참조하면 영상 복호화 장치(100)는 현재 부호화 단위(400 또는 450)가 분할되어 생성된 3개의 부호화 단위(430a, 430b, 430c, 480a, 480b, 480c)들 중 중앙에 위치하는 부호화 단위(430b, 480b)에 대한 복호화 과정을 다른 부호화 단위(430a, 430c, 480a, 480c)와 다르게 할 수 있다. 예를 들면, 영상 복호화 장치(100)는 중앙에 위치하는 부호화 단위(430b, 480b)에 대하여는 다른 부호화 단위(430a, 430c, 480a, 480c)와 달리 더 이상 분할되지 않도록 제한하거나, 소정의 횟수만큼만 분할되도록 제한할 수 있다.
도 5는 일 실시예에 따라 영상 복호화 장치(100)가 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 부호화 단위를 분할하는 과정을 도시한다.
일 실시예에 따라 영상 복호화 장치(100)는 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 정사각형 형태의 제1 부호화 단위(500)를 부호화 단위들로 분할하거나 분할하지 않는 것으로 결정할 수 있다. 일 실시예에 따라 분할 형태 모드에 대한 정보가 수평 방향으로 제1 부호화 단위(500)를 분할하는 것을 나타내는 경우, 영상 복호화 장치(100)는 제1 부호화 단위(500)를 수평 방향으로 분할하여 제2 부호화 단위(510)를 결정할 수 있다. 일 실시예에 따라 이용되는 제1 부호화 단위, 제2 부호화 단위, 제3 부호화 단위는 부호화 단위 간의 분할 전후 관계를 이해하기 위해 이용된 용어이다. 예를 들면, 제1 부호화 단위를 분할하면 제2 부호화 단위가 결정될 수 있고, 제2 부호화 단위가 분할되면 제3 부호화 단위가 결정될 수 있다. 이하에서는 이용되는 제1 부호화 단위, 제2 부호화 단위 및 제3 부호화 단위의 관계는 상술한 특징에 따르는 것으로 이해될 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 결정된 제2 부호화 단위(510)를 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 부호화 단위들로 분할하거나 분할하지 않는 것으로 결정할 수 있다. 도 5를 참조하면 영상 복호화 장치(100)는 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 제1 부호화 단위(500)를 분할하여 결정된 비-정사각형의 형태의 제2 부호화 단위(510)를 적어도 하나의 제3 부호화 단위(520a, 520b, 520c, 520d 등)로 분할하거나 제2 부호화 단위(510)를 분할하지 않을 수 있다. 영상 복호화 장치(100)는 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나를 획득할 수 있고 영상 복호화 장치(100)는 획득한 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 제1 부호화 단위(500)를 분할하여 다양한 형태의 복수개의 제2 부호화 단위(예를 들면, 510)를 분할할 수 있으며, 제2 부호화 단위(510)는 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 제1 부호화 단위(500)가 분할된 방식에 따라 분할될 수 있다. 일 실시예에 따라, 제1 부호화 단위(500)가 제1 부호화 단위(500)에 대한 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 제2 부호화 단위(510)로 분할된 경우, 제2 부호화 단위(510) 역시 제2 부호화 단위(510)에 대한 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 제3 부호화 단위(예를 들면, 520a, 520b, 520c, 520d 등)으로 분할될 수 있다. 즉, 부호화 단위는 부호화 단위 각각에 관련된 분할 형태 모드에 대한 정보 및 블록 형태 정보 중 적어도 하나에 기초하여 재귀적으로 분할될 수 있다. 따라서 비-정사각형 형태의 부호화 단위에서 정사각형의 부호화 단위가 결정될 수 있고, 이러한 정사각형 형태의 부호화 단위가 재귀적으로 분할되어 비-정사각형 형태의 부호화 단위가 결정될 수도 있다.
도 5를 참조하면, 비-정사각형 형태의 제2 부호화 단위(510)가 분할되어 결정되는 홀수개의 제3 부호화 단위(520b, 520c, 520d) 중 소정의 부호화 단위(예를 들면, 가운데에 위치하는 부호화 단위 또는 정사각형 형태의 부호화 단위)는 재귀적으로 분할될 수 있다. 일 실시예에 따라 홀수개의 제3 부호화 단위(520b, 520c, 520d) 중 하나인 정사각형 형태의 제3 부호화 단위(520b)는 수평 방향으로 분할되어 복수개의 제4 부호화 단위로 분할될 수 있다. 복수개의 제4 부호화 단위(530a, 530b, 530c, 530d) 중 하나인 비-정사각형 형태의 제4 부호화 단위(530b 또는 530d)는 다시 복수개의 부호화 단위들로 분할될 수 있다. 예를 들면, 비-정사각형 형태의 제4 부호화 단위(530b 또는 530d)는 홀수개의 부호화 단위로 다시 분할될 수도 있다. 부호화 단위의 재귀적 분할에 이용될 수 있는 방법에 대하여는 다양한 실시예를 통해 후술하도록 한다.
일 실시예에 따라 영상 복호화 장치(100)는 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 제3 부호화 단위(520a, 520b, 520c, 520d 등) 각각을 부호화 단위들로 분할할 수 있다. 또한 영상 복호화 장치(100)는 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 제2 부호화 단위(510)를 분할하지 않는 것으로 결정할 수 있다. 영상 복호화 장치(100)는 일 실시예에 따라 비-정사각형 형태의 제2 부호화 단위(510)를 홀수개의 제3 부호화 단위(520b, 520c, 520d)로 분할할 수 있다. 영상 복호화 장치(100)는 홀수개의 제3 부호화 단위(520b, 520c, 520d) 중 소정의 제3 부호화 단위에 대하여 소정의 제한을 둘 수 있다. 예를 들면 영상 복호화 장치(100)는 홀수개의 제3 부호화 단위(520b, 520c, 520d) 중 가운데에 위치하는 부호화 단위(520c)에 대하여는 더 이상 분할되지 않는 것으로 제한하거나 또는 설정 가능한 횟수로 분할되어야 하는 것으로 제한할 수 있다.
도 5를 참조하면, 영상 복호화 장치(100)는 비-정사각형 형태의 제2 부호화 단위(510)에 포함되는 홀수개의 제3 부호화 단위(520b, 520c, 520d)들 중 가운데에 위치하는 부호화 단위(520c)는 더 이상 분할되지 않거나, 소정의 분할 형태로 분할(예를 들면 4개의 부호화 단위로만 분할하거나 제2 부호화 단위(510)가 분할된 형태에 대응하는 형태로 분할)되는 것으로 제한하거나, 소정의 횟수로만 분할(예를 들면 n회만 분할, n>0)하는 것으로 제한할 수 있다. 다만 가운데에 위치한 부호화 단위(520c)에 대한 상기 제한은 단순한 실시예들에 불과하므로 상술한 실시예들로 제한되어 해석되어서는 안되고, 가운데에 위치한 부호화 단위(520c)가 다른 부호화 단위(520b, 520d)와 다르게 복호화 될 수 있는 다양한 제한들을 포함하는 것으로 해석되어야 한다.
일 실시예에 따라 영상 복호화 장치(100)는 현재 부호화 단위를 분할하기 위해 이용되는 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나를 현재 부호화 단위 내의 소정의 위치에서 획득할 수 있다.
도 6은 일 실시예에 따라 영상 복호화 장치(100)가 홀수개의 부호화 단위들 중 소정의 부호화 단위를 결정하기 위한 방법을 도시한다.
도 6을 참조하면, 현재 부호화 단위(600, 650)의 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나는 현재 부호화 단위(600, 650)에 포함되는 복수개의 샘플 중 소정 위치의 샘플(예를 들면, 가운데에 위치하는 샘플(640, 690))에서 획득될 수 있다. 다만 이러한 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나가 획득될 수 있는 현재 부호화 단위(600) 내의 소정 위치가 도 6에서 도시하는 가운데 위치로 한정하여 해석되어서는 안되고, 소정 위치에는 현재 부호화 단위(600)내에 포함될 수 있는 다양한 위치(예를 들면, 최상단, 최하단, 좌측, 우측, 좌측상단, 좌측하단, 우측상단 또는 우측하단 등)가 포함될 수 있는 것으로 해석되어야 한다. 영상 복호화 장치(100)는 소정 위치로부터 획득되는 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나를 획득하여 현재 부호화 단위를 다양한 형태 및 크기의 부호화 단위들로 분할하거나 분할하지 않는 것으로 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 현재 부호화 단위가 소정의 개수의 부호화 단위들로 분할된 경우 그 중 하나의 부호화 단위를 선택할 수 있다. 복수개의 부호화 단위들 중 하나를 선택하기 위한 방법은 다양할 수 있으며, 이러한 방법들에 대한 설명은 이하의 다양한 실시예를 통해 후술하도록 한다.
일 실시예에 따라 영상 복호화 장치(100) 는 현재 부호화 단위를 복수개의 부호화 단위들로 분할하고, 소정 위치의 부호화 단위를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 홀수개의 부호화 단위들 중 가운데에 위치하는 부호화 단위를 결정하기 위하여 홀수개의 부호화 단위들 각각의 위치를 나타내는 정보를 이용할 수 있다. 도 6을 참조하면, 영상 복호화 장치(100)는 현재 부호화 단위(600) 또는 현재 부호화 단위(650)를 분할하여 홀수개의 부호화 단위들(620a, 620b, 620c) 또는 홀수개의 부호화 단위들(660a, 660b, 660c)을 결정할 수 있다. 영상 복호화 장치(100)는 홀수개의 부호화 단위들(620a, 620b, 620c) 또는 홀수개의 부호화 단위들(660a, 660b, 660c)의 위치에 대한 정보를 이용하여 가운데 부호화 단위(620b)또는 가운데 부호화 단위(660b)를 결정할 수 있다. 예를 들면 영상 복호화 장치(100)는 부호화 단위들(620a, 620b, 620c)에 포함되는 소정의 샘플의 위치를 나타내는 정보에 기초하여 부호화 단위들(620a, 620b, 620c)의 위치를 결정함으로써 가운데에 위치하는 부호화 단위(620b)를 결정할 수 있다. 구체적으로, 영상 복호화 장치(100)는 부호화 단위들(620a, 620b, 620c)의 좌측 상단의 샘플(630a, 630b, 630c)의 위치를 나타내는 정보에 기초하여 부호화 단위들(620a, 620b, 620c)의 위치를 결정함으로써 가운데에 위치하는 부호화 단위(620b)를 결정할 수 있다.
일 실시예에 따라 부호화 단위들(620a, 620b, 620c)에 각각 포함되는 좌측 상단의 샘플(630a, 630b, 630c)의 위치를 나타내는 정보는 부호화 단위들(620a, 620b, 620c)의 픽쳐 내에서의 위치 또는 좌표에 대한 정보를 포함할 수 있다. 일 실시예에 따라 부호화 단위들(620a, 620b, 620c)에 각각 포함되는 좌측 상단의 샘플(630a, 630b, 630c)의 위치를 나타내는 정보는 현재 부호화 단위(600)에 포함되는 부호화 단위들(620a, 620b, 620c)의 너비 또는 높이를 나타내는 정보를 포함할 수 있고, 이러한 너비 또는 높이는 부호화 단위들(620a, 620b, 620c)의 픽쳐 내에서의 좌표 간의 차이를 나타내는 정보에 해당할 수 있다. 즉, 영상 복호화 장치(100)는 부호화 단위들(620a, 620b, 620c)의 픽쳐 내에서의 위치 또는 좌표에 대한 정보를 직접 이용하거나 좌표간의 차이값에 대응하는 부호화 단위의 너비 또는 높이에 대한 정보를 이용함으로써 가운데에 위치하는 부호화 단위(620b)를 결정할 수 있다.
일 실시예에 따라, 상단 부호화 단위(620a)의 좌측 상단의 샘플(630a)의 위치를 나타내는 정보는 (xa, ya) 좌표를 나타낼 수 있고, 가운데 부호화 단위(620b)의 좌측 상단의 샘플(530b)의 위치를 나타내는 정보는 (xb, yb) 좌표를 나타낼 수 있고, 하단 부호화 단위(620c)의 좌측 상단의 샘플(630c)의 위치를 나타내는 정보는 (xc, yc) 좌표를 나타낼 수 있다. 영상 복호화 장치(100)는 부호화 단위들(620a, 620b, 620c)에 각각 포함되는 좌측 상단의 샘플(630a, 630b, 630c)의 좌표를 이용하여 가운데 부호화 단위(620b)를 결정할 수 있다. 예를 들면, 좌측 상단의 샘플(630a, 630b, 630c)의 좌표를 오름차순 또는 내림차순으로 정렬하였을 때, 가운데에 위치하는 샘플(630b)의 좌표인 (xb, yb)를 포함하는 부호화 단위(620b)를 현재 부호화 단위(600)가 분할되어 결정된 부호화 단위들(620a, 620b, 620c) 중 가운데에 위치하는 부호화 단위로 결정할 수 있다. 다만 좌측 상단의 샘플(630a, 630b, 630c)의 위치를 나타내는 좌표는 픽쳐 내에서의 절대적인 위치를 나타내는 좌표를 나타낼 수 있고, 나아가 상단 부호화 단위(620a)의 좌측 상단의 샘플(630a)의 위치를 기준으로, 가운데 부호화 단위(620b)의 좌측 상단의 샘플(630b)의 상대적 위치를 나타내는 정보인 (dxb, dyb)좌표, 하단 부호화 단위(620c)의 좌측 상단의 샘플(630c)의 상대적 위치를 나타내는 정보인 (dxc, dyc)좌표를 이용할 수도 있다. 또한 부호화 단위에 포함되는 샘플의 위치를 나타내는 정보로서 해당 샘플의 좌표를 이용함으로써 소정 위치의 부호화 단위를 결정하는 방법이 상술한 방법으로 한정하여 해석되어서는 안되고, 샘플의 좌표를 이용할 수 있는 다양한 산술적 방법으로 해석되어야 한다.
일 실시예에 따라 영상 복호화 장치(100)는 현재 부호화 단위(600)를 복수개의 부호화 단위들(620a, 620b, 620c)로 분할할 수 있고, 부호화 단위들(620a, 620b, 620c) 중 소정의 기준에 따라 부호화 단위를 선택할 수 있다. 예를 들면, 영상 복호화 장치(100)는 부호화 단위들(620a, 620b, 620c) 중 크기가 다른 부호화 단위(620b)를 선택할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 상단 부호화 단위(620a)의 좌측 상단의 샘플(630a)의 위치를 나타내는 정보인 (xa, ya) 좌표, 가운데 부호화 단위(620b)의 좌측 상단의 샘플(630b)의 위치를 나타내는 정보인 (xb, yb) 좌표, 하단 부호화 단위(620c)의 좌측 상단의 샘플(630c)의 위치를 나타내는 정보인 (xc, yc) 좌표를 이용하여 부호화 단위들(620a, 620b, 620c) 각각의 너비 또는 높이를 결정할 수 있다. 영상 복호화 장치(100)는 부호화 단위들(620a, 620b, 620c)의 위치를 나타내는 좌표인 (xa, ya), (xb, yb), (xc, yc)를 이용하여 부호화 단위들(620a, 620b, 620c) 각각의 크기를 결정할 수 있다. 일 실시예에 따라, 영상 복호화 장치(100)는 상단 부호화 단위(620a)의 너비를 현재 부호화 단위(600)의 너비로 결정할 수 있다. 영상 복호화 장치(100)는 상단 부호화 단위(620a)의 높이를 yb-ya로 결정할 수 있다. 일 실시예에 따라 영상 복호화 장치(100)는 가운데 부호화 단위(620b)의 너비를 현재 부호화 단위(600)의 너비로 결정할 수 있다. 영상 복호화 장치(100)는 가운데 부호화 단위(620b)의 높이를 yc-yb로 결정할 수 있다. 일 실시예에 따라 영상 복호화 장치(100)는 하단 부호화 단위의 너비 또는 높이는 현재 부호화 단위의 너비 또는 높이와 상단 부호화 단위(620a) 및 가운데 부호화 단위(620b)의 너비 및 높이를 이용하여 결정할 수 있다. 영상 복호화 장치(100)는 결정된 부호화 단위들(620a, 620b, 620c)의 너비 및 높이에 기초하여 다른 부호화 단위와 다른 크기를 갖는 부호화 단위를 결정할 수 있다. 도 6을 참조하면, 영상 복호화 장치(100)는 상단 부호화 단위(620a) 및 하단 부호화 단위(620c)의 크기와 다른 크기를 가지는 가운데 부호화 단위(620b)를 소정 위치의 부호화 단위로 결정할 수 있다. 다만 상술한 영상 복호화 장치(100)가 다른 부호화 단위와 다른 크기를 갖는 부호화 단위를 결정하는 과정은 샘플 좌표에 기초하여 결정되는 부호화 단위의 크기를 이용하여 소정 위치의 부호화 단위를 결정하는 일 실시예에 불과하므로, 소정의 샘플 좌표에 따라 결정되는 부호화 단위의 크기를 비교하여 소정 위치의 부호화 단위를 결정하는 다양한 과정이 이용될 수 있다.
영상 복호화 장치(100)는 좌측 부호화 단위(660a)의 좌측 상단의 샘플(670a)의 위치를 나타내는 정보인 (xd, yd) 좌표, 가운데 부호화 단위(660b)의 좌측 상단의 샘플(670b)의 위치를 나타내는 정보인 (xe, ye) 좌표, 우측 부호화 단위(660c)의 좌측 상단의 샘플(670c)의 위치를 나타내는 정보인 (xf, yf) 좌표를 이용하여 부호화 단위들(660a, 660b, 660c) 각각의 너비 또는 높이를 결정할 수 있다. 영상 복호화 장치(100)는 부호화 단위들(660a, 660b, 660c)의 위치를 나타내는 좌표인 (xd, yd), (xe, ye), (xf, yf)를 이용하여 부호화 단위들(660a, 660b, 660c) 각각의 크기를 결정할 수 있다.
일 실시예에 따라, 영상 복호화 장치(100)는 좌측 부호화 단위(660a)의 너비를 xe-xd로 결정할 수 있다. 영상 복호화 장치(100)는 좌측 부호화 단위(660a)의 높이를 현재 부호화 단위(650)의 높이로 결정할 수 있다. 일 실시예에 따라 영상 복호화 장치(100)는 가운데 부호화 단위(660b)의 너비를 xf-xe로 결정할 수 있다. 영상 복호화 장치(100)는 가운데 부호화 단위(660b)의 높이를 현재 부호화 단위(600)의 높이로 결정할 수 있다. 일 실시예에 따라 영상 복호화 장치(100)는 우측 부호화 단위(660c)의 너비 또는 높이는 현재 부호화 단위(650)의 너비 또는 높이와 좌측 부호화 단위(660a) 및 가운데 부호화 단위(660b)의 너비 및 높이를 이용하여 결정할 수 있다. 영상 복호화 장치(100)는 결정된 부호화 단위들(660a, 660b, 660c)의 너비 및 높이에 기초하여 다른 부호화 단위와 다른 크기를 갖는 부호화 단위를 결정할 수 있다. 도 6을 참조하면, 영상 복호화 장치(100)는 좌측 부호화 단위(660a) 및 우측 부호화 단위(660c)의 크기와 다른 크기를 가지는 가운데 부호화 단위(660b)를 소정 위치의 부호화 단위로 결정할 수 있다. 다만 상술한 영상 복호화 장치(100)가 다른 부호화 단위와 다른 크기를 갖는 부호화 단위를 결정하는 과정은 샘플 좌표에 기초하여 결정되는 부호화 단위의 크기를 이용하여 소정 위치의 부호화 단위를 결정하는 일 실시예에 불과하므로, 소정의 샘플 좌표에 따라 결정되는 부호화 단위의 크기를 비교하여 소정 위치의 부호화 단위를 결정하는 다양한 과정이 이용될 수 있다.
다만 부호화 단위의 위치를 결정하기 위하여 고려하는 샘플의 위치는 상술한 좌측 상단으로 한정하여 해석되어서는 안되고 부호화 단위에 포함되는 임의의 샘플의 위치에 대한 정보가 이용될 수 있는 것으로 해석될 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 현재 부호화 단위의 형태를 고려하여, 현재 부호화 단위가 분할되어 결정되는 홀수개의 부호화 단위들 중 소정 위치의 부호화 단위를 선택할 수 있다. 예를 들면, 현재 부호화 단위가 너비가 높이보다 긴 비-정사각형 형태라면 영상 복호화 장치(100)는 수평 방향에 따라 소정 위치의 부호화 단위를 결정할 수 있다. 즉, 영상 복호화 장치(100)는 수평 방향으로 위치를 달리 하는 부호화 단위들 중 하나를 결정하여 해당 부호화 단위에 대한 제한을 둘 수 있다. 현재 부호화 단위가 높이가 너비보다 긴 비-정사각형 형태라면 영상 복호화 장치(100)는 수직 방향에 따라 소정 위치의 부호화 단위를 결정할 수 있다. 즉, 영상 복호화 장치(100)는 수직 방향으로 위치를 달리 하는 부호화 단위들 중 하나를 결정하여 해당 부호화 단위에 대한 제한을 둘 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 짝수개의 부호화 단위들 중 소정 위치의 부호화 단위를 결정하기 위하여 짝수개의 부호화 단위들 각각의 위치를 나타내는 정보를 이용할 수 있다. 영상 복호화 장치(100)는 현재 부호화 단위를 분할(바이 분할; binarysplit)하여 짝수개의 부호화 단위들을 결정할 수 있고 짝수개의 부호화 단위들의 위치에 대한 정보를 이용하여 소정 위치의 부호화 단위를 결정할 수 있다. 이에 대한 구체적인 과정은 도 6에서 상술한 홀수개의 부호화 단위들 중 소정 위치(예를 들면, 가운데 위치)의 부호화 단위를 결정하는 과정에 대응하는 과정일 수 있으므로 생략하도록 한다.
일 실시예에 따라, 비-정사각형 형태의 현재 부호화 단위를 복수개의 부호화 단위로 분할한 경우, 복수개의 부호화 단위들 중 소정 위치의 부호화 단위를 결정하기 위하여 분할 과정에서 소정 위치의 부호화 단위에 대한 소정의 정보를 이용할 수 있다. 예를 들면 영상 복호화 장치(100)는 현재 부호화 단위가 복수개로 분할된 부호화 단위들 중 가운데에 위치하는 부호화 단위를 결정하기 위하여 분할 과정에서 가운데 부호화 단위에 포함된 샘플에 저장된 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나를 이용할 수 있다.
도 6을 참조하면 영상 복호화 장치(100)는 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 현재 부호화 단위(600)를 복수개의 부호화 단위들(620a, 620b, 620c)로 분할할 수 있으며, 복수개의 부호화 단위들(620a, 620b, 620c) 중 가운데에 위치하는 부호화 단위(620b)를 결정할 수 있다. 나아가 영상 복호화 장치(100)는 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나가 획득되는 위치를 고려하여, 가운데에 위치하는 부호화 단위(620b)를 결정할 수 있다. 즉, 현재 부호화 단위(600)의 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나는 현재 부호화 단위(600)의 가운데에 위치하는 샘플(640)에서 획득될 수 있으며, 상기 블록 형태 정보 및 상기 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 현재 부호화 단위(600)가 복수개의 부호화 단위들(620a, 620b, 620c)로 분할된 경우 상기 샘플(640)을 포함하는 부호화 단위(620b)를 가운데에 위치하는 부호화 단위로 결정할 수 있다. 다만 가운데에 위치하는 부호화 단위로 결정하기 위해 이용되는 정보가 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나로 한정하여 해석되어서는 안되고, 다양한 종류의 정보가 가운데에 위치하는 부호화 단위를 결정하는 과정에서 이용될 수 있다.
일 실시예에 따라 소정 위치의 부호화 단위를 식별하기 위한 소정의 정보는, 결정하려는 부호화 단위에 포함되는 소정의 샘플에서 획득될 수 있다. 도 6을 참조하면, 영상 복호화 장치(100)는 현재 부호화 단위(600)가 분할되어 결정된 복수개의 부호화 단위들(620a, 620b, 620c) 중 소정 위치의 부호화 단위(예를 들면, 복수개로 분할된 부호화 단위 중 가운데에 위치하는 부호화 단위)를 결정하기 위하여 현재 부호화 단위(600) 내의 소정 위치의 샘플(예를 들면, 현재 부호화 단위(600)의 가운데에 위치하는 샘플)에서 획득되는 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나를 이용할 수 있다. 즉, 영상 복호화 장치(100)는 현재 부호화 단위(600)의 블록 형태를 고려하여 상기 소정 위치의 샘플을 결정할 수 있고, 영상 복호화 장치(100)는 현재 부호화 단위(600)가 분할되어 결정되는 복수개의 부호화 단위들(620a, 620b, 620c) 중, 소정의 정보(예를 들면, 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나)가 획득될 수 있는 샘플이 포함된 부호화 단위(620b)를 결정하여 소정의 제한을 둘 수 있다. 도 6을 참조하면 일 실시예에 따라 영상 복호화 장치(100)는 소정의 정보가 획득될 수 있는 샘플로서 현재 부호화 단위(600)의 가운데에 위치하는 샘플(640)을 결정할 수 있고, 영상 복호화 장치(100)는 이러한 샘플(640)이 포함되는 부호화 단위(620b)를 복호화 과정에서의 소정의 제한을 둘 수 있다. 다만 소정의 정보가 획득될 수 있는 샘플의 위치는 상술한 위치로 한정하여 해석되어서는 안되고, 제한을 두기 위해 결정하려는 부호화 단위(620b)에 포함되는 임의의 위치의 샘플들로 해석될 수 있다.
일 실시예에 따라 소정의 정보가 획득될 수 있는 샘플의 위치는 현재 부호화 단위(600)의 형태에 따라 결정될 수 있다. 일 실시예에 따라 블록 형태 정보는 현재 부호화 단위의 형태가 정사각형인지 또는 비-정사각형인지 여부를 결정할 수 있고, 형태에 따라 소정의 정보가 획득될 수 있는 샘플의 위치를 결정할 수 있다. 예를 들면, 영상 복호화 장치(100)는 현재 부호화 단위의 너비에 대한 정보 및 높이에 대한 정보 중 적어도 하나를 이용하여 현재 부호화 단위의 너비 및 높이 중 적어도 하나를 반으로 분할하는 경계 상에 위치하는 샘플을 소정의 정보가 획득될 수 있는 샘플로 결정할 수 있다. 또다른 예를 들면, 영상 복호화 장치(100)는 현재 부호화 단위에 관련된 블록 형태 정보가 비-정사각형 형태임을 나타내는 경우, 현재 부호화 단위의 긴 변을 반으로 분할하는 경계에 인접하는 샘플 중 하나를 소정의 정보가 획득될 수 있는 샘플로 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 현재 부호화 단위를 복수개의 부호화 단위로 분할한 경우, 복수개의 부호화 단위들 중 소정 위치의 부호화 단위를 결정하기 위하여, 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나를 이용할 수 있다. 일 실시예에 따라 영상 복호화 장치(100)는 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나를 부호화 단위에 포함된 소정 위치의 샘플에서 획득할 수 있고, 영상 복호화 장치(100)는 현재 부호화 단위가 분할되어 생성된 복수개의 부호화 단위들을 복수개의 부호화 단위 각각에 포함된 소정 위치의 샘플로부터 획득되는 분할 형태 모드에 대한 정보 및 블록 형태 정보 중 적어도 하나를 이용하여 분할할 수 있다. 즉, 부호화 단위는 부호화 단위 각각에 포함된 소정 위치의 샘플에서 획득되는 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나를 이용하여 재귀적으로 분할될 수 있다. 부호화 단위의 재귀적 분할 과정에 대하여는 도 5를 통해 상술하였으므로 자세한 설명은 생략하도록 한다.
일 실시예에 따라 영상 복호화 장치(100)는 현재 부호화 단위를 분할하여 적어도 하나의 부호화 단위를 결정할 수 있고, 이러한 적어도 하나의 부호화 단위가 복호화되는 순서를 소정의 블록(예를 들면, 현재 부호화 단위)에 따라 결정할 수 있다.
도 7는 일 실시예에 따라 영상 복호화 장치(100)가 현재 부호화 단위를 분할하여 복수개의 부호화 단위들을 결정하는 경우, 복수개의 부호화 단위들이 처리되는 순서를 도시한다.
일 실시예에 따라 영상 복호화 장치(100)는 블록 형태 정보 및 분할 형태 모드에 대한 정보에 따라 제1 부호화 단위(700)를 수직 방향으로 분할하여 제2 부호화 단위(710a, 710b)를 결정하거나 제1 부호화 단위(700)를 수평 방향으로 분할하여 제2 부호화 단위(730a, 730b)를 결정하거나 제1 부호화 단위(700)를 수직 방향 및 수평 방향으로 분할하여 제2 부호화 단위(750a, 750b, 750c, 750d)를 결정할 수 있다.
도 7를 참조하면, 영상 복호화 장치(100)는 제1 부호화 단위(700)를 수직 방향으로 분할하여 결정된 제2 부호화 단위(710a, 710b)를 수평 방향(710c)으로 처리되도록 순서를 결정할 수 있다. 영상 복호화 장치(100)는 제1 부호화 단위(700)를 수평 방향으로 분할하여 결정된 제2 부호화 단위(730a, 730b)의 처리 순서를 수직 방향(730c)으로 결정할 수 있다. 영상 복호화 장치(100)는 제1 부호화 단위(700)를 수직 방향 및 수평 방향으로 분할하여 결정된 제2 부호화 단위(750a, 750b, 750c, 750d)를 하나의 행에 위치하는 부호화 단위들이 처리된 후 다음 행에 위치하는 부호화 단위들이 처리되는 소정의 순서(예를 들면, 래스터 스캔 순서((raster scan order) 또는 z 스캔 순서(z scan order)(750e) 등)에 따라 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 부호화 단위들을 재귀적으로 분할할 수 있다. 도 7를 참조하면, 영상 복호화 장치(100)는 제1 부호화 단위(700)를 분할하여 복수개의 부호화 단위들(710a, 710b, 730a, 730b, 750a, 750b, 750c, 750d)을 결정할 수 있고, 결정된 복수개의 부호화 단위들(710a, 710b, 730a, 730b, 750a, 750b, 750c, 750d) 각각을 재귀적으로 분할할 수 있다. 복수개의 부호화 단위들(710a, 710b, 730a, 730b, 750a, 750b, 750c, 750d)을 분할하는 방법은 제1 부호화 단위(700)를 분할하는 방법에 대응하는 방법이 될 수 있다. 이에 따라 복수개의 부호화 단위들(710a, 710b, 730a, 730b, 750a, 750b, 750c, 750d)은 각각 독립적으로 복수개의 부호화 단위들로 분할될 수 있다. 도 7를 참조하면 영상 복호화 장치(100)는 제1 부호화 단위(700)를 수직 방향으로 분할하여 제2 부호화 단위(710a, 710b)를 결정할 수 있고, 나아가 제2 부호화 단위(710a, 710b) 각각을 독립적으로 분할하거나 분할하지 않는 것으로 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 좌측의 제2 부호화 단위(710a)를 수평 방향으로 분할하여 제3 부호화 단위(720a, 720b)로 분할할 수 있고, 우측의 제2 부호화 단위(710b)는 분할하지 않을 수 있다.
일 실시예에 따라 부호화 단위들의 처리 순서는 부호화 단위의 분할 과정에 기초하여 결정될 수 있다. 다시 말해, 분할된 부호화 단위들의 처리 순서는 분할되기 직전의 부호화 단위들의 처리 순서에 기초하여 결정될 수 있다. 영상 복호화 장치(100)는 좌측의 제2 부호화 단위(710a)가 분할되어 결정된 제3 부호화 단위(720a, 720b)가 처리되는 순서를 우측의 제2 부호화 단위(710b)와 독립적으로 결정할 수 있다. 좌측의 제2 부호화 단위(710a)가 수평 방향으로 분할되어 제3 부호화 단위(720a, 720b)가 결정되었으므로 제3 부호화 단위(720a, 720b)는 수직 방향(720c)으로 처리될 수 있다. 또한 좌측의 제2 부호화 단위(710a) 및 우측의 제2 부호화 단위(710b)가 처리되는 순서는 수평 방향(710c)에 해당하므로, 좌측의 제2 부호화 단위(710a)에 포함되는 제3 부호화 단위(720a, 720b)가 수직 방향(720c)으로 처리된 후에 우측 부호화 단위(710b)가 처리될 수 있다. 상술한 내용은 부호화 단위들이 각각 분할 전의 부호화 단위에 따라 처리 순서가 결정되는 과정을 설명하기 위한 것이므로, 상술한 실시예에 한정하여 해석되어서는 안되고, 다양한 형태로 분할되어 결정되는 부호화 단위들이 소정의 순서에 따라 독립적으로 처리될 수 있는 다양한 방법으로 이용되는 것으로 해석되어야 한다.
도 8는 일 실시예에 따라 영상 복호화 장치(100)가 소정의 순서로 부호화 단위가 처리될 수 없는 경우, 현재 부호화 단위가 홀수개의 부호화 단위로 분할되는 것임을 결정하는 과정을 도시한다.
일 실시예에 따라 영상 복호화 장치(100)는 획득된 블록 형태 정보 및 분할 형태 모드에 대한 정보에 기초하여 현재 부호화 단위가 홀수개의 부호화 단위들로 분할되는 것을 결정할 수 있다. 도 8를 참조하면 정사각형 형태의 제1 부호화 단위(800)가 비-정사각형 형태의 제2 부호화 단위(810a, 810b)로 분할될 수 있고, 제2 부호화 단위(810a, 810b)는 각각 독립적으로 제3 부호화 단위(820a, 820b, 820c, 820d, 820e)로 분할될 수 있다. 일 실시예에 따라 영상 복호화 장치(100)는 제2 부호화 단위 중 좌측 부호화 단위(810a)는 수평 방향으로 분할하여 복수개의 제3 부호화 단위(820a, 820b)를 결정할 수 있고, 우측 부호화 단위(810b)는 홀수개의 제3 부호화 단위(820c, 820d, 820e)로 분할할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 제3 부호화 단위들(820a, 820b, 820c, 820d, 820e)이 소정의 순서로 처리될 수 있는지 여부를 판단하여 홀수개로 분할된 부호화 단위가 존재하는지를 결정할 수 있다. 도 8를 참조하면, 영상 복호화 장치(100)는 제1 부호화 단위(800)를 재귀적으로 분할하여 제3 부호화 단위(820a, 820b, 820c, 820d, 820e)를 결정할 수 있다. 영상 복호화 장치(100)는 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여, 제1 부호화 단위(800), 제2 부호화 단위(810a, 810b) 또는 제3 부호화 단위(820a, 820b, 820c, 820d, 820e)가 분할되는 형태 중 홀수개의 부호화 단위로 분할되는지 여부를 결정할 수 있다. 예를 들면, 제2 부호화 단위(810a, 810b) 중 우측에 위치하는 부호화 단위가 홀수개의 제3 부호화 단위(820c, 820d, 820e)로 분할될 수 있다. 제1 부호화 단위(800)에 포함되는 복수개의 부호화 단위들이 처리되는 순서는 소정의 순서(예를 들면, z-스캔 순서(z-scan order)(830))가 될 수 있고, 영상 복호화 장치(100)는 우측 제2 부호화 단위(810b)가 홀수개로 분할되어 결정된 제3 부호화 단위(820c, 820d, 820e)가 상기 소정의 순서에 따라 처리될 수 있는 조건을 만족하는지를 판단할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 제1 부호화 단위(800)에 포함되는 제3 부호화 단위(820a, 820b, 820c, 820d, 820e)가 소정의 순서에 따라 처리될 수 있는 조건을 만족하는지를 결정할 수 있으며, 상기 조건은 제3 부호화 단위(820a, 820b, 820c, 820d, 820e)의 경계에 따라 제2 부호화 단위(810a, 810b)의 너비 및 높이 중 적어도 하나를 반으로 분할되는지 여부와 관련된다. 예를 들면 비-정사각형 형태의 좌측 제2 부호화 단위(810a)의 높이를 반으로 분할하여 결정되는 제3 부호화 단위(820a, 820b)는 조건을 만족할 수 있다. 우측 제2 부호화 단위(810b)를 3개의 부호화 단위로 분할하여 결정되는 제3 부호화 단위(820c, 820d, 820e)들의 경계가 우측 제2 부호화 단위(810b)의 너비 또는 높이를 반으로 분할하지 못하므로 제3 부호화 단위(820c, 820d, 820e)는 조건을 만족하지 못하는 것으로 결정될 수 있다. 영상 복호화 장치(100)는 이러한 조건 불만족의 경우 스캔 순서의 단절(disconnection)로 판단하고, 판단 결과에 기초하여 우측 제2 부호화 단위(810b)는 홀수개의 부호화 단위로 분할되는 것으로 결정할 수 있다. 일 실시예에 따라 영상 복호화 장치(100)는 홀수개의 부호화 단위로 분할되는 경우 분할된 부호화 단위들 중 소정 위치의 부호화 단위에 대하여 소정의 제한을 둘 수 있으며, 이러한 제한 내용 또는 소정 위치 등에 대하여는 다양한 실시예를 통해 상술하였으므로 자세한 설명은 생략하도록 한다.
도 9은 일 실시예에 따라 영상 복호화 장치(100)가 제1 부호화 단위(900)를 분할하여 적어도 하나의 부호화 단위를 결정하는 과정을 도시한다.
일 실시예에 따라 영상 복호화 장치(100)는 수신부(110)를 통해 획득한 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 제1 부호화 단위(900)를 분할할 수 있다. 정사각형 형태의 제1 부호화 단위(900)는 4개의 정사각형 형태를 가지는 부호화 단위로 분할되거나 또는 비-정사각형 형태의 복수개의 부호화 단위로 분할할 수 있다. 예를 들면 도 9을 참조하면, 블록 형태 정보가 제1 부호화 단위(900)는 정사각형임을 나타내고 분할 형태 모드에 대한 정보가 비-정사각형의 부호화 단위로 분할됨을 나타내는 경우 영상 복호화 장치(100)는 제1 부호화 단위(900)를 복수개의 비-정사각형의 부호화 단위들로 분할할 수 있다. 구체적으로, 분할 형태 모드에 대한 정보가 제1 부호화 단위(900)를 수평 방향 또는 수직 방향으로 분할하여 홀수개의 부호화 단위를 결정하는 것을 나타내는 경우, 영상 복호화 장치(100)는 정사각형 형태의 제1 부호화 단위(900)를 홀수개의 부호화 단위들로서 수직 방향으로 분할되어 결정된 제2 부호화 단위(910a, 910b, 910c) 또는 수평 방향으로 분할되어 결정된 제2 부호화 단위(920a, 920b, 920c)로 분할할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 제1 부호화 단위(900)에 포함되는 제2 부호화 단위(910a, 910b, 910c, 920a, 920b, 920c)가 소정의 순서에 따라 처리될 수 있는 조건을 만족하는지를 결정할 수 있으며, 상기 조건은 제2 부호화 단위(910a, 910b, 910c, 920a, 920b, 920c)의 경계에 따라 제1 부호화 단위(900)의 너비 및 높이 중 적어도 하나를 반으로 분할되는지 여부와 관련된다. 도 9를 참조하면 정사각형 형태의 제1 부호화 단위(900)를 수직 방향으로 분할하여 결정되는 제2 부호화 단위(910a, 910b, 910c)들의 경계가 제1 부호화 단위(900)의 너비를 반으로 분할하지 못하므로 제1 부호화 단위(900)는 소정의 순서에 따라 처리될 수 있는 조건을 만족하지 못하는 것으로 결정될 수 있다. 또한 정사각형 형태의 제1 부호화 단위(900)를 수평 방향으로 분할하여 결정되는 제2 부호화 단위(920a, 920b, 920c)들의 경계가 제1 부호화 단위(900)의 너비를 반으로 분할하지 못하므로 제1 부호화 단위(900)는 소정의 순서에 따라 처리될 수 있는 조건을 만족하지 못하는 것으로 결정될 수 있다. 영상 복호화 장치(100)는 이러한 조건 불만족의 경우 스캔 순서의 단절(disconnection)로 판단하고, 판단 결과에 기초하여 제1 부호화 단위(900)는 홀수개의 부호화 단위로 분할되는 것으로 결정할 수 있다. 일 실시예에 따라 영상 복호화 장치(100)는 홀수개의 부호화 단위로 분할되는 경우 분할된 부호화 단위들 중 소정 위치의 부호화 단위에 대하여 소정의 제한을 둘 수 있으며, 이러한 제한 내용 또는 소정 위치 등에 대하여는 다양한 실시예를 통해 상술하였으므로 자세한 설명은 생략하도록 한다.
일 실시예에 따라, 영상 복호화 장치(100)는 제1 부호화 단위를 분할하여 다양한 형태의 부호화 단위들을 결정할 수 있다.
도 9을 참조하면, 영상 복호화 장치(100)는 정사각형 형태의 제1 부호화 단위(900), 비-정사각형 형태의 제1 부호화 단위(930 또는 950)를 다양한 형태의 부호화 단위들로 분할할 수 있다.
도 10은 일 실시예에 따라 영상 복호화 장치(100)가 제1 부호화 단위(1000)가 분할되어 결정된 비-정사각형 형태의 제2 부호화 단위가 소정의 조건을 만족하는 경우 제2 부호화 단위가 분할될 수 있는 형태가 제한되는 것을 도시한다.
일 실시예에 따라 영상 복호화 장치(100)는 수신부(110)를 통해 획득한 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 정사각형 형태의 제1 부호화 단위(1000)를 비-정사각형 형태의 제2 부호화 단위(1010a, 1010b, 1020a, 1020b)로 분할하는 것으로 결정할 수 있다. 제2 부호화 단위(1010a, 1010b, 1020a, 1020b)는 독립적으로 분할될 수 있다. 이에 따라 영상 복호화 장치(100)는 제2 부호화 단위(1010a, 1010b, 1020a, 1020b) 각각에 관련된 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 복수개의 부호화 단위로 분할하거나 분할하지 않는 것을 결정할 수 있다. 일 실시예에 따라 영상 복호화 장치(100)는 수직 방향으로 제1 부호화 단위(1000)가 분할되어 결정된 비-정사각형 형태의 좌측 제2 부호화 단위(1010a)를 수평 방향으로 분할하여 제3 부호화 단위(1012a, 1012b)를 결정할 수 있다. 다만 영상 복호화 장치(100)는 좌측 제2 부호화 단위(1010a)를 수평 방향으로 분할한 경우, 우측 제2 부호화 단위(1010b)는 좌측 제2 부호화 단위(1010a)가 분할된 방향과 동일하게 수평 방향으로 분할될 수 없도록 제한할 수 있다. 만일 우측 제2 부호화 단위(1010b)가 동일한 방향으로 분할되어 제3 부호화 단위(1014a, 1014b)가 결정된 경우, 좌측 제2 부호화 단위(1010a) 및 우측 제2 부호화 단위(1010b)가 수평 방향으로 각각 독립적으로 분할됨으로써 제3 부호화 단위(1012a, 1012b, 1014a, 1014b)가 결정될 수 있다. 하지만 이는 영상 복호화 장치(100)가 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1000)를 4개의 정사각형 형태의 제2 부호화 단위(1030a, 1030b, 1030c, 1030d)로 분할한 것과 동일한 결과이며 이는 영상 복호화 측면에서 비효율적일 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 수평 방향으로 제1 부호화 단위(1000)가 분할되어 결정된 비-정사각형 형태의 제2 부호화 단위(1020a 또는 1020b)를 수직 방향으로 분할하여 제3 부호화 단위(1022a, 1022b, 1024a, 1024b)를 결정할 수 있다. 다만 영상 복호화 장치(100)는 제2 부호화 단위 중 하나(예를 들면 상단 제2 부호화 단위(1020a))를 수직 방향으로 분할한 경우, 상술한 이유에 따라 다른 제2 부호화 단위(예를 들면 하단 부호화 단위(1020b))는 상단 제2 부호화 단위(1020a)가 분할된 방향과 동일하게 수직 방향으로 분할될 수 없도록 제한할 수 있다.
도 11은 일 실시예에 따라 분할 형태 모드에 대한 정보가 4개의 정사각형 형태의 부호화 단위로 분할하는 것을 나타낼 수 없는 경우, 영상 복호화 장치(100)가 정사각형 형태의 부호화 단위를 분할하는 과정을 도시한다.
일 실시예에 따라 영상 복호화 장치(100)는 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1100)를 분할하여 제2 부호화 단위(1110a, 1110b, 1120a, 1120b 등)를 결정할 수 있다. 분할 형태 모드에 대한 정보에는 부호화 단위가 분할될 수 있는 다양한 형태에 대한 정보가 포함될 수 있으나, 다양한 형태에 대한 정보에는 정사각형 형태의 4개의 부호화 단위로 분할하기 위한 정보가 포함될 수 없는 경우가 있다. 이러한 분할 형태 모드에 대한 정보에 따르면, 영상 복호화 장치(100)는 정사각형 형태의 제1 부호화 단위(1100)를 4개의 정사각형 형태의 제2 부호화 단위(1130a, 1130b, 1130c, 1130d)로 분할하지 못한다. 분할 형태 모드에 대한 정보에 기초하여 영상 복호화 장치(100)는 비-정사각형 형태의 제2 부호화 단위(1110a, 1110b, 1120a, 1120b 등)를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 비-정사각형 형태의 제2 부호화 단위(1110a, 1110b, 1120a, 1120b 등)를 각각 독립적으로 분할할 수 있다. 재귀적인 방법을 통해 제2 부호화 단위(1110a, 1110b, 1120a, 1120b 등) 각각이 소정의 순서대로 분할될 수 있으며, 이는 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1100)가 분할되는 방법에 대응하는 분할 방법일 수 있다.
예를 들면 영상 복호화 장치(100)는 좌측 제2 부호화 단위(1110a)가 수평 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1112a, 1112b)를 결정할 수 있고, 우측 제2 부호화 단위(1110b)가 수평 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1114a, 1114b)를 결정할 수 있다. 나아가 영상 복호화 장치(100)는 좌측 제2 부호화 단위(1110a) 및 우측 제2 부호화 단위(1110b) 모두 수평 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1116a, 1116b, 1116c, 1116d)를 결정할 수도 있다. 이러한 경우 제1 부호화 단위(1100)가 4개의 정사각형 형태의 제2 부호화 단위(1130a, 1130b, 1130c, 1130d)로 분할된 것과 동일한 형태로 부호화 단위가 결정될 수 있다.
또 다른 예를 들면 영상 복호화 장치(100)는 상단 제2 부호화 단위(1120a)가 수직 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1122a, 1122b)를 결정할 수 있고, 하단 제2 부호화 단위(1120b)가 수직 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1124a, 1124b)를 결정할 수 있다. 나아가 영상 복호화 장치(100)는 상단 제2 부호화 단위(1120a) 및 하단 제2 부호화 단위(1120b) 모두 수직 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1126a, 1126b, 1126a, 1126b)를 결정할 수도 있다. 이러한 경우 제1 부호화 단위(1100)가 4개의 정사각형 형태의 제2 부호화 단위(1130a, 1130b, 1130c, 1130d)로 분할된 것과 동일한 형태로 부호화 단위가 결정될 수 있다.
도 12는 일 실시예에 따라 복수개의 부호화 단위들 간의 처리 순서가 부호화 단위의 분할 과정에 따라 달라질 수 있음을 도시한 것이다.
일 실시예에 따라 영상 복호화 장치(100)는 블록 형태 정보 및 분할 형태 모드에 대한 정보에 기초하여 제1 부호화 단위(1200)를 분할할 수 있다. 블록 형태 정보가 정사각형 형태를 나타내고, 분할 형태 모드에 대한 정보가 제1 부호화 단위(1200)가 수평 방향 및 수직 방향 중 적어도 하나의 방향으로 분할됨을 나타내는 경우, 영상 복호화 장치(100)는 제1 부호화 단위(1200)를 분할하여 제2 부호화 단위(예를 들면, 1210a, 1210b, 1220a, 1220b 등)를 결정할 수 있다. 도 12를 참조하면 제1 부호화 단위1200)가 수평 방향 또는 수직 방향만으로 분할되어 결정된 비-정사각형 형태의 제2 부호화 단위(1210a, 1210b, 1220a, 1220b)는 각각에 대한 블록 형태 정보 및 분할 형태 모드에 대한 정보에 기초하여 독립적으로 분할될 수 있다. 예를 들면 영상 복호화 장치(100)는 제1 부호화 단위(1200)가 수직 방향으로 분할되어 생성된 제2 부호화 단위(1210a, 1210b)를 수평 방향으로 각각 분할하여 제3 부호화 단위(1216a, 1216b, 1216c, 1216d)를 결정할 수 있고, 제1 부호화 단위(1200)가 수평 방향으로 분할되어 생성된 제2 부호화 단위(1220a, 1220b)를 수평 방향으로 각각 분할하여 제3 부호화 단위(1226a, 1226b, 1226c, 1226d)를 결정할 수 있다. 이러한 제2 부호화 단위(1210a, 1210b, 1220a, 1220b)의 분할 과정은 도 11과 관련하여 상술하였으므로 자세한 설명은 생략하도록 한다.
일 실시예에 따라 영상 복호화 장치(100)는 소정의 순서에 따라 부호화 단위를 처리할 수 있다. 소정의 순서에 따른 부호화 단위의 처리에 대한 특징은 도 7와 관련하여 상술하였으므로 자세한 설명은 생략하도록 한다. 도 12를 참조하면 영상 복호화 장치(100)는 정사각형 형태의 제1 부호화 단위(1200)를 분할하여 4개의 정사각형 형태의 제3 부호화 단위(1216a, 1216b, 1216c, 1216d, 1226a, 1226b, 1226c, 1226d)를 결정할 수 있다. 일 실시예에 따라 영상 복호화 장치(100)는 제1 부호화 단위(1200)가 분할되는 형태에 따라 제3 부호화 단위(1216a, 1216b, 1216c, 1216d, 1226a, 1226b, 1226c, 1226d)의 처리 순서를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 수직 방향으로 분할되어 생성된 제2 부호화 단위(1210a, 1210b)를 수평 방향으로 각각 분할하여 제3 부호화 단위(1216a, 1216b, 1216c, 1216d)를 결정할 수 있고, 영상 복호화 장치(100)는 좌측 제2 부호화 단위(1210a)에 포함되는 제3 부호화 단위(1216a, 1216c)를 수직 방향으로 먼저 처리한 후, 우측 제2 부호화 단위(1210b)에 포함되는 제3 부호화 단위(1216b, 1216d)를 수직 방향으로 처리하는 순서(1217)에 따라 제3 부호화 단위(1216a, 1216b, 1216c, 1216d)를 처리할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 수평 방향으로 분할되어 생성된 제2 부호화 단위(1220a, 1220b)를 수직 방향으로 각각 분할하여 제3 부호화 단위(1226a, 1226b, 1226c, 1226d)를 결정할 수 있고, 영상 복호화 장치(100)는 상단 제2 부호화 단위(1220a)에 포함되는 제3 부호화 단위(1226a, 1226b)를 수평 방향으로 먼저 처리한 후, 하단 제2 부호화 단위(1220b)에 포함되는 제3 부호화 단위(1226c, 1226d)를 수평 방향으로 처리하는 순서(1227)에 따라 제3 부호화 단위(1226a, 1226b, 1226c, 1226d)를 처리할 수 있다.
도 12를 참조하면, 제2 부호화 단위(1210a, 1210b, 1220a, 1220b)가 각각 분할되어 정사각형 형태의 제3 부호화 단위(1216a, 1216b, 1216c, 1216d, 1226a, 1226b, 1226c, 1226d)가 결정될 수 있다. 수직 방향으로 분할되어 결정된 제2 부호화 단위(1210a, 1210b) 및 수평 방향으로 분할되어 결정된 제2 부호화 단위(1220a, 1220b)는 서로 다른 형태로 분할된 것이지만, 이후에 결정되는 제3 부호화 단위(1216a, 1216b, 1216c, 1216d, 1226a, 1226b, 1226c, 1226d)에 따르면 결국 동일한 형태의 부호화 단위들로 제1 부호화 단위(1200)가 분할된 결과가 된다. 이에 따라 영상 복호화 장치(100)는 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 상이한 과정을 통해 재귀적으로 부호화 단위를 분할함으로써 결과적으로 동일한 형태의 부호화 단위들을 결정하더라도, 동일한 형태로 결정된 복수개의 부호화 단위들을 서로 다른 순서로 처리할 수 있다.
도 13은 일 실시예에 따라 부호화 단위가 재귀적으로 분할되어 복수개의 부호화 단위가 결정되는 경우, 부호화 단위의 형태 및 크기가 변함에 따라 부호화 단위의 심도가 결정되는 과정을 도시한다.
일 실시예에 따라 영상 복호화 장치(100)는 부호화 단위의 심도를 소정의 기준에 따라 결정할 수 있다. 예를 들면 소정의 기준은 부호화 단위의 긴 변의 길이가 될 수 있다. 영상 복호화 장치(100)는 현재 부호화 단위의 긴 변의 길이가 분할되기 전의 부호화 단위의 긴 변의 길이보다 2n (n>0) 배로 분할된 경우, 현재 부호화 단위의 심도는 분할되기 전의 부호화 단위의 심도보다 n만큼 심도가 증가된 것으로 결정할 수 있다. 이하에서는 심도가 증가된 부호화 단위를 하위 심도의 부호화 단위로 표현하도록 한다.
도 13을 참조하면, 일 실시예에 따라 정사각형 형태임을 나타내는 블록 형태 정보(예를 들면 블록 형태 정보는 ′0: SQUARE′를 나타낼 수 있음)에 기초하여 영상 복호화 장치(100)는 정사각형 형태인 제1 부호화 단위(1300)를 분할하여 하위 심도의 제2 부호화 단위(1302), 제3 부호화 단위(1304) 등을 결정할 수 있다. 정사각형 형태의 제1 부호화 단위(1300)의 크기를 2Nx2N이라고 한다면, 제1 부호화 단위(1300)의 너비 및 높이를 1/2배로 분할하여 결정된 제2 부호화 단위(1302)는 NxN의 크기를 가질 수 있다. 나아가 제2 부호화 단위(1302)의 너비 및 높이를 1/2크기로 분할하여 결정된 제3 부호화 단위(1304)는 N/2xN/2의 크기를 가질 수 있다. 이 경우 제3 부호화 단위(1304)의 너비 및 높이는 제1 부호화 단위(1300)의 1/4배에 해당한다. 제1 부호화 단위(1300)의 심도가 D인 경우 제1 부호화 단위(1300)의 너비 및 높이의 1/2배인 제2 부호화 단위(1302)의 심도는 D+1일 수 있고, 제1 부호화 단위(1300)의 너비 및 높이의 1/4배인 제3 부호화 단위(1304)의 심도는 D+2일 수 있다.
일 실시예에 따라 비-정사각형 형태를 나타내는 블록 형태 정보(예를 들면 블록 형태 정보는, 높이가 너비보다 긴 비-정사각형임을 나타내는 ′1: NS_VER′ 또는 너비가 높이보다 긴 비-정사각형임을 나타내는 ′2: NS_HOR′를 나타낼 수 있음)에 기초하여, 영상 복호화 장치(100)는 비-정사각형 형태인 제1 부호화 단위(1310 또는 1320)를 분할하여 하위 심도의 제2 부호화 단위(1312 또는 1322), 제3 부호화 단위(1314 또는 1324) 등을 결정할 수 있다.
영상 복호화 장치(100)는 Nx2N 크기의 제1 부호화 단위(1310)의 너비 및 높이 중 적어도 하나를 분할하여 제2 부호화 단위(예를 들면, 1302, 1312, 1322 등)를 결정할 수 있다. 즉, 영상 복호화 장치(100)는 제1 부호화 단위(1310)를 수평 방향으로 분할하여 NxN 크기의 제2 부호화 단위(1302) 또는 NxN/2 크기의 제2 부호화 단위(1322)를 결정할 수 있고, 수평 방향 및 수직 방향으로 분할하여 N/2xN 크기의 제2 부호화 단위(1312)를 결정할 수도 있다.
일 실시예에 따라 영상 복호화 장치(100)는 2NxN 크기의 제1 부호화 단위(1320) 의 너비 및 높이 중 적어도 하나를 분할하여 제2 부호화 단위(예를 들면, 1302, 1312, 1322 등)를 결정할 수도 있다. 즉, 영상 복호화 장치(100)는 제1 부호화 단위(1320)를 수직 방향으로 분할하여 NxN 크기의 제2 부호화 단위(1302) 또는 N/2xN 크기의 제2 부호화 단위(1312)를 결정할 수 있고, 수평 방향 및 수직 방향으로 분할하여 NxN/2 크기의 제2 부호화 단위(1322)를 결정할 수도 있다.
일 실시예에 따라 영상 복호화 장치(100)는 NxN 크기의 제2 부호화 단위(1302) 의 너비 및 높이 중 적어도 하나를 분할하여 제3 부호화 단위(예를 들면, 1304, 1314, 1324 등)를 결정할 수도 있다. 즉, 영상 복호화 장치(100)는 제2 부호화 단위(1302)를 수직 방향 및 수평 방향으로 분할하여 N/2xN/2 크기의 제3 부호화 단위(1304)를 결정하거나 N/4xN/2 크기의 제3 부호화 단위(1314)를 결정하거나 N/2xN/4 크기의 제3 부호화 단위(1324)를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 N/2xN 크기의 제2 부호화 단위(1312)의 너비 및 높이 중 적어도 하나를 분할하여 제3 부호화 단위(예를 들면, 1304, 1314, 1324 등)를 결정할 수도 있다. 즉, 영상 복호화 장치(100)는 제2 부호화 단위(1312)를 수평 방향으로 분할하여 N/2xN/2 크기의 제3 부호화 단위(1304) 또는 N/2xN/4 크기의 제3 부호화 단위(1324)를 결정하거나 수직 방향 및 수평 방향으로 분할하여 N/4xN/2 크기의 제3 부호화 단위(1314)를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 NxN/2 크기의 제2 부호화 단위(1322)의 너비 및 높이 중 적어도 하나를 분할하여 제3 부호화 단위(예를 들면, 1304, 1314, 1324 등)를 결정할 수도 있다. 즉, 영상 복호화 장치(100)는 제2 부호화 단위(1322)를 수직 방향으로 분할하여 N/2xN/2 크기의 제3 부호화 단위(1304) 또는 N/4xN/2 크기의 제3 부호화 단위(1314)를 결정하거나 수직 방향 및 수평 방향으로 분할하여 N/2xN/4크기의 제3 부호화 단위(1324)를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 정사각형 형태의 부호화 단위(예를 들면, 1300, 1302, 1304)를 수평 방향 또는 수직 방향으로 분할할 수 있다. 예를 들면, 2Nx2N 크기의 제1 부호화 단위(1300)를 수직 방향으로 분할하여 Nx2N 크기의 제1 부호화 단위(1310)를 결정하거나 수평 방향으로 분할하여 2NxN 크기의 제1 부호화 단위(1320)를 결정할 수 있다. 일 실시예에 따라 심도가 부호화 단위의 가장 긴 변의 길이에 기초하여 결정되는 경우, 2Nx2N 크기의 제1 부호화 단위(1300)가 수평 방향 또는 수직 방향으로 분할되어 결정되는 부호화 단위의 심도는 제1 부호화 단위(1300)의 심도와 동일할 수 있다.
일 실시예에 따라 제3 부호화 단위(1314 또는 1324)의 너비 및 높이는 제1 부호화 단위(1310 또는 1320)의 1/4배에 해당할 수 있다. 제1 부호화 단위(1310 또는 1320)의 심도가 D인 경우 제1 부호화 단위(1310 또는 1320)의 너비 및 높이의 1/2배인 제2 부호화 단위(1312 또는 1322)의 심도는 D+1일 수 있고, 제1 부호화 단위(1310 또는 1320)의 너비 및 높이의 1/4배인 제3 부호화 단위(1314 또는 1324)의 심도는 D+2일 수 있다.
도 14은 일 실시예에 따라 부호화 단위들의 형태 및 크기에 따라 결정될 수 있는 심도 및 부호화 단위 구분을 위한 인덱스(part index, 이하 PID)를 도시한다.
일 실시예에 따라 영상 복호화 장치(100)는 정사각형 형태의 제1 부호화 단위(1400)를 분할하여 다양한 형태의 제2 부호화 단위를 결정할 수 있다. 도 14를 참조하면, 영상 복호화 장치(100)는 분할 형태 모드에 대한 정보에 따라 제1 부호화 단위(1400)를 수직 방향 및 수평 방향 중 적어도 하나의 방향으로 분할하여 제2 부호화 단위(1402a, 1402b, 1404a, 1404b, 1406a, 1406b, 1406c, 1406d)를 결정할 수 있다. 즉, 영상 복호화 장치(100)는 제1 부호화 단위(1400)에 대한 분할 형태 모드에 대한 정보에 기초하여 제2 부호화 단위(1402a, 1402b, 1404a, 1404b, 1406a, 1406b, 1406c, 1406d)를 결정할 수 있다.
일 실시예에 따라 정사각형 형태의 제1 부호화 단위(1400)에 대한 분할 형태 모드에 대한 정보에 따라 결정되는 제2 부호화 단위(1402a, 1402b, 1404a, 1404b, 1406a, 1406b, 1406c, 1406d)는 긴 변의 길이에 기초하여 심도가 결정될 수 있다. 예를 들면, 정사각형 형태의 제1 부호화 단위(1400)의 한 변의 길이와 비-정사각형 형태의 제2 부호화 단위(1402a, 1402b, 1404a, 1404b)의 긴 변의 길이가 동일하므로, 제1 부호화 단위(1400)와 비-정사각형 형태의 제2 부호화 단위(1402a, 1402b, 1404a, 1404b)의 심도는 D로 동일하다고 볼 수 있다. 이에 반해 영상 복호화 장치(100)가 분할 형태 모드에 대한 정보에 기초하여 제1 부호화 단위(1400)를 4개의 정사각형 형태의 제2 부호화 단위(1406a, 1406b, 1406c, 1406d)로 분할한 경우, 정사각형 형태의 제2 부호화 단위(1406a, 1406b, 1406c, 1406d)의 한 변의 길이는 제1 부호화 단위(1400)의 한 변의 길이의 1/2배 이므로, 제2 부호화 단위(1406a, 1406b, 1406c, 1406d)의 심도는 제1 부호화 단위(1400)의 심도인 D보다 한 심도 하위인 D+1의 심도일 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 높이가 너비보다 긴 형태의 제1 부호화 단위(1410)를 분할 형태 모드에 대한 정보에 따라 수평 방향으로 분할하여 복수개의 제2 부호화 단위(1412a, 1412b, 1414a, 1414b, 1414c)로 분할할 수 있다. 일 실시예에 따라 영상 복호화 장치(100)는 너비가 높이보다 긴 형태의 제1 부호화 단위(1420)를 분할 형태 모드에 대한 정보에 따라 수직 방향으로 분할하여 복수개의 제2 부호화 단위(1422a, 1422b, 1424a, 1424b, 1424c)로 분할할 수 있다.
일 실시예에 따라 비-정사각형 형태의 제1 부호화 단위(1410 또는 1420)에 대한 분할 형태 모드에 대한 정보에 따라 결정되는 제2 부호화 단위(1412a, 1412b, 1414a, 1414b, 1414c. 1422a, 1422b, 1424a, 1424b, 1424c)는 긴 변의 길이에 기초하여 심도가 결정될 수 있다. 예를 들면, 정사각형 형태의 제2 부호화 단위(1412a, 1412b)의 한 변의 길이는 높이가 너비보다 긴 비-정사각형 형태의 제1 부호화 단위(1410)의 한 변의 길이의 1/2배이므로, 정사각형 형태의 제2 부호화 단위(1412a, 1412b)의 심도는 비-정사각형 형태의 제1 부호화 단위(1410)의 심도 D보다 한 심도 하위의 심도인 D+1이다.
나아가 영상 복호화 장치(100)가 분할 형태 모드에 대한 정보에 기초하여 비-정사각형 형태의 제1 부호화 단위(1410)를 홀수개의 제2 부호화 단위(1414a, 1414b, 1414c)로 분할할 수 있다. 홀수개의 제2 부호화 단위(1414a, 1414b, 1414c)는 비-정사각형 형태의 제2 부호화 단위(1414a, 1414c) 및 정사각형 형태의 제2 부호화 단위(1414b)를 포함할 수 있다. 이 경우 비-정사각형 형태의 제2 부호화 단위(1414a, 1414c)의 긴 변의 길이 및 정사각형 형태의 제2 부호화 단위(1414b)의 한 변의 길이는 제1 부호화 단위(1410)의 한 변의 길이의 1/2배 이므로, 제2 부호화 단위(1414a, 1414b, 1414c)의 심도는 제1 부호화 단위(1410)의 심도인 D보다 한 심도 하위인 D+1의 심도일 수 있다. 영상 복호화 장치(100)는 제1 부호화 단위(1410)와 관련된 부호화 단위들의 심도를 결정하는 상기 방식에 대응하는 방식으로, 너비가 높이보다 긴 비-정사각형 형태의 제1 부호화 단위(1420)와 관련된 부호화 단위들의 심도를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 분할된 부호화 단위들의 구분을 위한 인덱스(PID)를 결정함에 있어서, 홀수개로 분할된 부호화 단위들이 서로 동일한 크기가 아닌 경우, 부호화 단위들 간의 크기 비율에 기초하여 인덱스를 결정할 수 있다. 도 14를 참조하면, 홀수개로 분할된 부호화 단위들(1414a, 1414b, 1414c) 중 가운데에 위치하는 부호화 단위(1414b)는 다른 부호화 단위들(1414a, 1414c)와 너비는 동일하지만 높이가 다른 부호화 단위들(1414a, 1414c)의 높이의 두 배일 수 있다. 즉, 이 경우 가운데에 위치하는 부호화 단위(1414b)는 다른 부호화 단위들(1414a, 1414c)의 두 개를 포함할 수 있다. 따라서, 스캔 순서에 따라 가운데에 위치하는 부호화 단위(1414b)의 인덱스(PID)가 1이라면 그 다음 순서에 위치하는 부호화 단위(1414c)는 인덱스가 2가 증가한 3일수 있다. 즉 인덱스의 값의 불연속성이 존재할 수 있다. 일 실시예에 따라 영상 복호화 장치(100)는 이러한 분할된 부호화 단위들 간의 구분을 위한 인덱스의 불연속성의 존재 여부에 기초하여 홀수개로 분할된 부호화 단위들이 서로 동일한 크기가 아닌지 여부를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 현재 부호화 단위로부터 분할되어 결정된 복수개의 부호화 단위들을 구분하기 위한 인덱스의 값에 기초하여 특정 분할 형태로 분할된 것인지를 결정할 수 있다. 도 14를 참조하면 영상 복호화 장치(100)는 높이가 너비보다 긴 직사각형 형태의 제1 부호화 단위(1410)를 분할하여 짝수개의 부호화 단위(1412a, 1412b)를 결정하거나 홀수개의 부호화 단위(1414a, 1414b, 1414c)를 결정할 수 있다. 영상 복호화 장치(100)는 복수개의 부호화 단위 각각을 구분하기 위하여 각 부호화 단위를 나타내는 인덱스(PID)를 이용할 수 있다. 일 실시예에 따라 PID는 각각의 부호화 단위의 소정 위치의 샘플(예를 들면, 좌측 상단 샘플)에서 획득될 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 부호화 단위의 구분을 위한 인덱스를 이용하여 분할되어 결정된 부호화 단위들 중 소정 위치의 부호화 단위를 결정할 수 있다. 일 실시예에 따라 높이가 너비보다 긴 직사각형 형태의 제1 부호화 단위(1410)에 대한 분할 형태 모드에 대한 정보가 3개의 부호화 단위로 분할됨을 나타내는 경우 영상 복호화 장치(100)는 제1 부호화 단위(1410)를 3개의 부호화 단위(1414a, 1414b, 1414c)로 분할할 수 있다. 영상 복호화 장치(100)는 3개의 부호화 단위(1414a, 1414b, 1414c) 각각에 대한 인덱스를 할당할 수 있다. 영상 복호화 장치(100)는 홀수개로 분할된 부호화 단위 중 가운데 부호화 단위를 결정하기 위하여 각 부호화 단위에 대한 인덱스를 비교할 수 있다. 영상 복호화 장치(100)는 부호화 단위들의 인덱스에 기초하여 인덱스들 중 가운데 값에 해당하는 인덱스를 갖는 부호화 단위(1414b)를, 제1 부호화 단위(1410)가 분할되어 결정된 부호화 단위 중 가운데 위치의 부호화 단위로서 결정할 수 있다. 일 실시예에 따라 영상 복호화 장치(100)는 분할된 부호화 단위들의 구분을 위한 인덱스를 결정함에 있어서, 부호화 단위들이 서로 동일한 크기가 아닌 경우, 부호화 단위들 간의 크기 비율에 기초하여 인덱스를 결정할 수 있다. 도 14를 참조하면, 제1 부호화 단위(1410)가 분할되어 생성된 부호화 단위(1414b)는 다른 부호화 단위들(1414a, 1414c)와 너비는 동일하지만 높이가 다른 부호화 단위들(1414a, 1414c)의 높이의 두 배일 수 있다. 이 경우 가운데에 위치하는 부호화 단위(1414b)의 인덱스(PID)가 1이라면 그 다음 순서에 위치하는 부호화 단위(1414c)는 인덱스가 2가 증가한 3일수 있다. 이러한 경우처럼 균일하게 인덱스가 증가하다가 증가폭이 달라지는 경우, 영상 복호화 장치(100)는 다른 부호화 단위들과 다른 크기를 가지는 부호화 단위를 포함하는 복수개의 부호화 단위로 분할된 것으로 결정할 수 있다, 일 실시예에 따라 분할 형태 모드에 대한 정보가 홀수개의 부호화 단위로 분할됨을 나타내는 경우, 영상 복호화 장치(100)는 홀수개의 부호화 단위 중 소정 위치의 부호화 단위(예를 들면 가운데 부호화 단위)가 다른 부호화 단위와 크기가 다른 형태로 현재 부호화 단위를 분할할 수 있다. 이 경우 영상 복호화 장치(100)는 부호화 단위에 대한 인덱스(PID)를 이용하여 다른 크기를 가지는 가운데 부호화 단위를 결정할 수 있다. 다만 상술한 인덱스, 결정하고자 하는 소정 위치의 부호화 단위의 크기 또는 위치는 일 실시예를 설명하기 위해 특정한 것이므로 이에 한정하여 해석되어서는 안되며, 다양한 인덱스, 부호화 단위의 위치 및 크기가 이용될 수 있는 것으로 해석되어야 한다.
일 실시예에 따라 영상 복호화 장치(100)는 부호화 단위의 재귀적인 분할이 시작되는 소정의 데이터 단위를 이용할 수 있다.
도 15는 일 실시예에 따라 픽쳐에 포함되는 복수개의 소정의 데이터 단위에 따라 복수개의 부호화 단위들이 결정된 것을 도시한다.
일 실시예에 따라 소정의 데이터 단위는 부호화 단위가 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나를 이용하여 재귀적으로 분할되기 시작하는 데이터 단위로 정의될 수 있다. 즉, 현재 픽쳐를 분할하는 복수개의 부호화 단위들이 결정되는 과정에서 이용되는 최상위 심도의 부호화 단위에 해당할 수 있다. 이하에서는 설명 상 편의를 위해 이러한 소정의 데이터 단위를 기준 데이터 단위라고 지칭하도록 한다.
일 실시예에 따라 기준 데이터 단위는 소정의 크기 및 형태를 나타낼 수 있다. 일 실시예에 따라, 기준 부호화 단위는 MxN의 샘플들을 포함할 수 있다. 여기서 M 및 N은 서로 동일할 수도 있으며, 2의 승수로 표현되는 정수일 수 있다. 즉, 기준 데이터 단위는 정사각형 또는 비-정사각형의 형태를 나타낼 수 있으며, 이후에 정수개의 부호화 단위로 분할될 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 현재 픽쳐를 복수개의 기준 데이터 단위로 분할할 수 있다. 일 실시예에 따라 영상 복호화 장치(100)는 현재 픽쳐를 분할하는 복수개의 기준 데이터 단위를 각각의 기준 데이터 단위에 대한 분할 형태 모드에 대한 정보를 이용하여 분할할 수 있다. 이러한 기준 데이터 단위의 분할 과정은 쿼드 트리(quad-tree)구조를 이용한 분할 과정에 대응될 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 현재 픽쳐에 포함되는 기준 데이터 단위가 가질 수 있는 최소 크기를 미리 결정할 수 있다. 이에 따라, 영상 복호화 장치(100)는 최소 크기 이상의 크기를 갖는 다양한 크기의 기준 데이터 단위를 결정할 수 있고, 결정된 기준 데이터 단위를 기준으로 블록 형태 정보 및 분할 형태 모드에 대한 정보를 이용하여 적어도 하나의 부호화 단위를 결정할 수 있다.
도 15를 참조하면, 영상 복호화 장치(100)는 정사각형 형태의 기준 부호화 단위(1500)를 이용할 수 있고, 또는 비-정사각형 형태의 기준 부호화 단위(1502)를 이용할 수도 있다. 일 실시예에 따라 기준 부호화 단위의 형태 및 크기는 적어도 하나의 기준 부호화 단위를 포함할 수 있는 다양한 데이터 단위(예를 들면, 시퀀스(sequence), 픽쳐(picture), 슬라이스(slice), 슬라이스 세그먼트(slice segment), 최대부호화단위 등)에 따라 결정될 수 있다.
일 실시예에 따라 영상 복호화 장치(100)의 수신부(110)는 기준 부호화 단위의 형태에 대한 정보 및 기준 부호화 단위의 크기에 대한 정보 중 적어도 하나를 상기 다양한 데이터 단위마다 비트스트림으로부터 획득할 수 있다. 정사각형 형태의 기준 부호화 단위(1500)에 포함되는 적어도 하나의 부호화 단위가 결정되는 과정은 도 3의 현재 부호화 단위(300)가 분할되는 과정을 통해 상술하였고, 비-정사각형 형태의 기준 부호화 단위(1502)에 포함되는 적어도 하나의 부호화 단위가 결정되는 과정은 도 4의 현재 부호화 단위(400 또는 450)가 분할되는 과정을 통해 상술하였으므로 자세한 설명은 생략하도록 한다.
일 실시예에 따라 영상 복호화 장치(100)는 소정의 조건에 기초하여 미리 결정되는 일부 데이터 단위에 따라 기준 부호화 단위의 크기 및 형태를 결정하기 위하여, 기준 부호화 단위의 크기 및 형태를 식별하기 위한 인덱스를 이용할 수 있다. 즉, 수신부(110)는 비트스트림으로부터 상기 다양한 데이터 단위(예를 들면, 시퀀스, 픽쳐, 슬라이스, 슬라이스 세그먼트, 최대부호화단위 등) 중 소정의 조건(예를 들면 슬라이스 이하의 크기를 갖는 데이터 단위)을 만족하는 데이터 단위로서 슬라이스, 슬라이스 세그먼트, 최대부호화 단위 등 마다, 기준 부호화 단위의 크기 및 형태의 식별을 위한 인덱스만을 획득할 수 있다. 영상 복호화 장치(100)는 인덱스를 이용함으로써 상기 소정의 조건을 만족하는 데이터 단위마다 기준 데이터 단위의 크기 및 형태를 결정할 수 있다. 기준 부호화 단위의 형태에 대한 정보 및 기준 부호화 단위의 크기에 대한 정보를 상대적으로 작은 크기의 데이터 단위마다 비트스트림으로부터 획득하여 이용하는 경우, 비트스트림의 이용 효율이 좋지 않을 수 있으므로, 기준 부호화 단위의 형태에 대한 정보 및 기준 부호화 단위의 크기에 대한 정보를 직접 획득하는 대신 상기 인덱스만을 획득하여 이용할 수 있다. 이 경우 기준 부호화 단위의 크기 및 형태를 나타내는 인덱스에 대응하는 기준 부호화 단위의 크기 및 형태 중 적어도 하나는 미리 결정되어 있을 수 있다. 즉, 영상 복호화 장치(100)는 미리 결정된 기준 부호화 단위의 크기 및 형태 중 적어도 하나를 인덱스에 따라 선택함으로써, 인덱스 획득의 기준이 되는 데이터 단위에 포함되는 기준 부호화 단위의 크기 및 형태 중 적어도 하나를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 하나의 최대 부호화 단위에 포함하는 적어도 하나의 기준 부호화 단위를 이용할 수 있다. 즉, 영상을 분할하는 최대 부호화 단위에는 적어도 하나의 기준 부호화 단위가 포함될 수 있고, 각각의 기준 부호화 단위의 재귀적인 분할 과정을 통해 부호화 단위가 결정될 수 있다. 일 실시예에 따라 최대 부호화 단위의 너비 및 높이 중 적어도 하나는 기준 부호화 단위의 너비 및 높이 중 적어도 하나의 정수배에 해당할 수 있다. 일 실시예에 따라 기준 부호화 단위의 크기는 최대부호화단위를 쿼드 트리 구조에 따라 n번 분할한 크기일 수 있다. 즉, 영상 복호화 장치(100)는 최대부호화단위를 쿼드 트리 구조에 따라 n 번 분할하여 기준 부호화 단위를 결정할 수 있고, 다양한 실시예들에 따라 기준 부호화 단위를 블록 형태 정보 및 분할 형태 모드에 대한 정보 중 적어도 하나에 기초하여 분할할 수 있다.
도 16은 일 실시예에 따라 픽쳐(1600)에 포함되는 기준 부호화 단위의 결정 순서를 결정하는 기준이 되는 프로세싱 블록을 도시한다.
일 실시예에 따라 영상 복호화 장치(100)는 픽쳐를 분할하는 적어도 하나의 프로세싱 블록을 결정할 수 있다. 프로세싱 블록이란, 영상을 분할하는 적어도 하나의 기준 부호화 단위를 포함하는 데이터 단위로서, 프로세싱 블록에 포함되는 적어도 하나의 기준 부호화 단위는 특정 순서대로 결정될 수 있다. 즉, 각각의 프로세싱 블록에서 결정되는 적어도 하나의 기준 부호화 단위의 결정 순서는 기준 부호화 단위가 결정될 수 있는 다양한 순서의 종류 중 하나에 해당할 수 있으며, 각각의 프로세싱 블록에서 결정되는 기준 부호화 단위 결정 순서는 프로세싱 블록마다 상이할 수 있다. 프로세싱 블록마다 결정되는 기준 부호화 단위의 결정 순서는 래스터 스캔(raster scan), Z 스캔(Z-scan), N 스캔(N-scan), 우상향 대각 스캔(up-right diagonal scan), 수평적 스캔(horizontal scan), 수직적 스캔(vertical scan) 등 다양한 순서 중 하나일 수 있으나, 결정될 수 있는 순서는 상기 스캔 순서들에 한정하여 해석되어서는 안 된다.
일 실시예에 따라 영상 복호화 장치(100)는 프로세싱 블록의 크기에 대한 정보를 획득하여 영상에 포함되는 적어도 하나의 프로세싱 블록의 크기를 결정할 수 있다. 영상 복호화 장치(100)는 프로세싱 블록의 크기에 대한 정보를 비트스트림으로부터 획득하여 영상에 포함되는 적어도 하나의 프로세싱 블록의 크기를 결정할 수 있다. 이러한 프로세싱 블록의 크기는 프로세싱 블록의 크기에 대한 정보가 나타내는 데이터 단위의 소정의 크기일 수 있다.
일 실시예에 따라 영상 복호화 장치(100)의 수신부(110)는 비트스트림으로부터 프로세싱 블록의 크기에 대한 정보를 특정의 데이터 단위마다 획득할 수 있다. 예를 들면 프로세싱 블록의 크기에 대한 정보는 영상, 시퀀스, 픽쳐, 슬라이스, 슬라이스 세그먼트 등의 데이터 단위로 비트스트림으로부터 획득될 수 있다. 즉 수신부(110)는 상기 여러 데이터 단위마다 비트스트림으로부터 프로세싱 블록의 크기에 대한 정보를 획득할 수 있고 영상 복호화 장치(100)는 획득된 프로세싱 블록의 크기에 대한 정보를 이용하여 픽쳐를 분할하는 적어도 하나의 프로세싱 블록의 크기를 결정할 수 있으며, 이러한 프로세싱 블록의 크기는 기준 부호화 단위의 정수배의 크기일 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 픽쳐(1600)에 포함되는 프로세싱 블록(1602, 1612)의 크기를 결정할 수 있다. 예를 들면, 영상 복호화 장치(100)는 비트스트림으로부터 획득된 프로세싱 블록의 크기에 대한 정보에 기초하여 프로세싱 블록의 크기를 결정할 수 있다. 도 16을 참조하면, 영상 복호화 장치(100)는 일 실시예에 따라 프로세싱 블록(1602, 1612)의 가로크기를 기준 부호화 단위 가로크기의 4배, 세로크기를 기준 부호화 단위의 세로크기의 4배로 결정할 수 있다. 영상 복호화 장치(100)는 적어도 하나의 프로세싱 블록 내에서 적어도 하나의 기준 부호화 단위가 결정되는 순서를 결정할 수 있다.
일 실시예에 따라, 영상 복호화 장치(100)는 프로세싱 블록의 크기에 기초하여 픽쳐(1600)에 포함되는 각각의 프로세싱 블록(1602, 1612)을 결정할 수 있고, 프로세싱 블록(1602, 1612)에 포함되는 적어도 하나의 기준 부호화 단위의 결정 순서를 결정할 수 있다. 일 실시예에 따라 기준 부호화 단위의 결정은 기준 부호화 단위의 크기의 결정을 포함할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 비트스트림으로부터 적어도 하나의 프로세싱 블록에 포함되는 적어도 하나의 기준 부호화 단위의 결정 순서에 대한 정보를 획득할 수 있고, 획득한 결정 순서에 대한 정보에 기초하여 적어도 하나의 기준 부호화 단위가 결정되는 순서를 결정할 수 있다. 결정 순서에 대한 정보는 프로세싱 블록 내에서 기준 부호화 단위들이 결정되는 순서 또는 방향으로 정의될 수 있다. 즉, 기준 부호화 단위들이 결정되는 순서는 각각의 프로세싱 블록마다 독립적으로 결정될 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 특정 데이터 단위마다 기준 부호화 단위의 결정 순서에 대한 정보를 비트스트림으로부터 획득할 수 있다. 예를 들면, 수신부(110)는 기준 부호화 단위의 결정 순서에 대한 정보를 영상, 시퀀스, 픽쳐, 슬라이스, 슬라이스 세그먼트, 프로세싱 블록 등의 데이터 단위로마다 비트스트림으로부터 획득할 수 있다. 기준 부호화 단위의 결정 순서에 대한 정보는 프로세싱 블록 내에서의 기준 부호화 단위 결정 순서를 나타내므로, 결정 순서에 대한 정보는 정수개의 프로세싱 블록을 포함하는 특정 데이터 단위 마다 획득될 수 있다.
영상 복호화 장치(100)는 일 실시예에 따라 결정된 순서에 기초하여 적어도 하나의 기준 부호화 단위를 결정할 수 있다.
일 실시예에 따라 수신부(110)는 비트스트림으로부터 프로세싱 블록(1602, 1612)과 관련된 정보로서, 기준 부호화 단위 결정 순서에 대한 정보를 획득할 수 있고, 영상 복호화 장치(100)는 상기 프로세싱 블록(1602, 1612)에 포함된 적어도 하나의 기준 부호화 단위를 결정하는 순서를 결정하고 부호화 단위의 결정 순서에 따라 픽쳐(1600)에 포함되는 적어도 하나의 기준 부호화 단위를 결정할 수 있다. 도 16을 참조하면, 영상 복호화 장치(100)는 각각의 프로세싱 블록(1602, 1612)과 관련된 적어도 하나의 기준 부호화 단위의 결정 순서(1604, 1614)를 결정할 수 있다. 예를 들면, 기준 부호화 단위의 결정 순서에 대한 정보가 프로세싱 블록마다 획득되는 경우, 각각의 프로세싱 블록(1602, 1612)과 관련된 기준 부호화 단위 결정 순서는 프로세싱 블록마다 상이할 수 있다. 프로세싱 블록(1602)과 관련된 기준 부호화 단위 결정 순서(1604)가 래스터 스캔(raster scan)순서인 경우, 프로세싱 블록(1602)에 포함되는 기준 부호화 단위는 래스터 스캔 순서에 따라 결정될 수 있다. 이에 반해 다른 프로세싱 블록(1612)과 관련된 기준 부호화 단위 결정 순서(1614)가 래스터 스캔 순서의 역순인 경우, 프로세싱 블록(1612)에 포함되는 기준 부호화 단위는 래스터 스캔 순서의 역순에 따라 결정될 수 있다.
영상 복호화 장치(100)는 일 실시예에 따라, 결정된 적어도 하나의 기준 부호화 단위를 복호화할 수 있다. 영상 복호화 장치(100)는 상술한 실시예를 통해 결정된 기준 부호화 단위에 기초하여 영상을 복호화 할 수 있다. 기준 부호화 단위를 복호화 하는 방법은 영상을 복호화 하는 다양한 방법들을 포함할 수 있다.
일 실시예에 따라 영상 복호화 장치(100)는 현재 부호화 단위의 형태를 나타내는 블록 형태 정보 또는 현재 부호화 단위를 분할하는 방법을 나타내는 분할 형태 모드에 대한 정보를 비트스트림으로부터 획득하여 이용할 수 있다. 블록 형태 정보 또는 분할 형태 모드에 대한 정보는 다양한 데이터 단위와 관련된 비트스트림에 포함될 수 있다. 예를 들면, 영상 복호화 장치(100)는 시퀀스 파라미터 세트(sequence parameter set), 픽쳐 파라미터 세트(picture parameter set), 비디오 파라미터 세트(video parameter set), 슬라이스 헤더(slice header), 슬라이스 세그먼트 헤더(slice segment header)에 포함된 블록 형태 정보 또는 분할 형태 모드에 대한 정보를 이용할 수 있다. 나아가, 영상 복호화 장치(100)는 최대 부호화 단위, 기준 부호화 단위, 프로세싱 블록마다 비트스트림으로부터 블록 형태 정보 또는 분할 형태 모드에 대한 정보에 대응하는 신택스 엘리먼트를 비트스트림으로부터 획득하여 이용할 수 있다.
도 17 은 일 실시예에 따라 블록 형태 정보를 설명하기 위한 도면이다.
블록 형태 정보는 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기를 포함할 수 있다. 표(1700)를 참조하면 부호화 단위의 모양은 정사각형(square) 및 비-정사각형(non-square)을 포함할 수 있다. 부호화 단위의 너비 및 높이의 길이가 같은 경우, 영상 복호화 장치(100)는 부호화 단위의 모양을 정사각형으로 결정할 수 있다. 또한, 영상 복호화 장치(100)는 부호화 단위의 모양이 정사각형인 경우 부호화 단위의 너비 및 높이의 비율을 1:1로 결정할 수 있다.
영상 복호화 장치(100)는 부호화 단위의 모양을 비-정사각형으로 결정할 수 있다. 부호화 단위의 모양이 비-정사각형인 경우 부호화 단위의 너비 및 높이의 비율은 1:2, 2:1, 1:4, 4:1, 1:8, 8:1 중 적어도 하나를 포함할 수 있다.
부호화 단위의 너비의 길이(N)가 높이의 길이(2N)의 1/2배인 경우, 영상 복호화 장치(100)는 부호화 단위의 모양을 비-정사각형으로 결정할 수 있다. 또한, 영상 복호화 장치(100)는 부호화 단위의 너비 및 높이의 비율을 1:2로 결정할 수 있다. 또한, 부호화 단위의 너비의 길이가 높이의 길이보다 짧으므로, 영상 복호화 장치(100)는 부호화 단위의 방향을 수직 방향으로 결정할 수 있다.
부호화 단위의 너비의 길이(2N)가 높이의 길이(N)의 2배인 경우, 영상 복호화 장치(100)는 부호화 단위의 모양을 비-정사각형으로 결정할 수 있다. 또한, 영상 복호화 장치(100)는 부호화 단위의 너비 및 높이의 비율을 2:1로 결정할 수 있다. 또한, 부호화 단위의 너비의 길이가 높이의 길이보다 길므로, 영상 복호화 장치(100)는 부호화 단위의 방향을 수평 방향으로 결정할 수 있다.
부호화 단위의 너비의 길이(N)가 높이의 길이(4N)의 1/4배인 경우, 영상 복호화 장치(100)는 부호화 단위의 모양을 비-정사각형으로 결정할 수 있다. 또한, 영상 복호화 장치(100)는 부호화 단위의 너비 및 높이의 비율을 1:4로 결정할 수 있다. 또한, 부호화 단위의 너비의 길이가 높이의 길이보다 짧으므로, 영상 복호화 장치(100)는 부호화 단위의 방향을 수직 방향으로 결정할 수 있다.
부호화 단위의 너비의 길이(4N)는 높이의 길이(N)의 4배인 경우, 영상 복호화 장치(100)는 부호화 단위의 모양을 비-정사각형으로 결정할 수 있다. 또한, 영상 복호화 장치(100)는 부호화 단위의 너비 및 높이의 비율을 4:1로 결정할 수 있다. 또한, 부호화 단위의 너비의 길이가 높이의 길이보다 길므로, 영상 복호화 장치(100)는 부호화 단위의 방향을 수평 방향으로 결정할 수 있다.
부호화 단위의 너비의 길이(N)는 높이의 길이(8N)의 1/8배인 경우, 영상 복호화 장치(100)는 부호화 단위의 모양을 비-정사각형으로 결정할 수 있다. 또한, 영상 복호화 장치(100)는 부호화 단위의 너비 및 높이의 비율을 1:8로 결정할 수 있다. 또한, 부호화 단위의 너비의 길이가 높이의 길이보다 짧으므로,영상 복호화 장치(100)는 부호화 단위의 방향을 수직 방향으로 결정할 수 있다.
부호화 단위의 너비의 길이(8N)는 높이의 길이(N)의 8배인 경우, 영상 복호화 장치(100)는 부호화 단위의 모양을 비-정사각형으로 결정할 수 있다. 또한, 영상 복호화 장치(100)는 부호화 단위의 너비 및 높이의 비율을 8:1로 결정할 수 있다. 또한, 부호화 단위의 너비의 길이가 높이의 길이보다 길므로, 영상 복호화 장치(100)는 부호화 단위의 방향을 수평 방향으로 결정할 수 있다.
도 18 은 일 실시예에 따라 블록 형태 정보를 설명하기 위한 도면이다.
표(1800)를 참조하면 부호화 단위는 다양한 크기를 가질 수 있다. 영상 복호화 장치(100)는 부호화 단위의 너비의 길이가 4, 8, 16, 32, 64 및 128 중 적어도 하나임을 결정할 수 있다. 또한 영상 복호화 장치(100)는 부호화 단위의 너비 및 높이의 비율이 8:1, 4:1, 2:1, 1:1, 1:2, 1:4 및 1:8 중 적어도 하나임을 결정할 수 있다. 영상 복호화 장치(100)는 부호화 단위의 긴변의 길이 및 부호화 단위의 너비 및 높이의 비율에 기초하여 부호화 단위의 크기를 결정할 수 있다. 예를 들어 영상 복호화 장치(100)는 부호화 단위의 너비의 길이를 4로 결정할 수 있다. 또한 영상 복호화 장치(100)는 부호화 단위의 너비 및 높이의 비율을 1:1로 결정할 수 있다. 영상 복호화 장치(100)는 부호화 단위의 긴변의 길이 및 부호화 단위의 너비 및 높이의 비율에 기초하여 부호화 단위의 크기를 4x4로 결정할 수 있다. 하지만 이에 한정되는 것은 아니며 부호화 단위의 너비의 길이 및 높이의 길이는 256 과 같거나 더 큰 값을 가질 수 있다. 또한 부호화 단위의 너비 및 높이의 비율은 16:1, 1:16 등을 포함할 수 있다.
영상 복호화 장치(100)는 특정한 크기의 부호화 단위를 허용하지 않을 수 있다. 표(1800)에는 영상 복호화 장치(100)가 허용하지 않는 부호화 단위를 "X"표시 되어있다. 예를 들어 부호화 단위의 너비의 길이는 4이고, 너비 및 높이의 비율은 4:1인 경우 부호화 단위의 크기는 4x1이다. 하지만 영상 복호화 장치(100)는 4x1 크기의 부호화 단위를 허용하지 않을 수 있다.
이하 영상 복호화 장치(100)가 엔트로피 부호화 및 복호화하기 위하여 사용하는 컨텍스트 모델(context model)을 선택하는 방법에 대하여 설명한다.
영상 복호화 장치(100)는 영상 부호화 장치(2200)로부터 비트스트림을 수신한다. 영상 복호화 장치(100)는 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 포함하는 블록 형태 정보에 기초하여 컨텍스트 모델을 결정할 수 있다. 영상 복호화 장치(100)는 컨텍스트 모델에 기초한 엔트로피 복호화를 수행하여 비트스트림으로부터 신택스 엘리먼트를 획득할 수 있다. 영상 복호화 장치(100)는 신택스 엘리먼트에 기초하여 부호화 단위를 복원할 수 있다.
신택스 엘리먼트는 영상을 복호화 하기 위하여 이용되는 다양한 정보이다. 신택스 엘리먼트는 skip flag, prediction mode, motion vector difference, motion vector prediction method (or index), transform quantized coefficient, coded block pattern, coded block flag, intra prediction mode, direct flag, merge flag, delta QP, reference index, prediction direction, transform index 등을 포함할 수 있다.
skip flag는 부호화 단위를 예측 하기 위하여 사용하는 신택스 엘리먼트다. 영상 복호화 장치(100)는 skip flag에 따라 부호화 단위를 skip 모드로 예측할지 또는 다른 모드로 예측할지 결정할 수 있다. skip 모드는 현재 블록과 현재 블록에 인접한 주변 블록의 유사성을 이용하여 현재 블록을 예측하는 모드이다. 주변 블록은 현재 블록의 이전에 복원될 수 있다. 주변 블록은 현재 블록의 좌하측, 좌측, 좌상측, 상측, 우상측, 우측, 우하측 블록을 포함할 수 있다. 영상 복호화 장치(100)는 비트스트림으로부터 참조 영상을 선택하기 위한 신택스 엘리먼트(reference index)를 획득할 수 있다. 영상 복호화 장치(100)는 획득된 신택스 엘리먼트(reference index)에 기초하여 참조 영상을 획득할 수 있다. 영상 복호화 장치(100)는 주변 블록의 움직임 벡터를 이용하여 현재 블록의 움직임 벡터를 결정할 수 있다. 또한 영상 복호화 장치(100)는 현재 블록의 움직임 벡터에 기초하여 참조 영상에 포함된 참조 블록을 획득할 수 있다. skip 모드인 경우, 영상 복호화 장치(100)는 비트스트림으로부터 레지듀얼(residual)과 관련된 정보를 획득하지 않고, 획득된 참조 블록에 기초하여 현재 블록을 복원할 수 있다.
prediction mode는 현재 블록을 인터 모드로 예측할지 또는 인트라 모드로 예측할지를 나타내는 신택스 엘리먼트다. prediction mode는 skip flag가 skip이 아닌 경우를 나타내는 경우 비트스트림으로부터 획득될 수 있다.
prediction mode가 현재 블록을 인터 모드로 예측할 것을 나타내는 경우, 영상 복호화 장치(100)는 수신된 비트스트림으로부터 신택스 엘리먼트(merge flag 또는 direct flag)에 기초하여 현재 영상을 예측하기 위하여 차분 움직임 벡터를 수신할 것인지 여부를 결정할 수 있다. merge flag(또는 direct flag)는 현재 블록을 예측하기 위하여 차분 움직임 벡터를 수신할 것인지 여부를 나타내는 신택스 엘리먼트다.
본 개시의 일 실시예에 따라, merge flag(또는 direct flag)가 차분 움직임 벡터(motion vector difference)를 수신할 것을 나타내는 경우, 영상 복호화 장치(100)는 비트스트림으로부터 수신된 신택스 엘리먼트(motion vector difference)에 기초하여 차분 움직임 벡터를 획득할 수 있다. 영상 복호화 장치(100)는 현재 블록의 주변 블록들을 후보 블록으로 결정할 수 있다. 영상 복호화 장치(100)는 비트스트림으로부터 획득된 신택스 엘리먼트(motion vector prediction index)에 기초하여 후보 블록들 중 하나를 선택할 수 있다. 영상 복호화 장치(100)는 선택된 후보 블록의 움직임 벡터를 예측 움직임 벡터로 획득할 수 있다. 영상 복호화 장치(100)는 비트스트림으로부터 수신된 차분 움직임 벡터 및 예측 움직임 벡터에 기초하여 현재 블록의 움직임 벡터를 획득할 수 있다. 영상 복호화 장치(100)는 수신된 비트스트림으로부터 참조 영상을 선택하기 위한 신택스 엘리먼트(reference index)를 획득할 수 있다. 영상 복호화 장치(100)는 신택스 엘리먼트에 기초하여 참조 영상을 획득할 수 있다. 영상 복호화 장치(100)는 현재 블록의 움직임 벡터에 기초하여 참조 영상에 포함된 참조 블록을 획득할 수 있다. 영상 복호화 장치(100)는 참조 블록에 기초하여 예측된 현재 블록을 획득할 수 있다. 영상 복호화 장치(100)는 비트스트림으로부터 획득된 양자화된 변환 계수(quantized transform coefficient)에 기초하여 레지듀얼을 획득할 수 있다. 영상 복호화 장치(100)는 예측된 현재 블록 및 레지듀얼에 기초하여 현재 블록을 복원할 수 있다.
본 개시의 다른 실시예에 따라, merge flag가 차분 움직임 벡터를 수신하지 않을 것을 나타내는 경우, 영상 복호화 장치(100)는 현재 블록의 주변 블록들을 후보 블록으로 획득할 수 있다. 영상 복호화 장치(100)는 비트스트림으로부터 획득된 신택스 엘리먼트(motion vector prediction index)에 기초하여 후보 블록들 중 하나를 선택할 수 있다. 영상 복호화 장치(100)는 선택된 후보 블록의 움직임 벡터를 현재 블록의 움직임 벡터로 획득할 수 있다. 영상 복호화 장치(100)는 merge flag가 차분 움직임 벡터를 수신하는 것을 나타내는 경우와 유사하게 현재 블록의 움직임 벡터에 기초하여 현재 블록을 복원할 수 있다.
prediction mode가 현재 블록을 인트라 모드로 예측할 것을 나타내는 경우, 영상 복호화 장치(100)는 비트스트림으로부터 인트라 예측 모드에 관련된 신택스 엘리먼트(intra prediction mode)를 획득할 수 있다. 영상 복호화 장치(100)는 인트라 예측 모드에 관련된 신택스 엘리먼트에 기초하여 인트라 예측 모드를 선택할 수 있다. 인트라 예측 모드는 33개의 방향(directional) 예측 모드, DC 모드 및 플래너(planar) 모드를 포함할 수 있다. 다만 이에 한정되는 것은 아니며, 인트라 예측 모드의 방향 예측 모드는 62개의 방향 예측 모드로 세분화 될 수 있다. 또한 인트라 예측 모드는, DC 모드, 수직 모드, 수평모드, 플래너(planar) 모드, 좌상측 및 우하측 방향의 대각모드, 우상측 및 좌하측 방향의 대각모드 중 적어도 하나의 모드를 포함할 수 있다.
인트라 예측 모드가 방향 예측 모드인 경우, 영상 복호화 장치(100)는 비트스트림으로부터 예측 방향을 나타내는 신택스 엘리먼트(prediction direction)를 수신할 수 있다. 영상 복호화 장치(100)는 신택스 엘리먼트에 기초하여 복수의 방향으로부터 적어도 하나의 방향을 선택할 수 있다.
coded block flag (CBF)는 부호화 단위(또는 변환 단위)에 하나 이상의 0이 아닌 양자화된 변환 계수가 존재하는지 여부를 나타내는 신택스 엘리먼트다. 예를 들어 부호화 단위에 대한 CBF 값이 1 인 경우, 영상 복호화 장치(100)는 해당 부호화 단위의 양자화된 변환 계수를 비트스트림으로부터 읽어 역변환을 수행한다. 또한, 부호화 단위에 대한 CBF 값이 0 인 경우, 영상 복호화 장치(100)는 부호화 단위의 모든 양자화된 변환 계수의 값이 0임을 결정할 수 있다. 따라서 영상 복호화 장치(100)는 부호화 단위에 대하여 역변환 과정을 수행하지 않을 수 있다. coded block pattern (CBP) 은 CBF를 집합적으로 나타내는 신택스 엘리먼트다.
양자화는 변환 계수를 복수의 대표값으로 근사하는 과정이다. 영상 부호화 장치는 변환 계수를 양자화 율로 나누어 양자화된 변환 계수를 획득할 수 있다. 영상 복호화 장치(100)는 비트스트림으로부터 양자화된 변환 계수를 획득하고, 양자화된 변환 계수에 양자화 율을 곱하여 변환 계수를 획득할 수 있다. 양자화 율은 실수값을 가지므로 코덱의 구현의 복잡도를 줄이기 위하여 양자화 율에 대응되는 정수값을 정의할 수 있다. 양자화 파라미터는 양자화 율에 대응되는 신택스 엘리먼트로서 정수 값을 가질 수 있다. 영상 복호화 장치(100)는 52개의 양자화 율을 가질 수 있으므로, 양자화 파라미터는 0부터 51까지의 값을 가질 수 있다. 하지만 이에 한정되는 것은 아니다.
영상 복호화 장치(100)는 주파수 도메인의 값이 변환 계수를 역변환하여 공간 도메인의 값인 레지듀얼을 생성할 수 있다. 영상 복호화 장치(100)는 역변환을 위한 복수의 커널(kernel)을 사용할 수 있다. 영상 복호화 장치(100)는 비트스트림으로부터 획득된 변환 인덱스(transform index)에 기초하여 복수의 커널들 중 하나의 커널을 선택하여 역변환을 수행할 수 있다. 변환 인덱스(transform index)는 비트스트림으로부터 획득된 신택스 엘리먼트일 수 있다.
영상 복호화 장치(100)는 부호화 단위 별로 양자화 파라미터를 비트스트림으로부터 획득할 수 있다. 또한, 영상 복호화 장치(100)는 이미 복원된 부호화 단위와 현재 부호화 단위의 양자화 파라미터 사이의 정보의 중복성을 제거하기 위하여, 이미 복원된 부호화 단위의 양자화 파라미터와 현재 부호화 단위의 양자화 파라미터의 차분값만을 비트스트림으로부터 획득할 수 있다. delta QP는 이미 복원된 부호화 단위의 양자화 파라미터와 현재 부호화 단위의 양자화 파라미터의 차분값을 나타내는 신택스 엘리먼트다.
엔트로피 코딩은 무손실 압축 기법이며, 부호화 할 신택스 엘리먼트의 발생 확률에 기초하여 동작한다. 엔트로피 코딩이 영상 부호화 장치(2200)에서 이루어 지면 엔트로피 부호화라고 하며, 영상 부호화 장치(2200)는 엔트로피 부호화에 기초하여 신택스 엘리먼트를 압축한다. 엔트로피 코딩이 영상 복호화 장치(100)에서 이루어 지면 엔트로피 복호화라고 하며, 영상 복호화 장치(100)는 엔트로피 복호화에 기초하여 비트스트림으로부터 신택스 엘리먼트를 획득한다.
엔트로피 코딩에 의하면, 신택스 엘리먼트의 통계를 이용하여, 자주 나타나는 신택스 엘리먼트에는 짧은 비트가 할당될 수 있고, 자주 나타나지 않은 신택스 엘리먼트에는 긴 비트가 할당될 수 있다. 엔트로피 코딩에 의하면 동일한 정보를 짧은 비트로 전송할 수 있으므로 비트의 전송 효율이 좋아질 수 있다. 엔트로피 코딩의 종류에는 CABAC(Context-Adaptive Binary Arithmetic Coding) 또는 CAVLC(Context-Adaptive Variable Length Coding)가 있을 수 있다.
엔트로피 코딩을 위해서는 디코딩할 빈에 대하여 확률 값을 적용하는 컨텍스트 모델이 할당되며, 할당된 컨텍스트 모델에 기초하여 해당 빈이 코딩(엔트로피 인코딩/엔트로피 디코딩)될 수 있다. 각 빈에 대한 코딩 후 컨텍스트 모델은 업데이트될 수 있다.
이하 본 개시의 일 실시예에 따라 영상 복호화 장치(100)가 컨텍스트 모델을 이용하여 신택스 엘리먼트를 획득하는 과정에 대하여 자세히 설명한다.
도 19 는 일 실시예에 따라 블록 형태 정보에 따른 컨텍스트 모델을 결정하는 과정을 설명하기 위한 도면이다.
블록 형태 정보는 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 포함할 수 있다. 영상 복호화 장치(100)는 부호화 단위의 모양에 따라 신택스 엘리먼트의 컨텍스트 모델을 결정할 수 있다. 표(1910)를 참조하면, 영상 복호화 장치(100)는 정사각형 부호화 단위(1911) 및 비-정사각형 부호화 단위(1915)에 대하여 컨텍스트 모델을 개별적으로 결정할 수 있다. 정사각형 모양(1911)은 너비 및 높이의 길이의 비율이 1:1 일 수 있다. 비-정사각형 모양은 너비 및 높이의 길이의 비율이 8:1, 4:1, 2:1, 1:2, 1:4 및 1:8 중 적어도 하나일 수 있다.
영상 복호화 장치(100)는 정사각형 부호화 단위(1911)와 비-정사각형 부호화 단위(1915)에 대하여 서로 다른 컨텍스트 모델을 사용할 수 있다. 다만 이에 한정되는 것은 아니며, 영상 복호화 장치(100)는 비-정사각형 부호화 단위(1915)의 너비 및 높이의 길이의 비율들 중 적어도 하나 및 정사각형 부호화 단위(1911)에 대하여 동일한 컨텍스트 모델을 사용할 수도 있다.
영상 복호화 장치(100)는 정사각형 부호화 단위(1911) 및 비-정사각형 부호화 단위(1915)에 대하여 각각 미리 정해진 컨텍스트 모델에 대한 인덱스를 할당할 수 있다. 영상 복호화 장치(100)는 현재 부호화 단위의 블록 형태 정보를 결정할 수 있다. 예를 들어 영상 복호화 장치(100)는 현재 부호화 단위의 블록 형태 정보가 정사각형 부호화 단위 또는 비-정사각형 부호화 단위임을 결정할 수 있다. 영상 복호화 장치(100)는 현재 부호화 단위의 블록 형태 정보에 기초하여 컨텍스트 모델에 대한 인덱스를 결정할 수 있다. 영상 복호화 장치(100)는 컨텍스트 모델에 대한 인덱스에 기초하여 상기 컨텍스트 모델을 결정할 수 있다.
영상 복호화 장치(100)는 부호화 단위의 방향에 따라 신택스 엘리먼트의 컨텍스트 모델을 결정할 수 있다. 표(1920)를 참조하면, 영상 복호화 장치(100)는 수평 방향의 부호화 단위(1921), 수직 방향의 부호화 단위(1923) 및 정사각형 모양의 부호화 단위(1922)에 대해서 컨텍스트 모델을 개별적으로 결정할 수 있다. 예를 들어 영상 복호화 장치(100)는 수평 방향의 부호화 단위(1921)에 대해서는 제 1 컨텍스트 모델을 사용할 수 있다. 또한 영상 복호화 장치(100)는 수직 방향의 부호화 단위(1923)에 대해서는 제 2 컨텍스트 모델을 사용할 수 있다. 또한 정사각형 모양의 부호화 단위(1922)에 대해서는 제 3 컨텍스트 모델을 사용할 수 있다. 하지만 이에 한정되는 것은 아니며, 영상 복호화 장치(100)는 수평 방향의 부호화 단위(1921), 수직 방향의 부호화 단위(1923) 또는 정사각형 모양의 부호화 단위(1922) 중 일부에 대해서 동일한 컨텍스트 모델을 사용할 수 있다.
영상 복호화 장치(100)는 수평 방향의 부호화 단위(1921), 수직 방향의 부호화 단위(1923) 및 정사각형 모양의 부호화 단위(1922)에 대하여 각각 미리 정해진 컨텍스트 모델에 대한 인덱스를 할당할 수 있다. 영상 복호화 장치(100)는 현재 부호화 단위의 블록 형태 정보를 결정할 수 있다. 예를 들어 영상 복호화 장치(100)는 현재 부호화 단위의 블록 형태 정보가 수평 방향의 부호화 단위, 수직 방향의 부호화 단위 및 정사각형 모양의 부호화 단위 중 어느 하나임을 결정할 수 있다. 영상 복호화 장치(100)는 현재 부호화 단위의 블록 형태 정보에 기초하여 컨텍스트 모델에 대한 인덱스를 결정할 수 있다. 영상 복호화 장치(100)는 컨텍스트 모델에 대한 인덱스에 기초하여 상기 컨텍스트 모델을 결정할 수 있다.
영상 복호화 장치(100)는 부호화 단위의 너비 및 높이의 길이의 비율에 따라 신택스 엘리먼트의 컨텍스트 모델을 결정할 수 있다. 표(1930)를 참조하면, 부호화 단위의 너비 및 높이의 길이의 비율은 8:1, 4:1, 2:1, 1:1, 1:2, 1:4, 1:8 중 적어도 하나를 포함할 수 있다. 하지만 이에 한정되는 것은 아니며 부호화 단위의 너비 및 높이의 비율은 1:2^M, 2^M:1을 포함할 수 있다. 여기서 M은 양의 정수이다. 영상 복호화 장치(100)는 너비 및 높이의 길이의 비율이 8:1인 부호화 단위(1931), 너비 및 높이의 길이의 비율이 4:1인 부호화 단위(1932), 너비 및 높이의 길이의 비율이 2:1인 부호화 단위(1933), 너비 및 높이의 길이의 비율이 1:1인 부호화 단위(1934), 너비 및 높이의 길이의 비율이 1:2인 부호화 단위(1935), 너비 및 높이의 길이의 비율이 1:4인 부호화 단위(1936), 너비 및 높이의 길이의 비율이 1:8인 부호화 단위(1937)에 대하여 컨텍스트 모델을 개별적으로 결정할 수 있다. 영상 복호화 장치(100)는 비율에 따라 서로 다른 컨텍스트 모델을 사용할 수 있다. 또한 영상 복호화 장치(100) 일부 너비 및 높이의 길이의 비율들에 대하여 동일한 컨텍스트 모델을 사용할 수 있다.
영상 복호화 장치(100)는 부호화 단위의 비율에 따라 각각 미리 정해진 컨텍스트 모델에 대한 인덱스를 할당할 수 있다. 영상 복호화 장치(100)는 현재 부호화 단위의 블록 형태 정보를 결정할 수 있다. 예를 들어 영상 복호화 장치(100)는 현재 부호화 단위의 블록 형태 정보가 8:1, 4:1, 2:1, 1:1, 1:2, 1:4, 1:8 비율 중 어느 하나임을 결정할 수 있다. 영상 복호화 장치(100)는 현재 부호화 단위의 블록 형태 정보에 기초하여 컨텍스트 모델에 대한 인덱스를 결정할 수 있다. 영상 복호화 장치(100)는 컨텍스트 모델에 대한 인덱스에 기초하여 상기 컨텍스트 모델을 결정할 수 있다.
또한, 영상 복호화 장치(100)는 부호화 단위의 너비 및 높이의 산술 관계에 기초하여 컨텍스트 모델을 결정할 수 있다. 영상 복호화 장치(100)는 너비의 길이에 log2를 취한 값 및 높이의 길이에 log2를 취한 값의 차를 컨텍스트 모델에 대한 인덱스로 결정할 수 있다. 영상 복호화 장치(100)는 컨텍스트 모델에 대한 인덱스에 기초하여 상기 컨텍스트 모델을 결정할 수 있다.
영상 복호화 장치(100)는 부호화 단위의 크기에 따라 신택스 엘리먼트의 컨텍스트 모델을 결정할 수 있다. 예를 들어 영상 복호화 장치(100)는 부호화 단위의 너비의 길이, 부호화 단위의 높이의 길이, 긴 변의 길이, 짧은 변의 길이 또는 부호화 단위의 넓이 중 적어도 하나에 기초하여 컨텍스트 모델을 결정할 수 있다.
영상 복호화 장치(100)는 부호화 단위의 한 변의 길이에 기초하여 컨텍스트 모델을 개별적으로 결정할 수 있다. 표(1940)를 참조하면, 영상 복호화 장치(100)는 긴 변의 길이가 같은 부호화 단위에 대하여 같은 컨텍스트 모델을 사용할 수 있다. 부호화 단위들(1941)은 긴 변의 길이가 4이다. 부호화 단위들(1942)은 긴 변의 길이가 8이다. 부호화 단위들(1943)은 긴 변의 길이가 16이다. 부호화 단위들(1944)은 긴 변의 길이가 32이다. 부호화 단위들(1945)은 긴 변의 길이가 64이다. 부호화 단위들(1946)은 긴 변의 길이가 128이다. 영상 복호화 장치(100)는 긴 변의 길이가 다른 경우 다른 컨텍스트 모델을 사용할 수 있다. 하지만 이에 한정되는 것은 아니며, 영상 복호화 장치(100)는 일부 긴 변의 길이들에 대하여 동일한 컨텍스트 모델을 사용할 수 있다. 또한, 영상 복호화 장치(100)는 짧은 변의 길이에 따라 컨텍스트 모델을 개별적으로 결정할 수 있다.
영상 복호화 장치(100)는 부호화 단위의 긴 변의 길이에 따라 각각 미리 정해진 컨텍스트 모델에 대한 인덱스를 할당할 수 있다. 영상 복호화 장치(100)는 현재 부호화 단위의 블록 형태 정보를 결정할 수 있다. 예를 들어 영상 복호화 장치(100)는 현재 부호화 단위의 긴 변의 길이가 4 내지 258 중 어느 하나임을 결정할 수 있다. 영상 복호화 장치(100)는 현재 부호화 단위의 블록 형태 정보에 기초하여 컨텍스트 모델에 대한 인덱스를 결정할 수 있다. 영상 복호화 장치(100)는 컨텍스트 모델에 대한 인덱스에 기초하여 상기 컨텍스트 모델을 결정할 수 있다. 설명의 편의를 위하여 긴 변의 길이를 기준으로 설명하였으나 영상 복호화 장치(100)는 짧은 변의 길이에 기초하여 컨텍스트 모델에 대한 인덱스를 결정할 수 있다.
또한, 영상 복호화 장치(100)는 부호화 단위의 긴 변의 길이에 기초하여 컨텍스트 모델을 결정할 수 있다. 영상 복호화 장치(100)는 현재 부호화 단위의 긴 변의 길이에 log2를 취한 값을 컨텍스트 모델에 대한 인덱스로 결정할 수 있다. 영상 복호화 장치(100)는 컨텍스트 모델에 대한 인덱스에 기초하여 상기 컨텍스트 모델을 결정할 수 있다. 설명의 편의를 위하여 긴 변의 길이를 기준으로 설명하였으나 영상 복호화 장치(100)는 짧은 변의 길이에 기초하여 컨텍스트 모델에 대한 인덱스를 결정할 수 있다.영상 복호화 장치(100)는 부호화 단위의 면적에 기초하여 컨텍스트 모델을 개별적으로 결정할 수 있다. 예를 들어, 영상 복호화 장치(100)는 면적이 다른 부호화 단위에 대하여 서로 다른 컨텍스트 모델을 사용할 수 있다. 하지만 이에 한정되는 것은 아니며 영상 복호화 장치(100)는 서로 다른 면적들에 대하여 동일한 컨텍스트 모델을 사용할 수 있다.
영상 복호화 장치(100)는 면적의 범위에 기초하여 컨텍스트 모델을 개별적으로 결정할 수 있다. 예를 들어 부호화 단위의 면적이 64보다 작거나 같은 경우, 영상 복호화 장치(100)는 제 1 컨텍스트 모델을 사용할 것을 결정할 수 있다. 또한 부호화 단위의 면적이 64 보다 크고 256 보다 작거나 같은 경우, 영상 복호화 장치(100)는 제 2 컨텍스트 모델을 사용할 것을 결정할 수 있다. 또한 부호화 단위의 면적인 256 보다 크고 1024보다 작거나 같은 경우, 영상 복호화 장치(100)는 제 3 컨텍스트 모델을 사용할 것을 결정할 수 있다. 또한 부호화 단위의 면적이 1024보다 크고 4096보다 작거나 같은 경우 영상 복호화 장치(100)는 제 4 컨텍스트 모델을 사용할 것을 결정할 수 있다. 또한 부호화 단위의 면적이 4096보다 큰 경우, 영상 복호화 장치(100)는 제 5 컨텍스트 모델을 사용할 것을 결정할 수 있다.
영상 복호화 장치(100)는 부호화 단위의 넓이에 따라 각각 미리 정해진 컨텍스트 모델에 대한 인덱스를 할당할 수 있다. 영상 복호화 장치(100)는 현재 부호화 단위의 블록 형태 정보를 결정할 수 있다. 예를 들어 영상 복호화 장치(100)는 현재 부호화 단위의 넓이가 16 내지 65536 중 어느 하나임을 결정할 수 있다. 영상 복호화 장치(100)는 현재 부호화 단위의 블록 형태 정보에 기초하여 컨텍스트 모델에 대한 인덱스를 결정할 수 있다. 영상 복호화 장치(100)는 컨텍스트 모델에 대한 인덱스에 기초하여 상기 컨텍스트 모델을 결정할 수 있다.
또한, 영상 복호화 장치(100)는 부호화 단위의 넓이에 기초하여 컨텍스트 모델을 결정할 수 있다. 영상 복호화 장치(100)는 현재 부호화 단위의 넓이에 log2를 취한 값을 컨텍스트 모델에 대한 인덱스로 결정할 수 있다. 영상 복호화 장치(100)는 컨텍스트 모델에 대한 인덱스에 기초하여 상기 컨텍스트 모델을 결정할 수 있다.
영상 복호화 장치(100)는 신택스 엘리먼트의 컨텍스트 모델을 그룹화 해서 결정할 수 있다. 영상 복호화 장치(100)는 복수의 블록 형태 정보를 동일한 그룹으로 설정할 수 있다. 영상 복호화 장치(100)는 부호화 단위의 복수의 모양을 하나의 그룹으로 설정할 수 있다. 영상 복호화 장치(100)는 부호화 단위의 복수의 방향을 하나의 그룹으로 설정할 수 있다. 영상 복호화 장치(100)는 부호화 단위의 복수의 너비 및 높이의 비율을 하나의 그룹으로 설정할 수 있다. 또는 영상 복호화 장치(100)는 부호화 단위의 복수의 크기를 하나의 그룹으로 설정할 수 있다. 하나의 그룹은 하나의 컨텍스트 모델과 대응될 수 있다. 영상 복호화 장치(100)는 그룹에 기초하여 컨텍스트 모델을 결정할 수 있다.
예를 들어, 영상 복호화 장치(100)는 부호화 단위의 복수의 너비 및 높이의 비율에 대하여 동일한 컨텍스트 모델을 사용할 것을 결정할 수 있다. 또한 영상 복호화 장치(100)는 부호화 단위의 복수의 크기에 대하여 동일한 컨텍스트 모델을 사용할 것을 결정할 수 있다. 예를 들어, 너비 및 높이의 비율이 1:2 이거나 2:1 인 부호화 단위에 대하여 영상 복호화 장치(100)는 동일한 컨텍스트 모델을 사용할 것을 결정할 수 있다. 또한 너비 및 높이의 비율이 1:2 이거나 1:4 인 부호화 단위에 대하여 영상 복호화 장치(100)는 동일한 컨텍스트 모델을 사용할 것을 결정할 수 있다.
영상 복호화 장치(100)는 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기의 조합에 기초하여 컨텍스트 모델을 결정할 수 있다. 영상 복호화 장치(100)는 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기의 조합에 따른 컨텍스트 모델의 인덱스를 배열(또는 테이블)로 획득할 수 있다. 영상 복호화 장치(100)는 영상 부호화 장치(2200)로부터 배열을 수신할 수 있다. 또는 영상 복호화 장치(100) 및 영상 부호화 장치(2200)는 미리 결정된 배열을 사용할 수 있다. 배열은 2차원 이상일 수 있다. 영상 복호화 장치(100)는 컨텍스트 모델의 인텍스에 기초하여 컨텍스트 모델을 결정하고, 컨텍스트 모델에 기초하여 신택스를 획득할 수 있다.
예를 들어, 제 1 블록 형태 정보는 부호화 단위의 모양일 수 있다. 제 2 블록 형태는 부호화 단위의 크기일 수 있다. 영상 복호화 장치(100)는 제 1 블록 형태 및 제 2 블록 형태의 조합에 기초하여 컨텍스트 모델을 결정할 수 있다. 제 1 블록 형태 정보가 정사각형을 나타내고, 제 2 블록 형태 정보에 포함되는 긴변의 길이가 16을 나타내는 경우, 영상 복호화 장치(100)는 제 1 컨텍스트 모델을 선택할 수 있다. 하지만 제 2 블록 형태 정보에 포함되는 긴변의 길이가 16일지라도 제 1 블록 형태 정보가 비-정사각형을 나타내는 경우, 영상 복호화 장치(100)는 제 2 컨텍스트 모델을 선택할 수 있다. 또한 제 1 블록 형태 정보가 정사각형일지라도 제 2 블록 형태 정보에 포함되는 긴변의 길이가 32를 나타내는 경우 영상 복호화 장치(100)는 제 3 컨텍스트 모델을 선택할 수 있다. 블록 형태 정보들의 조합과 컨텍스트 모델의 매핑관계는 2차원 배열(또는 테이블)로 나타낼 수 있다. 설명의 편의를 위하여 2개의 블록 형태 정보에 따른 컨텍스트 모델을 설명하였다. 하지만 이에 한정되는 것은 아니며 영상 복호화 장치(100)는 3개 이상의 블록 형태 정보에 따른 컨텍스트 모델을 결정할 수 있다. 3개 이상의 블록 형태 정보와 컨텍스트 모델을 맵핑하기 위한 배열은 3차원 이상이 될 수 있다.
영상 복호화 장치(100)는 현재 부호화 단위의 신택스 엘리먼트에 대한 컨텍스트 모델을 결정하기 위하여, 현재 부호화 단위에 인접한 주변 부호화 단위의 신택스 엘리먼트에 대한 컨텍스트 모델을 이용할 수 있다. 주변 부호화 단위는 현재 부호화 단위 이전에 복원되었으므로 영상 복호화 장치(100)는 주변 부호화 단위의 컨텍스트 모델에 대한 정보를 가지고 있을 수 있다. 예를 들어, 영상 복호화 장치(100)는 주변 부호화 단위의 컨텍스트 모델을 현재 부호화 단위의 컨텍스트 모델로 결정할 수 있다.
영상 복호화 장치(100)는 현재 부호화 단위의 신택스 엘리먼트에 대한 컨텍스트 모델을 결정하기 위하여, 현재 부호화 단위에 인접한 주변 부호화 단위의 신택스 엘리먼트를 이용할 수 있다. 주변 부호와 단위의 신택스 엘리먼트는 현재 부호화 단위의 신택스 엘리먼트와 유사할 수 있다. 예를 들어 주변 부호화 단위가 분할 형태 모드에 대한 정보에 기초하여 분할 되었을 경우, 현재 부호화 단위도 유사한 분할 형태 모드에 대한 정보에 기초하여 분할될 가능성이 있다. 영상 복호화 장치(100)는 주변 부호화 단위의 신택스 엘리먼트와 현재 부호화 단위의 컨텍스트 모델을 맵핑하는 배열(또는 테이블)에 기초하여, 현재 부호화 단위의 컨텍스트 모델을 결정할 수 있다. 또한 영상 복호화 장치(100)는 현재 부호화 단위의 컨텍스트 모델에 기초하여 신택스 엘리먼트를 획득할 수 있다. 신택스 엘리먼트는 현재 부호화 단위의 분할 형태 모드에 대한 정보를 포함할 수 있다.
도 20 은 일 실시예에 따라 컨텍스트 모델을 결정하는 방법을 설명하기 위한 도면이다.
영상 복호화 장치(100)는 컨텍스트 모델을 결정하기 위하여, 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나와 컨텍스트 모델에 대한 인덱스를 맵핑하기 위한 배열을 획득할 수 있다. 영상 복호화 장치(100) 및 영상 부호화 장치(2200)는 배열을 저장하고 있을 수 있다. 영상 부호화 장치(2200)는 비트스트림을 통하여 영상 복호화 장치(100)에게 배열을 전송할 수 있다.
배열은 1차원 배열일 수 있다. 즉, 배열은 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 하나와 컨텍스트 모델에 대한 인덱스를 일대일 대응시킬 수 있다. 예를 들어 배열은 4x4, 4x8, 8x4, 8x8, 16x4, 16,8, 16x16... 크기의 부호화 단위 각각에 대한 컨텍스트 모델에 대한 인덱스를 포함할 수 있다. 배열은 2차원 배열일 수 있다. 즉, 배열은 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 두개의 조합에 대한 컨텍스트 모델에 대한 인덱스를 포함할 수 있다. 하지만 배열은 2 차원에 한정되는 것은 아니며 배열은 3 차원 이상일 수 있다.
본 개시의 일 실시예에 따르면 배열은 표(2000)와 같을 수 있다. 표(2000)의 가로 축은 높이의 길이를 나타낸다. 표(2000)의 세로 축은 너비의 길이를 나타낼 수 있다. 하지만 이에 한정되는 것은 아니다. 축은 너비의 길이, 높이의 길이, 긴 변의 길이, 짧은 변의 길이, 너비 및 높이의 길이의 비율, 넓이 중 하나 일 수 있다. 예를 들어 제 1 축은 긴 변의 길이 이고, 제 1 축과 다른 제 2 축은 너비 및 높이의 길이의 비율일 수 있다.
배열(2000)은 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나에 따른 컨텍스트 모델에 대한 인덱스들을 포함하고 있을 수 있다. 배열은 부호화 단위의 크기에 따른 인덱스들을 포함할 수 있다. 표(2000)를 참조하면 4x8, 4x16, 8x4, 8x8 및 16x8 크기의 부호화 단위에 대한 인덱스는 '4'일 수 있다. 또한 8x16, 8x32, 16x8, 16x16 및 32x16 크기의 부호화 단위에 대한 인덱스는 '3' 일 수 있다. 또한 16x32, 16x64, 32x16, 32x32, 64x16 크기의 부호화 단위에 대한 인덱스는 '2' 일 수 있다. 또한 32x64, 32x128, 64x32, 64x64 및 128x32 크기의 부호화 단위에 대한 인덱스는 '1'일 수 있다. 또한 64x128, 128x64 및 128x128 크기의 부호화 단위에 대한 인덱스는 '0'일 수 있다.
영상 복호화 장치(100)는 배열에서 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나에 기초하여 컨텍스트 모델에 대한 인덱스를 획득할 수 있다. 표 2000을 참조하면 영상 복호화 장치(100)는 64x64 크기의 부호화 단위에 대한 인덱스를 '1'로 결정할 수 있다.
영상 복호화 장치(100)는 소정의 블록 형태 정보에 대하여 부호화 단위의 컨텍스트 모델에 대한 인덱스를 정의하지 않을 수 있다. 표(2000)를 참조하면 영상 복호화 장치(100)는 4x4, 4x32, 4x64, 4x128, 32x4, 64x4, 64x8, 128x4, 128x8, 128x16 크기의 부호화 단위에 대하여 컨텍스트 모델에 대한 인덱스를 정의하지 않을 수 있다.
해당 부호화 단위가 영상의 부호화 및 복호화에서 허용 가능하지 않은 블록 형태 정보인 경우, 영상 복호화 장치(100)는 컨텍스트 모델에 대한 인덱스를 정의하지 않을 수 있다. 예를 들어 영상 복호화 장치(100)는 4x1 크기의 부호화 단위를 허용하지 않을 수 있다. 이 경우 영상 복호화 장치(100)는 4x1 크기의 부호화 단위에 대한 인덱스를 정의하지 않을 수 있다.
또는, 신택스 엘리먼트가 필요하지 않은 경우, 영상 복호화 장치(100)는 인덱스를 정의하지 않을 수 있다. 예를 들어 신택스 엘리먼트는 분할 형태 모드에 대한 정보를 포함할 수 있다. 영상 복호화 장치(100)는 256x256 크기의 부호화 단위를 언제나 쿼드 분할할 수 있다. 즉, 영상 복호화 장치(100)는 신택스 엘리먼트 없이 256x256 크기의 부호화 단위를 분할할 수 있다. 따라서 영상 복호화 장치(100)는 256x256 크기를 가지는 부호화 단위의 신택스 엘리먼트를 위한 컨텍스트 모델에 대한 인덱스를 정의하지 않을 수 있다.
또한 영상 복호화 장치(100)는 컨텍스트 모델에 대한 인덱스에 기초하여 부호화 단위의 컨텍스트 모델을 결정할 수 있다. 영상 복호화 장치(100)는 서로 다른 신택스 엘리먼트 간의 간섭을 피하기 위하여 컨텍스트 모델에 대한 인덱스 및 소정의 오프셋(offset)의 합에 기초하여 컨텍스트 모델을 결정할 수 있다. 또한 영상 복호화 장치(100)는 현재 부호화 단위에 인접한 주변 블록의 신택스 엘리먼트 또는 컨텍스트 모델에 기초하여 현재 부호화 단위의 컨텍스트 모델을 결정할 수 있다.
도 24는 현재 부호화 단위의 분할을 나타내는 방법을 설명하는 도면이다.
split_unit()은 현재 부호화 단위를 분할하기 위한 신택스를 나타낼 수 있다. 분할 형태 모드에 대한 정보(split_mode)는 분할 여부를 나타내는 정보, 분할 방향 정보 및 분할 타입 정보 중 적어도 하나를 포함할 수 있다. 분할 여부를 나타내는 정보는 현재 부호화 단위를 분할할지 여부를 나타낸다. 분할 방향 정보는 수평 방향 또는 수직 방향 중 하나로 분할함을 나타낸다.
분할 타입 정보는 부호화 단위를 바이너리 분할(binary split), 트라이 분할(tri split) 또는 쿼드 분할(quad split) 중 하나로 분할함을 나타낸다. 바이너리 분할은 부호화 단위의 높이 또는 너비 중 하나를 1/2로 분할하는 것을 의미한다. 트라이 분할은 부호화 단위의 높이 또는 너비 중 하나를 1:2:1로 분할하는 것을 의미한다. 또한 쿼드 분할은 부호화 단위의 높이 및 너비를 1/2로 분할하는 것을 의미한다.
설명의 편의를 위하여 본 개시는 분할 형태 모드에 대한 정보(split_mode)를 분할 여부를 나타내는 정보, 분할 방향 정보 및 분할 타입 정보로 구분하여 설명하였으나, 이에 한정되는 것은 아니다. 분할 형태 모드에 대한 정보는 분할 여부를 나타내는 정보, 분할 방향 정보 또는 분할 타입 정보를 조합하여 표현될 수 있다. 예를 들어 분할 형태 모드에 대한 정보(split_mode)는 현재 부호화 단위가 분할되지 않음(NO_SPLIT)을 나타낼 수 있다. 또한 분할 형태 모드에 대한 정보는 쿼드 분할(QUAD_SPLIT)을 나타낼 수 있다. 또한 분할 형태 모드에 대한 정보는 바이너리 수직 분할(BI_VER_SPLIT)을 나타낼 수 있다. 또한 분할 형태 모드에 대한 정보는 바이너리 수직 분할(BI_VER_SPLIT)을 나타낼 수 있다. 또한 분할 형태 모드에 대한 정보는 바이너리 수평 분할(BI_HOR_SPLIT)을 나타낼 수 있다. 또한 분할 형태 모드에 대한 정보는 트라이 수직 분할(TRI_VER_SPLIT)을 나타낼 수 있다. 또한 분할 형태 모드에 대한 정보는 트라이 수평 분할(TRI_HOR_SPLIT)을 나타낼 수 있다.
영상 복호화 장치(100)는 분할 형태 모드에 대한 정보를 빈스트링에 기초하여 획득할 수 있다. 영상 복호화 장치(100)는 빈스트링에 기초하여, 부호화 단위를 분할할지 여부, 분할 방향 및 분할 타입을 결정할 수 있다.
빈스트링은 정보를 2진수의 나열로 나타낸 것이다. 빈스트링은 적어도 하나의 비트로 구성될 수 있다. 영상 복호화 장치(100)는 현재 부호화 단위에 허용가능한 분할 형태 모드의 개수에 기초하여 빈스트링의 비트의 개수를 결정할 수 있다. 예를 들어, 영상 복호화 장치(100)는 현재 부호화 단위를 분할하거나 분할 하지 않는 모드가 있음을 결정할 수 있다. 즉, 현재 부호화 단위로부터 허용가능한 분할 형태 모드의 개수는 2개일 수 있다. 영상 복호화 장치(100)는 한 개의 비트롤 포함하는 분할 형태 모드에 대한 정보의 빈스트링 기초하여 부호화 단위의 분할 형태 모드에 대한 정보를 결정할 수 있다. 한 개의 비트는 분할 여부를 나타낼 수 있다. 비트는 분할하지 않음(NO_SPLIT)을 나타낼 수 있다. 비트가 분할을 나타내는 경우, 영상 복호화 장치(100)는 현재 부호화 단위의 허용 가능한 분할 형태 모드에 기초하여 분할 방향 또는 분할 타입을 결정할 수 있다.
또한, 현재 부호화 단위에 허용가능한 분할 형태 모드의 개수가 3개인 경우, 영상 복호화 장치(100)는 2 개의 비트롤 포함하는 빈스트링에 기초하여 부호화 단위의 분할 형태 모드에 대한 정보를 결정할 수 있다. 빈스트링의 첫번째 비트는 분할 여부를 나타낼 수 있다. 빈스트링의 두번째 비트는 분할 타입 또는 분할 방향을 나타낼 수 있다. 영상 복호화 장치(100)는 현재 부호화 단위의 허용 가능한 분할 형태 모드에 기초하여 분할 방향 또는 분할 타입을 결정할 수 있다.
또한, 현재 부호화 단위에 허용가능한 분할 형태 모드의 개수가 4개 또는 5개인 경우, 영상 복호화 장치(100)는 3 개의 비트롤 포함하는 빈스트링 기초하여 부호화 단위를 분할 할 수 있다. 빈스트링의 첫번째 비트는 분할 여부를 나타낼 수 있다. 빈스트링의 두번째 비트는 분할 타입 또는 분할 방향을 나타낼 수 있다. 빈스트링의 세번째 비트는 분할 방향 또는 분할 타입을 나타낼 수 있다.영상 복호화 장치(100)는 현재 부호화 단위의 허용 가능한 분할 형태 모드에 기초하여 분할 방향 또는 분할 타입을 결정할 수 있다.
영상 복호화 장치(100)는 비트스트림으로부터 분할 형태 모드에 대한 정보를 획득할 수 있으나 이에 한정되는 것은 아니다. 영상 복호화 장치(100)는 영상 부호화 장치(2200)와 미리 약속된 분할 규칙에 기초하여 분할 형태 모드에 대한 정보를 획득할 수 있다. 영상 복호화 장치(100)는 현재 부호화 단위의 크기에 기초하여 미리 약속된 분할 형태 모드에 대한 정보를 획득할 수 있다. 예를 들어 영상 복호화 장치(100)는 최대 크기의 부호화 단위에 대하여 분할 형태 모드에 대한 정보를 쿼드 분할(QUAD_SPLIT)로 결정할 수 있다. 또한 영상 복호화 장치(100)는 최소 크기의 부호화 단위에 대하여 분할 형태 모드에 대한 정보를 분할 하지 않음(NO_SPLIT)으로 결정할 수 있다.
도 21 은 일 실시예에 따라 컨텍스트 모델을 결정하는 방법을 설명하기 위한 도면이다.
블록(2110)은 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나와 컨텍스트 모델에 대한 인덱스를 대응시키기 위한 배열을 정의한다. ifvc_tbl_split_flag_ctx는 부호화 단위의 분할 형태 모드에 대한 정보에 포함된 소정의 비트를 결정하기 위한 컨텍스트 모델에 대한 인덱스를 나타낸다. 보다 구체적으로 ifvc_tbl_split_flag_ctx는 분할 형태 모드에 대한 정보 중 현재 부호화 단위를 분할할지 여부를 나타내는 정보에 관련될 수 있다. 블록(2110)의 배열은 6X6의 2차원 배열이다. 블록(2110)의 배열은 {NA, 4, 4, NB, NC, NC}, {4, 4, 3, 3, NB, NC}, {4, 3, 3, 2, 2, NB}, {NB, 3, 2, 2, 1, 1}, {NC, NB, 2, 1, 1, 0} 및 {NC, NC, NB, 1, 0, 0}을 포함할 수 있다. NA, NB, NC는 분할 형태 모드에 대한 정보가 정의되지 않았음을 의미한다. 예를 들어 현재 부호화 단위가 더 이상 분할 될 수 없는 경우 영상 복호화 장치(100)는 컨텍스트 모델을 정의할 필요가 없을 수 있다. 또한 영상 복호화 장치(100)에서 허용하지 않는 부호화 단위의 크기에 대해서는 컨텍스트 모델이 정의되지 않을 수 있다. 블록(2110)의 배열은 도 20의 표(2000)와 동일할 수 있다.
영상 복호화 장치(100) 및 영상 부호화 장치(2200)는 배열을 미리 저장하고 있을 수 있다. 또한 영상 복호화 장치(100)는 비트스트림으로부터 배열을 획득할 수 있다.
영상 복호화 장치(100)는 부호화 단위에 인접한 주변 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 포함하는 블록 형태 정보에 더 기초하여 컨텍스트 모델을 결정할 수 있다. 주변 부호화 단위는 부호화 단위의 좌하측, 좌측, 좌상측, 상측, 우상측, 우측 또는 우하측에 위치한 부호화 단위 중 적어도 하나를 포함할 수 있다. 주변 부호화 단위는 현재 부호화 단위 이전에 복원될 수 있다. 주변 부호화 단위는 현재 부호화 단위와 공간적 또는 시간적으로 인접하고 있으므로, 유사한 컨텍스트 모델을 사용할 가능성이 있다. 따라서 주변 부호화 단위의 블록 형태 정보에 더 기초하여 컨텍스트 모델을 결정하는 경우 신택스 엘리먼트를 엔트로피 코딩하기 위하여 보다 적은 비트가 사용될 수 있다.
예를 들어, 영상 복호화 장치(100)는 주변 부호화 단위의 너비의 길이와 현재 부호화 단위의 너비의 길이를 비교할 수 있다. 또한 영상 복호화 장치(100)는 좌측 및 우측의 주변 블록의 높이의 길이와 부호화 단위의 높이의 길이를 비교할 수 있다. 또한 영상 복호화 장치(100)는 비교 결과들에 기초하여 컨텍스트 모델을 결정할 수 있다. 주변 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나에 더 기초하여 컨텍스트 모델을 결정하는 경우에 대해서는 블록(2120)과 함께 자세히 설명한다.
블록(2120)을 참조하면, w[i]는 주변 부호화 단위의 너비를 나타낼 수 있다. h[i]는 주변 부호화 단위의 높이를 나타낼 수 있다. 또한 i가 '0'인 경우 상측 주변 부호화 단위를 나타낼 수 있다. i가 '1'인 경우 좌측 주변 부호화 단위를 나타낼 수 있다. i가 '2'인 경우 우측 주변 부호화 단위를 나타낼 수 있다.
영상 복호화 장치(100)는 현재 부호화 단위의 너비를 상측 주변 부호화 단위의 너비와 비교할 수 있다. 또한 영상 복호화 장치(100)는 비교 결과 정보(smaller[0])를 획득할 수 있다. 예를 들어 현재 부호화 단위의 너비가 상측 주변 부호화 단위의 너비보다 큰 경우, 영상 복호화 장치(100)는 비교 결과 정보(smaller[0])를 '1'로 설정할 수 있다. 현재 부호화 단위의 너비가 상측 주변 부호화 단위의 너비보다 크지 않은 경우, 영상 복호화 장치(100)는 비교 결과 정보(smaller[0])를 '0'으로 설정할 수 있다.
영상 복호화 장치(100)는 현재 부호화 단위의 높이를 좌측 또는 우측 주변 부호화 단위의 높이와 비교할 수 있다. 또한 영상 복호화 장치(100)는 비교 결과 정보(smaller[1] or smaller[2])를 획득할 수 있다. 예를 들어 현재 부호화 단위의 높이가 좌측 또는 우측 주변 부호화 단위의 높이보다 큰 경우, 영상 복호화 장치(100)는 비교 결과 정보(smaller[1] or smaller[2])를 '1'로 설정할 수 있다. 현재 부호화 단위의 높이가 좌측 또는 우측 주변 부호화 단위의 높이보다 크지 않은 경우, 영상 복호화 장치(100)는 비교 결과 정보(smaller[1] or smaller[2])를 '0'으로 설정할 수 있다.
영상 복호화 장치(100)는 비교 결과들에 기초하여 컨텍스트 모델(ctx)을 획득할 수 있다. 예를 들어 비교 결과 정보들의 합(smaller[0]+smaller[1]+smaller[1])과 '2' 중 작은 수에 기초하여 컨텍스트 모델 (ctx)을 결정할 수 있다. 영상 복호화 장치(100)는 블록(2110)의 배열에 기초하여 컨텍스트 모델에 대한 인덱스(ifvc_tbl_split_flag_ctx)를 획득할 수 있다. log2_cuw 는 현재 부호화 단위의 너비에 log2를 취한 값이다. 또한 log2_cuh는 현재 부호화 단위의 높이에 log2를 취한 값이다. 영상 복호화 장치(100)는 현재 부호화 단위의 크기에 기초하여 블록(2110)의 배열로부터 컨텍스트 모델에 대한 인덱스(ifvc_tbl_split_flag_ctx[log2_cuw-2][log2_cuh-2])를 획득할 수 있다. 영상 복호화 장치(100)는 컨텍스트 모델에 대한 인덱스에 기초하여 컨텍스트 모델(ctx)을 결정할 수 있다. 영상 복호화 장치(100)는 컨텍스트 모델(ctx)에 기초하여 비트스트림을 엔트로피 복호화하여 신택스 엘리먼트를 획득할 수 있다. 신택스 엘리먼트는 현재 부호화 단위의 분할 여부를 나타내는 정보일 수 있다.
영상 복호화 장치(100)는 부호화 단위의 크기에 기초하여 분할 방향 정보에 대한 컨텍스트 모델(ctx_dir)을 결정할 수 있다. 블록(2130)을 참조하면, log2_cuw 는 현재 부호화 단위의 너비에 log2를 취한 값이다. 또한 log2_cuh는 현재 부호화 단위의 높이에 log2를 취한 값이다. 영상 복호화 장치(100)는 부호화 단위의 너비 및 높이의 길이에 기초하여 분할 방향 정보에 대한 컨텍스트 모델(ctx_dir)을 결정할 수 있다. 구체적으로 영상 복호화 장치(100)는 부호화 단위의 너비 및 높이의 비율에 관련된 값에 기초하여 분할 방향 정보에 대한 컨텍스트 모델(ctx_dir)을 결정할 수 있다. log2_cuw-log2_cuh는 부호화 단위의 너비를 높이로 나눈 값에 log2를 취한 값이다. 즉, log2_cuw-log2_cuh는 부호화 단위의 너비 및 높이의 비율에 관련된 값일 수 있다.
영상 복호화 장치(100)는 오프셋(dir_ctx_offset)에 더 기초하여 컨텍스트 모델(ctx_dir)을 획득할 수 있다. 오프셋(dir_ctx_offset)은 다른 신택스를 위한 컨텍스트 모델과 중복을 피하기 위한 값일 수 있다. 오프셋은 0을 포함한 정수일 수 있다. 영상 복호화 장치(100)는 컨텍스트 모델(ctx_dir)에 기초하여 비트스트림을 엔트로피 복호화 하여 분할 방향 정보에 관한 신택스 엘리먼트를 획득할 수 있다. 영상 복호화 장치(100)는 분할 방향 정보에 기초하여 현재 부호화 단위의 분할 형태 모드를 결정할 수 있다. 예를 들어 현재 부호화 단위의 분할 형태 모드는 수평 분할 또는 수직 분할일 수 있다. 영상 복호화 장치(100)는 분할 방향 정보에 기초하여 부호화 단위를 분할할 수 있다.
영상 복호화 장치(100)는 오프셋(typ_ctx_offset)에 기초하여 분할 타입 정보에 대한 컨텍스트 모델(ctx_typ)을 결정할 수 있다. 블록(2140)을 참조하면, 영상 복호화 장치(100)는 오프셋(typ_ctx_offset)에 기초하여 컨텍스트 모델(ctx_typ)을 획득할 수 있다. 오프셋(typ_ctx_offset)은 다른 컨텍스트 모델과 중복을 피하기 위한 값이다. 오프셋(typ_ctx_offset)은 영상 부호화 장치(2200) 및 영상 복호화 장치(100) 사이에 미리 결정될 값일 수 있다. 또는 영상 부호화 장치(2200)는 영상 복호화 장치(100)로 오프셋(typ_ctx_offset)에 대한 정보를 송신할 수 있다. 영상 복호화 장치(100)는 비트스트림으로부터 오프셋(typ_ctx_offset)을 획득할 수 있다. 영상 복호화 장치(100)는 분할 타입 정보에 기초하여 현재 부호화 단위의 분할 형태 모드를 결정할 수 있다. 예를 들어 현재 부호화 단위의 분할 형태 모드는 바이너리 분할(binary split), 트라이 분할(tri split) 또는 쿼드 분할(quad split) 중 하나일 수 있다. 영상 복호화 장치(100)는 분할 타입 정보에 기초하여 부호화 단위를 분할할 수 있다.
도 22 는 일 실시예에 따라 영상 부호화 장치의 개략적인 블록도를 도시한다.
영상 부호화 장치(2200)는 부호화부(2210) 및 비트스트림 생성부(2220)를 포함할 수 있다. 부호화부(2210)는 입력 영상을 수신하여 입력 영상을 부호화할 수 있다. 부호화부(2210)는 입력 영상을 부호화하여 적어도 하나의 신택스 엘리먼트를 획득할 수 있다. 신택스 엘리먼트는 skip flag, prediction mode, motion vector difference, motion vector prediction method (or index), transform quantized coefficient, coded block pattern, coded block flag, intra prediction mode, direct flag, merge flag, delta QP, reference index, prediction direction, transform index 중 적어도 하나를 포함할 수 있다. 부호화부(2210)는 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 포함하는 블록 형태 정보에 기초하여 컨텍스트 모델을 결정할 수 있다.
비트스트림 생성부(2220)는 부호화된 입력 영상에 기초하여 비트스트림을 생성할 수 있다. 예를 들어 비트스트림 생성부(2220)는 컨텍스트 모델에 기초하여 신택스 엘리먼트를 엔트로피 부호화함으로써 비트스트림을 생성할 수 있다. 또한 영상 부호화 장치(2200)는 비트스트림을 영상 복호화 장치(100)로 전송할 수 있다. 영상 부호화 장치(2200)의 자세한 동작에 대해서는 도 23 과 함께 설명한다.
도 23은 일 실시예에 따라 영상 부호화 방법의 흐름도를 도시한다.
도 23은 영상 부호화 방법에 관한 것으로 도 3 내지 도 21에서 설명된 영상 복호화 방법 및 장치와 유사한 내용을 포함하고 있으며, 중복되는 설명은 생략한다.
영상 부호화 장치(2200)는 부호화 단위의 분할 형태 모드에 기초하여 분할 형태 모드에 대한 정보를 결정하는 단계(2310)를 수행한다. 영상 부호화 장치(2200)는 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나에 기초하여 컨텍스트 모델을 결정하는 단계(2320)를 수행한다. 영상 부호화 장치(2200)는 컨텍스트 모델에 기초하여 부호화 단위를 분할하기 위한 분할 형태 모드에 대한 정보를 비트스트림으로 생성하는 단계(2330)를 수행한다.
영상 부호화 장치(2200)는 컨텍스트 모델을 결정하기 위하여, 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나와 컨텍스트 모델에 대한 인덱스를 대응시키기 위한 배열을 획득할 수 있다. 영상 부호화 장치(2200)는 배열에서 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나에 기초하여 컨텍스트 모델에 대한 인덱스를 획득할 수 있다. 영상 부호화 장치(2200)는 컨텍스트 모델에 대한 인덱스에 기초하여 컨텍스트 모델을 결정할 수 있다.
영상 부호화 장치(2200)는, 컨텍스트 모델을 결정하기 위하여, 부호화 단위에 인접한 주변 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 포함하는 블록 형태 정보에 더 기초하여 컨텍스트 모델을 결정할 수 있다. 또한 주변 부호화 단위는 부호화 단위의 좌하측, 좌측, 좌상측, 상측, 우상측, 우측 또는 우하측에 위치한 부호화 단위 중 적어도 하나를 포함할 수 있다.
또한, 영상 부호화 장치(2200)는, 컨텍스트 모델을 결정하기 위하여, 상측 주변 부호화 단위의 너비의 길이와 부호화 단위의 너비의 길이를 비교할 수 있다. 또한, 영상 부호화 장치(2200)는 좌측 및 우측의 주변 부호화 단위의 높이의 길이와 부호화 단위의 높이의 길이를 비교할 수 있다. 또한, 영상 부호화 장치(2200)는 비교 결과들에 기초하여 컨텍스트 모델을 결정할 수 있다.
이제까지 다양한 실시예들을 중심으로 살펴보았다. 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자는 본 개시가 본 개시의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 개시의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 개시에 포함된 것으로 해석되어야 할 것이다.
한편, 상술한 본 개시의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다.
Claims (15)
- 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 포함하는 블록 형태 정보에 기초하여 컨텍스트 모델을 결정하는 단계;상기 부호화 단위를 분할하기 위한 분할 형태 모드에 대한 정보를. 상기 컨텍스트 모델에 기초하여 비트스트림으로부터, 획득하는 단계; 및상기 분할 형태 모드에 대한 정보에 기초하여 상기 부호화 단위의 분할 형태 모드를 결정하는 단계를 포함하는 것을 특징으로 하는 영상 복호화 방법.
- 제 1 항에 있어서,상기 컨텍스트 모델을 결정하는 단계는,상기 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나와 컨텍스트 모델에 대한 인덱스를 대응시키기 위한 배열을 획득하는 단계;상기 배열에서 상기 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나에 기초하여 상기 컨텍스트 모델에 대한 인덱스를 획득하는 단계; 및상기 컨텍스트 모델에 대한 인덱스에 기초하여 상기 컨텍스트 모델을 결정하는 단계를 포함하는 것을 특징으로 하는 영상 복호화 방법.
- 제 1 항에 있어서,상기 부호화 단위의 모양은 상기 부호화 단위가 정사각형인지 또는 직사각형인지를 나타내고,상기 부호화 단위의 방향은 상기 부호화 단위가 수평 방향인지 또는 수직 방향인지를 나타내고,상기 부호화 단위의 너비 및 높이의 비율은 1:1, 1:2, 1:4, 1:8, 2:1, 4:1 및 8:1 중 적어도 하나를 포함하고,상기 부호화 단위의 크기는 상기 부호화 단위의 한 변의 길이 또는 넓이를 나타내는 것을 특징으로 하는 영상 복호화 방법.
- 제 1 항에 있어서,상기 컨텍스트 모델을 결정하는 단계는,상기 부호화 단위에 인접한 주변 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 포함하는 블록 형태 정보에 더 기초하여 컨텍스트 모델을 결정하는 단계를 포함하고,상기 주변 부호화 단위는 상기 부호화 단위의 좌하측, 좌측, 좌상측, 상측, 우상측, 우측 또는 우하측에 위치한 부호화 단위 중 적어도 하나를 포함하는 것을 특징으로 하는 영상 복호화 방법.
- 제 4 항에 있어서,상기 컨텍스트 모델을 결정하는 단계는,상측 주변 부호화 단위의 너비의 길이와 상기 부호화 단위의 너비의 길이를 비교하는 단계;좌측 및 우측의 주변 부호화 단위의 높이의 길이와 상기 부호화 단위의 높이의 길이를 비교하는 단계; 및상기 비교 결과들에 기초하여 상기 컨텍스트 모델을 결정하는 단계를 포함하는 것을 특징으로 하는 영상 복호화 방법.
- 제 1 항에 있어서,상기 분할 형태 모드에 대한 정보는 분할 여부를 나타내는 정보, 분할 방향 정보 및 분할 타입 정보 중 적어도 하나를 포함하고,상기 분할 여부를 나타내는 정보는 부호화 단위를 분할할지 여부를 나타내고,상기 분할 방향 정보는 수평 방향 또는 수직 방향 중 하나로 분할함을 나타내고,상기 분할 타입 정보는 상기 부호화 단위를 바이너리 분할(binary split), 트라이 분할(tri split) 또는 쿼드 분할(quad split) 중 하나로 분할함을 나타내는 것을 특징으로 하는 영상 부호화 방법.
- 영상 복호화 장치는 적어도 하나의 프로세서를 포함하고,상기 적어도 하나의 프로세서는,부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 포함하는 블록 형태 정보에 기초하여 컨텍스트 모델을 결정하는 단계;상기 부호화 단위를 분할하기 위한 분할 형태 모드에 대한 정보를, 상기 컨텍스트 모델에 기초하여 비트스트림으로부터, 획득하는 단계; 및상기 분할 형태 모드에 대한 정보에 기초하여 상기 부호화 단위의 분할 형태 모드를 결정하는 단계를 수행하도록 구성되는 것을 특징으로 하는 영상 복호화 장치.
- 부호화 단위의 분할 형태 모드에 기초하여 분할 형태 모드에 대한 정보를 결정하는 단계;상기 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 포함하는 블록 형태 정보에 기초하여 컨텍스트 모델을 결정하는 단계; 및상기 컨텍스트 모델에 기초하여 상기 부호화 단위를 분할하기 위한 분할 형태 모드에 대한 정보를 비트스트림으로 생성하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법.
- 제 8항에 있어서,상기 컨텍스트 모델을 결정하는 단계는,상기 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나와 컨텍스트 모델에 대한 인덱스를 대응시키기 위한 배열을 획득하는 단계;상기 배열에서 상기 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나에 기초하여 상기 컨텍스트 모델에 대한 인덱스를 획득하는 단계; 및상기 컨텍스트 모델에 대한 인덱스에 기초하여 상기 컨텍스트 모델을 결정하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법.
- 제 8 항에 있어서,상기 부호화 단위의 모양은 상기 부호화 단위가 정사각형인지 또는 직사각형인지를 나타내고,상기 부호화 단위의 방향은 상기 부호화 단위가 수평 방향인지 또는 수직 방향인지를 나타내고,상기 부호화 단위의 너비 및 높이의 비율은 1:1, 1:2, 1:4, 1:8, 2:1, 4:1 및 8:1 중 적어도 하나를 포함하고,상기 부호화 단위의 크기는 상기 부호화 단위의 한 변의 길이 또는 넓이를 나타내는 것을 특징으로 하는 영상 부호화 방법.
- 제 8 항에 있어서,상기 컨텍스트 모델을 결정하는 단계는,상기 부호화 단위에 인접한 주변 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 포함하는 블록 형태 정보에 더 기초하여 컨텍스트 모델을 결정하는 단계를 포함하고,상기 주변 부호화 단위는 상기 부호화 단위의 좌하측, 좌측, 좌상측, 상측, 우상측, 우측 또는 우하측에 위치한 부호화 단위 중 적어도 하나를 포함하는 것을 특징으로 하는 영상 부호화 방법.
- 제 11 항에 있어서,상기 컨텍스트 모델을 결정하는 단계는,상측 주변 부호화 단위의 너비의 길이와 상기 부호화 단위의 너비의 길이를 비교하는 단계;좌측 및 우측의 주변 부호화 단위의 높이의 길이와 상기 부호화 단위의 높이의 길이를 비교하는 단계; 및상기 비교 결과들에 기초하여 상기 컨텍스트 모델을 결정하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법.
- 제 8 항에 있어서,상기 분할 형태 모드에 대한 정보는 분할 여부를 나타내는 정보, 분할 방향 정보 및 분할 타입 정보 중 적어도 하나를 포함하고,상기 분할 여부를 나타내는 정보는 부호화 단위를 분할할지 여부를 나타내고,상기 분할 방향 정보는 수평 방향 또는 수직 방향 중 하나로 분할함을 나타내고,상기 분할 타입 정보는 상기 부호화 단위를 바이너리 분할(binary split), 트라이 분할(tri split) 또는 쿼드 분할(quad split) 중 하나로 분할함을 나타내는 것을 특징으로 하는 영상 부호화 방법.
- 영상 부호화 장치는 적어도 하나의 프로세서를 포함하고,상기 적어도 하나의 프로세서는,부호화 단위의 분할 형태 모드에 기초하여 분할 형태 모드에 대한 정보를 결정하는 단계;상기 부호화 단위의 모양, 방향, 너비 및 높이의 비율 또는 크기 중 적어도 하나를 포함하는 블록 형태 정보에 기초하여 컨텍스트 모델을 결정하는 단계; 및상기 컨텍스트 모델에 기초하여 상기 부호화 단위를 분할하기 위한 분할 형태 모드에 대한 정보를 비트스트림으로 생성하는 단계를 수행하도록 구성되는 것을 특징으로 하는 영상 부호화 장치.
- 제 1 항의 방법을 실행하기 위한 컴퓨터 프로그램을 기록한 컴퓨터로 판독 가능한 기록매체.
Priority Applications (13)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
MX2019015090A MX2019015090A (es) | 2017-07-07 | 2018-03-30 | Metodo y dispositivo de codificacion de video, metodo y dispositivo de descodificacion de video. |
KR1020217041398A KR20210156351A (ko) | 2017-07-07 | 2018-03-30 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
US16/623,252 US11330259B2 (en) | 2017-07-07 | 2018-03-30 | Video coding method and device, video decoding method and device |
CN202210316052.4A CN114466188A (zh) | 2017-07-07 | 2018-03-30 | 视频编码方法及装置、视频解码方法及装置 |
KR1020217000586A KR102343333B1 (ko) | 2017-07-07 | 2018-03-30 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
CN202210314193.2A CN114554222B (zh) | 2017-07-07 | 2018-03-30 | 视频编码方法及装置、视频解码方法及装置 |
KR1020197034034A KR102205905B1 (ko) | 2017-07-07 | 2018-03-30 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
CN202210313435.6A CN114449269B (zh) | 2017-07-07 | 2018-03-30 | 视频编码方法及装置、视频解码方法及装置 |
EP18828450.9A EP3621305A4 (en) | 2017-07-07 | 2018-03-30 | VIDEO CODING METHOD AND DEVICE, VIDEO DECODING METHOD AND DEVICE |
CN201880044834.9A CN110832857B (zh) | 2017-07-07 | 2018-03-30 | 视频编码方法及装置、视频解码方法及装置 |
SG11201911621SA SG11201911621SA (en) | 2017-07-07 | 2018-03-30 | Video coding method and device, video decoding method and device |
US17/740,035 US11652995B2 (en) | 2017-07-07 | 2022-05-09 | Video coding method and device, video decoding method and device |
US18/301,013 US11949864B2 (en) | 2017-07-07 | 2023-04-14 | Video coding method and device, video decoding method and device |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762529556P | 2017-07-07 | 2017-07-07 | |
US62/529,556 | 2017-07-07 |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US16/623,252 A-371-Of-International US11330259B2 (en) | 2017-07-07 | 2018-03-30 | Video coding method and device, video decoding method and device |
US17/740,035 Continuation US11652995B2 (en) | 2017-07-07 | 2022-05-09 | Video coding method and device, video decoding method and device |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2019009503A1 true WO2019009503A1 (ko) | 2019-01-10 |
Family
ID=64951066
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2018/003761 WO2019009503A1 (ko) | 2017-07-07 | 2018-03-30 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
Country Status (7)
Country | Link |
---|---|
US (3) | US11330259B2 (ko) |
EP (1) | EP3621305A4 (ko) |
KR (3) | KR20210156351A (ko) |
CN (4) | CN110832857B (ko) |
MX (3) | MX2019015090A (ko) |
SG (1) | SG11201911621SA (ko) |
WO (1) | WO2019009503A1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020178352A1 (en) * | 2019-03-05 | 2020-09-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Use-case driven context model selection for hybrid video coding tools |
KR20200112752A (ko) * | 2019-03-21 | 2020-10-05 | 삼성전자주식회사 | 블록 형태별로 블록 크기가 설정되는 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
WO2021037053A1 (en) | 2019-08-27 | 2021-03-04 | Huawei Technologies Co., Ltd. | An encoder, a decoder and corresponding methods of cabac coding for the indices of geometric partition flag |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210156351A (ko) * | 2017-07-07 | 2021-12-24 | 삼성전자주식회사 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
FR3086486A1 (fr) * | 2018-09-21 | 2020-03-27 | Orange | Procedes et dispositifs de codage et de decodage d'un flux de donnees representatif d'au moins une image. |
KR102625145B1 (ko) * | 2018-12-17 | 2024-01-16 | 삼성전자주식회사 | 예측 모드를 시그널링하는 비디오 신호 처리 방법 및 장치 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120081241A1 (en) * | 2010-09-30 | 2012-04-05 | Kiran Misra | Methods and Systems for Context Initialization in Video Coding and Decoding |
KR20150052817A (ko) * | 2011-07-01 | 2015-05-14 | 삼성전자주식회사 | 계층적 구조의 데이터 단위를 이용한 엔트로피 부호화 방법 및 장치, 복호화 방법 및 장치 |
US20150326879A1 (en) * | 2008-07-02 | 2015-11-12 | Samsung Electronics Co., Ltd. | Image encoding method and device, and decoding method and device therefor |
KR20170020778A (ko) * | 2014-06-20 | 2017-02-24 | 삼성전자주식회사 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
US20170142448A1 (en) * | 2015-11-13 | 2017-05-18 | Qualcomm Incorporated | Coding sign information of video data |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2572566C (en) * | 2000-01-21 | 2008-03-25 | Nokia Corporation | A method for encoding images in a block-based manner employing block spatial prediction |
CA2614571C (en) * | 2000-01-21 | 2014-03-25 | Nokia Corporation | A method for encoding images in a block-based manner employing block spatial prediction |
CN100345449C (zh) * | 2005-03-18 | 2007-10-24 | 清华大学 | 图像/视频编码中变换系数的熵编码方法 |
JP2009156982A (ja) * | 2007-12-25 | 2009-07-16 | Sony Corp | 電子機器、制御方法及びプログラム |
KR20110017719A (ko) * | 2009-08-14 | 2011-02-22 | 삼성전자주식회사 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
KR101484280B1 (ko) * | 2009-12-08 | 2015-01-20 | 삼성전자주식회사 | 임의적인 파티션을 이용한 움직임 예측에 따른 비디오 부호화 방법 및 장치, 임의적인 파티션을 이용한 움직임 보상에 따른 비디오 복호화 방법 및 장치 |
CN102804782A (zh) | 2010-01-15 | 2012-11-28 | 三星电子株式会社 | 用于预测编码的使用可变分区的视频编码的方法和设备以及用于预测编码的使用可变分区的视频解码的方法和设备 |
US9237355B2 (en) * | 2010-02-19 | 2016-01-12 | Qualcomm Incorporated | Adaptive motion resolution for video coding |
CN104811705B (zh) | 2011-01-06 | 2018-05-08 | 三星电子株式会社 | 视频的编码方法和装置及视频的解码方法和装置 |
US8995523B2 (en) * | 2011-06-03 | 2015-03-31 | Qualcomm Incorporated | Memory efficient context modeling |
US9807426B2 (en) | 2011-07-01 | 2017-10-31 | Qualcomm Incorporated | Applying non-square transforms to video data |
US10469852B2 (en) * | 2012-08-23 | 2019-11-05 | Mediatek Inc. | Method and apparatus of interlayer texture prediction |
JPWO2015012360A1 (ja) * | 2013-07-26 | 2017-03-02 | 三菱電機株式会社 | 監視カメラ、映像セキュリティシステム及び旋回型監視カメラ |
CN103561275A (zh) * | 2013-10-17 | 2014-02-05 | 中国矿业大学(北京) | 一种改进条带波变换的图像压缩方法 |
US9936201B2 (en) * | 2015-01-27 | 2018-04-03 | Qualcomm Incorporated | Contexts for large coding tree units |
US10070130B2 (en) * | 2015-01-30 | 2018-09-04 | Qualcomm Incorporated | Flexible partitioning of prediction units |
CN108605130B (zh) * | 2015-11-27 | 2021-05-11 | 联发科技股份有限公司 | 一种用于对与区块相关的符号进行熵编解码的方法和装置 |
KR20210156351A (ko) * | 2017-07-07 | 2021-12-24 | 삼성전자주식회사 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
US11284093B2 (en) * | 2019-05-09 | 2022-03-22 | Qualcomm Incorporated | Affine linear weighted intra prediction in video coding |
-
2018
- 2018-03-30 KR KR1020217041398A patent/KR20210156351A/ko active Application Filing
- 2018-03-30 EP EP18828450.9A patent/EP3621305A4/en active Pending
- 2018-03-30 KR KR1020217000586A patent/KR102343333B1/ko active IP Right Grant
- 2018-03-30 CN CN201880044834.9A patent/CN110832857B/zh active Active
- 2018-03-30 CN CN202210316052.4A patent/CN114466188A/zh active Pending
- 2018-03-30 CN CN202210313435.6A patent/CN114449269B/zh active Active
- 2018-03-30 WO PCT/KR2018/003761 patent/WO2019009503A1/ko unknown
- 2018-03-30 CN CN202210314193.2A patent/CN114554222B/zh active Active
- 2018-03-30 SG SG11201911621SA patent/SG11201911621SA/en unknown
- 2018-03-30 US US16/623,252 patent/US11330259B2/en active Active
- 2018-03-30 KR KR1020197034034A patent/KR102205905B1/ko active Application Filing
- 2018-03-30 MX MX2019015090A patent/MX2019015090A/es unknown
-
2019
- 2019-12-13 MX MX2023006112A patent/MX2023006112A/es unknown
- 2019-12-13 MX MX2023006113A patent/MX2023006113A/es unknown
-
2022
- 2022-05-09 US US17/740,035 patent/US11652995B2/en active Active
-
2023
- 2023-04-14 US US18/301,013 patent/US11949864B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150326879A1 (en) * | 2008-07-02 | 2015-11-12 | Samsung Electronics Co., Ltd. | Image encoding method and device, and decoding method and device therefor |
US20120081241A1 (en) * | 2010-09-30 | 2012-04-05 | Kiran Misra | Methods and Systems for Context Initialization in Video Coding and Decoding |
KR20150052817A (ko) * | 2011-07-01 | 2015-05-14 | 삼성전자주식회사 | 계층적 구조의 데이터 단위를 이용한 엔트로피 부호화 방법 및 장치, 복호화 방법 및 장치 |
KR20170020778A (ko) * | 2014-06-20 | 2017-02-24 | 삼성전자주식회사 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
US20170142448A1 (en) * | 2015-11-13 | 2017-05-18 | Qualcomm Incorporated | Coding sign information of video data |
Non-Patent Citations (1)
Title |
---|
See also references of EP3621305A4 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7377878B2 (ja) | 2019-03-05 | 2023-11-10 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ハイブリッドビデオ符号化ツールのための使用事例駆動コンテキストモデル選択 |
JP7554335B2 (ja) | 2019-03-05 | 2024-09-19 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ハイブリッドビデオ符号化ツールのための使用事例駆動コンテキストモデル選択 |
CN113647106A (zh) * | 2019-03-05 | 2021-11-12 | 弗劳恩霍夫应用研究促进协会 | 混合视频编码工具的用例驱动上下文模型选择 |
CN113647106B (zh) * | 2019-03-05 | 2024-08-13 | 弗劳恩霍夫应用研究促进协会 | 混合视频编码工具的用例驱动上下文模型选择 |
JP2022522744A (ja) * | 2019-03-05 | 2022-04-20 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ハイブリッドビデオ符号化ツールのための使用事例駆動コンテキストモデル選択 |
WO2020178352A1 (en) * | 2019-03-05 | 2020-09-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Use-case driven context model selection for hybrid video coding tools |
US11997280B2 (en) | 2019-03-05 | 2024-05-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Use-case driven context model selection for hybrid video coding tools |
US11979569B2 (en) | 2019-03-21 | 2024-05-07 | Samsung Electronics Co., Ltd. | Method and device for encoding video having block size set for each block shape, and method and device for decoding video |
KR102213901B1 (ko) | 2019-03-21 | 2021-02-08 | 삼성전자주식회사 | 블록 형태별로 블록 크기가 설정되는 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
KR20200112752A (ko) * | 2019-03-21 | 2020-10-05 | 삼성전자주식회사 | 블록 형태별로 블록 크기가 설정되는 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
US11431975B2 (en) | 2019-03-21 | 2022-08-30 | Samsung Electronics Co., Ltd. | Method and device for encoding video having block size set for each block shape, and method and device for decoding video |
EP4022925A4 (en) * | 2019-08-27 | 2022-11-16 | Huawei Technologies Co., Ltd. | CABAC CODING ENCODER, DECODER AND RELATED METHODS FOR INDICES OF A GEOMETRIC PARTITION INDICATOR |
CN114303380B (zh) * | 2019-08-27 | 2024-04-09 | 华为技术有限公司 | 用于几何划分标志的索引的cabac译码的编码器、解码器及对应方法 |
CN114303380A (zh) * | 2019-08-27 | 2022-04-08 | 华为技术有限公司 | 用于几何划分标志的索引的cabac译码的编码器、解码器及对应方法 |
WO2021037053A1 (en) | 2019-08-27 | 2021-03-04 | Huawei Technologies Co., Ltd. | An encoder, a decoder and corresponding methods of cabac coding for the indices of geometric partition flag |
Also Published As
Publication number | Publication date |
---|---|
CN114449269B (zh) | 2023-03-28 |
CN110832857B (zh) | 2022-04-15 |
CN114449269A (zh) | 2022-05-06 |
CN110832857A (zh) | 2020-02-21 |
SG11201911621SA (en) | 2020-01-30 |
CN114554222B (zh) | 2023-03-28 |
CN114466188A (zh) | 2022-05-10 |
US11330259B2 (en) | 2022-05-10 |
MX2019015090A (es) | 2020-02-13 |
MX2023006112A (es) | 2023-06-08 |
MX2023006113A (es) | 2023-06-08 |
US20210152823A1 (en) | 2021-05-20 |
KR102343333B1 (ko) | 2021-12-24 |
US11949864B2 (en) | 2024-04-02 |
US11652995B2 (en) | 2023-05-16 |
KR102205905B1 (ko) | 2021-01-21 |
US20220272339A1 (en) | 2022-08-25 |
KR20210156351A (ko) | 2021-12-24 |
KR20210006028A (ko) | 2021-01-15 |
CN114554222A (zh) | 2022-05-27 |
EP3621305A4 (en) | 2020-03-25 |
EP3621305A1 (en) | 2020-03-11 |
US20230254486A1 (en) | 2023-08-10 |
KR20190139288A (ko) | 2019-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019009503A1 (ko) | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 | |
WO2019009502A1 (ko) | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 | |
WO2018097691A2 (ko) | 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체 | |
WO2021006692A1 (ko) | 비디오 복호화 방법 및 장치, 비디오 부호화 방법 및 장치 | |
WO2019143093A1 (ko) | 비디오 복호화 방법 및 장치, 비디오 부호화 방법 및 장치 | |
WO2018056703A1 (ko) | 비디오 신호 처리 방법 및 장치 | |
WO2019066384A1 (ko) | 크로스-성분 예측에 의한 비디오 복호화 방법 및 장치, 크로스-성분 예측에 의한 비디오 부호화 방법 및 장치 | |
WO2020040619A1 (ko) | 비디오 복호화 방법 및 장치, 비디오 부호화 방법 및 장치 | |
WO2017142327A1 (ko) | 인트라 예측오차의 감소를 위한 인트라 예측 방법 및 그 장치 | |
WO2020027551A1 (ko) | 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치 | |
WO2019216712A1 (ko) | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 | |
WO2019216710A1 (ko) | 영상의 부호화 및 복호화를 위한 영상의 분할 방법 및 장치 | |
WO2019059575A2 (ko) | 움직임 정보의 부호화 및 복호화 방법, 및 움직임 정보의 부호화 및 복호화 장치 | |
WO2017091007A1 (ko) | 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치 | |
WO2020130712A1 (ko) | 삼각 예측 모드를 이용하는 영상 부호화 장치 및 영상 복호화 장치, 및 이에 의한 영상 부호화 방법 및 영상 복호화 방법 | |
WO2019088700A1 (ko) | 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치 | |
WO2019164306A1 (ko) | 영상 부호화 방법/장치, 영상 복호화 방법/장치 및 비트스트림을 저장한 기록 매체 | |
WO2019135558A1 (ko) | 비디오 복호화 방법 및 장치, 비디오 부호화 방법 및 장치 | |
WO2020189978A1 (ko) | 비디오 복호화 방법 및 장치, 비디오 부호화 방법 및 장치 | |
WO2019066514A1 (ko) | 부호화 방법 및 그 장치, 복호화 방법 및 그 장치 | |
WO2019078630A1 (ko) | 비디오 복호화 방법 및 장치, 비디오 부호화 방법 및 장치 | |
WO2019209028A1 (ko) | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 | |
WO2020101429A1 (ko) | 양방향 예측을 이용한 영상의 부호화 및 복호화 방법, 및 영상의 부호화 및 복호화 장치 | |
WO2019066574A1 (ko) | 부호화 방법 및 그 장치, 복호화 방법 및 그 장치 | |
WO2019009666A1 (ko) | 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 18828450 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 20197034034 Country of ref document: KR Kind code of ref document: A |
|
ENP | Entry into the national phase |
Ref document number: 2018828450 Country of ref document: EP Effective date: 20191203 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |