KR20150045973A - Method and apparatus for video encoding, and method and apparatus for video decoding - Google Patents
Method and apparatus for video encoding, and method and apparatus for video decoding Download PDFInfo
- Publication number
- KR20150045973A KR20150045973A KR20150051135A KR20150051135A KR20150045973A KR 20150045973 A KR20150045973 A KR 20150045973A KR 20150051135 A KR20150051135 A KR 20150051135A KR 20150051135 A KR20150051135 A KR 20150051135A KR 20150045973 A KR20150045973 A KR 20150045973A
- Authority
- KR
- South Korea
- Prior art keywords
- unit
- encoding
- depth
- coding
- maximum
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
본 발명은 비디오의 부호화 및 복호화에 관한 것이다.The present invention relates to encoding and decoding of video.
고해상도 또는 고화질 비디오 컨텐트를 재생, 저장할 수 있는 하드웨어의 개발 및 보급에 따라, 고해상도 또는 고화질 비디오 컨텐트를 효과적으로 부호화하거나 복호화하는 비디오 코덱의 필요성이 증대하고 있다. 기존의 비디오 코덱에 따르면, 비디오는 소정 크기의 매크로블록에 기반하여 제한된 부호화 방식에 따라 부호화되고 있다.Background of the Invention [0002] As the development and dissemination of hardware capable of playing back and storing high-resolution or high-definition video content increases the need for video codecs to effectively encode or decode high-definition or high-definition video content. According to the conventional video codec, video is encoded according to a limited encoding method based on a macroblock of a predetermined size.
본 발명은, 다양한 크기의 계층적 부호화 단위에 기반한 영상 부호화 및 영상 복호화에 관한 것이다.The present invention relates to image encoding and image decoding based on hierarchical encoding units of various sizes.
본 발명의 일 실시예에 따른 비디오 부호화 방법은, 현재 픽처를 최대 크기의 부호화 단위인 적어도 하나의 최대 부호화 단위로 분할하는 단계; 상기 최대 부호화 단위의 영역을 분할하는 횟수가 증가함에 따라 깊어지는 심도에 기초하여, 상기 심도마다 상기 최대 부호화 단위의 영역이 분할된 적어도 하나의 분할 영역을 부호화하여, 상기 적어도 하나의 분할 영역 별로 최종 부호화 결과가 출력될 심도를 결정하는 단계; 상기 최대 부호화 단위마다 상기 적어도 하나의 분할 영역 별 최종 부호화 결과인 영상 데이터와, 심도 및 예측 모드에 관한 부호화 정보를 출력하는 단계를 포함한다. .According to an aspect of the present invention, there is provided a video encoding method including: dividing a current picture into at least one maximum encoding unit that is a maximum-size encoding unit; Encoding the at least one divided area in which the area of the maximum encoding unit is divided for each depth, based on a depth that increases as the number of times of dividing the area of the maximum encoding unit increases, Determining a depth at which the result is to be output; And outputting the image data as the final encoding result for each of the at least one divided area and the encoding information for the depth and the prediction mode for each maximum encoding unit. .
일 실시예에 따른 부호화 단위는 최대 크기 및 심도로 특징지어질 수 있다. An encoding unit according to an embodiment may be characterized by a maximum size and a depth.
심도란 부호화 단위가 계층적으로 분할되는 단계를 나타내며, 심도가 깊어질수록 심도별 부호화 단위는 최대 부호화 단위로부터 최소 부호화 단위까지 분할될 수 있다. 본 명세서에서는, 높은 심도 또는 상위 심도로부터 낮은 심도 또는 하위 심도의 방향으로 '심도가 깊어진다'고 정의한다. 심도가 깊어짐에 따라 최대 부호화 단위의 분할 횟수가 증가하고, 최대 부호화 단위의 분할 가능한 총 횟수가 '최대 심도'로 대응된다. 부호화 단위의 최대 크기 및 최대 심도가 미리 설정되어 있을 수 있다. Depth indicates a stage in which coding units are hierarchically divided. As the depth increases, the depth coding units can be divided from the maximum coding unit to the minimum coding unit. In the present specification, it is defined that the depth is deepened from a high depth or a high depth toward a low depth or a bottom depth. As the depth increases, the number of division of the maximum encoding unit increases and the total number of divisions of the maximum encoding unit corresponds to 'maximum depth'. The maximum size and the maximum depth of the encoding unit may be preset.
일 실시예에 따른 비디오 부호화 방법은, 상기 부호화 크기의 최대 크기 및 최대 심도를 미리 설정하는 단계를 더 포함할 수 있다.The video encoding method according to an exemplary embodiment may further include setting a maximum size and a maximum depth of the encoding size in advance.
일 실시예에 따른 비디오 부호화 방법은, 상기 적어도 하나의 최대 부호화 단위마다, 적어도 하나의 심도별에 따른 심도별 부호화 단위를 기반으로 상기 영상 데이터를 부호화하고, 상기 심도가 깊어짐에 따라 상기 최대 부호화 단위로부터 부호화 단위가 계층적으로 분할될 수 있다.According to an exemplary embodiment of the present invention, the image encoding method may include encoding the image data on the basis of at least one depth-dependent encoding unit for each of the at least one maximum encoding unit, The encoding unit can be hierarchically divided.
일 실시예에 따른 상기 비디오 부호화 방법의 부호화 심도 결정 단계는, 상기 최대 부호화 단위별로 부호화 심도를 결정하기 위해, 상기 최대 부호화 단위별로, 상기 심도별 부호화 단위마다, 현재 심도의 부호화 단위, 및 상기 현재 심도의 부호화 단위의 높이 및 너비 중 적어도 하나를 분할한 부분적 데이터 단위별로 예측 부호화를 수행하여 해당 영상 데이터를 부호화할 수 있다. The coding depth determination step of the video coding method according to an exemplary embodiment of the present invention may further include determining a coding depth for each of the maximum coding units for each of the depth coding units, It is possible to encode the corresponding image data by performing predictive encoding for each partial data unit obtained by dividing at least one of the height and the width of the depth encoding unit.
일 실시예에 따른 상기 비디오 부호화 방법의 부호화 심도 결정 단계는, 상기 최대 부호화 단위별로 부호화 심도를 결정하기 위해, 상기 최대 부호화 단위별로, 상기 심도별 부호화 단위마다, 현재 심도의 부호화 단위의 높이 및 너비보다 작거나 같은 데이터 단위로 주파수 변환을 수행하여 해당 영상 데이터를 부호화할 수 있다.The coding depth determination step of the video coding method according to an exemplary embodiment of the present invention may further include determining a coding depth for each of the maximum coding units for each of the coding units, It is possible to encode the corresponding image data by performing frequency conversion in a unit of data smaller than or equal to the frequency.
일 실시예에 따른 상기 비디오 부호화 방법의 부호화 심도 결정 단계는, 상기 최대 부호화 단위별로, 상기 심도별 부호화 결과를 비교하여 최소 부호화 오차를 발생시키는 부호화 심도의 부호화 단위마다 예측 부호화를 수행한 데이터 단위의 파티션 타입 및 예측 모드, 및 주파수 변환을 수행한 데이터 단위의 크기 중 적어도 하나를 결정하는 단계를 더 포함할 수 있다.The step of determining a coding depth of the video coding method according to an exemplary embodiment of the present invention includes a step of comparing a coding result of each depth coding unit for each of the coding units to generate a minimum coding error, A partition type and a prediction mode, and a size of a data unit in which frequency conversion is performed.
상기 최대 부호화 단위별 상기 예측 모드는, 상기 심도별 부호화 단위별로 독립적으로 결정되며, 인트라 모드, 인터 모드 및 스킵 모드 중 적어도 하나를 포함할 수 있다.The prediction mode for each maximum encoding unit is independently determined for each depth encoding unit, and may include at least one of an intra mode, an inter mode, and a skip mode.
상기 최대 부호화 단위별로 결정된 부호화 모드에 관한 정보는, 상기 결정된 부호화 심도의 부호화 단위마다 예측 부호화를 수행한 데이터 단위의 파티션 타입에 대한 정보 및 상기 부분적 데이터 단위별 예측 모드에 대한 정보, 및 상기 결정된 부호화 심도의 부호화 단위의 주파수 변환을 수행한 데이터 단위의 크기에 대한 정보 중 적어도 하나를 포함할 수 있다.Wherein the information on the encoding mode determined for each maximum encoding unit includes at least one of information on a partition type of a data unit for which predictive encoding has been performed for each encoding unit of the determined encoding depth and information on the partial data unit prediction mode, And information on the size of the data unit in which the frequency conversion of the depth encoding unit is performed.
일 실시예에 따른 상기 비디오 부호화 방법은, 상기 최대 부호화 단위마다, 심도별로 현재 심도로 부호화하지 않고 하위 심도의 부호화 단위로 부호화하는지 여부를 나타내는 분할 정보를 부호화하는 단계를 더 포함할 수 있다. 상기 현재 심도의 분할 정보에 기초하여 하위 심도에 대한 부호화가 수행되는 경우, 상기 현재 심도의 부호화 단위를 분할한 부분적 데이터 단위마다 반복적으로 부호화가 수행될 수 있다.The video coding method according to an exemplary embodiment may further include coding division information indicating whether or not coding is performed in units of sub-depth coding, instead of coding the current coding depth at the maximum coding unit for each maximum coding unit. If encoding is performed for the lower depth based on the division information of the current depth, the encoding may be repeatedly performed for each partial data unit obtained by dividing the encoding unit of the current depth.
상기 최대 부호화 단위의 심도가 최상위 심도이며, 상기 심도별 부호화 단위는 한 계층 상위 심도의 부호화 단위의 높이 및 너비를 반분한 크기의 부호화 단위일 수 있다. 또한, 상기 현재 심도의 부분적 데이터 단위는 상기 현재 심도의 데이터 단위의 높이 및 너비 중 적어도 하나를 반분한 데이터 단위일 수 있다. The depth of the maximum encoding unit is the highest depth, and the depth encoding unit may be an encoding unit having a height and a width half the height of one higher depth encoding unit. The partial data unit of the current depth may be a data unit of at least one of a height and a width of the data unit of the current depth.
상기 부호화 오차는, 라그랑지 곱(Lagrangian Multiplier) 기반의 율-왜곡 최적화(Rate-Distortion Optimization) 기법을 이용하여 측정될 수 있다. The coding error may be measured using a rate-distortion optimization technique based on a Lagrangian multiplier.
일 실시예에 따라, 상기 인트라 모드의 예측 부호화 및 상기 인터 모드의 예측 부호화는, 상기 현재 심도의 부호화 단위 및 상기 현재 심도의 부호화 단위의 높이 및 너비 중 적어도 하나를 반분한 데이터 단위별로 수행될 수 있다.According to one embodiment, the intra-mode predictive encoding and the inter-mode predictive encoding may be performed for each data unit that is obtained by halving at least one of the current-depth encoding unit and the current-depth encoding unit height and width have.
본 발명의 일 실시예에 따른 비디오 복호화 방법은, 부호화된 비디오에 대한 비트스트림을 수신하여 파싱(parsing)하는 단계; 상기 비트스트림으로부터 최대 크기의 부호화 단위인 최대 부호화 단위에 할당되는 상기 현재 픽처의 영상 데이터 및 상기 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보를 추출하는 단계; 및 상기 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보에 기초하여 각각의 최대 부호화 단위의 영상 데이터를 복호화하는 단계를 포함하고, 상기 심도는 상기 최대 부호화 단위의 영역을 분할하는 횟수가 증가함에 따라 깊어지고, 상기 최대 부호화 단위별 부호화 심도는, 상기 현재 픽처의 부호화 과정에서 상기 최대 부호화 단위별로, 상기 심도마다 상기 최대 부호화 단위의 영역이 분할된 적어도 하나의 분할 영역을 부호화하여 상기 적어도 하나의 분할 영역 별로 최종 부호화 결과가 출력된 심도로 결정된다.According to an embodiment of the present invention, there is provided a video decoding method including: receiving and parsing a bitstream of encoded video; Extracting, from the bitstream, image data of the current picture allocated to a maximum coding unit, which is a coding unit of a maximum size, and information on coding depth and coding mode of each coding unit; And decoding the image data of each maximum encoding unit based on the information on the encoding depth and the encoding mode of the maximum encoding unit, wherein the depth of the image is determined as the number of times of dividing the area of the maximum encoding unit increases Wherein the coding depth for the maximum coding unit is obtained by coding at least one divided area in which the area of the maximum coding unit is divided by the maximum coding unit in the coding process of the current picture, The final encoding result for each region is determined by the output depth.
일 실시예에 따른 상기 비디오 복호화 방법은, 상기 비트스트림으로부터, 상기 최대 부호화 단위의 높이 및 너비를 계층적으로 분할 가능한 총 횟수를 나타내는 최대 심도에 관한 정보를 추출하는 단계를 더 포함할 수 있다.The video decoding method may further include extracting information on a maximum depth indicating a total number of times the height and width of the maximum encoding unit can be hierarchically divided from the bit stream.
일 실시예에 따른 상기 비디오 복호화 방법의 복호화 단계는, 상기 추출된 최대 부호화 단위별 부호화 모드에 관한 정보 중 부호화 심도, 예측 부호화를 수행할 데이터 단위의 파티션 타입 및 예측 모드에 기초하여, 상기 최대 부호화 단위별로 상기 부호화 심도의 부호화 단위에 대해 예측 부호화를 수행하는 단계를 포함할 수 있다. The decoding step of the video decoding method according to an exemplary embodiment of the present invention may further include a decoding step of decoding, based on a coding depth of information on the extracted coding mode per coding unit, a partition type of a data unit to be predictively coded, And performing predictive encoding on the encoding unit of the encoding depth for each unit.
일 실시예에 따른 상기 비디오 복호화 방법의 복호화 단계는, 상기 추출된 최대 부호화 단위별 부호화 심도 및 상기 주파수 역변환을 수행할 데이터 단위의 크기에 기초하여, 상기 최대 부호화 단위별로 상기 부호화 심도의 부호화 단위에 대해 주파수 역변환을 수행하는 단계를 포함할 수 있다.The decoding step of the video decoding method according to an exemplary embodiment of the present invention may further include decoding the encoded data in units of encoding units of the encoding depth for each maximum encoding unit based on the extracted encoding depth for the largest encoding unit and the size of the data unit for performing the inverse frequency conversion And performing frequency inverse transform on the frequency domain.
일 실시예에 따른 상기 비디오 복호화 방법은, 상기 비트스트림으로부터, 상기 최대 부호화 단위마다 심도별로 현재 심도로 복호화하지 않고 하위 심도의 부호화 단위로 복호화하는지 여부를 나타내는 분할 정보를 추출하는 단계를 더 포함할 수 있다.The video decoding method according to an embodiment may further include extracting division information indicating whether to decode from the bitstream into low-depth coding units instead of decoding the current coding units by depth at the maximum coding unit .
본 발명의 일 실시예에 따른 비디오 부호화 장치는, 현재 픽처를 최대 크기의 부호화 단위인 적어도 하나의 최대 부호화 단위로 분할하는 최대 부호화 단위 분할부; 상기 최대 부호화 단위의 영역을 분할하는 횟수가 증가함에 따라 깊어지는 심도에 기초하여, 상기 심도마다 상기 최대 부호화 단위의 영역이 분할된 적어도 하나의 분할 영역을 부호화하여, 상기 적어도 하나의 분할 영역 별로 최종 부호화 결과가 출력될 심도를 결정하는 부호화 심도 결정부; 상기 최대 부호화 단위마다 상기 적어도 하나의 분할 영역 별 최종 부호화 결과인 영상 데이터와, 심도 및 예측 모드에 관한 부호화 정보를 출력하는 출력부를 포함할 수 있다.A video encoding apparatus according to an embodiment of the present invention includes: a maximum encoding unit division unit that divides a current picture into at least one maximum encoding unit, which is a maximum-size encoding unit; Encoding the at least one divided area in which the area of the maximum encoding unit is divided for each depth, based on a depth that increases as the number of times of dividing the area of the maximum encoding unit increases, An encoding depth determination unit for determining a depth at which a result is output; And an output unit for outputting image data as a final encoding result for each of the at least one divided area and encoding information about a depth and a prediction mode for each of the maximum encoding units.
본 발명의 일 실시예에 따른 비디오 복호화 장치는, 부호화된 비디오에 대한 비트스트림을 수신하여 파싱하는 수신부; 상기 비트스트림으로부터 최대 크기의 부호화 단위인 최대 부호화 단위에 할당되는 상기 현재 픽처의 영상 데이터 및 상기 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보를 추출하는 영상 데이터 및 부호화 정보 추출부; 및 상기 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보에 기초하여 각각의 최대 부호화 단위의 영상 데이터를 복호화하는 복호화부를 포함하고, 상기 최대 부호화 단위별 부호화 심도는, 상기 현재 픽처의 부호화 과정에서 상기 최대 부호화 단위별로, 상기 심도마다 상기 최대 부호화 단위의 영역이 분할된 적어도 하나의 분할 영역을 부호화하여 상기 적어도 하나의 분할 영역 별로 최종 부호화 결과가 출력된 심도로 결정된다.According to an aspect of the present invention, there is provided a video decoding apparatus including: a receiver for receiving and parsing a bitstream of encoded video; An image data and an encoding information extracting unit for extracting image data of the current picture allocated to a maximum encoding unit, which is the encoding unit of the maximum size, from the bitstream, and information on the encoding depth and encoding mode of the maximum encoding unit; And a decoding unit that decodes image data of each maximum encoding unit based on information on the encoding depth and encoding mode for each of the maximum encoding units, wherein the encoding depth for each of the maximum encoding units includes: And at least one divided region in which the region of the maximum encoding unit is divided is encoded for each depth, by the maximum encoding unit, and is determined as a depth at which the final encoding result is output for each of the at least one divided region.
본 발명은, 일 실시예에 따른 비디오 부호화 방법을 구현하기 위한 프로그램이 기록된 컴퓨터로 판독 가능한 기록 매체를 포함한다. 또한, 본 발명은 일 실시예에 따른 비디오 복호화 방법을 구현하기 위한 프로그램이 기록된 컴퓨터로 판독 가능한 기록 매체를 포함한다.The present invention includes a computer-readable recording medium on which a program for implementing a video encoding method according to an embodiment is recorded. In addition, the present invention includes a computer-readable recording medium on which a program for implementing a video decoding method according to an embodiment is recorded.
도 1 은 본 발명의 일 실시예에 따른 비디오 부호화 장치의 블록도를 도시한다.
도 2 는 본 발명의 일 실시예에 따른 비디오 복호화 장치의 블록도를 도시한다.
도 3 은 본 발명의 일 실시예에 따른 부호화 단위의 개념을 도시한다.
도 4 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 부호화부의 블록도를 도시한다.
도 5 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 복호화부의 블록도를 도시한다.
도 6 는 본 발명의 일 실시예에 따른 심도별 부호화 단위 및 예측 단위를 도시한다.
도 7 은 본 발명의 일 실시예에 따른, 부호화 단위 및 변환 단위의 관계를 도시한다.
도 8 은 본 발명의 일 실시예에 따라, 심도별 부호화 정보들을 도시한다.
도 9 는 본 발명의 일 실시예에 따른 심도별 부호화 단위를 도시한다.
도 10a, 10b 및 10c는 본 발명의 일 실시예에 따른, 부호화 단위, 예측 단위 및 주파수 변환 단위의 관계를 도시한다.
도 11 은 본 발명의 일 실시예에 따른 부호화 단위별 부호화 정보를 도시한다.
도 12 는 본 발명의 일 실시예에 따른 비디오 부호화 방법의 흐름도를 도시한다.
도 13 은 본 발명의 일 실시예에 따른 비디오 복호화 방법의 흐름도를 도시한다.1 shows a block diagram of a video encoding apparatus according to an embodiment of the present invention.
2 shows a block diagram of a video decoding apparatus according to an embodiment of the present invention.
FIG. 3 illustrates a concept of an encoding unit according to an embodiment of the present invention.
4 is a block diagram of an image encoding unit based on an encoding unit according to an embodiment of the present invention.
5 is a block diagram of an image decoding unit based on an encoding unit according to an embodiment of the present invention.
FIG. 6 illustrates a depth-based coding unit and a prediction unit according to an embodiment of the present invention.
FIG. 7 shows a relationship between an encoding unit and a conversion unit according to an embodiment of the present invention.
FIG. 8 illustrates depth-specific encoding information, in accordance with an embodiment of the present invention.
FIG. 9 shows a depth encoding unit according to an embodiment of the present invention.
FIGS. 10A, 10B, and 10C illustrate the relationship between an encoding unit, a prediction unit, and a frequency conversion unit according to an embodiment of the present invention.
FIG. 11 shows encoding information for each encoding unit according to an embodiment of the present invention.
12 shows a flowchart of a video coding method according to an embodiment of the present invention.
13 shows a flowchart of a video decoding method according to an embodiment of the present invention.
이하 도 1 내지 도 13을 참조하여 본 발명의 일 실시예에 따른 비디오 부호화 장치 및 비디오 복호화 장치, 비디오 부호화 방법 및 비디오 복호화 방법이 상술된다.Hereinafter, a video encoding apparatus, a video encoding apparatus, a video encoding method, and a video decoding method according to an embodiment of the present invention will be described with reference to FIGS. 1 to 13.
도 1 은 본 발명의 일 실시예에 따른 비디오 부호화 장치의 블록도를 도시한다.1 shows a block diagram of a video encoding apparatus according to an embodiment of the present invention.
일 실시예에 따른 비디오 부호화 장치(100)는 최대 부호화 단위 분할부(110), 부호화 심도 결정부(120) 및 출력부(130)를 포함한다.The video coding apparatus 100 according to an embodiment includes a maximum coding
최대 부호화 단위 분할부(110)는 영상의 현재 픽처를 위한 최대 크기의 부호화 단위인 최대 부호화 단위에 기반하여 현재 픽처를 구획할 수 있다. 현재 픽처가 최대 부호화 단위보다 크다면, 현재 픽처의 영상 데이터는 적어도 하나의 최대 부호화 단위로 분할될 수 있다. 영상 데이터는 적어도 하나의 최대 부호화 단위별로 부호화 심도 결정부(120)로 출력될 수 있다.The maximum coding
일 실시예에 따른 부호화 단위는 최대 크기 및 심도로 특징지어질 수 있다. 심도란 부호화 단위가 계층적으로 분할되는 단계를 나타내며, 심도가 깊어질수록 심도별 부호화 단위는 최대 부호화 단위로부터 최소 부호화 단위까지 분할될 수 있다. 최대 부호화 단위의 심도가 최상위 심도이며 최소 부호화 단위가 최하위 부호화 단위로 정의될 수 있다. 최대 부호화 단위는 심도가 깊어짐에 따라 심도별 부호화 단위의 크기는 감소하므로, 상위 심도의 부호화 단위는 복수 개의 하위 심도의 부호화 단위를 포함할 수 있다.An encoding unit according to an embodiment may be characterized by a maximum size and a depth. Depth indicates a stage in which coding units are hierarchically divided. As the depth increases, the depth coding units can be divided from the maximum coding unit to the minimum coding unit. The depth of the maximum encoding unit is the highest depth and the minimum encoding unit can be defined as the least significant encoding unit. As the depth of the maximum encoding unit increases, the size of the depth-dependent encoding unit decreases, so that the encoding unit of the higher depth may include a plurality of lower-depth encoding units.
전술한 바와 같이 부호화 단위의 최대 크기에 따라, 현재 픽처의 영상 데이터를 최대 부호화 단위로 분할하며, 각각의 최대 부호화 단위는 심도별로 분할되는 부호화 단위들을 포함할 수 있다. 일 실시예에 따른 최대 부호화 단위는 심도별로 분할되므로, 최대 부호화 단위에 포함된 공간 영역(spatial domain)의 영상 데이터가 심도에 따라 계층적으로 분류될 수 있다. As described above, according to the maximum size of an encoding unit, the image data of the current picture is divided into a maximum encoding unit, and each maximum encoding unit may include encoding units divided by depth. Since the maximum encoding unit according to an embodiment is divided by depth, image data of a spatial domain included in the maximum encoding unit can be hierarchically classified according to depth.
최대 부호화 단위의 높이 및 너비를 계층적으로 분할할 수 있는 총 횟수를 제한하는 최대 심도 및 부호화 단위의 최대 크기가 미리 설정되어 있을 수 있다.The maximum depth for limiting the total number of times the height and width of the maximum encoding unit can be hierarchically divided and the maximum size of the encoding unit may be preset.
부호화 심도 결정부(120)는, 심도마다 최대 부호화 단위의 영역이 분할된 적어도 하나의 분할 영역을 부호화하여, 적어도 하나의 분할 영역 별로 최종 부호화 결과가 출력될 심도를 결정한다. 즉 부호화 심도 결정부(120)는, 현재 픽처의 최대 부호화 단위마다 심도별 부호화 단위로 영상 데이터를 부호화하여 가장 작은 부호화 오차가 발생하는 심도를 선택하여 부호화 심도로 결정한다. 결정된 부호화 심도 및 최대 부호화 단위별 영상 데이터는 출력부(130)로 출력된다.The coding depth determiner 120 encodes at least one divided area in which the area of the maximum coding unit is divided for each depth, and determines the depth at which the final coding result is output for each of at least one of the divided areas. That is, the coding
최대 부호화 단위 내의 영상 데이터는 최대 심도 이하의 적어도 하나의 심도에 따라 심도별 부호화 단위에 기반하여 부호화되고, 각각의 심도별 부호화 단위에 기반한 부호화 결과가 비교된다. 심도별 부호화 단위의 부호화 오차의 비교 결과 부호화 오차가 가장 작은 심도가 선택될 수 있다. 각각의 최대화 부호화 단위마다 적어도 하나의 부호화 심도가 결정될 수 있다. The image data in the maximum encoding unit is encoded based on the depth encoding unit according to at least one depth below the maximum depth, and the encoding results based on the respective depth encoding units are compared. As a result of the comparison of the encoding error of the depth-dependent encoding unit, the depth with the smallest encoding error can be selected. At least one coding depth may be determined for each maximum coding unit.
최대 부호화 단위의 크기는 심도가 깊어짐에 따라 부호화 단위가 계층적으로 분할되어 분할되며 부호화 단위의 개수는 증가한다. 또한, 하나의 최대 부호화 단위에 포함되는 동일한 심도의 부호화 단위들이라 하더라도, 각각의 데이터에 대한 부호화 오차를 측정하고 하위 심도로의 분할 여부가 결정된다. 따라서, 하나의 최대 부호화 단위에 포함되는 데이터라 하더라도 위치에 따라 심도별 부호화 오차가 다르므로 위치에 따라 부호화 심도가 달리 결정될 수 있다. 따라서, 하나의 최대 부호화 단위에 대해 부호화 심도가 하나 이상 설정될 수 있으며, 최대 부호화 단위의 데이터는 하나 이상의 부호화 심도의 부호화 단위에 따라 구획될 수 있다.As the depth of the maximum encoding unit increases, the encoding unit is hierarchically divided and divided, and the number of encoding units increases. In addition, even if encoding units of the same depth included in one maximum encoding unit, the encoding error of each data is measured and it is determined whether or not the encoding unit is divided into lower depths. Therefore, even if the data included in one maximum coding unit has a different coding error according to the position, the coding depth can be determined depending on the position. Accordingly, one or more coding depths may be set for one maximum coding unit, and data of the maximum coding unit may be divided according to one or more coding depth encoding units.
최대 부호화 단위의 예측 부호화 및 주파수 변환이 수행될 수 있다. 예측 부호화 및 주파수 변환도 마찬가지로, 최대 부호화 단위마다, 최대 심도 이하의 심도마다 심도별 부호화 단위를 기반으로 수행된다. The predictive encoding and frequency conversion of the maximum encoding unit can be performed. Likewise, predictive coding and frequency conversion are performed on the basis of the depth coding unit for each maximum coding unit and for each depth below the maximum depth.
최대 부호화 단위가 심도별로 분할될 때마다 심도별 부호화 단위의 개수가 증가하므로, 심도가 깊어짐에 따라 생성되는 모든 심도별 부호화 단위에 대해 예측 부호화 및 주파수 변환을 포함한 부호화가 수행되어야 한다. 이하 설명의 편의를 위해 적어도 하나의 최대 부호화 단위 중 현재 심도의 부호화 단위을 기반으로 예측 부호화 및 주파수 변환을 설명하겠다.Since the number of coding units per depth is increased every time the maximum coding unit is divided by the depth, the coding including the predictive coding and the frequency conversion should be performed for every depth coding unit as the depth increases. For convenience of explanation, predictive coding and frequency conversion will be described based on a coding unit of a current depth among at least one maximum coding unit.
일 실시예에 따른 비디오 부호화 장치(100)는, 영상 데이터의 부호화를 위한 데이터 단위의 크기 또는 형태를 다양하게 선택할 수 있다. 영상 데이터의 부호화를 위해서는 예측 부호화, 주파수 변환, 엔트로피 부호화 등의 단계를 거치는데, 모든 단계에 걸쳐서 동일한 데이터 단위가 사용될 수도 있으며, 단계별로 데이터 단위가 변경될 수도 있다.The video encoding apparatus 100 according to an exemplary embodiment may select various sizes or types of data units for encoding image data. To encode the image data, a step such as predictive encoding, frequency conversion, and entropy encoding is performed. The same data unit may be used for all steps, and the data unit may be changed step by step.
예를 들어 비디오 부호화 장치(100)는, 영상 데이터의 부호화를 위한 부호화 단위 뿐만 아니라, 부호화 단위의 영상 데이터의 예측 부호화를 수행하기 위해, 부호화 단위와 다른 데이터 단위를 선택할 수 있다. For example, the video coding apparatus 100 can select not only a coding unit for coding image data but also a data unit different from the coding unit in order to perform predictive coding of the image data of the coding unit.
최대 부호화 단위의 예측 부호화를 위해서는, 최대 부호화 단위의 심도별 부호화 단위의 부분적 데이터 단위를 기반으로 예측 부호화가 수행될 수 있다. 부호화 단위의 부분적 데이터 단위는, 부호화 단위 및 심도별 부호화 단위의 높이 및 너비 중 적어도 하나가 분할된 데이터 단위를 포함할 수 있다. For predictive coding of the maximum coding unit, predictive coding may be performed based on the partial data unit of the coding unit for each depth of the maximum coding unit. The partial data unit of the encoding unit may include a data unit in which at least one of the height and the width of the encoding unit and the depth encoding unit is divided.
예를 들어, 부호화 단위의 크기가 2Nx2N(단, N은 양의 정수)인 경우, 부분적 데이터 단위의 크기는 2Nx2N, 2NxN, Nx2N, NxN 등일 수 있다. 부호화 단위의 높이 또는 너비 중 적어도 하나를 반분하는 형태의 데이터 단위 이외에도 다양하게 분할한 형태의 데이터 단위를 기반으로 예측 부호화가 수행될 수도 있다. 이하, 예측 부호화의 기반이 되는 데이터 단위는 '예측 단위'라고 지칭될 수 있다.For example, when the size of the encoding unit is 2Nx2N (where N is a positive integer), the size of the partial data unit may be 2Nx2N, 2NxN, Nx2N, NxN, and the like. Prediction coding may be performed based on data units of various types, in addition to data units of a type in which at least one of the height and the width of an encoding unit is divided by half. Hereinafter, a data unit on which prediction encoding is based may be referred to as a 'prediction unit'.
부호화 단위의 예측 모드는, 인트라 모드, 인터 모드 및 스킵 모드 중 적어도 하나일 수 있다. 예를 들어 인트라 모드 및 인터 모드는, 2Nx2N, 2NxN, Nx2N, NxN 크기의 예측 단위에 대해서 수행될 수 있다. 또한, 스킵 모드는 2Nx2N 크기의 예측 단위에 대해서만 수행될 수 있다. 부호화 단위 이내의 하나의 예측 단위마다 독립적으로 부호화가 수행되어 부호화 오차가 가장 작은 예측 모드가 선택될 수 있다.The prediction mode of the encoding unit may be at least one of an intra mode, an inter mode, and a skip mode. For example, the intra mode and the inter mode can be performed for prediction units of 2Nx2N, 2NxN, Nx2N, and NxN sizes. In addition, the skip mode can be performed only for a prediction unit of 2Nx2N size. Encoding is performed independently for each prediction unit within an encoding unit, and a prediction mode having the smallest encoding error can be selected.
또한, 일 실시예에 따른 비디오 부호화 장치(100)는, 영상 데이터의 부호화를 위한 부호화 단위 뿐만 아니라, 부호화 단위와 다른 데이터 단위를 기반으로 부호화 단위의 영상 데이터의 주파수 변환을 수행할 수 있다.In addition, the video encoding apparatus 100 according to an exemplary embodiment may perform frequency conversion of image data of an encoding unit based on not only an encoding unit for encoding image data but also a data unit different from the encoding unit.
부호화 단위의 주파수 변환을 위해서는, 부호화 단위보다 작거나 같은 크기의 데이터 단위를 기반으로 주파수 변환이 수행될 수 있다. 예를 들어, 주파수 변환을 위한 데이터 단위는, 인트라 모드를 위한 데이터 단위 및 인터 모드를 위한 데이터 단위를 포함할 수 있다. 이하, 주파수 변환의 기반이 되는 데이터 단위는 '변환 단위'라고 지칭될 수 있다.For frequency conversion of a coding unit, frequency conversion may be performed based on a data unit having a size smaller than or equal to the coding unit. For example, a data unit for frequency conversion may include a data unit for intra mode and a data unit for inter mode. Hereinafter, the data unit on which the frequency conversion is based may be referred to as a 'conversion unit'.
부호화 심도별 부호화 정보는, 부호화 심도 뿐만 아니라 예측 관련 정보 및 주파수 변환 관련 정보가 필요하다. 따라서, 부호화 심도 결정부(120)는 최소 부호화 오차를 발생시킨 부호화 심도 뿐만 아니라, 부호화 심도의 부호화 단위를 예측 단위로 분할한 파티션 타입, 예측 단위별 예측 모드, 주파수 변환을 위한 변환 단위의 크기 등을 결정할 수 있다.The coding information according to the coding depth needs not only the coding depth but also prediction related information and frequency conversion related information. Therefore, the
부호화 심도 결정부(120)는 심도별 부호화 단위의 부호화 오차를 라그랑지 곱(Lagrangian Multiplier) 기반의 율-왜곡 최적화 기법(Rate-Distortion Optimization)을 이용하여 측정할 수 있다.The coding
출력부(130)는, 부호화 심도 결정부(120)에서 결정된 적어도 하나의 부호화 심도에 기초하여 부호화된 최대 부호화 단위의 영상 데이터및 심도별 부호화 모드에 관한 정보를 비트스트림 형태로 출력한다. The
부호화된 영상 데이터는 영상의 레지듀얼 데이터의 부호화 결과일 수 있다.The encoded image data may be a result of encoding residual data of the image.
심도별 부호화 모드에 관한 정보는, 부호화 심도 정보, 부호화 심도의 부호화 단위의 예측 단위의 파티션 타입 정보, 예측 단위별 예측 모드 정보, 변환 단위의 크기 정보 등을 포함할 수 있다.The information on the depth-dependent coding mode may include coding depth information, partition type information of a prediction unit of a coding unit of coding depth, prediction mode information per prediction unit, size information of a conversion unit, and the like.
부호화 심도 정보는, 현재 심도로 부호화하지 않고 하위 심도의 부호화 단위로 부호화할지 여부를 나타내는 심도별 분할 정보를 이용하여 정의될 수 있다. 현재 부호화 단위의 현재 심도가 부호화 심도라면, 현재 부호화 단위는 현재 심도의 부호화 단위로 부호화되므로 현재 심도의 분할 정보는 더 이상 하위 심도로 분할되지 않도록 정의될 수 있다. 반대로, 현재 부호화 단위의 현재 심도가 부호화 심도가 아니라면 하위 심도의 부호화 단위를 이용한 부호화를 시도해보아야 하므로, 현재 심도의 분할 정보는 하위 심도의 부호화 단위로 분할되도록 정의될 수 있다.The coding depth information can be defined using depth division information indicating whether or not coding is performed at the lower depth coding unit without coding at the current depth. If the current depth of the current encoding unit is the encoding depth, the current encoding unit is encoded in the current depth encoding unit, so that the division information of the current depth can be defined so as not to be further divided into lower depths. On the other hand, if the current depth of the current encoding unit is not the encoding depth, the encoding using the lower depth encoding unit should be tried. Therefore, the division information of the current depth may be defined to be divided into the lower depth encoding units.
현재 심도가 부호화 심도가 아니라면, 하위 심도의 부호화 단위로 분할된 부호화 단위에 대해 부호화가 수행된다. 현재 심도의 부호화 단위 내에 하위 심도의 부호화 단위가 하나 이상 존재하므로, 각각의 하위 심도의 부호화 단위마다 반복적으로 부호화가 수행되어, 동일한 심도의 부호화 단위마다 재귀적(recursive) 부호화가 수행될 수 있다.If the current depth is not the encoding depth, encoding is performed on the encoding unit divided into lower-depth encoding units. Since there are one or more lower-level coding units in the current-depth coding unit, the coding is repeatedly performed for each lower-level coding unit so that recursive coding can be performed for each coding unit of the same depth.
하나의 최대 부호화 단위 안에 적어도 하나의 부호화 심도가 결정되며 부호화 심도마다 적어도 하나의 부호화 모드에 관한 정보가 결정되어야 하므로, 하나의 최대 부호화 단위에 대해서는 적어도 하나의 부호화 모드에 관한 정보가 결정될 수 있다. 또한, 최대 부호화 단위의 데이터는 심도에 따라 계층적으로 구획되어 위치 별로 부호화 심도가 다를 수 있으므로, 데이터에 대해 부호화 심도 및 부호화 모드에 관한 정보가 설정될 수 있다.At least one coding depth is determined in one maximum coding unit and at least one coding mode information is determined for each coding depth so that information on at least one coding mode can be determined for one maximum coding unit. Since the data of the maximum encoding unit is hierarchically divided according to the depth and the depth of encoding may be different for each position, information on the encoding depth and the encoding mode may be set for the data.
따라서, 일 실시예에 따른 출력부(130)는, 최대 부호화 단위에 포함되어 있는 최소 부호화 단위마다 해당 부호화 정보를 설정할 수 있다. 즉, 부호화 심도의 부호화 단위는 동일한 부호화 정보를 보유하고 있는 최소 부호화 단위를 하나 이상 포함하고 있다. 이를 이용하여, 인근 최소 부호화 단위들이 동일한 심도별 부호화 정보를 갖고 있다면, 동일한 최대 부호화 단위에 포함되는 최소 부호화 단위일 수 있다.Accordingly, the
예를 들어 출력부(130)를 통해 출력되는 부호화 정보는, 심도별 부호화 단위별 부호화 정보와 예측 단위별 부호화 정보로 분류될 수 있다. 심도별 부호화 단위별 부호하 정보는, 예측 모드 정보, 파티션 크기 정보를 포함할 수 있다. 예측 단위별로 전송되는 부호화 정보는 인터 모드의 추정 방향에 관한 정보, 인터 모드의 참조 영상 인덱스에 관한 정보, 움직임 벡터에 관한 정보, 인트라 모드의 크로마 성분에 관한 정보, 인트라 모드의 보간 방식에 관한 정보 등을 포함할 수 있다. 또한, 픽처, 슬라이스 또는 GOP별로 정의되는 부호화 단위의 최대 크기에 관한 정보 및 최대 심도에 관한 정보는 비트스트림의 헤더에 삽입될 수 있다.For example, the encoding information output through the
비디오 부호화 장치(100)의 가장 간단한 형태의 실시예에 따르면, 심도별 부호화 단위는 한 계층 상위 심도의 부호화 단위의 높이 및 너비를 반분한 크기의 부호화 단위이다. 즉, 현재 심도의 부호화 단위의 크기가 2Nx2N이라면, 하위 심도의 부호화 단위의 크기는 NxN 이다. 또한, 2Nx2N 크기의 현재 부호화 단위는 NxN 크기의 하위 심도 부호화 단위를 최대 4개 포함할 수 있다.According to the simplest embodiment of the video coding apparatus 100, the coding unit for depth is a coding unit which is half the height and width of the coding unit of one layer higher depth. That is, if the size of the current depth encoding unit is 2Nx2N, the size of the lower depth encoding unit is NxN. In addition, the current encoding unit of 2Nx2N size can include a maximum of 4 sub-depth encoding units of NxN size.
따라서, 일 실시예에 따른 비디오 복호화 장치(100)는 현재 픽처의 특성을 고려하여 결정된 최대 부호화 단위의 크기 및 최대 심도를 기반으로, 각각의 최대 부호화 단위마다 최적의 형태 및 크기의 부호화 단위를 결정할 수 있다. 또한, 각각의 최대 부호화 단위마다 다양한 예측 모드, 주파수 변환 방식 등으로 부호화할 수 있으므로, 다양한 영상 크기의 부호화 단위의 영상 특성을 고려하여 최적의 부호화 모드가 결정될 수 있다.Therefore, the video decoding apparatus 100 according to an embodiment determines an encoding unit of an optimal shape and size for each maximum encoding unit based on the size and the maximum depth of the maximum encoding unit determined in consideration of the characteristics of the current picture . In addition, since each encoding unit can be encoded by various prediction modes, frequency conversion methods, and the like, an optimal encoding mode can be determined in consideration of image characteristics of encoding units of various image sizes.
따라서, 영상의 해상도가 매우 높거나 데이터량이 매우 큰 영상을 기존 매크로블록 단위로 부호화한다면, 픽처당 매크로블록의 수가 과도하게 많아진다. 이에 따라, 매크로블록마다 생성되는 압축 정보도 많아지므로 압축 정보의 전송 부담이 커지고 데이터 압축 효율이 감소하는 경향이 있다. 따라서, 일 실시예에 따른 비디오 부호화 장치는, 영상의 크기를 고려하여 부호화 단위의 최대 크기를 증가시키면서, 영상 특성을 고려하여 부호화 단위를 조절할 수 있으므로, 영상 압축 효율이 증대될 수 있다.Therefore, if an image having a very high image resolution or a very large data amount is encoded in units of existing macroblocks, the number of macroblocks per picture becomes excessively large. This increases the amount of compression information generated for each macroblock, so that the burden of transmission of compressed information increases and the data compression efficiency tends to decrease. Therefore, the video encoding apparatus according to an embodiment can increase the maximum size of the encoding unit in consideration of the image size, and adjust the encoding unit in consideration of the image characteristic, so that the image compression efficiency can be increased.
도 2 는 본 발명의 일 실시예에 따른 비디오 복호화 장치의 블록도를 도시한다.2 shows a block diagram of a video decoding apparatus according to an embodiment of the present invention.
일 실시예에 따른 비디오 복호화 장치(200)는 수신부(210), 영상 데이터 및 부호화 정보 추출부(220) 및 영상 데이터 복호화부(230)를 포함한다. 일 실시예에 따른 비디오 복호화 장치(200)의 각종 프로세싱을 위한 부호화 단위, 심도, 예측 단위, 변환 단위, 각종 부호화 모드에 관한 정보 등 각종 용어의 정의는, 도 1 및 비디오 부호화 장치(100)을 참조하여 전술한 바와 동일하다. The
수신부(205)는 부호화된 비디오에 대한 비트스트림을 수신하여 파싱(parsing)한다. 영상 데이터 및 부호화 정보 추출부(220)는 파싱된 비트스트림으로부터 최대 부호화 단위별로 영상 데이터를 추출하여 영상 데이터 복호화부(230)로 출력한다. 영상 데이터 및 부호화 정보 추출부(220)는 현재 픽처에 대한 헤더로부터 현재 픽처의 부호화 단위의 최대 크기에 관한 정보를 추출할 수 있다. The receiving unit 205 receives and parses the bitstream of the encoded video. The image data and encoding
또한, 영상 데이터 및 부호화 정보 추출부(220)는 파싱된 비트스트림으로부터 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보를 추출한다. 추출된 부호화 심도 및 부호화 모드에 관한 정보는 영상 데이터 복호화부(230)로 출력된다. 즉, 비트열의 영상 데이터를 최대 부호화 단위로 분할하여, 영상 데이터 복호화부(230)가 최대 부호화 단위마다 영상 데이터를 복호화하도록 할 수 있다. Also, the image data and encoding
최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보는, 하나 이상의 부호화 심도 정보에 대해 설정될 수 있으며, 부호화 심도별 부호화 모드에 관한 정보는, 부호화 단위별 예측 단위의 파티션 타입 정보, 예측 모드 정보 및 변환 단위의 크기 정보 등을 포함할 수 있다. 또한, 부호화 심도 정보로서, 심도별 분할 정보가 추출될 수도 있다.Information on the coding depth and the coding mode per coding unit can be set for one or more coding depth information, and the information on the coding mode for each coding depth includes information on partition type information, prediction mode information, Size information of the conversion unit, and the like. In addition, as the encoding depth information, depth-based segmentation information may be extracted.
영상 데이터 및 부호화 정보 추출부(220)가 추출한 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보는, 일 실시예에 따른 비디오 부호화 장치(100)와 같이 부호화단에서, 최대 부호화 단위별 심도별 부호화 단위마다 반복적으로 부호화를 수행하여 최소 부호화 오차를 발생시키는 것으로 결정된 부호화 심도 및 부호화 모드에 관한 정보이다. 따라서, 비디오 복호화 장치(200)는 최소 부호화 오차를 발생시키는 부호화 방식에 따라 데이터를 복호화하여 영상을 복원할 수 있다.The encoding depth and encoding mode information extracted by the image data and encoding
영상 데이터 및 부호화 정보 추출부(220)는 최소 부호화 단위별로 부호화 심도 및 부호화 모드에 관한 정보를 추출할 수 있다. 최소 부호화 단위별로, 해당 최대 부호화 단위의 부호화 심도 및 부호화 모드에 관한 정보가 기록되어 있다면, 동일한 부호화 심도 및 부호화 모드에 관한 정보를 갖고 있는 최소 부호화 단위들은 동일한 최대 부호화 단위에 포함되는 데이터 단위로 유추될 수 있다. 즉, 동일한 정보의 최소 부호화 단위를 모아 복호화하면, 부호화 오차가 가장 작은 부호화 심도의 부호화 단위를 기반으로 한 복호화가 가능하다.The image data and encoding
영상 데이터 복호화부(230)는 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보에 기초하여 각각의 최대 부호화 단위의 영상 데이터를 복호화하여 현재 픽처를 복원한다. 최대 부호화 단위별 부호화 심도 정보에 기초하여, 영상 데이터 복호화부(230)는 적어도 하나의 부호화 심도의 부호화 단위마다 영상 데이터를 복호화할 수 있다. 복호화 과정은 인트라 예측 및 움직임 보상을 포함하는 예측 과정, 및 주파수 역변환 과정을 포함할 수 있다.The image
영상 데이터 복호화부(230)는, 부호화 단위별 예측 부호화를 위해, 부호화 심도별 부호화 단위의 예측 단위의 파티션 타입 정보 및 예측 모드 정보에 기초하여, 부호화 단위마다 각각의 예측 단위 및 예측 모드로 인트라 예측 또는 움직임 보상을 수행할 수 있다.The image
또한, 영상 데이터 복호화부(230)는, 최대 부호화 단위별 주파수 역변환을 위해, 부호화 심도별 부호화 단위의 변환 단위의 크기 정보에 기초하여, 부호화 단위마다 각각의 변환 단위로 주파수 역변환을 수행할 수 있다.In addition, the image
영상 데이터 복호화부(230)는 심도별 분할 정보를 이용하는 현재 최대 부호화 단위의 부호화 심도를 결정할 수 있다. 만약, 분할 정보가 현재 심도로 복호화할 것을 나타내고 있다면 현재 심도가 부호화 심도이다. 따라서, 영상 데이터 복호화부(230)는 현재 최대 부호화 단위의 영상 데이터에 대해 현재 심도의 부호화 단위를 예측 단위의 파티션 타입, 예측 모드 및 변환 단위 크기 정보를 이용하여 복호화할 수 있다. The image
즉, 최소 부호화 단위에 대해 설정되어 있는 부호화 정보를 관찰하여, 동일한 분할 정보를 포함한 부호화 정보를 보유하고 있는 최소 부호화 단위를 모아, 하나의 데이터 단위로 복호화할 수 있다. That is, it is possible to observe the encoding information set for the minimum encoding unit and to decode the minimum encoding units that hold the encoding information including the same division information, into one data unit.
일 실시예에 따른 비디오 복호화 장치(200)는, 부호화 과정에서 최대 부호화 단위마다 재귀적으로 부호화를 수행하여 최소 부호화 오차를 발생시킨 부호화 단위에 대한 정보를 획득하여, 현재 픽처에 대한 복호화에 이용할 수 있다. 즉, 최대 부호화 단위마다 최적 부호화 단위로 영상 데이터의 복호화가 가능해진다.The
따라서, 높은 해상도의 영상 또는 데이터량이 과도하게 많은 영상이라도 부호화단으로부터 전송된 최적 부호화 모드에 관한 정보를 이용하여, 영상의 특성에 적응적으로 결정된 부호화 단위의 크기 및 부호화 모드에 따라 효율적으로 영상 데이터를 복호화하여 복원할 수 있다.Accordingly, even if an image with a high resolution or an excessively large amount of data is used, the information on the optimal encoding mode transmitted from the encoding end is used, and the image data is efficiently encoded according to the encoding unit size and encoding mode, Can be decoded and restored.
도 3 은 계층적 부호화 단위의 개념을 도시한다.FIG. 3 shows the concept of a hierarchical coding unit.
부호화 단위의 예는, 너비x높이가 64x64인 부호화 단위부터, 32x32, 16x16, 8x8, 및 4x4를 포함할 수 있다. 정사각형 형태의 부호화 단위 이외에도, 너비x높이가 64x32, 32x64, 32x16, 16x32, 16x8, 8x16, 8x4, 4x8인 부호화 단위들이 존재할 수 있다.An example of an encoding unit may include 32x32, 16x16, 8x8, and 4x4 from an encoding unit with a width x height of 64x64. In addition to the square-shaped encoding units, there may be encoding units whose width x height is 64x32, 32x64, 32x16, 16x32, 16x8, 8x16, 8x4, 4x8.
비디오 데이터(310)에 대해서는, 해상도는 1920x1080, 부호화 단위의 최대 크기는 64, 최대 심도가 2로 설정되어 있다. 비디오 데이터(320)에 대해서는, 해상도는 1920x1080, 부호화 단위의 최대 크기는 64, 최대 심도가 4로 설정되어 있다. 비디오 데이터(330)에 대해서는, 해상도는 352x288, 부호화 단위의 최대 크기는 16, 최대 심도가 2로 설정되어 있다.With respect to the
해상도가 높거나 데이터량이 많은 경우 부호화 효율의 향상 뿐만 아니라 영상 특성을 정확히 반형하기 위해 부호화 사이즈의 최대 크기가 상대적으로 큰 것이 바람직하다. 따라서, 비디오 데이터(330)에 비해, 해상도가 높은 비디오 데이터(310, 320)는 부호화 사이즈의 최대 크기가 64로 선택될 수 있다.It is preferable that the maximum size of the coding size is relatively large in order to improve the coding efficiency as well as to accurately characterize the image characteristics when the resolution or the data amount is large. Therefore, the maximum size of the
최대 심도는 계층적 부호화 단위에서 총 계층수를 나타낸다. 따라서, 비디오 데이터(310)의 최대 심도는 2이므로, 비디오 데이터(310)의 부호화 단위(315)는 장축 크기가 64인 최대 부호화 단위로부터, 심도가 두 계층 깊어져서 장축 크기가 32, 16인 부호화 단위들까지 포함할 수 있다. 반면, 비디오 데이터(330)의 최대 심도는 2이므로, 비디오 데이터(330)의 부호화 단위(335)는 장축 크기가 16인 부호화 단위들로부터, 심도가 두 계층 깊어져서 장축 크기가 8, 4인 부호화 단위들까지 포함할 수 있다. The maximum depth indicates the total number of layers in the hierarchical encoding unit. Therefore, since the maximum depth of the
비디오 데이터(320)의 최대 심도는 4이므로, 비디오 데이터(320)의 부호화 단위(325)는 장축 크기가 64인 최대 부호화 단위로부터, 심도가 네 계층 깊어져서 장축 크기가 32, 16, 8, 4인 부호화 단위들까지 포함할 수 있다. 심도가 깊어질수록 세부 정보의 표현능력이 향상될 수 있다.Since the maximum depth of the
도 4 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 부호화부의 블록도를 도시한다.4 is a block diagram of an image encoding unit based on an encoding unit according to an embodiment of the present invention.
일 실시예에 따른 영상 부호화부(400)는, 비디오 부호화 장치(100)의 부호화 심도 결정부(120)에서 영상 데이터를 부호화하는데 거치는 작업들을 포함한다. 즉, 인트라 예측부(410)는 현재 프레임(405) 중 인트라 모드의 부호화 단위에 대해 인트라 예측을 수행하고, 움직임 추정부(420) 및 움직임 보상부(425)는 인터 모드의 현재 프레임(405) 및 참조 프레임(495)를 이용하여 인터 추정 및 움직임 보상을 수행한다.The
인트라 예측부(410), 움직임 추정부(420) 및 움직임 보상부(425)로부터 출력된 데이터는 주파수 변환부(430) 및 양자화부(440)를 거쳐 양자화된 변환 계수로 출력된다. 양자화된 변환 계수는 역양자화부(460), 주파수 역변환부(470)을 통해 공간 영역의 데이터로 복원되고, 복원된 공간 영역의 데이터는 디블로킹부(480) 및 루프 필터링부(490)를 거쳐 후처리되어 참조 프레임(495)으로 출력된다. 양자화된 변환 계수는 엔트로피 부호화부(450)를 거쳐 비트스트림(455)으로 출력될 수 있다.The data output from the
일 실시예에 따른 비디오 부호화 장치(100)에 적용되기 위해서는, 영상 부호화부(400)의 구성 요소들인 인트라 예측부(410), 움직임 추정부(420), 움직임 보상부(425), 주파수 변환부(430), 양자화부(440), 엔트로피 부호화부(450), 역양자화부(460), 주파수 역변환부(470), 디블로킹부(480) 및 루프 필터링부(490)가 모두, 최대 부호화 단위마다 최대 심도를 고려한 심도별 부호화 단위에 기반하여 작업을 수행하여야 한다. The
특히, 인트라 예측부(410), 움직임 추정부(420) 및 움직임 보상부(425)는 부호화 단위의 최대 크기 및 심도를 고려하여 부호화 단위 내의 예측 단위 및 예측 모드를 결정하며, 주파수 변환부(430)는 부호화 단위의 최대 크기 및 심도를 고려하여 변환 단위의 크기를 고려하여야 한다.In particular, the
도 5 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 복호화부의 블록도를 도시한다.5 is a block diagram of an image decoding unit based on an encoding unit according to an embodiment of the present invention.
비트스트림(505)이 파싱부(510)를 거쳐 복호화 대상인 부호화된 영상 데이터 및 복호화를 위해 필요한 부호화에 관한 정보가 파싱된다. 부호화된 영상 데이터는 엔트로피 복호화부(520) 및 역양자화부(530)를 거쳐 역양자화된 데이터로 출력되고, 주파수 역변환부(540)를 거쳐 공간 영역의 영상 데이터가 복원된다. The
공간 영역의 영상 데이터에 대해서, 인트라 예측부(550)는 인트라 모드의 부호화 단위에 대해 인트라 예측을 수행하고, 움직임 보상부(560)는 참조 프레임(585)를 함께 이용하여 인터 모드의 부호화 단위에 대해 움직임 보상을 수행한다.The
인트라 예측부(550) 및 움직임 보상부(560)를 거친 공간 영역의 데이터는 디블로킹부(570) 및 루프 필터링부(580)를 거쳐 후처리되어 복원 프레임(595)으로 출력될 수 있다. 또한, 디블로킹부(570) 및 루프 필터링부(580)를 거쳐 후처리된 데이터는 참조 프레임(585)으로서 출력될 수 있다.The data in the spatial domain that has passed through the
비디오 복호화 장치(200)의 영상 데이터 복호화부(230)에서 영상 데이터를 복호화하기 위해, 일 실시예에 따른 영상 복호화부(500)의 파싱부(510) 이후의 단계별 작업들이 수행될 수 있다.In order to decode the image data in the image
일 실시예에 따른 비디오 복호화 장치(200)에 적용되기 위해서는, 영상 복호화부(400)의 구성 요소들인 파싱부(510), 엔트로피 복호화부(520), 역양자화부(530), 주파수 역변환부(540), 인트라 예측부(550), 움직임 보상부(560), 디블로킹부(570) 및 루프 필터링부(580)가 모두, 최대 부호화 단위마다 부호화 심도의 부호화 단위에 기반하여 작업을 수행하여야 한다. The
특히, 인트라 예측부(550), 움직임 보상부(560)는 부호화 단위의 최대 크기 및 심도를 고려하여 부호화 단위 및 예측 모드를 결정하며, 주파수 역변환부(540)는 부호화 단위의 최대 크기 및 심도를 고려하여 변환 단위의 크기를 고려하여야 한다.In particular, the
도 6 는 본 발명의 일 실시예에 따른 심도별 부호화 단위 및 예측 단위를 도시한다.FIG. 6 illustrates a depth-based coding unit and a prediction unit according to an embodiment of the present invention.
일 실시예에 따른 비디오 부호화 장치(100) 및 일 실시예에 따른 비디오 복호화 장치(200)는 영상 특성을 고려하기 위해 계층적인 부호화 단위를 사용한다. 부호화 단위의 최대 높이 및 너비, 최대 심도는 영상의 특성에 따라 적응적으로 결정될 수도 있으며, 사용자의 요구에 따라 다양하게 설정될 수도 있다. 미리 설정된 부호화 단위의 최대 크기에 따라, 심도별 부호화 단위의 크기가 결정될 수 있다.The video encoding apparatus 100 and the
일 실시예에 따른 부호화 단위의 계층 구조(600)는 부호화 단위의 최대 높이 및 너비가 64이며, 최대 심도가 4인 경우를 도시하고 있다. 일 실시예에 따른 부호화 단위의 계층 구조(600)의 세로축을 따라서 심도가 깊어지므로 심도별 부호화 단위의 높이 및 너비가 각각 분할한다. 또한, 부호화 단위의 계층 구조(600)의 가로축을 따라, 각각의 심도별 부호화 단위의 예측 부호화의 기반이 되는 부분적 데이터 단위인 예측 단위가 도시되어 있다.The
즉, 부호화 단위(610)는 부호화 단위의 계층 구조(600) 중 최대 부호화 단위로서 심도가 0이며, 부호화 단위의 크기, 즉 높이 및 너비가 64x64이다. 세로축을 따라 심도가 깊어지며, 크기 32x32인 심도 1의 부호화 단위(620), 크기 16x16인 심도 2의 부호화 단위(630), 크기 8x8인 심도 3의 부호화 단위(640), 크기 4x4인 심도 4의 부호화 단위(650)가 존재한다. 크기 4x4인 심도 4의 부호화 단위(650)는 최소 부호화 단위이다.That is, the
각각의 심도별로 가로축을 따라, 부호화 단위의 예측 단위로서, 부분적 데이터 단위들이 배열된다. 즉, 심도 0의 크기 64x64의 부호화 단위(610)의 예측 단위는, 크기 64x64의 부호화 단위(610)에 포함되는 크기 64x64의 부분적 데이터 단위(610), 크기 64x32의 부분적 데이터 단위들(612), 크기 32x64의 부분적 데이터 단위들(614), 크기 32x32의 부분적 데이터 단위들(616)일 수 있다. 반대로 보면, 부호화 단위는 변환 단위들(610, 612, 614, 616)을 포함하는 최소 크기의 정사각형의 데이터 단위일 수 있다.The partial data units are arranged as a prediction unit of the encoding unit along the horizontal axis for each depth. That is, the prediction unit of the
마찬가지로, 심도 1의 크기 32x32의 부호화 단위(620)의 예측 단위는, 크기 32x32의 부호화 단위(620)에 포함되는 크기 32x32의 부분적 데이터 단위(620), 크기 32x16의 부분적 데이터 단위들(622), 크기 16x32의 부분적 데이터 단위들(624), 크기 16x16의 부분적 데이터 단위들(626)일 수 있다. Likewise, the prediction unit of the
마찬가지로, 심도 2의 크기 16x16의 부호화 단위(630)의 예측 단위는, 크기 16x16의 부호화 단위(630)에 포함되는 크기 16x16의 부분적 데이터 단위(630), 크기 16x8의 부분적 데이터 단위들(632), 크기 8x16의 부분적 데이터 단위들(634), 크기 8x8의 부분적 데이터 단위들(636)일 수 있다. Likewise, the prediction unit of a 16x16 size 16x16 encoding unit is a 16x16
마찬가지로, 심도 3의 크기 8x8의 부호화 단위(640)의 예측 단위는, 크기 8x8의 부호화 단위(640)에 포함되는 크기 8x8의 부분적 데이터 단위(640), 크기 8x4의 부분적 데이터 단위들(642), 크기 4x8의 부분적 데이터 단위들(644), 크기 4x4의 부분적 데이터 단위들(646)일 수 있다. Likewise, the prediction unit of the
마지막으로, 심도 4의 크기 4x4의 부호화 단위(650)는 최소 부호화 단위이며 최하위 심도의 부호화 단위이고, 해당 예측 단위도 크기 4x4의 데이터 단위(650)이다.Finally, a
일 실시예에 따른 비디오 부호화 장치(100)의 부호화 심도 결정부(120)는, 최대 부호화 단위(610)의 부호화 심도를 결정하기 위해, 최대 부호화 단위(610)에 포함되는 각각의 심도의 부호화 단위마다 부호화를 수행하여야 한다. The
동일한 범위 및 크기의 데이터를 포함하기 위한 심도별 부호화 단위의 개수는, 심도가 깊어질수록 심도별 부호화 단위의 개수도 증가한다. 예를 들어, 심도 1의 부호화 단위 한 개가 포함하는 데이터에 대해서, 심도 2의 부호화 단위는 네 개가 필요하다. 따라서, 동일한 데이터의 부호화 결과를 심도별로 비교하기 위해서, 한 개의 심도 1의 부호화 단위 및 네 개의 심도 2의 부호화 단위를 이용하여 각각 부호화되어야 한다.The number of coding units per depth to include data of the same range and size increases as the depth of the coding unit increases. For example, for data containing one coding unit at
각각의 심도별 부호화를 위해서는, 부호화 단위의 계층 구조(600)의 가로축을 따라, 심도별 부호화 단위의 예측 단위들마다 부호화를 수행하여, 해당 심도에서 가장 작은 부호화 오차인 대표 부호화 오차가 선택될 수다. 또한, 부호화 단위의 계층 구조(600)의 세로축을 따라 심도가 깊어지며, 각각의 심도마다 부호화를 수행하여, 심도별 대표 부호화 오차를 비교하여 최소 부호화 오차가 검색될 수 있다. 최대 부호화 단위(610) 중 최소 부호화 오차가 발생하는 심도가 최대 부호화 단위(610)의 부호화 심도 및 파티션 타입으로 선택될 수 있다. For each depth-of-field coding, encoding is performed for each prediction unit of the depth-dependent coding unit along the horizontal axis of the
도 7 은 본 발명의 일 실시예에 따른, 부호화 단위 및 변환 단위의 관계를 도시한다. FIG. 7 shows a relationship between an encoding unit and a conversion unit according to an embodiment of the present invention.
일 실시예에 따른 비디오 부호화 장치(100) 또는 일 실시예에 따른 비디오 복호화 장치(200)는, 최대 부호화 단위마다 최대 부호화 단위보다 작거나 같은 크기의 부호화 단위로 영상을 부호화하거나 복호화한다. 부호화 과정 중 주파수 변환을 위한 변환 단위의 크기는 각각의 부호화 단위보다 크지 않은 데이터 단위를 기반으로 선택될 수 있다.The video coding apparatus 100 or the
예를 들어, 일 실시예에 따른 비디오 부호화 장치(100) 또는 일 실시예에 따른 비디오 복호화 장치(200)에서, 현재 부호화 단위(710)가 64x64 크기일 때, 32x32 크기의 변환 단위(720)를 이용하여 주파수 변환이 수행될 수 있다. For example, in the video encoding apparatus 100 or the
또한, 64x64 크기의 부호화 단위(710)의 데이터를 64x64 크기 이하의 32x32, 16x16, 8x8, 4x4 크기의 변환 단위들로 각각 주파수 변환을 수행하여 부호화한 후, 원본과의 오차가 가장 적은 변환 단위가 선택될 수 있다.In addition, the data of the encoding unit 710 of 64x64 size is encoded by performing the frequency conversion with the conversion units of 32x32, 16x16, 8x8, and 4x4 size of 64x64 or smaller, respectively, and then the conversion unit having the smallest error with the original Can be selected.
도 8 은 본 발명의 일 실시예에 따라, 심도별 부호화 정보들을 도시한다.FIG. 8 illustrates depth-specific encoding information, in accordance with an embodiment of the present invention.
일 실시예에 따른 비디오 부호화 장치(100)의 부호화 정보 부호화부는 부호화 모드에 관한 정보로서, 각각의 부호화 심도의 부호화 단위마다 파티션 타입에 관한 정보(800), 예측 모드에 관한 정보(810), 변환 단위 크기에 대한 정보(820)를 부호화하여 전송할 수 있다.The encoding information encoding unit of the video encoding apparatus 100 according to the embodiment is information on an encoding mode, and includes information on a partition type 800, information on a prediction mode 810, Information 820 on the unit size can be encoded and transmitted.
파티션 타입에 대한 정보(800)는, 현재 부호화 단위의 예측 부호화를 위해 예측 단위로서, 현재 부호화 단위가 분할된 타입에 대한 정보를 나타낸다. 예를 들어, 심도 0 및 크기 2Nx2N의 현재 부호화 단위 CU_0는, 크기 2Nx2N의 예측 단위(802), 크기 2NxN의 예측 단위(804), 크기 Nx2N의 예측 단위(806), 크기 NxN의 예측 단위(808) 중 어느 하나의 타입으로 분할되어 예측 단위로 이용될 수 있다. 이 경우 현재 부호화 단위의 파티션 타입에 관한 정보(800)는 크기 2Nx2N의 예측 단위(802), 크기 2NxN의 예측 단위(804), 크기 Nx2N의 예측 단위(806) 및 크기 NxN의 예측 단위(808) 중 하나를 나타내도록 설정된다.The partition type information 800 indicates information on a type in which the current encoding unit is divided as a prediction unit for predictive encoding of the current encoding unit. For example, the current encoding unit CU_0 of
예측 모드에 관한 정보(810)는, 각각의 예측 단위의 예측 모드를 나타낸다. 예를 들어 예측 모드에 관한 정보(810)를 통해, 파티션 타입에 관한 정보(800)가 가리키는 예측 단위가 인트라 모드(812), 인터 모드(814) 및 스킵 모드(816) 중 하나로 예측 부호화가 수행되는지 여부가 설정될 수 있다.The information 810 on the prediction mode indicates the prediction mode of each prediction unit. The prediction unit indicated by the information 800 relating to the partition type is predicted to be one of the
또한, 변환 단위 크기에 관한 정보(820)는 현재 부호화 단위를 어떠한 변환 단위를 기반으로 주파수 변환을 수행할지 여부를 나타낸다. 예를 들어, 변환 단위는 제 1 인트라 변환 단위 크기(822), 제 2 인트라 변환 단위 크기(824), 제 1 인터 변환 단위 크기(826), 제 2 인트라 변환 단위 크기(828) 중 하나일 수 있다.In addition, the information 820 on the conversion unit size indicates whether to perform frequency conversion on the basis of which conversion unit the current encoding unit is performed. For example, the conversion unit may be one of a first
일 실시예에 따른 비디오 복호화 장치(200)의 부호화 정보 추출부는, 각각의 심도별 부호화 단위마다 파티션 타입에 관한 정보(800), 예측 모드에 관한 정보(810), 변환 단위 크기에 대한 정보(820)를 추출하여 복호화에 이용할 수 있다.The encoding information extracting unit of the
도 9 는 본 발명의 일 실시예에 따른 심도별 부호화 단위를 도시한다. FIG. 9 shows a depth encoding unit according to an embodiment of the present invention.
심도의 변화를 나타내기 위해 분할 정보가 이용될 수 있다. 분할 정보는 현재 심도의 부호화 단위가 하위 심도의 부호화 단위로 분할될지 여부를 나타낸다. Partition information may be used to indicate changes in depth. The division information indicates whether the current-depth encoding unit is divided into lower-depth encoding units.
심도 0 및 2N_0x2N_0 크기의 부호화 단위의 예측 부호화를 위한 예측 단위(910)는 2N_0x2N_0 크기의 파티션 타입(912), 2N_0xN_0 크기의 파티션 타입(914), N_0x2N_0 크기의 파티션 타입(916), N_0xN_0 크기의 파티션 타입(918)을 포함할 수 있다. The
파티션 타입마다, 한 개의 2N_0x2N_0 크기의 예측 단위, 두 개의 2N_0xN_0 크기의 예측 단위, 두 개의 N_0x2N_0 크기의 예측 단위, 네 개의 N_0xN_0 크기의 예측 단위마다 반복적으로 예측 부호화가 수행되어야 한다. 크기 2N_0x2N_0, 크기 N_0x2N_0 및 크기 2N_0xN_0 및 크기 N_0xN_0의 예측 단위에 대해서는, 인트라 모드 및 인터 모드로 예측 부호화가 수행될 수 있다. 스킵 모드는 크기 2N_0x2N_0의 예측 단위에 예측 부호화가 대해서만 수행될 수 있다.For each partition type, predictive encoding should be repeatedly performed for each prediction unit of 2N_0x2N_0 size, two 2N_0xN_0 size prediction units, two N_0x2N_0 size prediction units, and four N_0xN_0 size prediction units. For a prediction unit of size 2N_0x2N_0, size N_0x2N_0, size 2N_0xN_0, and size N_0xN_0, predictive coding may be performed in intra mode and inter mode. The skip mode can be performed only for predictive encoding in a prediction unit of size 2N_0x2N_0.
크기 N_0xN_0의 파티션 타입(918)에 의한 부호화 오차가 가장 작다면, 심도 0를 1로 변경하고(920), 심도 2 및 크기 N_0xN_0의 파티션 타입의 부호화 단위들(922, 924, 926, 928)에 대해 반복적으로 최소 부호화 오차를 검색해 나갈 수 있다. If the coding error by the
동일한 심도의 부호화 단위들(922, 924, 926, 928)에 대해 부호화가 반복적으로 수행되므로, 이중 하나만 예를 들어 심도 1의 부호화 단위의 부호화를 설명한다. 심도 1 및 크기 2N_1x2N_1 (=N_0xN_0)의 부호화 단위의 예측 부호화를 위한 예측 단위(930)는, 크기 2N_1x2N_1의 파티션 타입(932), 크기 2N_1xN_1의 파티션 타입(934), 크기 N_1x2N_1의 파티션 타입(936), 크기 N_1xN_1의 파티션 타입(938)을 포함할 수 있다. 파티션 타입마다, 한 개의 크기 2N_1x2N_1의 예측 단위, 두 개의 크기 2N_1xN_1의 예측 단위, 두 개의 크기 N_1x2N_1의 예측 단위, 네 개의 크기 N_1xN_1의 예측 단위마다 반복적으로 예측 부호화가 수행되어야 한다.Since encoding is repeatedly performed on the
또한, 크기 N_1xN_1 크기의 파티션 타입(938)에 의한 부호화 오차가 가장 작다면, 심도 1을 심도 2로 변경하면서(940), 심도 2 및 크기 N_2xN_2의 부호화 단위들(942, 944, 946, 948)에 대해 반복적으로 최소 부호화 오차를 검색해 나갈 수 있다. If the coding error by the
최대 심도가 d인 경우, 심도별 분할 정보는 심도 d-1일 때까지 설정될 수 있다. 즉, 심도 d-1 및 크기 2N_(d-1)x2N_(d-1)의 부호화 단위의 예측 부호화를 위한 예측 단위(950)는, 크기 2N_(d-1)x2N_(d-1)의 파티션 타입(952), 크기 2N_(d-1)xN_(d-1)의 파티션 타입(954), 크기 N_(d-1)x2N_(d-1)의 파티션 타입(956), 크기 N_(d-1)xN_(d-1)의 파티션 타입(958)을 포함할 수 있다. If the maximum depth is d, the depth-based segmentation information can be set until the depth d-1. That is, the
파티션 타입마다, 한 개의 크기 2N_(d-1)x2N_(d-1)의 예측 단위, 두 개의 크기 2N_(d-1)xN_(d-1)의 예측 단위, 두 개의 크기 N_(d-1)x2N_(d-1)의 예측 단위, 네 개의 크기 N_(d-1)xN_(d-1)의 예측 단위마다 반복적으로 예측 부호화를 통한 부호화가 수행되어야 한다. 최대 심도가 d이므로, 심도 d-1의 부호화 단위(952)는 더 이상 분할 과정을 거치지 않는다.(D-1) x2N_ (d-1), two predicted units of two sizes 2N_ (d-1) (d-1) x2N_ (d-1), four sizes N_ (d-1) xN_ (d-1). Since the maximum depth is d, the
일 실시예에 따른 비디오 부호화 장치(100)는 부호화 단위(912)를 위한 부호화 심도를 결정하기 위해, 심도별 부호화 오차를 비교하여 가장 작은 부호화 오차가 발생하는 심도를 선택한다. The video coding apparatus 100 according to an exemplary embodiment compares depth-based coding errors to determine the depth of coding for the
예를 들어, 심도 0의 부호화 단위에 대한 부호화 오차는 파티션 타입(912, 914, 916, 918)마다 예측 부호화를 수행한 후 가장 작은 부호화 오차가 발생하는 예측 단위가 결정된다. 마찬가지로 심도 0, 1, ..., d-1 마다 부호화 오차가 가장 작은 예측 단위가 검색될 수 있다. 심도 d에서는, 크기 2N_dx2N_d의 부호화 단위이면서 예측 단위(960)를 기반으로 한 예측 부호화를 통해 부호화 오차가 결정될 수 있다. For example, a coding error for a coding unit of
이런 식으로 심도 0, 1, ..., d-1, d의 모든 심도별 최소 부호화 오차를 비교하여 오차가 가장 작은 심도가 선택되어 부호화 심도로 결정될 수 있다. 부호화 심도 및 해당 심도의 예측 단위는 부호화 모드에 관한 정보로써 부호화되어 전송될 수 있다. 또한, 심도 0으로부터 부호화 심도에 이르기까지 부호화 단위가 분할되어야 하므로, 부호화 심도의 분할 정보만이 '0'으로 설정되고, 부호화 심도를 제외한 심도별 분할 정보는 '1'로 설정되어야 한다. In this way, the minimum coding error of each of the
일 실시예에 따른 비디오 복호화 장치(200)의 부호화 정보 추출부(220)는 부호화 단위(912)에 대한 부호화 심도 및 예측 단위에 관한 정보를 추출하여 부호화 단위(912)를 복호화하는데 이용할 수 있다. 일 실시예에 따른 비디오 복호화 장치(200)는 심도별 분할 정보를 이용하여 분할 정보가 '0'인 심도를 부호화 심도로 파악하고, 해당 심도에 대한 부호화 모드에 관한 정보를 이용하여 복호화에 이용할 수 있다.The encoding
도 10a, 10b 및 10c는 본 발명의 일 실시예에 따른, 부호화 단위, 예측 단위 및 주파수 변환 단위의 관계를 도시한다.FIGS. 10A, 10B, and 10C illustrate the relationship between an encoding unit, a prediction unit, and a frequency conversion unit according to an embodiment of the present invention.
부호화 단위(1010)는, 최대 부호화 단위에 대해 일 실시예에 따른 비디오 부호화 장치(100)가 결정한 부호화 심도별 부호화 단위들이다. 예측 단위(1060)는 부호화 단위(1010) 중 각각의 부호화 심도별 부호화 단위의 예측 단위들이며, 변환 단위(1070)는 각각의 부호화 심도별 부호화 단위의 변환 단위들이다.The coding unit 1010 is coding units for coding depth determined by the video coding apparatus 100 according to the embodiment with respect to the maximum coding unit. The prediction unit 1060 is a prediction unit of each coding depth unit among the coding units 1010 and the conversion unit 1070 is a conversion unit of each coding depth unit.
심도별 부호화 단위들(1010)은 최대 부호화 단위의 심도가 0이라고 하면, 부호화 단위들(1012, 1054)은 심도가 1, 부호화 단위들(1014, 1016, 1018, 1028, 1050, 1052)은 심도가 2, 부호화 단위들(1020, 1022, 1024, 1026, 1030, 1032, 1048)은 심도가 3, 부호화 단위들(1040, 1042, 1044, 1046)은 심도가 4이다. When the depth of the maximum encoding unit is 0, the depth of the
예측 단위들(1060) 중 일부(1014, 1016, 1022, 1032, 1048, 1050, 1052, 1054)는 부호화 단위가 분할된 타입이다. 즉, 예측 단위(1014, 1022, 1050, 1054)는 2NxN의 파티션 타입이며, 예측 단위(1016, 1048, 1052)는 Nx2N의 파티션 타입, 예측 단위(1032)는 NxN의 파티션 타입이다. 즉, 심도별 부호화 단위들(1010)의 예측 단위는 각각의 부호화 단위보다 작거나 같다. A portion (1014, 1016, 1022, 1032, 1048, 1050, 1052, 1054) of the prediction units 1060 is a type in which the coding unit is divided. That is, the
변환 단위들(1070) 중 일부(1052)의 영상 데이터에 대해서는 부호화 단위에 비해 작은 크기의 데이터 단위로 주파수 변환 또는 주파수 역변환이 수행된다. 또한, 변환 단위(1014, 1016, 1022, 1032, 1048, 1050, 1052, 1054)는 예측 단위들(1060) 중 해당 예측 단위와 비교해보면, 서로 다른 크기 또는 형태의 데이터 단위이다. 즉, 일 실시예에 따른 비디오 부호화 장치(100) 및 일 실시예에 다른 비디오 복호화 장치(200)는 동일한 부호화 단위에 대한 인트라 예측/움직임 추정/움직임 보상 작업, 및 주파수 변환/역변환 작업이라 할지라도, 각각 별개의 데이터 단위를 기반으로 수행할 수 있다.The image data of a
도 11 은 본 발명의 일 실시예에 따른 부호화 단위별 부호화 정보를 도시한다.FIG. 11 shows encoding information for each encoding unit according to an embodiment of the present invention.
일 실시예에 따른 비디오 부호화 장치(100)의 출력부(130)는 부호화 단위별 부호화 정보를 출력하고, 일 실시예에 따른 비디오 복호화 장치(200)의 부호화 정보 추출부(220)는 부호화 단위별 부호화 정보를 추출할 수 있다.The
부호화 정보는 부호화 단위에 대한 분할 정보, 파티션 타입 정보, 예측 모드 정보, 변환 단위 크기 정보를 포함할 수 있다. 도 11에 도시되어 있는 부호화 정보들은 일 실시예에 따른 비디오 부호화 장치(100) 및 일 실시예에 따른 비디오 복호화 장치(200)에서 설정할 수 있는 일례이다.The encoding information may include division information for the encoding unit, partition type information, prediction mode information, and conversion unit size information. The encoding information shown in FIG. 11 is an example that can be set in the video encoding apparatus 100 according to the embodiment and the
분할 정보는 해당 부호화 단위의 부호화 심도를 나타낼 수 있다. 즉, 분할 정보에 따라 더 이상 분할되지 않는 심도가 부호화 심도이므로, 부호화 심도에 대해서 파티션 타입 정보, 예측 모드, 변환 단위 크기 정보가 정의될 수 있다. 분할 정보에 따라 한 단계 더 분할되어야 하는 경우에는, 분할된 4개의 하위 심도의 부호화 단위마다 독립적으로 부호화가 수행되어야 한다.The division information may indicate the coding depth of the corresponding encoding unit. That is, since depths that are no longer divided according to the division information are coding depths, partition type information, prediction mode, and conversion unit size information can be defined with respect to the coding depth. When it is necessary to further divide by one division according to the division information, encoding should be performed independently for each of four divided sub-depth coding units.
파티션 타입 정보는, 부호화 심도의 부호화 단위의 변환 단위의 파티션 타입을 2Nx2N, 2NxN, Nx2N 및 NxN 중 하나로 나타낼 수 있다. 예측 모드는, 인트라 모드, 인터 모드 및 스킵 모드 중 하나로 나타낼 수 있다. 인트라 모드 및 인터 모드는 파티션 타입 2Nx2N, 2NxN, Nx2N 및 NxN에서 정의될 수 있으며, 스킵 모드는 파티션 타입 2Nx2N에서만 정의될 수 있다. 변환 단위 크기는 인트라 모드에서 두 종류의 크기, 인터 모드에서 두 종류의 크기로 설정될 수 있다.As the partition type information, the partition type of the conversion unit of the coding unit of the coding depth can be represented by 2Nx2N, 2NxN, Nx2N and NxN. The prediction mode may be represented by one of an intra mode, an inter mode, and a skip mode. The intra mode and the inter mode can be defined in the partition types 2Nx2N, 2NxN, Nx2N and NxN, and the skip mode can be defined only in the partition type 2Nx2N. The conversion unit size can be set to two kinds of sizes in the intra mode and two kinds of sizes in the inter mode.
부호화 단위 내의 최소 부호화 단위마다, 소속되어 있는 부호화 심도의 부호화 단위별 부호화 정보를 수록하고 있을 수 있다. 따라서, 인접한 최소 부호화 단위들끼리 각각 보유하고 있는 부호화 정보들을 확인하면, 동일한 부호화 심도의 부호화 단위에 포함되는지 여부가 확인될 수 있다. 또한, 최소 부호화 단위가 보유하고 있는 부호화 정보를 이용하면 해당 부호화 심도의 부호화 단위를 확인할 수 있으므로, 최대 부호화 단위 내의 부호화 심도들의 분포가 유추될 수 있다.The encoding unit-specific encoding information of the belonging encoding depth may be stored for each minimum encoding unit in the encoding unit. Therefore, if encoding information held in each of the adjacent minimum encoding units is checked, it can be confirmed whether or not the encoding information is included in the encoding unit of the same encoding depth. In addition, since the encoding unit of the encoding depth can be identified by using the encoding information held in the minimum encoding unit, the distribution of encoding depths in the maximum encoding unit can be inferred.
따라서 이 경우 현재 부호화 단위가 주변 데이터 단위를 참조하여 예측하기 경우, 현재 부호화 단위에 인접하는 심도별 부호화 단위 내의 최소 부호화 단위의 부호화 정보가 직접 이용됨으로써 최소 부호화 단위의 데이터가 참조될 수 있다.In this case, when the current encoding unit is predicted with reference to the neighboring data unit, the encoding information of the minimum encoding unit in the depth encoding unit adjacent to the current encoding unit is directly used, so that the data of the minimum encoding unit can be referred to.
또 다른 실시예로, 심도별 부호화 단위의 부호화 정보가 심도별 부호화 단위 내 중 대표되는 최소 부호화 단위에 대해서만 저장되어 있을 수 있다. 이 경우 현재 부호화 단위가 주변 부호화 단위를 참조하여 예측되는 경우, 인접하는 심도별 부호화 단위의 부호화 정보를 이용하여, 심도별 부호화 단위 내에서 현재 부호화 단위에 인접하는 데이터가 검색됨으로써 참조될 수도 있다.In yet another embodiment, the encoding information of the depth encoding unit may be stored only for the minimum encoding unit represented in the depth encoding unit. In this case, when the current encoding unit is predicted by referring to the surrounding encoding unit, the data adjacent to the current encoding unit in the depth encoding unit may be retrieved using the encoding information of the adjacent depth encoding unit.
도 12 는 본 발명의 일 실시예에 따른 비디오 부호화 방법의 흐름도를 도시한다.12 shows a flowchart of a video coding method according to an embodiment of the present invention.
단계 1210에서, 현재 픽처는 적어도 하나의 최대 부호화 단위로 분할된다. 또한, 가능한 총 분할 횟수를 나타내는 최대 심도가 미리 설정될 수도 있다.In
단계 1220에서, 심도마다 최대 부호화 단위의 영역이 분할된 적어도 하나의 분할 영역시 부호화되어, 적어도 하나의 분할 영역 별로 최종 부호화 결과가 출력될 심도가 결정된다. 최대 부호화 단위가 단계별로 분할되며 심도가 깊어질 때마다, 하위 심도별 부호화 단위들마다 반복적으로 부호화가 수행되어야 한다. In
또한, 심도별 부호화 단위마다, 부호화 오차가 가장 작은 파티션 타입별 변환 단위가 결정되어야 한다. 부호화 단위의 최소 부호화 오차를 발생시키는 부호화 심도가 결정되기 위해서는, 모든 심도별 부호화 단위마다 부호화 오차가 측정되어 비교되어야 한다. For each depth-based coding unit, the conversion unit for each partition type having the smallest coding error should be determined. In order to determine the coding depth that causes the minimum coding error of the coding unit, the coding error should be measured and compared for each coding unit of each depth.
단계 1230에서, 최대 부호화 단위마다 적어도 하나의 분할 영역 별 최종 부호화 결과인 영상 데이터와, 부호화 심도 및 부호화 모드에 관한 정보가 출력된다. 부호화 모드에 관한 정보는 부호화 심도에 관한 정보 또는 분할 정보, 부호화 심도의 파티션 타입 정보, 예측 모드 정보 및 변환 단위 크기 정보 등을 포함할 수 있다. 부호화된 부호화 모드에 관한 정보는, 부호화된 영상 데이터와 함께 복호화단으로 전송될 수 있다.In
도 13 은 본 발명의 일 실시예에 따른 비디오 복호화 방법의 흐름도를 도시한다.13 shows a flowchart of a video decoding method according to an embodiment of the present invention.
단계 1310에서, 부호화된 비디오에 대한 비트스트림가 수신되어 파싱된다. In step 1310, a bitstream for the encoded video is received and parsed.
단계 1320에서, 파싱된 비트스트림으로부터 최대 크기의 최대 부호화 단위에 할당되는 현재 픽처의 영상 데이터 및 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보가 추출된다. 최대 부호화 단위별 부호화 심도는, 현재 픽처의 부호화 과정에서 최대 부호화 단위별로 부호화 오차가 가장 적은 심도로 선택된 심도이다. 최대 부호화 단위별 부호화는, 최대 부호화 단위를 심도별로 계층적으로 분할한 적어도 하나의 데이터 단위에 기반하여 영상 데이터가 부호화된 것이다. 따라서, 부호화 단위별 부호화 심도를 파악한 후 각각의 영상 데이터를 복호화함으로써 영상의 부복호화의 효율성이 향상될 수 있다.In
단계 1330에서, 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보에 기초하여 각각의 최대 부호화 단위의 영상 데이터가 복호화된다. 복호화된 영상 데이터는 재생 장치에 의해 재생되거나, 저장 매체에 저장되거나, 네트워크를 통해 전송될 수 있다.In
한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등) 및 캐리어 웨이브(예를 들면, 인터넷을 통한 전송)와 같은 저장매체를 포함한다.The above-described embodiments of the present invention can be embodied in a general-purpose digital computer that can be embodied as a program that can be executed by a computer and operates the program using a computer-readable recording medium. The computer readable recording medium may be a magnetic storage medium such as a ROM, a floppy disk, a hard disk, etc., an optical reading medium such as a CD-ROM or a DVD and a carrier wave such as the Internet Lt; / RTI > transmission).
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.The present invention has been described with reference to the preferred embodiments. It will be understood by those skilled in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined by the appended claims. Therefore, the disclosed embodiments should be considered in an illustrative rather than a restrictive sense. The scope of the present invention is defined by the appended claims rather than by the foregoing description, and all differences within the scope of equivalents thereof should be construed as being included in the present invention.
Claims (1)
부호화 단위의 분할 정보를 비트스트림으로부터 획득하는 단계
상기 분할정보를 이용하여 최대 부호화 단위들 중에서 현재 최대 부호화 단위로부터 계층적으로 분할된 부호화 단위들을 결정하는 단계; 및
상기 부호화 단위들을 복호화하여 상기 영상을 복원하는 단계를 포함하는 것을 특징으로 하는 비디오 복호화 방법.
A video decoding method comprising:
Obtaining division information of an encoding unit from a bitstream
Determining encoding units hierarchically divided from a current maximum encoding unit among maximum encoding units using the division information; And
And reconstructing the image by decoding the encoded units.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150051135A KR101617336B1 (en) | 2015-04-10 | 2015-04-10 | Method and apparatus for video encoding, and method and apparatus for video decoding |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150051135A KR101617336B1 (en) | 2015-04-10 | 2015-04-10 | Method and apparatus for video encoding, and method and apparatus for video decoding |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020140172378A Division KR101573335B1 (en) | 2014-12-03 | 2014-12-03 | Method and apparatus for video encoding, and method and apparatus for video decoding |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150045973A true KR20150045973A (en) | 2015-04-29 |
KR101617336B1 KR101617336B1 (en) | 2016-05-02 |
Family
ID=53037727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020150051135A KR101617336B1 (en) | 2015-04-10 | 2015-04-10 | Method and apparatus for video encoding, and method and apparatus for video decoding |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101617336B1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113396585A (en) * | 2019-01-30 | 2021-09-14 | 三星电子株式会社 | Video encoding method and apparatus and video decoding method and apparatus using blocks partitioned from an image in various forms |
-
2015
- 2015-04-10 KR KR1020150051135A patent/KR101617336B1/en active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
KR101617336B1 (en) | 2016-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101487686B1 (en) | Method and apparatus for video encoding, and method and apparatus for video decoding | |
KR101675118B1 (en) | Method and apparatus for video encoding considering order of skip and split, and method and apparatus for video decoding considering order of skip and split | |
KR101703327B1 (en) | Method and apparatus for video encoding using pattern information of hierarchical data unit, and method and apparatus for video decoding using pattern information of hierarchical data unit | |
KR101857800B1 (en) | Method and apparatus for video encoding considering order of skip and split, and method and apparatus for video decoding considering order of skip and split | |
KR101743248B1 (en) | Method and apparatus for video encoding using pattern information of hierarchical data unit, and method and apparatus for video decoding using pattern information of hierarchical data unit | |
KR101617336B1 (en) | Method and apparatus for video encoding, and method and apparatus for video decoding | |
KR101700368B1 (en) | Method and apparatus for video encoding using pattern information of hierarchical data unit, and method and apparatus for video decoding using pattern information of hierarchical data unit | |
KR101943991B1 (en) | Method and apparatus for video encoding, and method and apparatus for video decoding | |
KR101750052B1 (en) | Method and apparatus for video encoding, and method and apparatus for video decoding | |
KR101917656B1 (en) | Method and apparatus for video encoding considering order of skip and split, and method and apparatus for video decoding considering order of skip and split | |
KR101826333B1 (en) | Method and apparatus for video encoding using pattern information of hierarchical data unit, and method and apparatus for video decoding using pattern information of hierarchical data unit | |
KR101894398B1 (en) | Method and apparatus for video encoding using pattern information of hierarchical data unit, and method and apparatus for video decoding using pattern information of hierarchical data unit | |
KR101785568B1 (en) | Method and apparatus for video encoding using pattern information of hierarchical data unit, and method and apparatus for video decoding using pattern information of hierarchical data unit | |
KR101768209B1 (en) | Method and apparatus for video encoding considering order of skip and split, and method and apparatus for video decoding considering order of skip and split | |
KR101573335B1 (en) | Method and apparatus for video encoding, and method and apparatus for video decoding | |
KR101644092B1 (en) | Method and apparatus for video encoding, and method and apparatus for video decoding | |
KR101643621B1 (en) | Method and apparatus for video encoding, and method and apparatus for video decoding | |
KR101540684B1 (en) | Method and apparatus for video encoding, and method and apparatus for video decoding | |
KR101452862B1 (en) | Method and apparatus for video encoding, and method and apparatus for video decoding | |
KR101454642B1 (en) | Method and apparatus for video encoding, and method and apparatus for video decoding | |
KR101694823B1 (en) | Method and apparatus for video encoding using pattern information of hierarchical data unit, and method and apparatus for video decoding using pattern information of hierarchical data unit | |
KR101675120B1 (en) | Method and apparatus for video encoding considering order of skip and split, and method and apparatus for video decoding considering order of skip and split | |
KR101676793B1 (en) | Method and apparatus for video encoding considering hierarchical coded block pattern, and method and apparatus for video decoding considering hierarchical coded block pattern | |
KR101676794B1 (en) | Method and apparatus for video encoding considering hierarchical coded block pattern, and method and apparatus for video decoding considering hierarchical coded block pattern | |
KR101624662B1 (en) | Method and apparatus for video encoding considering hierarchical coded block pattern, and method and apparatus for video decoding considering hierarchical coded block pattern |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20190328 Year of fee payment: 4 |