KR101477546B1 - Apparatus for decoding motion vector - Google Patents
Apparatus for decoding motion vector Download PDFInfo
- Publication number
- KR101477546B1 KR101477546B1 KR1020130048512A KR20130048512A KR101477546B1 KR 101477546 B1 KR101477546 B1 KR 101477546B1 KR 1020130048512 A KR1020130048512 A KR 1020130048512A KR 20130048512 A KR20130048512 A KR 20130048512A KR 101477546 B1 KR101477546 B1 KR 101477546B1
- Authority
- KR
- South Korea
- Prior art keywords
- motion vector
- unit
- current block
- block
- encoding
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
Abstract
영상 복호화 장치가 개시된다. 영상 복호화 장치는 현재 블록의 주변 블록들 중 움직임 벡터를 갖는 주변 블록들을 결정하고, 상기 결정된 주변 블록들의 움직임 벡터들 중 예측 움직임 벡터 후보를 결정하며, 상기 현재 블록의 예측 모드 정보에 기초하여, 상기 예측 움직임 벡터 후보 중 상기 현재 블록의 예측 움직임 벡터를 결정하는 예측부; 및 상기 예측 움직임 벡터와 상기 비트스트림으로부터 획득된 차이 벡터에 기초하여 상기 현재 블록의 움직임 벡터를 획득하는 움직임 벡터 복원부를 포함하며, 상기 주변 블록들은 상기 현재 블록의 바깥쪽 및 좌하측에 위치한 제 1 블록을 포함한다.An image decoding apparatus is disclosed. The video decoding apparatus determines neighboring blocks having a motion vector among neighboring blocks of the current block, determines a predicted motion vector candidate among the motion vectors of the determined neighboring blocks, and determines, based on the prediction mode information of the current block, A predictor for determining a predicted motion vector of the current block among predicted motion vector candidates; And a motion vector restoring unit for obtaining a motion vector of the current block based on the predictive motion vector and a difference vector obtained from the bitstream, wherein the neighboring blocks include a first block located outside and a left lower end of the current block, Block.
Description
본 발명은 움직임 벡터 복호화에 관한 것으로 보다 상세히는 현재 블록의 예측 움직임 벡터를 복호화하는 장치에 관한 것이다. The present invention relates to motion vector decoding, and more particularly, to an apparatus for decoding a predictive motion vector of a current block.
MPEG-4 H.264/MPEG-4 AVC(Advanced Video Coding)와 같은 코덱에서는 현재 블록의 움직임 벡터를 예측하기 위해 현재 블록에 인접한 이전에 부호화된 블록들의 움직임 벡터를 이용한다. 현재 블록에 좌측, 상부 및 우측 상부에 인접한 이전한 부호화된 블록들의 움직임 벡터들의 중앙값(median)을 현재 블록의 예측 움직임 벡터(Motion vector Predictor)로 이용한다.In a codec such as MPEG-4 H.264 / MPEG-4 Advanced Video Coding (AVC), a motion vector of a previously coded block adjacent to a current block is used to predict a motion vector of the current block. The median of the motion vectors of the previous coded blocks adjacent to the upper left, the upper and the upper right of the current block is used as a motion vector predictor of the current block.
본 발명이 해결하고자 하는 기술적 과제는 움직임 벡터를 부호화, 복호화하는 방법 및 장치를 제공하는데 있고, 상기 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는데 있다.SUMMARY OF THE INVENTION The present invention provides a method and apparatus for encoding and decoding motion vectors, and a computer-readable recording medium having recorded thereon a program for executing the method.
상기 기술적 과제를 해결하기 위한 본 발명의 일 실시예에 따른 영상 복호화 장치는 현재 블록의 주변 블록들 중 움직임 벡터를 갖는 주변 블록들을 결정하고, 상기 결정된 주변 블록들의 움직임 벡터들 중 예측 움직임 벡터 후보를 결정하며, 상기 현재 블록의 예측 모드 정보에 기초하여, 상기 예측 움직임 벡터 후보 중 상기 현재 블록의 예측 움직임 벡터를 결정하는 예측부; 및 상기 예측 움직임 벡터와 상기 비트스트림으로부터 획득된 차이 벡터에 기초하여 상기 현재 블록의 움직임 벡터를 획득하는 움직임 벡터 복원부를 포함하며, 상기 주변 블록들은 상기 현재 블록의 바깥쪽 및 좌하측에 위치한 제 1 블록을 포함하는 것을 특징으로 한다.According to an aspect of the present invention, there is provided an apparatus for decoding an image, the apparatus comprising: a motion estimation unit that determines neighboring blocks having a motion vector among neighboring blocks of a current block, A predictor for determining a predicted motion vector of the current block among the predicted motion vector candidates based on prediction mode information of the current block; And a motion vector restoring unit for obtaining a motion vector of the current block based on the predictive motion vector and a difference vector obtained from the bitstream, wherein the neighboring blocks include a first block located outside and a left lower end of the current block, Block.
일 실시예에 따르면, 상기 예측 움직임 벡터 후보는 현재 픽처의 상기 현재 블록과 동일한 위치의 참조 픽처의 동일 위치의 블록의 움직임 벡터를 더 포함할 수 있다.According to an embodiment, the predictive motion vector candidate may further include a motion vector of a block at the same position of a reference picture at the same position as the current block of the current picture.
일 실시예에 따르면, 상기 예측부는 상기 참조 픽처와 상기 현재 픽처의 시간적 거리에 기초하여 상기 동일 위치의 블록의 움직임 벡터를 스케일링할 수 있다.According to an embodiment, the predicting unit may scale the motion vector of the block at the same position based on the temporal distance between the reference picture and the current picture.
일 실시예에 따르면, 상기 영상은 심도에 따라 상기 최대 부호화 단위 크기 정보에 따른 최대 부호화 단위로부터 계층적으로 분할되고, 현재 심도의 부호화 단위는 상위 심도의 부호화 단위로부터 분할된 정사각 데이터 단위들 중 하나이며, 상기 현재 심도의 부호화 단위는 이웃 부호화 단위들과 독립적으로 하위 심도의 부호화 단위들로 분할되고, 상기 계층 구조의 부호화 단위들은 상기 최대 부호화 단위로부터 분할된 부호화 단위들 중 부호화된 부호화 단위들을 포함할 수 있다.According to one embodiment, the image is hierarchically divided from a maximum encoding unit according to the maximum encoding unit size information according to a depth, and a current depth encoding unit is divided into a plurality of square data units Wherein the coding unit of the current depth is divided into coding units of lower depth independently of neighboring coding units and the coding units of the hierarchical structure include coding units among the coding units divided from the maximum coding unit can do.
도 1은 본 발명의 일 실시예에 따른 영상 부호화 장치를 도시한다.
도 2는 본 발명의 일 실시예에 따른 영상 복호화 장치를 도시한다.
도 3은 본 발명의 일 실시예에 따른 계층적 부호화 단위를 도시한다.
도 4는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 부호화부를 도시한다.
도 5는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 복호화부를 도시한다.
도 6은 본 발명의 일 실시예에 따른 최대 부호화 단위, 서브 부호화 단위 및 예측 단위를 도시한다.
도 7은 본 발명의 일 실시예에 따른, 부호화 단위 및 변환 단위를 도시한다.
도 8a 및 8b는 본 발명의 일 실시예에 따른, 부호화 단위, 예측 단위 및 주파수 변환 단위의 분할 형태를 도시한다.
도 9는 본 발명의 일 실시예에 따른 움직임 벡터를 부호화하는 장치를 도시한다.
도 10a 및 10b는 본 발명의 일 실시예에 따른 명시 모드의 예측 움직임 벡터 후보들을 도시한다.
도 11a 내지 11c는 본 발명의 또 다른 실시예에 따른 명시 모드의 예측 움직임 벡터 후보들을 도시한다.
도 12는 본 발명의 일 실시예에 따른 암시 모드의 예측 움직임 벡터를 생성하는 방법을 도시한다.
도 13은 본 발명의 일 실시예에 따른 움직임 벡터를 복호화하는 장치를 도시한다.
도 14는 본 발명의 일 실시예에 따른 움직임 벡터를 부호화하는 방법을 설명하기 위한 흐름도이다.
도 15는 본 발명의 일 실시예에 따른 움직임 벡터를 복호화하는 방법을 설명하기 위한 흐름도이다.1 illustrates an image encoding apparatus according to an embodiment of the present invention.
FIG. 2 illustrates an image decoding apparatus according to an embodiment of the present invention.
FIG. 3 illustrates a hierarchical encoding unit according to an embodiment of the present invention.
FIG. 4 illustrates an image encoding unit based on an encoding unit according to an embodiment of the present invention.
FIG. 5 illustrates an image decoding unit based on an encoding unit according to an embodiment of the present invention.
FIG. 6 illustrates a maximum encoding unit, a sub-encoding unit, and a prediction unit according to an embodiment of the present invention.
7 shows an encoding unit and a conversion unit according to an embodiment of the present invention.
FIGS. 8A and 8B show a division form of an encoding unit, a prediction unit, and a frequency conversion unit according to an embodiment of the present invention.
9 illustrates an apparatus for encoding a motion vector according to an embodiment of the present invention.
10A and 10B show predicted motion vector candidates in explicit mode according to an embodiment of the present invention.
Figures 11A-11C illustrate predicted motion vector candidates in explicit mode in accordance with another embodiment of the present invention.
12 illustrates a method of generating a predictive motion vector of an implicit mode according to an embodiment of the present invention.
13 shows an apparatus for decoding a motion vector according to an embodiment of the present invention.
14 is a flowchart illustrating a method of coding a motion vector according to an embodiment of the present invention.
15 is a flowchart illustrating a method of decoding a motion vector according to an embodiment of the present invention.
이하에서는 도면을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다. Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the drawings.
도 1 은 본 발명의 일 실시예에 따른 영상 부호화 장치를 도시한다.1 illustrates an image encoding apparatus according to an embodiment of the present invention.
도 1을 참조하면, 본 발명의 일 실시예에 따른 영상 부호화 장치(100)는 최대 부호화 단위 분할부(110), 부호화 심도 결정부(120), 영상 데이터 부호화부(130) 및 부호화 정보 부호화부(140)를 포함한다.1, an
최대 부호화 단위 분할부(110)는 최대 크기의 부호화 단위인 최대 부호화 단위에 기반하여 현재 픽처 또는 현재 슬라이스를 분할할 수 있다. 현재 픽처 또는 현재 슬라이스를 적어도 하나의 최대 부호화 단위로 분할할 수 있다. The maximum coding
본 발명의 일 실시예에 따르면, 최대 부호화 단위 및 심도를 이용해 부호화 단위가 표현될 수 있다. 전술한 바와 같이 최대 부호화 단위는 현재 픽처의 부호화 단위 중 크기가 가장 큰 부호화 단위를 나타내며, 심도는 부호화 단위가 계층적으로 축소된 서브 부호화 단위의 크기를 나타낸다. 심도가 커지면서, 부호화 단위는 최대 부호화 단위로부터 최소 부호화 단위까지 축소될 수 있으며, 최대 부호화 단위의 심도는 최소 심도로 정의되고, 최소 부호화 단위의 심도는 최대 심도로 정의될 수 있다. 최대 부호화 단위는 심도가 커짐에 따라 심도별 부호화 단위의 크기는 감소하므로, k 심도의 서브 부호화 단위는 복수 개의 k보다 큰 심도의 서브 부호화 단위를 포함할 수 있다.According to an embodiment of the present invention, an encoding unit can be expressed using a maximum encoding unit and a depth. As described above, the maximum coding unit indicates the largest coding unit among the coding units of the current picture, and the depth indicates the size of the sub-coding unit in which the coding units are hierarchically reduced. As the depth increases, the encoding unit can be reduced from the maximum encoding unit to the minimum encoding unit, the depth of the maximum encoding unit can be defined as the minimum depth, and the depth of the minimum encoding unit can be defined as the maximum depth. As the depth of the maximum encoding unit increases, the size of the depth-dependent encoding unit decreases. Thus, the sub-encoding unit of k depth may include a sub-encoding unit of depth greater than a plurality of k.
부호화되는 픽처의 크기가 커짐에 따라, 더 큰 단위로 영상을 부호화하면 더 높은 영상 압축률로 영상을 부호화할 수 있다. 그러나, 부호화 단위를 크게 하고, 그 크기를 고정시켜버리면, 계속해서 변하는 영상의 특성을 반영하여 효율적으로 영상을 부호화할 수 없다. As the size of a picture to be encoded increases, if an image is coded in a larger unit, the image can be encoded with a higher image compression rate. However, if the coding unit is enlarged and its size is fixed, the image can not be efficiently encoded reflecting the characteristics of the continuously changing image.
예를 들어, 바다 또는 하늘에 대한 평탄한 영역을 부호화할 때에는 부호화 단위를 크게 할수록 압축률이 향상될 수 있으나, 사람들 또는 빌딩에 대한 복잡한 영역을 부호화할 때에는 부호화 단위를 작게 할수록 압축률이 향상된다.For example, when coding a flat area with respect to the sea or sky, the compression rate can be improved by increasing the coding unit. However, when coding a complex area for people or buildings, the compression ratio is improved as the coding unit is decreased.
이를 위해 본 발명의 일 실시예는 픽처 또는 슬라이스마다 상이한 최대 영상 부호화 단위를 설정하고, 최대 심도를 설정한다. 최대 심도는 부호화 단위가 축소될 수 있는 최대 횟수를 의미하므로, 최대 심도에 따라 최대 영상 부호화 단위에 포함된 최소 부호화 단위 크기를 가변적으로 설정할 수 있게 된다.To this end, one embodiment of the present invention sets a different maximum picture encoding unit for each picture or slice, and sets a maximum depth. Since the maximum depth means the maximum number of times the encoding unit can be reduced, the minimum encoding unit size included in the maximum image encoding unit can be variably set according to the maximum depth.
부호화 심도 결정부(120)는 최대 심도를 결정한다. 최대 심도는 R-D 코스트(Rate-Distortion Cost) 계산에 기초해 결정될 수 있다. 최대 심도는 픽처 또는 슬라이스마다 상이하게 결정되거나, 각각의 최대 부호화 단위마다 상이하게 결정될 수도 있다. 결정된 최대 심도는 부호화 정보 부호화부(140)로 출력되고, 최대 부호화 단위별 영상 데이터는 영상 데이터 부호화부(130)로 출력된다. The encoding
최대 심도는 최대 부호화 단위에 포함될 수 있는 가장 작은 크기의 부호화 단위 즉, 최소 부호화 단위를 의미한다. 다시 말해, 최대 부호화 단위는 상이한 심도에 따라 상이한 크기의 서브 부호화 단위로 분할될 수 있다. 도 8a 및 8b를 참조하여 상세히 후술한다. 또한, 최대 부호화 단위에 포함된 상이한 크기의 서브 부호화 단위들은 상이한 크기의 처리 단위에 기초해 예측 또는 주파수 변환될 수 있다. 다시 말해, 영상 부호화 장치(100)는 영상 부호화를 위한 복수의 처리 단계들을 다양한 크기 및 다양한 형태의 처리 단위에 기초해 수행할 수 있다. 영상 데이터의 부호화를 위해서는 예측, 주파수 변환, 엔트로피 부호화 등의 처리 단계를 거치는데, 모든 단계에 걸쳐서 동일한 크기의 처리 단위가 이용될 수도 있으며, 단계별로 상이한 크기의 처리 단위를 이용할 수 있다.The maximum depth means the smallest encoding unit, that is, the minimum encoding unit, which can be included in the maximum encoding unit. In other words, the maximum encoding unit may be divided into sub-encoding units of different sizes according to different depths. Will be described later in detail with reference to Figs. 8A and 8B. Further, the sub-encoding units of different sizes included in the maximum encoding unit can be predicted or frequency-converted based on the processing units of different sizes. In other words, the
예를 들어 영상 부호화 장치(100)는 부호화 단위를 예측하기 위해, 부호화 단위와 다른 처리 단위를 선택할 수 있다. For example, in order to predict a coding unit, the
부호화 단위의 크기가 2Nx2N(단, N은 양의 정수)인 경우, 예측을 위한 처리 단위는 2Nx2N, 2NxN, Nx2N, NxN 등일 수 있다. 다시 말해, 부호화 단위의 높이 또는 너비 중 적어도 하나를 반분하는 형태의 처리 단위를 기반으로 움직임 예측이 수행될 수도 있다. 이하, 예측의 기초가 되는 데이터 단위는 '예측 단위'라 한다.If the size of the encoding unit is 2Nx2N (where N is a positive integer), the processing unit for prediction may be 2Nx2N, 2NxN, Nx2N, NxN, and the like. In other words, motion prediction may be performed based on a processing unit of a type that halves at least one of a height or a width of an encoding unit. Hereinafter, a data unit serving as a basis of prediction is referred to as a 'prediction unit'.
예측 모드는 인트라 모드, 인터 모드 및 스킵 모드 중 적어도 하나일 수 있으며, 특정 예측 모드는 특정 크기 또는 형태의 예측 단위에 대해서만 수행될 수 있다. 예를 들어, 인트라 모드는 정방형인 2Nx2N, NxN 크기의 예측 단위에 대해서만 수행될 수 있다. 또한, 스킵 모드는 2Nx2N 크기의 예측 단위에 대해서만 수행될 수 있다. 부호화 단위 내부에 복수의 예측 단위가 있다면, 각각의 예측 단위에 대해 예측을 수행하여 부호화 오차가 가장 작은 예측 모드가 선택될 수 있다.The prediction mode may be at least one of an intra mode, an inter mode, and a skip mode, and the specific prediction mode may be performed only for a prediction unit of a specific size or type. For example, the intra mode can be performed only for a 2Nx2N, NxN sized prediction unit, which is a square. In addition, the skip mode can be performed only for a prediction unit of 2Nx2N size. If there are a plurality of prediction units in an encoding unit, a prediction mode having the smallest coding error can be selected by performing prediction for each prediction unit.
또한, 영상 부호화 장치(100)는 부호화 단위와 다른 크기의 처리 단위에 기초해 영상 데이터를 주파수 변환할 수 있다. 부호화 단위의 주파수 변환을 위해서 부호화 단위보다 작거나 같은 크기의 데이터 단위를 기반으로 주파수 변환이 수행될 수 있다. 이하, 주파수 변환의 기초가 되는 처리 단위를 '변환 단위'라 한다.Also, the
부호화 심도 결정부(120)는 라그랑지 곱(Lagrangian Multiplier) 기반의 율-왜곡 최적화 기법(Rate-Distortion Optimization)을 이용해 최대 부호화 단위에 포함된 서브 부호화 단위들을 결정할 수 있다. 다시 말해, 최대 부호화 단위가 어떠한 형태의 복수의 서브 부호화 단위로 분할되는지 결정할 수 있는데, 여기서 복수의 서브 부호화 단위는 심도에 따라 크기가 상이하다. 그런 다음, 영상 데이터 부호화부(130)는 부호화 심도 결정부(120)에서 결정된 분할 형태에 기초해 최대 부호화 단위를 부호화하여 비트스트림을 출력한다. The
부호화 정보 부호화부(140)는 부호화 심도 결정부(120)에서 최대 부호화 단위의 부호화 모드에 대한 정보를 부호화한다. 최대 부호화 단위의 분할 형태에 대한 정보, 최대 심도에 대한 정보 및 심도별 서브 부호화 단위의 부호화 모드에 관한 정보를 부호화하여 비트스트림을 출력한다. 서브 부호화 단위의 부호화 모드에 관한 정보는 서브 부호화 단위의 예측 단위에 대한 정보, 예측 단위별 예측 모드 정보, 서브 부호화 단위의 변환 단위에 대한 정보 등을 포함할 수 있다.The encoding
최대 부호화 단위마다 상이한 크기의 서브 부호화 단위가 존재하고, 각각의 서브 부호화 단위마다 부호화 모드에 관한 정보가 결정되어야 하므로, 하나의 최대 부호화 단위에 대해서는 적어도 하나의 부호화 모드에 관한 정보가 결정될 수 있다. There is a sub-encoding unit of a different size for each maximum encoding unit, and information on the encoding mode is determined for each sub-encoding unit, so that information on at least one encoding mode can be determined for one maximum encoding unit.
영상 부호화 장치(100)는 심도가 커짐에 따라 최대 부호화 단위를 높이 및 너비를 반분하여 서브 부호화 단위를 생성할 수 있다. 즉, k 심도의 부호화 단위의 크기가 2Nx2N이라면, k+1 심도의 부호화 단위의 크기는 NxN 이다. As the depth increases, the
따라서, 일 실시예에 따른 영상 복호화 장치(100)는 영상의 특성을 고려한 최대 부호화 단위의 크기 및 최대 심도를 기반으로, 각각의 최대 부호화 단위마다 최적의 분할 형태를 결정할 수 있다. 영상 특성을 고려하여 가변적으로 최대 부호화 단위의 크기를 조절하고, 상이한 심도의 서브 부호화 단위로 최대 부호화 단위를 분할하여 영상을 부호화함으로써, 다양한 해상도의 영상을 보다 효율적으로 부호화할 수 있다.Accordingly, the
도 2 는 본 발명의 일 실시예에 따른 영상 복호화 장치를 도시한다.FIG. 2 illustrates an image decoding apparatus according to an embodiment of the present invention.
도 2를 참조하면, 본 발명의 일 실시예에 따른 영상 복호화 장치(200)는 영상 데이터 획득부(210), 부호화 정보 추출부(220) 및 영상 데이터 복호화부(230)를 포함한다. 2, an
영상 관련 데이터 획득부(210)는 영상 복호화 장치(200)가 수신한 비트스트림을 파싱하여, 최대 부호화 단위별로 영상 데이터를 획득하여 영상 데이터 복호화부(230)로 출력한다. 영상 데이터 획득부(210)는 현재 픽처 또는 슬라이스에 대한 헤더로부터 현재 픽처 또는 슬라이스의 최대 부호화 단위에 대한 정보를 추출할 수 있다. 다시 말해, 비트스트림을 최대 부호화 단위로 분할하여, 영상 데이터 복호화부(230)가 최대 부호화 단위마다 영상 데이터를 복호화하게 한다.The image-related
부호화 정보 추출부(220)는 영상 복호화 장치(200)가 수신한 비트열을 파싱하여, 현재 픽처에 대한 헤더로부터 최대 부호화 단위, 최대 심도, 최대 부호화 단위의 분할 형태, 서브 부호화 단위의 부호화 모드에 관한 정보를 추출한다. 분할 형태 및 부호화 모드에 관한 정보는 영상 데이터 복호화부(230)로 출력된다.The encoding information extracting unit 220 parses the bit stream received by the
최대 부호화 단위의 분할 형태에 대한 정보는 최대 부호화 단위에 포함된 심도에 따라 상이한 크기의 서브 부호화 단위에 대한 정보를 포함할 수 있으며, 부호화 모드에 관한 정보는 서브 부호화 단위별 예측 단위에 대한 정보, 예측 모드에 대한 정보 및 변환 단위에 대한 정보 등을 포함할 수 있다. The information on the division type of the maximum encoding unit may include information on sub-encoding units of different sizes according to the depth included in the maximum encoding unit, the information on the encoding mode may include information on a prediction unit for each sub- Information on the prediction mode, information on the conversion unit, and the like.
영상 데이터 복호화부(230)는 부호화 정보 추출부에서 추출된 정보에 기초하여 각각의 최대 부호화 단위의 영상 데이터를 복호화하여 현재 픽처를 복원한다. 최대 부호화 단위의 분할 형태에 대한 정보에 기초하여, 영상 데이터 복호화부(230)는 최대 부호화 단위에 포함된 서브 부호화 단위를 복호화할 수 있다. 복호화 과정은 인트라 예측 및 움직임 보상을 포함하는 움직임 예측 과정, 및 주파수 역변환 과정을 포함할 수 있다.The image
영상 데이터 복호화부(230)는, 서브 부호화 단위의 예측을 위해, 서브 부호화 단위별 예측 단위에 대한 정보 및 예측 모드에 대한 정보에 기초해 인트라 예측 또는 인터 예측을 수행할 수 있다. 또한, 영상 데이터 복호화부(230)는, 서브 부호화 단위의 변환 단위에 대한 정보에 기초해 서브 부호화 단위마다 주파수 역변환을 수행할 수 있다.The image
도 3 은 본 발명의 일 실시예에 따른 계층적 부호화 단위를 도시한다.FIG. 3 illustrates a hierarchical encoding unit according to an embodiment of the present invention.
도 3을 참조하면, 본 발명에 따른 계층적 부호화 단위는 너비x높이가 64x64인 부호화 단위부터, 32x32, 16x16, 8x8, 및 4x4를 포함할 수 있다. 정사각형 형태의 부호화 단위 이외에도, 너비x높이가 64x32, 32x64, 32x16, 16x32, 16x8, 8x16, 8x4, 4x8인 부호화 단위들이 존재할 수 있다.Referring to FIG. 3, the hierarchical coding unit according to the present invention may include 32x32, 16x16, 8x8, and 4x4 from a coding unit having a width x height of 64x64. In addition to the square-shaped encoding units, there may be encoding units whose width x height is 64x32, 32x64, 32x16, 16x32, 16x8, 8x16, 8x4, 4x8.
도 3을 참조하면, 해상도가 1920x1080인 영상 데이터(310)에 대해서, 최대 부호화 단위의 크기는 64x64, 최대 심도가 2로 설정되어 있다. Referring to FIG. 3, the maximum encoding unit size is set to 64x64 and the maximum depth is set to 2 for the
또 다른 해상도가 1920x1080인 영상 데이터(320)에 대해서 최대 부호화 단위의 크기는 64x64, 최대 심도가 4로 설정되어 있다. 해상도가 352x288인 비디오 데이터(330)에 대해서 최대 부호화 단위의 크기는 16x16, 최대 심도가 2로 설정되어 있다.The size of the maximum encoding unit is set to 64x64 and the maximum depth is set to 4 for the
해상도가 높거나 데이터량이 많은 경우 압축률 향상뿐만 아니라 영상 특성을 정확히 반영하기 위해 부호화 사이즈의 최대 크기가 상대적으로 큰 것이 바람직하다. 따라서, 영상 데이터(330)에 비해, 해상도가 높은 영상 데이터(310 및 320)는 최대 부호화 단위의 크기가 64x64로 선택될 수 있다.It is desirable that the maximum size of the encoding size is relatively large in order to accurately reflect not only the compression ratio but also the image characteristic when the resolution is high or the data amount is large. Therefore, the size of the maximum encoding unit of the
최대 심도는 계층적 부호화 단위에서 총 계층수를 나타낸다. 영상 데이터(310)의 최대 심도는 2이므로, 영상 데이터(310)의 부호화 단위(315)는 장축 크기가 64인 최대 부호화 단위로부터, 심도가 증가함에 따라 장축 크기가 32, 16인 서브 부호화 단위들까지 포함할 수 있다. The maximum depth indicates the total number of layers in the hierarchical encoding unit. Since the maximum depth of the
반면, 영상 데이터(330)의 최대 심도는 2이므로, 영상 데이터(330)의 부호화 단위(335)는 장축 크기가 16인 최대 부호화 단위들로부터, 심도가 증가함에 따라 장축 크기가 8, 4인 부호화 단위들까지 포함할 수 있다. On the other hand, since the maximum depth of the
영상 데이터(320)의 최대 심도는 4이므로, 비디오 데이터(320)의 부호화 단위(325)는 장축 크기가 64인 최대 부호화 단위로부터, 심도가 증가함에 따라 장축 크기가 32, 16, 8, 4인 서브 부호화 단위들까지 포함할 수 있다. 심도가 증가할수록 더 작은 서브 부호화 단위에 기초해 영상을 부호화하므로 보다 세밀한 장면을 포함하고 있는 영상을 부호화하는데 적합해진다.Since the maximum depth of the
도 4 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 부호화부를 도시한다.FIG. 4 illustrates an image encoding unit based on an encoding unit according to an embodiment of the present invention.
인트라 예측부(410)는 현재 프레임(405) 중 인트라 모드의 예측 단위에 대해 인트라 예측을 수행하고, 움직임 추정부(420) 및 움직임 보상부(425)는 인터 모드의 예측 단위에 대해 현재 프레임(405) 및 참조 프레임(495)을 이용해 인터 예측 및 움직임 보상을 수행한다.The
인트라 예측부(410), 움직임 추정부(420) 및 움직임 보상부(425)로부터 출력된 예측 단위에 기초해 레지듀얼 값들이 생성되고, 생성된 레지듀얼 값들은 주파수 변환부(430) 및 양자화부(440)를 거쳐 양자화된 변환 계수로 출력된다. The residual values are generated based on the prediction unit output from the
양자화된 변환 계수는 역양자화부(460), 주파수 역변환부(470)를 통해 다시 레지듀얼 값으로 복원되고, 복원된 레지듀얼 값들은 디블로킹부(480) 및 루프 필터링부(490)를 거쳐 후처리되어 참조 프레임(495)으로 출력된다. 양자화된 변환 계수는 엔트로피 부호화부(450)를 거쳐 비트스트림(455)으로 출력될 수 있다.The quantized transform coefficients are restored to a residual value through the
본 발명의 일 실시예에 따른 영상 부호화 방법에 따라 부호화하기 위해, 영상 부호화부(400)의 구성 요소들인 인트라 예측부(410), 움직임 추정부(420), 움직임 보상부(425), 주파수 변환부(430), 양자화부(440), 엔트로피 부호화부(450), 역양자화부(460), 주파수 역변환부(470), 디블로킹부(480) 및 루프 필터링부(490)는 모두 최대 부호화 단위, 심도에 따른 서브 부호화 단위, 예측 단위 및 변환 단위에 기초해 영상 부호화 과정들을 처리한다. In order to perform encoding according to the image encoding method according to an embodiment of the present invention, an
도 5는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 복호화부를 도시한다.FIG. 5 illustrates an image decoding unit based on an encoding unit according to an embodiment of the present invention.
비트스트림(505)이 파싱부(510)를 거쳐 복호화 대상인 부호화된 영상 데이터 및 복호화를 위해 필요한 부호화 정보가 파싱된다. 부호화된 영상 데이터는 엔트로피 복호화부(520) 및 역양자화부(530)를 거쳐 역양자화된 데이터로 출력되고, 주파수 역변환부(540)를 거쳐 레지듀얼 값들로 복원된다. 레지듀얼 값들은 인트라 예측부(550)의 인트라 예측의 결과 또는 움직임 보상부(560)의 움직임 보상 결과와 가산되어 부호화 단위 별로 복원된다. 복원된 부호화 단위는 디블로킹부(570) 및 루프 필터링부(580)를 거쳐 다음 부호화 단위 또는 다음 픽처의 예측에 이용된다. The
본 발명의 일 실시예에 따른 영상 복호화 방법에 따라 복호화하기 위해 영상 복호화부(400)의 구성 요소들인 파싱부(510), 엔트로피 복호화부(520), 역양자화부(530), 주파수 역변환부(540), 인트라 예측부(550), 움직임 보상부(560), 디블로킹부(570) 및 루프 필터링부(580)가 모두 최대 부호화 단위, 심도에 따른 서브 부호화 단위, 예측 단위 및 변환 단위에 기초해 영상 복호화 과정들을 처리한다. A
특히, 인트라 예측부(550), 움직임 보상부(560)는 최대 부호화 단위 및 심도를 고려하여 서브 부호화 단위 내의 예측 단위 및 예측 모드를 결정하며, 주파수 역변환부(540)는 변환 단위의 크기를 고려하여 주파수 역변환을 수행한다.In particular, the
도 6는 본 발명의 일 실시예에 따른 최대 부호화 단위, 서브 부호화 단위 및 예측 단위를 도시한다.FIG. 6 illustrates a maximum encoding unit, a sub-encoding unit, and a prediction unit according to an embodiment of the present invention.
본 발명의 일 실시예에 따른 영상 부호화 장치(100) 및 영상 복호화 장치(200)는 영상 특성을 고려하여 부호화, 복호화를 수행하기 위해 계층적인 부호화 단위를 이용한다. 최대 부호화 단위 및 최대 심도는 영상의 특성에 따라 적응적으로 설정되거나, 사용자의 요구에 따라 다양하게 설정될 수 있다. The
본 발명의 일 실시예에 따른 부호화 단위의 계층 구조(600)는 최대 부호화 단위(610)의 높이 및 너비가 64이며, 최대 심도가 4인 경우를 도시한다. 부호화 단위의 계층 구조(600)의 세로축을 따라서 심도가 증가하고, 심도의 증가에 따라 서브 부호화 단위(620 내지 650)의 높이 및 너비가 축소된다. 또한, 부호화 단위의 계층 구조(600)의 가로축을 따라, 최대 부호화 단위(610) 및 서브 부호화 단위(620 내지 650)의 예측 단위가 도시되어 있다.The
최대 부호화 단위(610)는 심도가 0이며, 부호화 단위의 크기, 즉 높이 및 너비가 64x64이다. 세로축을 따라 심도가 증가하며, 크기 32x32인 심도 1의 서브 부호화 단위(620), 크기 16x16인 심도 2의 서브 부호화 단위(630), 크기 8x8인 심도 3의 서브 부호화 단위(640), 크기 4x4인 심도 4의 서브 부호화 단위(650)가 존재한다. 크기 4x4인 심도 4의 서브 부호화 단위(650)는 최소 부호화 단위이다.The
도 6을 참조하면, 각각의 심도별로 가로축을 따라 예측 단위의 예시들이 도시되어 있다. 즉, 심도 0의 최대 부호화 단위(610)의 예측 단위는, 크기 64x64의 부호화 단위(610)와 동일하거나 작은 크기인 크기 64x64의 예측 단위(610), 크기 64x32의 예측 단위(612), 크기 32x64의 예측 단위(614), 크기 32x32의 예측 단위(616)일 수 있다. Referring to FIG. 6, examples of prediction units along the horizontal axis are shown for each depth. That is, the prediction unit of the
심도 1의 크기 32x32의 부호화 단위(620)의 예측 단위는, 크기 32x32의 부호화 단위(620)와 동일하거나 작은 크기인 크기 32x32의 예측 단위(620), 크기 32x16의 예측 단위(622), 크기 16x32의 예측 단위(624), 크기 16x16의 예측 단위(626)일 수 있다. The prediction unit of the 32x32 coding unit 620 having the
심도 2의 크기 16x16의 부호화 단위(630)의 예측 단위는, 크기 16x16의 부호화 단위(630)와 동일하거나 작은 크기인 크기 16x16의 예측 단위(630), 크기 16x8의 예측 단위(632), 크기 8x16의 예측 단위(634), 크기 8x8의 예측 단위(636)일 수 있다. The prediction unit of the
심도 3의 크기 8x8의 부호화 단위(640)의 예측 단위는, 크기 8x8의 부호화 단위(640)와 동일하거나 작은 크기인 크기 8x8의 예측 단위(640), 크기 8x4의 예측 단위(642), 크기 4x8의 예측 단위(644), 크기 4x4의 예측 단위(646)일 수 있다. The prediction unit of the
마지막으로, 심도 4의 크기 4x4의 부호화 단위(650)는 최소 부호화 단위이며 최대 심도의 부호화 단위이고, 예측 단위는 크기 4x4의 예측 단위(650)이다.Finally, the
도 7은 본 발명의 일 실시예에 따른, 부호화 단위 및 변환 단위를 도시한다.7 shows an encoding unit and a conversion unit according to an embodiment of the present invention.
본 발명의 일 실시예에 따른 영상 부호화 장치(100) 및 영상 복호화 장치(200)는, 최대 부호화 단위 그대로 부호화하거나, 최대 부호화 단위 보다 작거나 같은 서브 부호화 단위로 최대 부호화 단위를 분할하여 부호화한다. 부호화 과정 중 주파수 변환을 위한 변환 단위의 크기는 각각의 부호화 단위보다 크지 않은 변환 단위로 선택된다. 예를 들어, 현재 부호화 단위(710)가 64x64 크기일 때, 32x32 크기의 변환 단위(720)를 이용하여 주파수 변환이 수행될 수 있다. The
도 8a 및 8b는 본 발명의 일 실시예에 따른, 부호화 단위, 예측 단위 및 주파수 변환 단위의 분할 형태를 도시한다.FIGS. 8A and 8B show a division form of an encoding unit, a prediction unit, and a frequency conversion unit according to an embodiment of the present invention.
도 8a는 본 발명의 일 실시예에 따른 부호화 단위 및 예측 단위를 도시한다. 8A shows an encoding unit and a prediction unit according to an embodiment of the present invention.
도 8a의 좌측은 최대 부호화 단위(810)를 부호화하기 위해 본 발명의 일 실시예에 따른 영상 부호화 장치(100)가 선택한 분할 형태를 도시한다. 영상 부호화 장치(100)는 다양한 형태로 최대 부호화 단위(810)를 분할하고, 부호화한 다음 다양한 분할 형태의 부호화 결과를 R-D 코스트에 기초해 비교하여 최적의 분할 형태를 선택한다. 최대 부호화 단위(810)를 그대로 부호화하는 것이 최적일 경우에는 도 8a 및 8b와 같이 최대 부호화 단위(810)를 분할하지 않고 최대 부호화 단위(800)를 부호화할 수도 있다. The left side of FIG. 8A shows a division type selected by the
도 8a의 좌측을 참조하면, 심도 0인 최대 부호화 단위(810)를 심도 1 이상의 서브 부호화 단위로 분할하여 부호화한다. 최대 부호화 단위(810)를 네 개의 심도 1의 서브 부호화 단위로 분할한 다음, 전부 또는 일부의 심도 1의 서브 부호화 단위를 다시 심도 2의 서브 부호화 단위로 분할한다.Referring to the left side of FIG. 8A, a maximum encoding unit 810 having a depth of 0 is divided into sub-encoding units having a depth of 1 or more and encoded. The maximum encoding unit 810 is divided into sub-encoding units of four
심도 1의 서브 부호화 단위 중 우측 상부에 외치한 서브 부호화 단위 및 좌측 하부에 위치한 서브 부호화 단위가 심도 2 이상의 서브 부호화 단위로 분할되었다. 심도 2 이상의 서브 부호화 단위 중 일부는 다시 심도 3 이상의 서브 부호화 단위로 분할될 수 있다.Among the sub-coding units of
도 8b의 우측은 최대 부호화 단위(810)에 대한 예측 단위의 분할 형태를 도시한다. The right side of FIG. 8B shows the division type of the prediction unit for the maximum coding unit 810.
도 8a의 우측을 참조하면, 최대 부호화 단위에 대한 예측 단위(860)는 최대 부호화 단위(810)와 상이하게 분할될 수 있다. 다시 말해, 서브 부호화 단위들 각각에 대한 예측 단위는 서브 부호화 단위보다 작을 수 있다. Referring to the right side of FIG. 8A, the prediction unit 860 for the maximum coding unit can be divided into the maximum coding unit 810 and the prediction unit 860 for the maximum coding unit. In other words, the prediction unit for each of the sub-encoding units may be smaller than the sub-encoding unit.
예를 들어, 심도 1의 서브 부호화 단위 중 우측 하부에 외치한 서브 부호화 단위(854)에 대한 예측 단위는 서브 부호화 단위(854)보다 작을 수 있다. 심도 2의 서브 부호화 단위들(814, 816, 818, 828, 850, 852) 중 일부 서브 부호화 단위(815, 816, 850, 852)에 대한 예측 단위는 서브 부호화 단위보다 작을 수 있다. 또한, 심도 3의 서브 부호화 단위(822, 832, 848)에 대한 예측 단위는 서브 부호화 단위보다 작을 수 있다. 예측 단위는 각각의 서브 부호화 단위를 높이 또는 너비 방향으로 반분한 형태일 수도 있고, 높이 및 너비 방향으로 4분한 형태일 수도 있다.For example, a prediction unit for a
도 8b는 본 발명의 일 실시예에 따른 예측 단위 및 변환 단위를 도시한다. FIG. 8B shows a prediction unit and a conversion unit according to an embodiment of the present invention.
도 8b의 좌측은 도 8a의 우측에 도시된 최대 부호화 단위(810)에 대한 예측 단위의 분할 형태를 도시하고, 도 8b의 우측은 최대 부호화 단위(810)의 변환 단위의 분할 형태를 도시한다. The left side of FIG. 8B shows the division form of the prediction unit for the maximum coding unit 810 shown on the right side of FIG. 8A, and the right side of FIG. 8B shows the division form of the conversion unit of the maximum coding unit 810.
도 8b의 우측을 참조하면, 변환 단위(870)의 분할 형태는 예측 단위(860)와 상이하게 설정될 수 있다. Referring to the right side of FIG. 8B, the division type of the conversion unit 870 may be set differently from the prediction unit 860. [
예를 들어, 심도 1의 부호화 단위(854)에 대한 예측 단위가 높이를 반분한 형태로 선택되더라도, 변환 단위는 심도 1의 부호화 단위(854)의 크기와 동일한 크기로 선택될 수 있다. 마찬가지로, 심도 2의 부호화 단위(814, 850)에 대한 예측 단위가 심도 2의 부호화 단위(814, 850)의 높이를 반분한 형태로 선택되더라도 변환 단위는 심도 2의 부호화 단위(814, 850)의 원래 크기와 동일한 크기로 선택될 수 있다. For example, even if the prediction unit for the
예측 단위보다 더 작은 크기로 변환 단위가 선택될 수도 있다. 예를 들어, 심도 2의 부호화 단위(852)에 대한 예측 단위가 너비를 반분한 형태로 선택된 경우에 변환 단위는 예측 단위보다 더 작은 크기인 높이 및 너비를 반분한 형태로 선택될 수 있다.The conversion unit may be selected to be smaller than the prediction unit. For example, if the prediction unit for
도 9는 본 발명의 일 실시예에 따른 움직임 벡터를 부호화하는 장치를 도시한다. 9 illustrates an apparatus for encoding a motion vector according to an embodiment of the present invention.
도 1과 관련하여 전술한 영상 부호화 장치(100) 또는 도 4와 관련하여 전술한 영상 부호화부(400)에 포함되어 움직임 벡터를 부호화하는 장치를 상세히 도시된다. 도 9를 참조하면, 본 발명의 일 실시예에 따른 움직임 벡터 부호화 장치(900)는 예측부(910), 제1 부호화부(920) 및 제2 부호화부(930)를 포함한다. The apparatus for encoding a motion vector included in the
인터 예측 즉, 픽처간 예측을 이용해 부호화된 블록을 복호화하기 위해서는 현재 블록과 참조 픽처 내의 유사한 블록 사이의 위치 차이를 나타내는 움직임 벡터에 대한 정보가 필요하다. 따라서, 영상 부호화시에 움직임 벡터에 대한 정보를 부호화하여 비트스트림에 삽입하게 되는데, 움직임 벡터에 대한 정보를 그대로 부호화하여 삽입하면, 움직임 벡터에 대한 정보를 부호화하기 위한 오버헤드(overhead)가 증가하게 되어 영상 데이터의 압축률이 낮아진다.In order to decode a block coded by inter prediction or inter-picture prediction, information on a motion vector indicating a position difference between a current block and a similar block in a reference picture is needed. Therefore, when the image coding is performed, the information on the motion vector is encoded and inserted into the bitstream. If the information on the motion vector is directly encoded and inserted, an overhead for coding information on the motion vector increases And the compression rate of the video data is lowered.
따라서, 영상 부호화에서는 현재 블록의 움직임 벡터를 예측하고, 예측의 결과로 생성된 예측 움직임 벡터(motion vector predictor)와 원본 움직임 벡터와의 차분 벡터만을 부호화하여 비트스트림에 삽입으로써 움직임 벡터에 대한 정보도 압축한다. 도 9는 이러한 예측 움직임 벡터를 이용한 움직임 벡터를 부호화하는 장치를 도시한다. Therefore, in the image coding, only the difference vector between the motion vector predictor and the original motion vector generated as a result of the prediction is predicted, and information about the motion vector is also inserted Compress. FIG. 9 shows an apparatus for coding a motion vector using such a predictive motion vector.
도 9를 참조하면, 예측부(910)는 현재 블록의 예측 움직임 벡터가 명시 모드(explicit mode) 및 암시 모드(implicit mode) 중 어떤 모드에 기초해 예측 부호화되는지 결정한다.Referring to FIG. 9, the
전술한 바와 같이, MPEG-4 H.264/MPEG-4 AVC(Advanced Video Coding)와 같은 코덱에서는 현재 블록의 움직임 벡터를 예측하기 위해 현재 블록에 인접한 이전에 부호화된 블록들의 움직임 벡터를 이용한다. 현재 블록에 좌측, 상부 및 우측 상부에 인접한 이전한 부호화된 블록들의 움직임 벡터들의 중앙값(median)을 현재 블록의 예측 움직임 벡터로 이용한다. 인터 예측을 이용해 부호화된 모든 블록의 움직임 벡터가 동일한 방법을 이용해 예측되기 때문에 예측 움직임 벡터에 대해 정보는 별도로 부호화할 필요가 없다. 그러나, 본원 발명에 따른 영상 부호화 장치(100) 또는 영상 부호화부(400)는 움직임 벡터를 보다 정확하게 예측하기 위해 전술한 예측 움직임 벡터에 대한 정보를 별도로 부호화하지 않는 모드 및 예측 움직임 벡터에 대한 정보를 부호화하는 모드를 모두 이용하는 바 이에 대해 상세히 후술한다.As described above, in a codec such as MPEG-4 H.264 / MPEG-4 AVC (Advanced Video Coding), a motion vector of a previously coded block adjacent to a current block is used to predict a motion vector of the current block. The median of the motion vectors of the previous coded blocks adjacent to the upper left, upper and right upper portions of the current block is used as the predicted motion vector of the current block. Since the motion vectors of all blocks coded using inter prediction are predicted using the same method, it is not necessary to separately encode information for the predicted motion vectors. However, in order to more accurately predict a motion vector, the
(1) 명시 모드(1) explicit mode
예측부(910)가 선택할 수 있는 예측 움직임 벡터를 부호화하는 방법 중 하나는 현재 블록의 예측 움직임 벡터에 대한 정보를 명시적으로 부호화하는 모드가 있을 수 있다. 이 모드는 적어도 하나의 예측 움직임 벡터 후보들을 계산하고, 이들 중 어떤 예측 움직임 벡터를 이용해 현재 블록의 움직임 벡터를 예측하는지 지시하는 정보를 별도로 부호화하는 모드이다. 도 10a, 10b, 11a 내지 11c를 참조하여 본원 발명의 예측 움직임 벡터 후보를 설명한다. One of the methods for encoding the predictive motion vector that can be selected by the
도 10a 및 10b는 본 발명의 일 실시예에 따른 명시 모드의 예측 움직임 벡터 후보들을 도시한다.10A and 10B show predicted motion vector candidates in explicit mode according to an embodiment of the present invention.
도 10a를 참조하면, 본 발명의 일 실시예에 따른 움직임 벡터 예측 방법은 현재 블록에 인접한 이전에 부호화된 블록들의 움직임 벡터 중 하나를 현재 블록의 예측 움직임 벡터로 이용할 수 있다. 현재 블록의 상부에 인접한 블록들 중 가장 좌측의 a0 블록, 좌측에 인접한 가장 상부의 b0 블록, 우측상부에 인접한 c 블록, 좌측상부에 인접한 d 블록 및 우측하부에 인접한 e 블록을 모두 현재 블록의 예측 움직임 벡터로 이용할 수 있다.Referring to FIG. 10A, a motion vector prediction method according to an embodiment of the present invention can use one of motion vectors of previously coded blocks adjacent to a current block as a predicted motion vector of a current block. The block a0, the block a0, the block a2, the block a3, the block a3, the block a3, the block a3, Can be used as a motion vector.
도 10b를 참조하면, 현재 블록의 인접한 모든 블록의 움직임 벡터를 현재 블록의 예측 움직임 벡터로 이용할 수 있다. 다시 말해, 상부에 인접한 블록들 중 가장 좌측의 a0 블록뿐만 아니라 상부에 인접한 모든 블록들의 움직임 벡터를 현재 블록의 예측 움직임 벡터로 이용할 수 있으며, 좌측에 인접한 불록들 중 가장 상부의 b0 블록뿐만 아니라 좌측에 인접한 모든 블록들의 움직임 벡터를 현재 블록의 예측 움직임 벡터로 이용할 수 있다. Referring to FIG. 10B, a motion vector of all adjacent blocks of the current block can be used as a predicted motion vector of the current block. In other words, not only the leftmost a block of the blocks adjacent to the uppermost block but also the motion vectors of all the blocks adjacent to the uppermost block can be used as a predicted motion vector of the current block. In addition to the uppermost b0 block among the blocks adjacent to the left, The motion vector of all blocks adjacent to the current block can be used as a predicted motion vector of the current block.
또한, 인접한 블록들의 움직임 벡터의 중앙값을 예측 움직임 벡터로 이용할 수 있다. 다시 말해, median(mv_a0, mv_b0, mv_c)을 현재 블록의 예측 움직임 벡터로 이용할 수 있다. 여기서, mv_a0은 a0 블록의 움직임 벡터이고, mv_b0는 b0 블록의 움직임 벡터이며, mv_c는 c 블록의 움직임 벡터이다. In addition, a median of motion vectors of adjacent blocks can be used as a predicted motion vector. In other words, median (mv_a0, mv_b0, mv_c) can be used as the predicted motion vector of the current block. Here, mv_a0 is a motion vector of the a0 block, mv_b0 is a motion vector of the b0 block, and mv_c is a motion vector of the c block.
도 11a 내지 11c는 본 발명의 또 다른 실시예에 따른 명시 모드의 예측 움직임 벡터 후보들을 도시한다.Figures 11A-11C illustrate predicted motion vector candidates in explicit mode in accordance with another embodiment of the present invention.
도 11a는 본 발명의 일 실시예에 따른 B 픽처(Bi-directional Predictive Picture)의 예측 움직임 벡터를 계산하는 방법을 도시한다. 현재 블록을 포함하는 현재 픽처가 양방향 예측을 수행하는 B 픽처인 경우 시간적 거리(tempral distance)에 기초해 생성된 움직임 벡터가 예측 움직임 벡터 후보일 수 있다.FIG. 11A illustrates a method of calculating a predictive motion vector of a B-directional predictive picture according to an embodiment of the present invention. If the current picture including the current block is a B-picture for bidirectional prediction, the motion vector generated based on the temporal distance may be a predicted motion vector candidate.
현재 픽처(1110)의 현재 블록(1100)의 예측 움직임 벡터는 시간적으로 선행하는 픽처(1112)의 동일한 위치(colocated)의 블록(1120)의 움직임 벡터를 이용해 생성될 수 있다. 예를 들어, 현재 블록(1100)과 동일한 위치의 블록(1120)의 움직임 벡터 mv_colA가 현재 픽처(1110)의 시간적으로 후행하는 픽처(1114)의 검색된 블록(1122)에 대해 생성되면, 현재 블록(1100)의 예측 움직임 벡터 후보들인 mv_L0A 및 mv_L1A 는 다음과 같이 생성될 수 있다. The predicted motion vector of the
mv_L1A = (t1/t2) x mv_colAmv_L1A = (t1 / t2) x mv_colA
mv_L0A = mv_L1A - mv_colAmv_L0A = mv_L1A - mv_colA
여기서, mv_L0A는 시간적으로 선행하는 픽처(1112)에 대한 현재 블록(1110)의 예측 움직임 벡터를 의미하고, mv_L1A는 시간적으로 후행하는 픽처(1114)에 대한 현재 블록(1110)의 예측 움직임 벡터를 의미한다.Here, mv_L0A denotes a predicted motion vector of the
도 11b는 본 발명의 또 다른 실시예에 따른 B 픽처(Bi-directional Predictive Picture)의 예측 움직임 벡터를 생성하는 방법을 도시한다. 도 11a에 도시된 방법과 비교해보면, 시간적으로 후행하는 픽처(1114)에 현재 블록(1100)과 동일한 위치의 블록이 존재한다는 점이 상이하다.FIG. 11B shows a method of generating a predictive motion vector of a B-directional predictive picture according to another embodiment of the present invention. Compared with the method shown in Fig. 11A, there is a difference in that a temporally following
도 11b를 참조하면, 현재 픽처(1110)의 현재 블록(1100)의 예측 움직임 벡터는 시간적으로 후행하는 픽처(1114)의 동일한 위치(colocated)의 블록(1130)의 움직임 벡터를 이용해 생성될 수 있다. 예를 들어, 현재 블록(1100)과 동일한 위치의 블록(1130)의 움직임 벡터 mv_colB가 현재 픽처(1110)의 시간적으로 선행하는 픽처(1112)의 검색된 블록(1132)에 대해 생성되면, 현재 블록(1100)의 예측 움직임 벡터 후보들인 mv_L0B 및 mv_L1B 는 다음과 같이 생성될 수 있다. 11B, the predicted motion vector of the
mv_L0B = (t3/t4) x mv_colBmv_L0B = (t3 / t4) x mv_colB
mv_L1B = mv_L0B - mv_colBmv_L1B = mv_L0B - mv_colB
여기서, mv_L0B는 시간적으로 선행하는 픽처(1112)에 대한 현재 블록(1110)의 예측 움직임 벡터를 의미하고, mv_L1A는 시간적으로 후행하는 픽처(1114)에 대한 현재 블록(1100)의 예측 움직임 벡터를 의미한다.Here, mv_L0B denotes a predicted motion vector of the
B 픽처의 현재 블록(1100)의 예측 움직임 벡터를 생성함에 있어서, 도 11a에 도시된 방법 및 도 11b에 도시된 방법 중 적어도 하나를 이용할 수 있다. 다시 말해, 현재 블록(1100)과 동일한 위치의 블록(1120 또는 1130)의 움직임 벡터와 시간적 거리를 이용해 예측 움직임 벡터를 생성하므로, 동일한 위치의 블록(1120 및 1130)의 움직임 벡터가 반드시 존재해야 도 11a 및 11b에 도시된 방법을 이용해 예측 움직임 벡터를 생성할 수 있다. 따라서, 본 발명에 따른 예측부(910)는 동일한 위치의 블록들(1120 및 1130) 중 해당 블록에 대한 움직임 벡터가 존재하는 블록만을 이용해 현재 블록(1100)의 예측 움직임 벡터를 생성한다. In generating the predicted motion vector of the
예를 들어, 시간적으로 선행하는 픽처(1112)의 동일한 위치의 블록(1120)이 인터 예측이 아닌 인트라 예측을 이용해 부호화된 경우 해당 블록(1120)의 움직임 벡터는 존재하지 않으므로, 도 11a에 도시된 바와 같은 예측 움직임 벡터를 생성하는 방법을 이용해 현재 블록(1100)의 예측 움직임 벡터를 생성할 수는 없다.For example, when the
도 11c는 본 발명의 일 실시예에 따른 P 픽처(Predictive Picture)의 예측 움직임 벡터를 생성하는 방법을 도시한다.FIG. 11C shows a method of generating a predictive motion vector of a P-picture (Predictive Picture) according to an embodiment of the present invention.
도 11c를 참조하면, 현재 픽처(1110)의 현재 블록(1100)의 예측 움직임 벡터는 시간적으로 선행하는 픽처(1112)의 동일한 위치(colocated)의 블록(1140)의 움직임 벡터를 이용해 생성될 수 있다. 예를 들어, 현재 블록(1100)과 동일한 위치의 블록(1130)의 움직임 벡터 mv_colC가 또 다른 시간적으로 선행하는 픽처(1116)의 검색된 블록(1142)에 대해 생성되면, 현재 블록(1100)의 예측 움직임 벡터 후보인 mv_L0C는 다음과 같이 생성될 수 있다.11C, the predicted motion vector of the
mv_L0C = (t6/t5) x mv_colCmv_L0C = (t6 / t5) x mv_colC
현재 픽처(1110)가 P 픽처이므로, 현재 블록(1100)의 예측 움직임 벡터 후보는 도 11a 및 11b와 달리 하나만 생성된다. Since the
종합하면, 도 10a 및 10b, 도 11a 내지 11c에 따라 다음과 같이 예측 움직임 벡터 후보들의 집합 C는 다음과 같이 생성될 수 있다.Taken together, a set C of predicted motion vector candidates may be generated as follows according to FIGS. 10A and 10B and FIGS. 11A through 11C as follows.
C = {median(mv_a0, mv_b0, mv_c), mv_a0, mv_a1 ..., mv_aN, mv_b0, mv_b1, ... , mv_bN, mv_c, mv_d, mv_e, mv_temporal} Mv_b0, mv_b1, ..., mv_bN, mv_c, mv_d, mv_e, mv_temporal}, mv_a0, mv_a1,
또는, 또는 예측 움직임 벡터 후보들의 개수를 줄여 생성할 수도 있다.Or, the number of prediction motion vector candidates may be reduced.
C = {median(mv_a', mv_b', mv_c'), mv_a', mv_b', mv_c', mv_temporal}C = {median (mv_a ', mv_b', mv_c '), mv_a', mv_b ', mv_c', mv_temporal}
여기서, mv_x는 x 블록의 움직임 벡터를 의미하고, median()은 중앙값을 의미하며, mv_temporal은 도 11a 내지 11c와 관련하여 전술한 시간적 거리를 이용해 생성된 예측 움직임 벡터 후보들을 의미한다. Here, mv_x denotes a motion vector of x block, median () denotes a median value, and mv_temporal denotes predicted motion vector candidates generated using the temporal distance described above with reference to Figs. 11A to 11C.
또한, mv_a'은 mv_a0, mv_a1 ..., mv_aN 중 유효한 최초의 움직임 벡터를 의미한다. 예를 들어, a0 블록이 인트라 예측을 이용해 부호화된 경우 a0의 움직임 벡터인 mv_a0은 유효하지 않으므로, mv_a'=mv_a1이 되며, a1 블록의 움직임 벡터도 유효하지 않은 경우에는 mv_a'=mv_a2이다.Also, mv_a 'denotes the first motion vector effective among mv_a0, mv_a1 ... mv_aN. For example, when the a0 block is coded using intraprediction, mv_a0, which is a motion vector of a0, is not valid, so mv_a '= mv_a1 and mv_a' = mv_a2 when the motion vector of a1 block is also invalid.
마찬가지로, mv_b'은 mv_b0, mv_b1, ... , mv_bN 중 유효한 최초의 움직임 벡터를 의미하고, mv_c'은 mv_c, mv_d, mv_e 중 유효한 최초의 움직임 벡터를 의미한다.Likewise, mv_b 'denotes the first motion vector valid among mv_b0, mv_b1, ..., mv_bN, and mv_c' denotes the first motion vector valid among mv_c, mv_d, and mv_e.
명시 모드는 상기 C 집합 중 어떤 움직임 벡터를 현재 블록의 예측 움직임 벡터로 이용했는지 지시하는 정보를 부호화하는 모드이다. 예를 들어, 명시 모드로 움직임 벡터를 부호화하는 경우 C 집합의 원소 즉 예측 움직임 벡터 후보들에 각각에 대응되는 이진수를 할당하고, 그 중 하나가 현재 블록의 예측 움직임 벡터로 이용되는 경우 대응되는 이진수를 출력할 수 있다.The explicit mode is a mode for coding information indicating which motion vector of the set C is used as a predicted motion vector of the current block. For example, when coding a motion vector in the explicit mode, a binary number corresponding to each of the elements of the C set, that is, the predicted motion vector candidates is allocated, and when one of them is used as a predicted motion vector of the current block, a corresponding binary number Can be output.
명시 모드와 관련하여 전술한 모든 예측 움직임 벡터 후보들 이외에 다른 예측 움직임 벡터 후보들이 이용될 수 있음은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 쉽게 이해할 수 있다. It will be appreciated by those skilled in the art that other predictive motion vector candidates other than all the predictive motion vector candidates described above with respect to the explicit mode can be used.
(2) 암시 모드(2) Implicit mode
예측부(910)가 선택할 수 있는 예측 움직임 벡터를 부호화하는 방법 중 또 다른 하나는 현재 블록의 예측 움직임 벡터가 현재 블록에 인접한 이전에 부호화된 영역에 포함된 블록 또는 픽셀에 기초해 생성됨을 지시하는 정보만 부호화하는 모드이다. 이 모드는 명시 모드와 달리 예측 움직임 벡터를 특정하기 위한 정보를 부호화하지 않고, 암시 모드로 예측 움직임 벡터로 생성함을 지시하는 정보만 부호화하는 모드이다. Another method of coding the predictive motion vector that can be selected by the
전술한 바와 같이 MPEG-4 H.264/MPEG-4 AVC(Advanced Video Coding)와 같은 코덱에서는 현재 블록의 움직임 벡터를 예측하기 위해 현재 블록에 인접한 이전에 부호화된 블록들의 움직임 벡터를 이용한다. 현재 블록에 좌측, 상부 및 우측 상부에 인접한 이전한 부호화된 블록들의 움직임 벡터들의 중앙값을 현재 블록의 예측 움직임 벡터로 이용하는데, 이 경우 명시 모드와 같이 예측 움직임 벡터 후보들 중 하나를 선택하기 위한 정보를 부호화하지 않아도 된다.As described above, in a codec such as MPEG-4 H.264 / MPEG-4 AVC (Advanced Video Coding), a motion vector of a previously coded block adjacent to a current block is used to predict a motion vector of the current block. The median of the motion vectors of the previous coded blocks adjacent to the upper left, upper and right upper blocks of the current block is used as a predicted motion vector of the current block. In this case, information for selecting one of the predicted motion vector candidates It is not necessary to encode it.
다시 말해, 영상 부호화 과정에서는 현재 블록의 예측 움직임 벡터가 암시 모드로 부호화되었음을 지시하는 정보만 부호화하면, 영상 복호화 과정에서는 현재 블록에 좌측, 상부 및 우측 상부에 인접한 이전한 복호화된 블록들의 움직임 벡터들의 중앙값을 현재 블록의 예측 움직임 벡터로 이용할 수 있다.In other words, in the image coding process, if only information indicating that the predictive motion vector of the current block is coded in the implicit mode is coded, in the image decoding process, the motion vectors of the previous decoded blocks adjacent to the left, The median value can be used as the predicted motion vector of the current block.
또한, 본 발명에 따른 영상 부호화 방법은 현재 블록에 좌측, 상부 및 우측 상부에 인접한 이전한 부호화된 블록들의 움직임 벡터들의 중앙값을 예측 움직임 벡터로 이용하는 방법 이외에 새로운 암시 모드를 제공한다. 도 12를 참조하여 상세히 설명한다. Also, the image encoding method according to the present invention provides a new implicit mode in addition to the method of using the median of the motion vectors of the previous coded blocks adjacent to the left, upper, and upper right of the current block as a predicted motion vector. Will be described in detail with reference to FIG.
도 12는 본 발명의 일 실시예에 따른 암시 모드의 예측 움직임 벡터를 생성하는 방법을 도시한다. 12 illustrates a method of generating a predictive motion vector of an implicit mode according to an embodiment of the present invention.
도 12를 참조하면, 현재 픽처(1210)의 현재 블록(1200)의 예측 움직임 벡터를 생성함에 있어, 현재 블록에 인접한 이전에 부호화된 영역(1220)에 포함된 픽셀들(1222)을 이용한다. 인접한 픽셀들(1222)을 이용해 참조 픽처(1212)를 검색하여 대응되는 픽셀들(1224)을 결정한다. SAD(Sum of Absolute Difference)를 계산하여 대응되는 픽셀들(1224)을 결정할 수 있다. 대응되는 픽셀들(1224)이 결정되면, 인접한 픽셀들(1222)의 움직임 벡터 mv_template가 생성되고, mv_template를 현재 블록(1200)의 예측 움직임 벡터로 이용할 수 있다.Referring to FIG. 12,
인접한 블록들의 움직임 벡터의 중앙값을 예측 움직임 벡터로 이용하는 모드를 implicit mode_1 이라 하고, 현재 블록에 인접한 픽셀들(1222)을 이용해 예측 움직임 벡터를 생성하는 모드를 implicit mode_2 라 한다면, 영상 부호화 과정에서는 이 두 가지 암시 모드 중 하나의 모드에 대한 정보를 부호화하고, 영상 복호화 과정에서는 모드에 대한 정보를 참조해 implicit mode_1 및 implicit mode_2 중 하나를 이용해 예측 움직임 벡터를 생성할 수 있다.If the mode for using the median of the motion vectors of adjacent blocks as a predictive motion vector is implicit mode_1 and the mode for generating predictive motion
(3) 모드의 선택(3) Selection of mode
예측부(910)가 전술한 명시 모드 및 암시 모드 중 하나를 선택하는 기준에는 다양한 기준들이 있을 수 있다. There may be various criteria for the predicting
명시 모드는 복수의 예측 움직임 벡터 후보들 중 하나를 선택하는 것이므로, 현재 블록의 움직임 벡터와 보다 유사한 예측 움직임 벡터를 선택할 수 있다. 대신 복수의 예측 움직임 벡터 후보 중 하나를 지시하는 정보를 부호화하기 때문에 암시 모드보다 더 큰 오버헤드가 발생할 수 있다. 따라서, 크기가 큰 부호화 단위인 경우에 명시 모드로 움직임 벡터를 부호화하는 것이 타당하다. 크기가 큰 부호화 단위가 크기가 작은 부호화 단위보다 움직임 벡터를 잘못 예측할 경우 발생하는 오차가 커질 확률이 높고, 각각의 픽처마다 오버헤드가 발생하는 횟수가 작아지기 때문이다.Since the explicit mode selects one of a plurality of predicted motion vector candidates, it is possible to select a predicted motion vector more similar to the motion vector of the current block. Instead, it may encode information indicating one of a plurality of predicted motion vector candidates, resulting in greater overhead than the implicit mode. Therefore, it is appropriate to encode a motion vector in the explicit mode in the case of a large-size encoding unit. This is because a probability that an error occurs when a large-sized coding unit is incorrectly predicted from a motion vector is smaller than a small-sized coding unit, and the number of times overhead occurs for each picture becomes small.
예를 들어, m 개의 64x64 크기의 부호화 단위로 균일하게 분할된 픽처를 명시 모드로 부호화하는 경우 오버헤드가 발생하는 횟수는 m 번이지만, 동일한 크기의 픽처를 4m 개의 32x32 크기의 부호화 단위로 균일하게 분할된 픽처를 명시 모드로 부호화하는 경우 오버헤드가 발생하는 횟수는 4m 번이다. For example, when coding a uniformly divided picture with m 64x64 coding units in the explicit mode, the number of times of occurrence of overhead is m times, but a picture of the same size is uniformly divided into 4m 32x32 coding units When the divided pictures are coded in the explicit mode, the number of overhead occurrences is 4m.
따라서, 본 발명에 따른 예측부(910)가 현재 블록의 움직임 벡터를 부호화함에 있어 명시 모드 및 암시 모드 중 하나를 부호화 단위의 크기에 기초해 선택할 수 있다. Therefore, when the
도 1 내지 8과 관련하여 전술한 본 발명에 따른 영상 부호화, 복호화 방법에서 부호화 단위의 크기는 심도에 의해 표현되므로, 예측부(910)는 현재 블록의 심도에 기초해 현재 블록의 움직임 벡터를 명시 모드로 부호화할지 암시 모드로 부호화할지 선택한다. 예를 들어, 심도 0 및 심도 1의 부호화 단위를 인터 예측하는 경우에는 부호화 단위의 움직임 벡터를 명시 모드로 부호화하고, 심도 2 이상의 부호화 단위를 인터 예측하는 경우에는 암시 모드로 부호화할 수 있다.In the image encoding and decoding method according to the present invention described above with reference to FIGS. 1 to 8, since the size of an encoding unit is represented by depth, the
본 발명의 또 다른 실시예에 따르면, 예측부(910)는 픽처 또는 슬라이스 단위로 명시 모드 또는 암시 모드를 선택할 수 있다. 픽처 또는 슬라이스 단위마다 영상 특성이 상이하므로, 이를 고려하여 픽처 또는 슬라이스 단위로 명시 모드 또는 암시 모드를 선택할 수 있다. R-D 코스트를 고려하여 명시 모드 및 암시 모드 중 최적의 모드를 선택해 현재 픽처 또는 슬라이스에 포함된 부호화 단위들의 움직임 벡터들을 예측 부호화할 수 있다.According to another embodiment of the present invention, the predicting
예를 들어, 명시 모드를 이용하지 않아도 픽처 또는 슬라이스에 포함된 부호화 단위들의 움직임 벡터들을 정확하게 예측할 수 있다면, 픽처 또는 슬라이스에 포함된 모든 부호화 단위들의 움직임 벡터들을 암시 모드로 예측 부호화할 수 있다.For example, if motion vectors of coding units included in a picture or a slice can be accurately predicted without using the explicit mode, motion vectors of all coding units included in a picture or slice can be predictively encoded in an implicit mode.
또한, 본 발명의 또 다른 실시예에 따르면, 예측부(910)는 현재 블록이 스킵 모드로 부호화 되었는지 여부에 따라 명시 모드 및 암시 모드 중 하나를 선택할 수도 있다. 스킵 모드란 현재 블록이 스킵 모드로 부호화되었음을 지시하는 플래그 정보만 부호화하고, 픽셀 값은 부호화하지 않는 부호화 모드를 의미한다. According to another embodiment of the present invention, the predicting
스킵 모드는 예측 움직임 벡터를 현재 블록의 움직임 벡터로 이용해 움직임 보상하여 생성된 예측 블록이 현재 블록과 매우 유사하여 현재 블록의 픽셀 값을 부호화하지 않는 모드이다. 따라서, 예측 움직임 벡터를 현재 블록의 움직임 벡터와 유사하게 생성할수록 스킵 모드로 현재 블록을 부호화할 확률이 높아진다. 따라서, 스킵 모드로 부호화되는 블록은 명시 모드로 부호화할 수 있다. The skip mode is a mode in which the prediction block generated by motion compensation using the predicted motion vector as a motion vector of the current block is very similar to the current block and thus the pixel value of the current block is not encoded. Accordingly, as the predictive motion vector is generated similar to the motion vector of the current block, the probability of encoding the current block in the skip mode increases. Therefore, the block to be coded in the skip mode can be encoded in the explicit mode.
다시 도 9를 참조하면, 예측부(910)에서 명시 모드 및 암시 모드 중 하나를 선택하고, 선택된 모드에 따라 예측 움직임 벡터를 결정하면, 제1 부호화(920) 및 제2 부호화부(930)는 부호화 모드에 대한 정보 및 움직임 벡터를 부호화한다. Referring again to FIG. 9, when one of the explicit mode and the implicit mode is selected in the predicting
먼저, 제1 부호화부(920)는 현재 블록의 예측 움직임 벡터에 대한 정보를 부호화한다. 예측부(910)에서 명시 모드로 현재 블록의 움직임 벡터를 부호화할 것을 선택하면, 명시 모드로 예측 움직임 벡터가 생성되었음을 지시하는 정보 및 복수의 예측 움직임 벡터 후보들 중에서 어떤 예측 움직임 벡터가 현재 블록의 예측 움직임 벡터로 이용되었는지 지시하는 정보를 부호화한다. First, the
반면에, 예측부(910)에서 암시 모드로 현재 블록의 움직임 벡터를 부호화할 것을 선택하면, 암시 모드로 현재 블록의 예측 움직임 벡터를 생성함을 지시하는 정보를 부호화한다. 다시 말해, 현재 블록에 인접한 블록 또는 픽셀을 이용해 현재 블록의 예측 움직임 벡터를 생성함을 지시하는 정보를 부호화한다. 두 개 이상의 암시 모드가 있는 경우 어떤 암시 모드를 이용해 현재 블록의 예측 움직임 벡터를 생성하였는지 지시하는 정보를 부호화할 수도 있다.On the other hand, if the
제2 부호화부(930)는 예측부(910)에서 결정된 예측 움직임 벡터에 기초해 현재 블록의 움직임 벡터를 부호화한다. 움직임 보상 결과 생성된 현재 블록의 움직임 벡터에서 예측부(910)에서 생성된 예측 움직임 벡터를 감산하여 차이 벡터를 생성한다. 그런 다음 차이 벡터에 대한 정보를 부호화한다. The
도 13은 본 발명의 일 실시예에 따른 움직임 벡터를 복호화하는 장치를 도시한다. 13 shows an apparatus for decoding a motion vector according to an embodiment of the present invention.
도 2와 관련하여 전술한 영상 부호화 장치(200) 또는 도 5와 관련하여 전술한 영상 부호화부(500)에 포함되어 움직임 벡터를 복호화하는 장치를 상세히 도시된다. 도 13을 참조하면, 본 발명의 일 실시예에 따른 움직임 벡터 복호화 장치(1300)는 제1 복호화부(1310), 제2 복호화부(1320), 예측부(1330) 및 움직임벡터복원부(1340)를 포함한다. An apparatus for decoding a motion vector included in the
제1 복호화부(1310)는 비트스트림에 포함되어 있는 현재 블록의 예측 움직임 벡터에 대한 정보를 복호화한다. 현재 블록의 예측 움직임 벡터가 명시 모드 또는 암시 모드로 부호화되었는지를 나타내는 정보를 복호화한다. 명시 모드로 현재 블록의 예측 움직임 벡터가 부호화된 경우에는 복수의 예측 움직임 벡터 후보들 중에서 현재 블록의 예측 움직임 벡터로 이용한 하나의 예측 움직임 벡터를 지시하는 정보도 복호화한다. 또한, 암시 모드로 현재 블록의 예측 움직임 벡터가 부호화된 경우에는 복수의 암시 모드 중 어떤 암시 모드로 현재 블록의 예측 움직임 벡터가 부호화되었는지 지시하는 정보도 복호화할 수 있다. The
제2 복호화부(1310)는 비트스트림에 포함되어 있는 현재 블록의 움직임 벡터와 예측 움직임 벡터 사이의 차이 벡터를 복호화한다.The
예측부(1330)는 제1 복호화부(1310)에서 복호화된 현재 블록의 예측 움직임 벡터에 대한 정보에 기초해 현재 블록의 예측 움직임 벡터를 생성한다. The
명시 모드로 부호화된 현재 블록의 예측 움직임 벡터에 대한 정보를 복호화한 경우에는 도 10a 및 10b, 11a 내지 11c와 관련하여 전술한 예측 움직임 벡터 후보들 중 하나의 예측 움직임 벡터를 생성하여 현재 블록의 예측 움직임 벡터로서 이용한다. When information on the predictive motion vector of the current block coded in the explicit mode is decoded, a predictive motion vector of one of the predictive motion vector candidates described above with reference to Figs. 10A and 10B and 11A to 11C is generated, Is used as a vector.
암시 모드로 부호화된 현재 블록의 예측 움직임 벡터에 대한 정보를 복호화한 경우에는 현재 블록에 인접한 이전에 부호화된 영역에 포함되어 있는 블록 또는 픽셀을 이용해 현재 블록의 예측 움직임 벡터를 생성한다. 현재 블록에 인접한 블록들의 움직임 벡터들의 중앙값을 현재 블록의 예측 움직임 벡터로서 생성하거나, 현재 블록에 인접한 픽셀들을 이용해 참조 픽처를 검색하여 현재 블록의 예측 움직임 벡터를 생성한다. When information on a predictive motion vector of a current block coded in an implicit mode is decoded, a predictive motion vector of the current block is generated using a block or pixel included in a previously coded area adjacent to the current block. A median of motion vectors of blocks adjacent to the current block is generated as a predictive motion vector of the current block or a reference picture is retrieved using pixels adjacent to the current block to generate a predictive motion vector of the current block.
움직임벡터복원부(1340)는 예측부(1330)에서 생성된 예측 움직임 벡터 및 제2 복호화부(320)에서 복호화된 차이 벡터를 가산하여 현재 블록의 움직임 벡터를 복원한다. 복원된 움직임 벡터는 현재 블록의 움직임 보상에 이용된다.The motion
도 14는 본 발명의 일 실시예에 따른 움직임 벡터를 부호화하는 방법을 설명하기 위한 흐름도이다.14 is a flowchart illustrating a method of coding a motion vector according to an embodiment of the present invention.
도 14를 참조하면, 본 발명의 일 실시예에 따른 움직임 벡터 부호화 장치는 단계 1410에서 예측 움직임 벡터에 대한 정보를 부호화는 모드로서 명시 모드 및 암시 모드 중 하나의 모드를 선택한다. Referring to FIG. 14, in
명시 모드는 예측 움직임 벡터에 대한 정보로서 적어도 하나의 예측 움직임 벡터 후보들 중 하나의 예측 움직임 벡터 후보를 지시하는 정보를 부호화하는 모드이고, 암시 모드는 예측 움직임 벡터에 대한 정보로서 현재 블록에 인접한 이전에 부호화된 영역에 포함된 블록 또는 픽셀에 기초해 예측 움직임 벡터를 생성함을 지시하는 정보를 부호화하는 모드이다. 상세한 설명은 도 10a, 10b, 11a 내지 11c 및 12와 관련하여 전술하였다.The explicit mode is a mode for coding information indicating a predicted motion vector candidate of at least one predicted motion vector candidate as information for a predicted motion vector, and the implied mode is a mode for previously And information indicating that a predictive motion vector should be generated based on the block or pixel included in the encoded region. Detailed descriptions have been given above with reference to Figs. 10A, 10B, 11A to 11C and 12. [
현재 블록의 크기 즉, 현재 블록의 심도에 기초해 모드를 선택하거나, 현재 블록이 포함된 현재 픽처 또는 현재 슬라이스 단위로 모드를 선택할 수 있다. 또한, 현재 블록이 스킵 모드로 부호화되었는지 여부에 따라 모드를 선택할 수도 있다. The mode can be selected based on the size of the current block, that is, the depth of the current block, or the mode can be selected in the current picture or the current slice unit including the current block. In addition, the mode may be selected depending on whether or not the current block is coded in the skip mode.
단계 1420에서 움직임 벡터 부호화 장치는 단계 1410에서 선택된 모드에 따라 예측 움직임 벡터를 결정한다. 단계 1410에서 선택된 명시 모드 또는 암시 모드에 기초해 현재 블록의 예측 움직임 벡터를 결정한다. 명시 모드에 따라 적어도 하나의 예측 움직임 벡터 후보들 중 하나의 예측 움직임 벡터 후보를 현재 블록의 예측 움직임 벡터로 결정하거나, 암시 모드에 따라 현재 블록에 인접한 블록 또는 픽셀에 기초해 현재 블록의 예측 움직임 벡터를 결정한다.In step 1420, the motion vector coding apparatus determines a predicted motion vector according to the mode selected in
단계 1430에서 움직임 벡터 부호화 장치는 단계 1420에서 결정된 예측 움직임 벡터에 대한 정보를 부호화한다. 명시 모드의 경우 현재 블록의 예측 움직임 벡터가 적어도 하나의 예측 움직임 벡터 중 하나의 예측 움직임 벡터를 지시하는 정보 및 현재 블록의 예측 움직임 벡터에 대한 정보가 명시 모드에 따라 부호화됨을 지시하는 정보를 부호화한다. 암시 모드의 경우 현재 블록의 예측 움직임 벡터가 현재 블록에 인접한 이전에 부호화된 영역에 포함된 블록 또는 픽셀에 기초해 생성됨을 지시하는 정보를 부호화한다. 복수의 암시 모드가 있는 경우 이 중 하나의 암시 모드를 지시하는 정보도 부호화될 수 있다. In
단계 1440에서 움직임 벡터 부호화 장치는 단계 1420에서 결정된 예측 움직임 벡터를 현재 블록의 움직임 벡터에서 감산하여 생성된 차이 벡터를 부호화한다. In
도 15는 본 발명의 일 실시예에 따른 움직임 벡터를 복호화하는 방법을 설명하기 위한 흐름도이다.15 is a flowchart illustrating a method of decoding a motion vector according to an embodiment of the present invention.
도 15를 참조하면, 본 발명의 일 실시예에 따른 움직임 벡터 복호화 장치는 단계 1510에서 비트스트림에 포함된 현재 블록의 예측 움직임 벡터에 대한 정보를 복호화한다. 명시 모드 및 모시 모드 중 현재 블록의 예측 움직임 벡터를 부호화하는데 이용된 모드에 대한 정보를 복호화한다. Referring to FIG. 15, in
명시 모드의 경우 현재 블록의 예측 움직임 벡터가 명시 모드에 따라 부호화되었음을 지시하는 정보 및 적어도 하나의 예측 움직임 벡터 후보들 중 하나의 예측 움직임 벡터 후보에 대한 정보를 복호화한다. 또한, 암시 모드의 경우 현재 블록의 예측 움직임 벡터가 현재 블록에 인접한 이전에 복호화된 영역에 포함된 블록 또는 픽셀에 기초해 생성됨을 지시하는 정보를 복호화한다. 복수의 암시 모드가 있는 경우 복수의 암시 모드 중 하나의 암시 모드를 지시하는 정보도 함께 복호화될 수 있다.In the explicit mode, information indicating that the predicted motion vector of the current block is coded according to the explicit mode and information on one predicted motion vector candidate of the at least one predicted motion vector candidate are decoded. Further, in the case of the implicit mode, information indicating that the predicted motion vector of the current block is generated based on the block or pixel included in the previously decoded area adjacent to the current block is decoded. If there is a plurality of implicit modes, information indicating one implicit mode of the plurality of implicit modes can also be decoded together.
단계 1520에서 움직임 벡터 복호화 장치는 차이 벡터에 대한 정보를 복호화한다. 차이 벡터는 현재 블록의 예측 움직임 벡터와 현재 블록의 움직임 벡터 사이의 차이에 대한 벡터이다. In
단계 1530에서 움직임 벡터 복호화 장치는 단계 1510에서 복호화된 예측 움직임 벡터에 대한 정보에 기초해 현재 블록의 예측 움직임 벡터를 생성한다. 명시 모드 또는 암시 모드에 따라 현재 블록의 예측 움직임 벡터를 생성한다. 적어도 하나의 예측 움직임 벡터 후보들 중에서 하나의 예측 움직임 벡터를 선택하거나, 현재 블록에 인접한 이전에 복호화된 영역에 포함된 블록 또는 픽셀을 이용해 현재 블록의 예측 움직임 벡터를 생성한다.In
단계 1540에서 움직임 벡터 부호화 장치는 단계 1520에서 복호화된 차이 벡터와 단계 1530에서 생성된 예측 움직임 벡터를 가산하여 현재 블록의 움직임 벡터를 복원한다. In
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명이 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이와 균등하거나 또는 등가적인 변형 모두는 본 발명 사상의 범주에 속한다 할 것이다. 또한, 본 발명에 따른 시스템은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments, but, on the contrary, Modification is possible. Accordingly, the spirit of the present invention should be understood only in accordance with the following claims, and all of the equivalent or equivalent variations will fall within the scope of the present invention. In addition, the system according to the present invention can be embodied as computer-readable codes on a computer-readable recording medium.
예를 들어, 본 발명의 예시적인 실시예에 따른 영상 부호화 장치, 영상 복호화 장치, 영상 부호화부, 영상 복호화부, 움직임 벡터 부호화 장치 및 움직임 벡터 복호화 장치는 도 1, 2, 4, 5, 9 및 13에 도시된 바와 같은 장치의 각각의 유닛들에 커플링된 버스, 상기 버스에 결합된 적어도 하나의 프로세서를 포함할 수 있다. 또한, 명령, 수신된 메시지 또는 생성된 메시지를 저장하기 위해 상기 버스에 결합되어, 전술한 바와 같은 명령들을 수행하기 위한 적어도 하나의 프로세서에 커플링된 메모리를 포함할 수 있다. For example, the image encoding apparatus, the image decoding apparatus, the image encoding unit, the image decoding unit, the motion vector encoding apparatus, and the motion vector decoding apparatus according to the exemplary embodiments of the present invention are shown in FIGS. 1, 2, 4, 5, 9, A bus coupled to each unit of the apparatus as shown at 13, and at least one processor coupled to the bus. It may also include a memory coupled to the bus for storing instructions, received messages or generated messages, and coupled to the at least one processor for performing the instructions as described above.
또한, 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.In addition, the computer-readable recording medium includes all kinds of recording apparatuses in which data that can be read by a computer system is stored. Examples of the recording medium include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, and the like. The computer-readable recording medium may also be distributed over a networked computer system so that computer readable code can be stored and executed in a distributed manner.
Claims (4)
비트스트림으로부터 현재 블록의 예측 모드 정보를 획득하고, 상기 현재 블록의 예측 모드가 인터 예측 모드인 경우 상기 현재 블록의 주변 블록들의 움직임 벡터들로부터 예측 움직임 벡터 후보를 결정하며, 상기 예측 움직임 벡터 후보 중 상기 현재 블록의 예측 움직임 벡터를 결정하는 예측부; 및
상기 예측 움직임 벡터와 상기 비트스트림으로부터 획득된 차이 벡터에 기초하여 상기 현재 블록의 움직임 벡터를 획득하는 움직임 벡터 복원부를 포함하며,
상기 주변 블록들은 상기 현재 블록의 바깥쪽에 위치한 블록들로서, 상기 현재 블록의 좌측 하부에 위치한 제 1 블록, 상기 제 1 블록의 상측에 위치한 제 2 블록, 상기 현재 블록의 우상측에 위치한 제 3 블록, 상기 제 3 블록의 좌측에 위치한 제 4 블록 및 상기 현재 블록의 좌측 상부에 위치한 제 5 블록을 포함하며,
상기 영상은 최대 부호화 단위 크기 정보에 따라서 복수 개의 최대 부호화 단위들로 분할되고, 최대 부호화 단위는 심도를 가지는 하나 이상의 부호화 단위들로 계층적으로 분할되고, 현재 심도를 (k+1)(k는 정수)이라 할 때 현재 심도 (k+1)의 부호화 단위는 k 심도의 부호화 단위로부터 분할된 정사각 데이터 단위들 중 하나인 것을 특징으로 하는 영상 복호화 장치. In the image decoding apparatus,
Determines a predicted motion vector candidate from the motion vectors of neighboring blocks of the current block if the current block's prediction mode is the inter prediction mode, A predictor for determining a predicted motion vector of the current block; And
And a motion vector restoring unit for obtaining a motion vector of the current block based on the predictive motion vector and the difference vector obtained from the bitstream,
Wherein the neighboring blocks are blocks located outside the current block, the first block located at the lower left of the current block, the second block located at the upper side of the first block, the third block located at the upper right side of the current block, A fourth block located on the left side of the third block and a fifth block located on the upper left side of the current block,
The image is divided into a plurality of maximum coding units according to the maximum coding unit size information, the maximum coding unit is hierarchically divided into one or more coding units having a depth, and the current depth is (k + 1) Wherein the encoding unit of the current depth (k + 1) is one of the square data units divided from the k-depth encoding unit.
상기 예측 움직임 벡터 후보는
현재 픽처의 상기 현재 블록과 동일한 위치의 참조 픽처의 동일 위치의 블록의 움직임 벡터를 더 포함하는 것을 특징으로 하는 영상 복호화 장치.The method according to claim 1,
The predicted motion vector candidate is
And a motion vector of a block in the same position of a reference picture at the same position as the current block of the current picture.
상기 예측부는
상기 참조 픽처와 상기 현재 픽처의 시간적 거리에 기초하여 상기 동일 위치의 블록의 움직임 벡터를 스케일링하는 것을 특징으로 하는 영상 복호화 장치.3. The method of claim 2,
The predicting unit
And scales the motion vector of the block at the same position based on the temporal distance between the reference picture and the current picture.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130048512A KR101477546B1 (en) | 2013-04-30 | 2013-04-30 | Apparatus for decoding motion vector |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130048512A KR101477546B1 (en) | 2013-04-30 | 2013-04-30 | Apparatus for decoding motion vector |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090074896A Division KR101452859B1 (en) | 2009-08-13 | 2009-08-13 | Method and apparatus for encoding and decoding motion vector |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130065673A KR20130065673A (en) | 2013-06-19 |
KR101477546B1 true KR101477546B1 (en) | 2014-12-31 |
Family
ID=48862154
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020130048512A KR101477546B1 (en) | 2013-04-30 | 2013-04-30 | Apparatus for decoding motion vector |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101477546B1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020060163A1 (en) * | 2018-09-17 | 2020-03-26 | 한국전자통신연구원 | Image encoding/decoding method and apparatus, and recording medium storing bitstream |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080159401A1 (en) * | 2007-01-03 | 2008-07-03 | Samsung Electronics Co., Ltd. | Method and apparatus for estimating motion vector using plurality of motion vector predictors, encoder, decoder, and decoding method |
-
2013
- 2013-04-30 KR KR1020130048512A patent/KR101477546B1/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080159401A1 (en) * | 2007-01-03 | 2008-07-03 | Samsung Electronics Co., Ltd. | Method and apparatus for estimating motion vector using plurality of motion vector predictors, encoder, decoder, and decoding method |
Non-Patent Citations (1)
Title |
---|
Laroche et al., "RD optimized coding for motion vector predictor selection", IEEE Trans. CSVT, Vol 18, No. 9, 2008.09.. * |
Also Published As
Publication number | Publication date |
---|---|
KR20130065673A (en) | 2013-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101452859B1 (en) | Method and apparatus for encoding and decoding motion vector | |
KR101522850B1 (en) | Method and apparatus for encoding/decoding motion vector | |
KR101859451B1 (en) | Method and apparatus for encoding/decoding image by using motion vector of previous block as motion vector of current block | |
KR20180121862A (en) | Method and apparatus for encoding/decoding motion vector based on reduced motion vector predictor candidates | |
KR101676791B1 (en) | Method for decoding an image | |
KR101691553B1 (en) | Method and apparatus for decoding image | |
KR101635111B1 (en) | Method and apparatus for encoding/decoding motion vector | |
KR101882949B1 (en) | Method and apparatus for encoding image, and computer-readable medium | |
KR101783965B1 (en) | Method and apparatus for decoding image | |
KR101477546B1 (en) | Apparatus for decoding motion vector | |
KR101477545B1 (en) | Method for decoding motion vector | |
KR101635114B1 (en) | Method for decoding an image | |
KR101617796B1 (en) | Method and apparatus for decoding image | |
KR101606812B1 (en) | Method and apparatus for decoding image | |
KR101454664B1 (en) | Method for decoding motion vector | |
KR101617334B1 (en) | Method and apparatus for encoding/decoding motion vector | |
KR101424977B1 (en) | Method and apparatus for encoding/decoding motion vector |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
A302 | Request for accelerated examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20171129 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20181129 Year of fee payment: 5 |