KR20220040451A - A method of decoding a video signal and an apparatus having the same - Google Patents
A method of decoding a video signal and an apparatus having the same Download PDFInfo
- Publication number
- KR20220040451A KR20220040451A KR1020220035103A KR20220035103A KR20220040451A KR 20220040451 A KR20220040451 A KR 20220040451A KR 1020220035103 A KR1020220035103 A KR 1020220035103A KR 20220035103 A KR20220035103 A KR 20220035103A KR 20220040451 A KR20220040451 A KR 20220040451A
- Authority
- KR
- South Korea
- Prior art keywords
- transform
- block
- unit
- prediction
- information
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
본 발명은 비디오 신호의 복호화 방법 및 이의 장치에 관한 것으로서, 더욱 상세하게는, 복수 개의 변환 영역별로 변환 계수 그룹을 스캔하는 비디오 신호의 복호화 방법 및 이의 장치에 관한 것이다.The present invention relates to a method and apparatus for decoding a video signal, and more particularly, to a method and apparatus for decoding a video signal for scanning a transform coefficient group for each of a plurality of transform regions.
최근 HD(High Definition) 영상 및 UHD(Ultra High Definition) 영상과 같은 고해상도, 고품질의 영상에 대한 수요가 다양한 응용 분야에서 증가하고 있다. 영상 데이터가 고해상도, 고품질이 될수록 기존의 영상 데이터에 비하여 상대적으로 데이터량이 증가하기 때문에, 기존의 유무선 광대역 회선과 같은 매체를 이용하여 영상 데이터를 전송하거나 기존의 저장 매체를 이용하여 저장하는 경우, 전송 비용과 저장 비용이 증가하게 된다. 영상 데이터가 고해상도, 고품질화 됨에 따라 발생하는 이러한 문제들을 해결하기 위하여 고효율의 영상 압축 기술들이 활용될 수 있다.Recently, the demand for high-resolution and high-quality images such as HD (High Definition) images and UHD (Ultra High Definition) images is increasing in various application fields. Since the amount of data increases relative to the existing image data as the image data becomes high-resolution and high-quality, when transmitting image data using a medium such as an existing wired/wireless broadband line or storing it using an existing storage medium, the transmission Costs and storage costs will increase. High-efficiency image compression techniques can be used to solve these problems that occur as image data becomes high-resolution and high-quality.
비디오 압축 기술들에서는, 종래의 압축 기술에 비하여 2 배 이상으로 압축률을 향상시키기 위하여 다양한 효과적인 방법들을 채택하고 있다. 화면간 예측 기술로는 모션 벡터 예측자(Motion Vector Predictor)를 이용하는 방법, 머지 모드 및 스킵 모드를 이용하는 방법들이 사용된다. 이는 모두 화면간 예측을 효율적으로 하기 위한 기술들이다.In video compression techniques, various effective methods are employed to improve the compression ratio by more than two times compared to the conventional compression techniques. As an inter prediction technique, a method using a motion vector predictor, a method using a merge mode, and a skip mode are used. These are all techniques for efficiently performing inter-screen prediction.
또한, 기존의 비디오 코덱들은 하나의 픽쳐를 16x16 크기 블록 단위인 매크로 블록(Macro Block)으로 분할하여 분할하였으나, 최근 HEVC 에서는 부호화 기본단위로서 코딩 유닛(Coding Unit: CU)을 이용하고 있다. 상기 코딩 유닛은 시퀀스 파라미터 셋에 저장된 파라미터값이 지정하는 최대 및 최소 크기까지 분할될 수 있다. 예측 부호화를 위한 기본 단위는 예측 유닛(Prediction Unit: PU)로 정의되며, 상기 하나의 코딩 유닛은 복수 개의 상기 예측 유닛으로 분할되어 예측되다. 또한, 각 코딩 유닛의 부호화 및 복호화 순서는 래스터 스캔(Raster scan) 방식을 이용한다.In addition, in existing video codecs, one picture is divided and split into macroblocks, which are 16x16 block units. However, in recent HEVC, a coding unit (CU) is used as a coding basic unit. The coding unit may be divided up to the maximum and minimum sizes specified by the parameter values stored in the sequence parameter set. A basic unit for prediction encoding is defined as a prediction unit (PU), and the one coding unit is divided into a plurality of the prediction units and predicted. In addition, the encoding and decoding order of each coding unit uses a raster scan method.
이와 같이, HEVC 에서는 다양한 크기의 코딩 유닛을 이용함으로써, 영상의 공간 해상도 및 블록 특성을 효과적으로 고려하여 부호화할 수 있다. 일반적으로 영상의 해상도가 작거나 화소값들이 국지적으로 크게 변화하는 경우에는 작은 크기의 코딩 유닛들을 이용하여 화면내 및 화면간 예측을 수행하는 것이 효율적일 수 있다. 이와 같이, 작은 크기의 코딩 유닛을 이용하는 경우, 부호화에 필요한 헤더 비트량은 증가하지만, 상대적으로 예측이 정밀하게 이루어져 양자화 에러와 변환 계수의 부호화에 필요한 비트량이 감소하는 장점이 있다. As described above, in HEVC, by using coding units of various sizes, it is possible to perform encoding in consideration of spatial resolution and block characteristics of an image effectively. In general, when the resolution of an image is small or pixel values vary greatly locally, it may be effective to perform intra- and inter-screen prediction using small-sized coding units. As described above, when a coding unit having a small size is used, the amount of header bits required for encoding increases, but prediction is relatively precise, so that a quantization error and an amount of bits required for encoding a transform coefficient are reduced.
반대로, 영상의 공간 해상도가 크거나 화소값들의 변화가 적은 영역에서는 큰 코딩 유닛을 이용하는 것이 부호화 효율을 높일 수 있다. 이 경우, 큰 코딩 유닛을 이용하여도 작은 코딩 유닛을 이용하여 예측하는 경우에 비하여 예측 오차가 크게 증가하지 않는 경향이 있으므로 이러한 블록들을 부호화하는 경우, 큰 코딩 유닛을 이용하여 전송 비트량을 절약하는 것이 효율적일 수 있다. 그러나, 종래의 다양한 코딩 유닛을 이용하더라도 높은 해상도를 갖는 다양한 이미지를 효율적으로 코딩하기 어려운 단점이 있다.Conversely, in a region where the spatial resolution of an image is large or a change in pixel values is small, using a large coding unit may increase encoding efficiency. In this case, even when using a large coding unit, the prediction error tends not to increase significantly compared to the case of prediction using a small coding unit. Therefore, when these blocks are encoded, the amount of transmission bits is saved using a large coding unit. can be efficient. However, there is a disadvantage in that it is difficult to efficiently code various images having high resolution even using various conventional coding units.
본 발명이 해결하고자 하는 과제는 다양한 모양의 변환 블록을 이용하여 화면내 예측의 코딩 효율을 향상시키는 비디오 신호의 복호화 방법 및 이의 장치를 제공하는 것이다.SUMMARY OF THE INVENTION It is an object of the present invention to provide a video signal decoding method and apparatus for improving coding efficiency of intra prediction using transform blocks having various shapes.
또한, 본 발명이 해결하고자 하는 다른 과제는 고주파 영역보다 저주파 영역의 변환 계수 그룹을 먼저 코딩함으로써, 코딩 효율을 높일 수 있는 비디오 신호의 복호화 방법 및 이의 장치를 제공하는 것이다.Another object to be solved by the present invention is to provide a method and an apparatus for decoding a video signal capable of increasing coding efficiency by first coding a transform coefficient group in a low frequency domain rather than a high frequency domain.
상기 과제를 해결하기 위한 본 발명의 일 실시예에 따른 비디오 신호의 복호화 방법은, 복수 개의 변환 계수 그룹을 포함하는 변환 블록을 스캔하는 방법에 있어서, 상기 변환 블록에 포함되는 적어도 하나 이상의 변환 영역을 나타내는 변환 영역 정보를 획득하는 단계; 상기 변환 영역 정보에 기초하여 제 1 변환 영역에 포함되는 복수 개의 변환 계수 그룹을 스캔하는 단계; 상기 변환 블록 내의 제 2 변환 영역에 포함되는 복수 개의 변환 계수 그룹을 스캔하는 단계를 포함한다.In a method for decoding a video signal according to an embodiment of the present invention for solving the above problems, in a method of scanning a transform block including a plurality of transform coefficient groups, at least one transform region included in the transform block is provided. obtaining information on the transformation region representing the; scanning a plurality of transform coefficient groups included in a first transform domain based on the transform domain information; and scanning a plurality of transform coefficient groups included in a second transform region in the transform block.
상기 복수 개의 변환 계수 그룹은 저주파 영역의 변환 계수 그룹이 고주파 영역의 변환 계수 그룹보다 선행하여 스캔될 수 있다.In the plurality of transform coefficient groups, a transform coefficient group of a low frequency domain may be scanned before a transform coefficient group of a high frequency domain.
일 실시예에서, 상기 변환 영역 정보는 인코더로부터 수신되거나 시퀀스 파라미터 셋(SPS) 및 슬라이스 헤더 중 적어도 하나 이상으로부터 획득될 수 있다. 또한, 상기 변환 영역 정보는 복호화기에서 기결정된 방법으로 획득될 수 있다.In an embodiment, the transform domain information may be received from an encoder or obtained from at least one of a sequence parameter set (SPS) and a slice header. Also, the transform domain information may be obtained by a predetermined method in the decoder.
상기 변환 영역 정보를 획득하는 단계 이전에, 상기 변환 블록이 비정방형 블록인지 판단하는 단계를 더 포함할 수 있다. 상기 판단하는 단계는 상기 변환 블록의 가로의 길이 및 세로의 길이에 기초하여 수행될 수 있다.Prior to obtaining the transform domain information, the method may further include determining whether the transform block is a non-square block. The determining may be performed based on a horizontal length and a vertical length of the transform block.
상기 다른 과제를 해결하기 위한 본 발명의 일 실시예에 따른 비디오 신호의 복호화 장치는, 변환 블록에 포함되는 적어도 하나 이상의 변환 영역을 나타내는 변환 영역 정보를 획득하는 변환 영역 정보 획득부; 및 상기 변환 영역 정보에 기초하여 상기 적어도 하나 이상의 변환 영역별로 상기 변환 영역에 포함되는 복수 개의 변환 계수 그룹을 차례로 스캔하는 변환 계수 그룹 스캔부를 포함할 수 있다.According to an aspect of the present invention, there is provided an apparatus for decoding a video signal, comprising: a transform domain information obtaining unit configured to obtain transform domain information indicating at least one transform domain included in a transform block; and a transform coefficient group scan unit configured to sequentially scan a plurality of transform coefficient groups included in the transform region for each of the at least one transform region based on the transform region information.
본 발명의 실시예에 따르면, 변환 블록이 비정방형 블록인 경우 상기 변환 블록을 복수 개의 변환 계수 그룹 중 일부를 포함하는 적어도 하나 이상의 변환 영역으로 분할하여 상기 변환 영역 내에 포함된 변환 계수 그룹들을 차례로 스캔함으로써, 화면내 예측의 코딩 효율을 향상시키는 비디오 신호의 복호화 방법 및 이의 장치를 제공하는 것이다.According to an embodiment of the present invention, when the transform block is a non-square block, the transform block is divided into at least one transform domain including a part of a plurality of transform coefficient groups, and the transform coefficient groups included in the transform domain are sequentially scanned. Accordingly, it is an object of the present invention to provide a video signal decoding method and apparatus for improving the coding efficiency of intra prediction.
또한, 본 발명의 다른 실시예에 따르면, 변환 블록을 적어도 하나 이상의 변환 영역으로 분할하고, 상기 분할된 변환 영역 내에 포함된 변환 계수 그룹들을 차례로 스캔함으로써, 고주파 영역보다 저주파 영역의 변환 계수 그룹을 먼저 코딩함으로써 코딩 효율을 높일 수 있는 비디오 신호의 복호화 방법 및 이의 장치를 제공하는 것이다.In addition, according to another embodiment of the present invention, by dividing a transform block into at least one transform region and sequentially scanning transform coefficient groups included in the divided transform region, the transform coefficient group of the low frequency region is selected before the high frequency region. An object of the present invention is to provide a method and apparatus for decoding a video signal capable of increasing coding efficiency by coding.
도 1은 본 발명의 일 실시예에 따른 비디오 부호화 장치를 개략적으로 나타낸 블록도이다.
도 2는 본 발명의 일 실시예에 따른 비디오 복호화 장치를 개략적으로 나타낸 블록도이다.
도 3은 종래의 변환 블록의 구조를 설명하기 위한 것이다.
도 4는 종래의 16x16 변환 블록을 구성하는 변환 계수 그룹을 설명하기 위한 것이다.
도 5는 일반적인 방법에 따른 변환 계수 그룹 및 상기 변환 계수 그룹의 변환 스캔 방법을 설명하기 위한 것이다.
도 6a 내지 도 6d는 일반적인 방법에 따른 변환 계수 그룹 및 상기 변환 계수 그룹의 스캔 방법의 종류를 설명하기 위한 것이다.
도 7a 및 도 7b는 본 발명의 일 실시예에 따른 변환 블록에 일반적인 스캔 방법을 적용한 예를 설명하기 위한 것이다.
도 8은 16x8 변환 블록의 변환 계수에 대하여 일반적인 스캔 방법을 적용한 예를 설명하기 위한 것이다.
도 9는 본 발명의 일 실시예에 따른 변환 계수 그룹을 스캔하는 방법을 나타내는 순서도이다.
도 10는 본 발명의 일 실시예에 따른 변환 계수 그룹을 스캔하는 장치를 도시한 것이다.
도 11a 및 도 11b는 본 발명의 일 실시예에 따른 비정방형 변환 블록을 위한 변환 계수 그룹을 스캔하는 방법을 설명하기 위한 것이다.
도 12a 내지 도 13d는 본 발명의 일 실시예에 따른 비정방형 변환 블록을 위한 변환 계수 그룹을 스캔하는 다양한 방법을 설명하기 위한 예이다.1 is a schematic block diagram of a video encoding apparatus according to an embodiment of the present invention.
2 is a block diagram schematically illustrating a video decoding apparatus according to an embodiment of the present invention.
3 is for explaining the structure of a conventional transform block.
4 is a diagram for describing a transform coefficient group constituting a conventional 16x16 transform block.
5 is a diagram for describing a transform coefficient group and a transform scan method of the transform coefficient group according to a general method.
6A to 6D are for describing a transform coefficient group according to a general method and types of scanning methods for the transform coefficient group.
7A and 7B are for explaining an example in which a general scan method is applied to a transform block according to an embodiment of the present invention.
FIG. 8 is for explaining an example in which a general scan method is applied to transform coefficients of a 16x8 transform block.
9 is a flowchart illustrating a method of scanning a transform coefficient group according to an embodiment of the present invention.
10 illustrates an apparatus for scanning a transform coefficient group according to an embodiment of the present invention.
11A and 11B are for explaining a method of scanning a transform coefficient group for a non-square transform block according to an embodiment of the present invention.
12A to 13D are examples for explaining various methods of scanning a transform coefficient group for a non-square transform block according to an embodiment of the present invention.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하기로 한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.
본 발명의 실시예들은 당해 기술 분야에서 통상의 지식을 가진 자에게 본 발명을 더욱 완전하게 설명하기 위하여 제공되는 것이며, 하기 실시예는 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 하기 실시예에 한정되는 것은 아니다. 오히려, 이들 실시예는 본 개시를 더욱 충실하고 완전하게 하고, 당업자에게 본 발명의 사상을 완전하게 전달하기 위하여 제공되는 것이다.Examples of the present invention are provided to more completely explain the present invention to those of ordinary skill in the art, and the following examples may be modified in various other forms, and the scope of the present invention is as follows It is not limited to an Example. Rather, these examples are provided so that this disclosure will be more thorough and complete, and will fully convey the spirit of the invention to those skilled in the art.
또한, 도면에서 각 유닛의 두께나 크기는 설명의 편의 및 명확성을 위하여 과장된 것이며, 도면상에서 동일 부호는 동일한 요소를 지칭한다. 본 명세서에서 사용된 바와 같이, 용어 "및/또는"은 해당 열거된 항목 중 어느 하나 및 하나 이상의 모든 조합을 포함한다.In addition, in the drawings, the thickness or size of each unit is exaggerated for convenience and clarity of description, and the same reference numerals in the drawings refer to the same elements. As used herein, the term “and/or” includes any one and all combinations of one or more of those listed items.
본 명세서에서 사용된 용어는 특정 실시예를 설명하기 위하여 사용되며, 본 발명을 제한하기 위한 것이 아니다. 본 명세서에서 사용된 바와 같이, 단수 형태는 문맥상 다른 경우를 분명히 지적하는 것이 아니라면, 복수의 형태를 포함할 수 있다. 또한, 본 명세서에서 사용되는 경우 "포함한다 (comprise)" 및/또는 "포함하는 (comprising)"은 언급한 형상들, 숫자, 단계, 동작, 부재, 요소 및/또는 이들 그룹의 존재를 특정하는 것이며, 하나 이상의 다른 형상, 숫자, 동작, 부재, 요소 및/또는 그룹들의 존재 또는 부가를 배제하는 것이 아니다.The terminology used herein is used to describe specific embodiments, not to limit the present invention. As used herein, the singular form may include the plural form unless the context clearly dictates otherwise. Also, as used herein, “comprise” and/or “comprising” refers to the specified presence of the recited shapes, numbers, steps, actions, members, elements, and/or groups thereof. and does not exclude the presence or addition of one or more other shapes, numbers, movements, members, elements and/or groups.
본 명세서에서 제 1, 제 2 등의 용어가 다양한 구성요소, 부재, 부품, 영역, 및/또는 부분들을 설명하기 위하여 사용되지만, 이들 구성요소, 부재, 부품, 영역, 및/또는 부분들은 이들 용어에 의해 한정되어서는 안됨은 자명하다. 이들 용어는 하나의 구성요소, 부재, 부품, 영역 또는 부분을 다른 영역 또는 부분과 구별하기 위하여만 사용된다. 따라서, 이하 상술할 제 1 구성요소, 부재, 부품, 영역 또는 부분은 본 발명의 가르침으로부터 벗어나지 않고서도 제 2 구성요소, 부재, 부품, 영역 또는 부분을 지칭할 수 있다. 또한, 및/또는 용어는 복수의 관련되어 기재되는 항목들의 조합 또는 복수의 관련되어 기재되는 항목들 중의 어느 항목을 포함한다.Although the terms first, second, etc. are used herein to describe various components, members, parts, regions, and/or parts, these components, members, parts, regions, and/or parts are used herein to refer to these terms. It is obvious that it should not be limited by These terms are used only to distinguish one component, member, part, region or portion from another region or portion. Accordingly, a first component, member, component, region or portion discussed below may refer to a second component, member, component, region or portion without departing from the teachings of the present invention. Also, and/or terms include combinations of a plurality of related recited items or any of a plurality of related recited items.
어느 구성요소가 다른 구성요소에 "연결되어" 있거나 "접속되어" 있다고 언급되는 경우에는, 상기 다른 구성요소에 직접적으로 연결되어 있거나 접속되어 있는 경우 뿐만 아니라, 상기 어느 구성요소와 상기 다른 구성요소 사이에 다른 구성요소가 존재하는 경우를 포함하여 이해되어야 한다. 그러나, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있거나 "직접 접속되어" 있다고 지칭되는 경우에는, 중간에 다른 구성요소가 존재하지 아니하고 상기 어느 구성요소와 상기 다른 구성요소가 직접 연결 또는 접속된 것으로 이해되어야 할 것이다.When a component is referred to as being “connected” or “connected” to another component, it is not only directly connected or connected to the other component, but also between the component and the other component. It should be understood including the case where other components exist in However, when a component is referred to as being “directly connected” or “directly connected” to another component, there is no other component in the middle and the component and the other component are directly connected or connected to each other. should be understood as being
이하, 본 발명의 실시예들은 본 발명의 이상적인 실시예들을 개략적으로 도시하는 도면들을 참조하여 설명한다. 도면들에 있어서, 예를 들면, 부재들의 크기와 형상은 설명의 편의와 명확성을 위하여 과장될 수 있으며, 실제 구현시, 도시된 형상의 변형들이 예상될 수 있다. 따라서, 본 발명의 실시예는 본 명세서에 도시된 영역의 특정 형상에 제한된 것으로 해석되어서는 아니된다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, embodiments of the present invention will be described with reference to the drawings schematically illustrating ideal embodiments of the present invention. In the drawings, for example, the size and shape of the members may be exaggerated for convenience and clarity of description, and in actual implementation, variations of the illustrated shape may be expected. Accordingly, embodiments of the present invention should not be construed as limited to the specific shapes of the regions shown herein.
도 1은 본 발명의 일 실시예에 따른 영상 부호화 장치를 개략적으로 나타낸 블록도이다.1 is a block diagram schematically illustrating an image encoding apparatus according to an embodiment of the present invention.
도 1을 참조하면, 영상 부호화 장치(100)는 영상 분할부(105), 화면간 예측부(110), 화면내 예측부(115), 변환부(120), 양자화부(125), 재정렬부(130), 엔트로피 부호화부(135), 역양자화부(140), 역변환부(145), 필터부(150) 및 메모리(155)를 포함한다. Referring to FIG. 1 , the
도 1에 나타난 각 구성요소들은 영상 부호화 장치에서 서로 다른 특징적인 기능들을 나타내기 위하여 독립적으로 도시한 것이며, 각 구성요소들이 분리된 하드웨어나 각각 하나의 소프트웨어 구성단위로 이루어짐을 의미하지 않는다. 즉, 각 구성요소는 설명의 편의상 각각의 구성요소로 나열하여 포함한 것으로 각 구성요소 중 적어도 두 개의 구성요소가 합쳐져 하나의 구성요소로 이루어지거나, 하나의 구성요소가 복수개의 구성요소로 나뉘어져 기능을 수행할 수 있다. 이러한 각 구성요소가 통합된 실시예 또는 분리된 실시예도 본 발명의 본질적인 측면에서 벗어나지 않는 한 본 발명의 권리범위에 포함될 수 있다.Each component shown in FIG. 1 is independently illustrated to represent different characteristic functions in the image encoding apparatus, and does not mean that each component is composed of separate hardware or one software component. That is, each component is listed as each component for convenience of description, and at least two components of each component are combined to form one component, or one component is divided into a plurality of components to provide a function. can be done An embodiment in which each of these components is integrated or a separate embodiment may be included in the scope of the present invention without departing from the essential aspect of the present invention.
영상 분할부(105)는 입력된 영상을 적어도 하나의 처리 단위로 분할할 수 있다. 상기 처리 단위는 예측 블록(Prediction Unit, 이하 "PU"라 함)일 수 있고, 변환 블록(Transform Unit, 이하 "TU"라 함)일 수도 있으며, 코딩 블록(Coding Unit, 이하 "CU"라 함)일 수도 있다. 다만, 본 명세서에서는 설명의 편의를 위해, 예측 블록을 예측 단위, 변환 블록을 변환 단위, 부호화 또는 복호화 블록을 부호화 단위 또는 복호화 단위로 표현할 수도 있다.The
일 실시예에서, 영상 분할부(105)는 하나의 영상에 대하여 복수의 부호화 블록, 예측 블록, 및 변환 블록의 조합으로 분할하고, 소정의 기준(예를 들어, 비용 함수)에 기초하여 하나의 부호화 블록, 예측 블록, 및 변환 블록의 조합을 선택하여 영상을 부호화할 수 있다.In an embodiment, the
예를 들어, 하나의 영상은 복수 개의 코딩 블록으로 분할될 수 있다. 일 실시예에서, 하나의 영상은 쿼드 트리 구조(Quad Tree Structure) 또는 바이너리 트리 구조와 같은 재귀적인 트리 구조를 사용하여 상기 코딩 블록을 분할할 수 있으며, 하나의 영상 또는 최대 크기 코딩 블록(largest coding unit)를 루트로 하여 다른 코딩 블록으로 분할되는 코딩 블록은 분할된 코딩 블록의 개수만큼의 자식 노드를 가지고 분할될 수 있다. 이러한 과정을 통하여 더 이상 분할되지 아니하는 코딩 블록은 리프 노드가 될 수 있다. 예를 들어, 하나의 코딩 블록에 대하여 정방형 분할만이 가능하다고 가정한 경우에는 하나의 코딩 블록은 예를 들어, 4 개의 코딩 블록으로 분할될 수 있다. 그러나, 본 발명에서는 상기 코딩 블록, 예측 블록 및/또는 변환 블록은 분할 시 대칭 분할에 한정하지 아니하고, 비대칭 분할(Asymmetric Partition)도 가능하며 4 개의 분할 뿐만 아니라 2 개의 분할도 가능하다. 그러나, 이러한 분할 개수는 예시적일 뿐 본 발명이 이에 한정되는 것은 아니다. For example, one image may be divided into a plurality of coding blocks. In an embodiment, one picture may divide the coding block using a recursive tree structure such as a quad tree structure or a binary tree structure, and one picture or a largest coding block (largest coding block) unit) as a root, a coding block divided into other coding blocks may be divided having as many child nodes as the number of divided coding blocks. A coding block that is no longer divided through this process may become a leaf node. For example, if it is assumed that only square division is possible with respect to one coding block, one coding block may be divided into, for example, four coding blocks. However, in the present invention, the coding block, the prediction block, and/or the transform block are not limited to symmetric partitioning when partitioning, and an asymmetric partition is also possible, and not only four partitions but also two partitions are possible. However, the number of divisions is merely exemplary and the present invention is not limited thereto.
예측 블록도 하나의 코딩 블록 내에서 동일한 크기의 적어도 하나의 정방형(square) 또는 비정방형(non-square) 등의 형태를 가지고 분할된 것일 수 있고, 하나의 코딩 블록 내에서 분할된 예측 블록 중 어느 하나의 예측 블록이 다른 하나의 예측 블록과 상이한 형태와 크기를 가지도록 분할될 수도 있다. 일 실시예에서는, 코딩 블록과 예측 블록이 동일할 수 있다. 즉, 코딩 블록과 예측 블록을 구분하지 아니하고, 분할된 코딩 블록을 기준으로 예측이 수행될 수도 있다. The prediction block may also be partitioned in the form of at least one square or non-square having the same size within one coding block, and any of the prediction blocks divided within one coding block. One prediction block may be divided to have a shape and size different from that of the other prediction block. In one embodiment, the coding block and the prediction block may be the same. That is, the prediction may be performed based on the divided coding block without distinguishing the coding block and the prediction block.
예측부는 화면간 예측(inter prediction)을 수행하는 화면간 예측부(110) 및 화면내 예측(intra prediction)을 수행하는 화면내 예측부(115)를 포함할 수 있다. 코딩 효율을 높이기 위하여, 영상 신호를 그대로 부호화하는 것이 아니라, 이미 부호화 및 복호화가 완료된 영상 내부의 특정 영역을 이용하여 영상을 예측하고, 원래의 영상과 예측 영상 사이의 레지듀얼 값을 부호화한다. 또한, 예측을 위하여 사용된 예측 모드 정보, 모션 벡터 정보 등은 레지듀얼 값과 함께 엔트로피 부호화부(135)에서 부호화되어 복호화부에 전달될 수 있다. 특정한 부호화 모드를 이용하는 경우에는 화면간 예측부(110) 및 화면내 예측부(115)를 통하여 예측 블록을 생성하지 아니하고, 원본 블록을 그대로 부호화하여 복호화부에 전송하는 것도 가능하다.The prediction unit may include an
일 실시예에서, 화면간 예측부(110) 및 화면내 예측부(115)는 예측 블록에 대하여 화면간 예측을 수행할 것인지 화면내 예측을 수행할 것인지를 결정하고, 화면간 예측 모드, 모션 벡터, 및 참조 영상과와 같은 상기 예측 방법 각각에 따른 구체적인 정보들을 결정할 수 있다. 이 경우, 예측이 수행되는 처리 단위와 예측 방법, 그리고 세부 처리 단위는 각각 다를 수 있다. 예를 들어, 예측 모드와 예측 방법은 예측 블록에 따라 결정되더라도, 예측의 수행은 변환 블록에 따라 수행될 수 있다.In an embodiment, the
화면간 예측부(110) 및 화면내 예측부(115)는, 영상 분할부(105)에서 분할된 영상의 처리 단위에 대하여 예측을 수행하여 예측된 샘플로 구성되는 예측 블록을 생성할 수 있다. 화면간 예측부(110) 및 화면내 예측부(115)에서의 영상 처리 단위는 코딩 블록 단위일 수 있고, 변환 블록 단위일 수도 있으며, 예측 블록 단위일 수도 있다.The
화면간 예측부(110)는 현재 영상의 이전 영상 또는 이후 영상 중 적어도 하나 이상의 영상의 정보를 기초로 예측 블록을 예측할 수 있고, 경우에 따라 현재 영상 내의 코딩이 완료된 일부 영역의 정보를 기초로 예측 블록을 예측할 수 있다. 화면간 예측부(110)는 참조 영상 보간부, 모션 예측부, 및 모션보상부를 포함할 수 있다.The
일 실시예에서, 화면간 예측부(110)에서 예측을 위하여 이용되는 상기 하나 이상의 영상의 정보는 이미 부호화 및 복호화가 진행된 영상들의 정보일 수 있고, 임의의 방법으로 변형되어 저장된 영상들의 정보일 수 있다. 예를 들어, 상기 임의의 방법으로 변형되어 저장된 영상은 부호화 및 복호화가 진행된 영상을 확대 또는 축소한 영상일 수 있고, 또는 영상 내의 모든 픽셀 값의 밝기를 변형시키거나, 칼라 포맷을 변형시킨 영상일 수도 있다. In an embodiment, the information of the one or more images used for prediction by the
참조 영상 보간부는 메모리(155)로부터 참조 영상 정보를 제공받아 참조 영상에서 정수 픽셀 이하의 픽셀 정보를 생성할 수 있다. 휘도 픽셀의 경우, 필터의 계수를 달리하는 DCT 기반의 8-탭 보간 필터(DCT-based Interpolation Filter)를 이용하여 1/4 픽셀 단위로 정수 이하의 픽셀 정보를 생성할 수 있다. 색차 신호의 경우에는 필터의 계수를 달리하는 DCT 기반의 4-탭 보간 필터(DCT-based Interpolation Filter)를 이용하여 1/8 픽셀 단위로 정수 이하의 픽셀 정보를 생성할 수 있다. 그러나, 필터의 종류 및 정수 이하의 픽셀 정보를 생성하는 단위는 이에 한정되지는 아니하고, 다양한 보간 필터를 이용하여 정수 이하의 픽셀 정보를 생성하는 단위가 결정될 수 있을 것이다.The reference image interpolator may receive reference image information from the
모션 예측부는 상기 참조 영상 보간부에 의하여 보간된 참조 영상을 기초로 하여 모션 예측을 수행할 수 있다. 모션 벡터를 산출하기 위하여 다양한 방법이 사용될 수 있다. 모션 벡터는 보간된 픽셀을 기초로 하여 정수 픽셀 단위 또는 1/2 또는 1/4 픽셀 단위의 모션 벡터값을 가질 수 있다. 일 실시예에서는, 모션 예측부에서 모션 예측 방법을 다르게 하여 현재 블록의 예측 단위를 예측할 수 있다. 상기 모션 예측 방법은 머지(Merge) 방법, AMVP(Advanced Motion Vector Prediction) 방법, 및 스킵(Skip) 방법을 포함하여 다양한 방법이 사용될 수 있다. 이와 같이, 화면간 예측부(110)에서 선택된 참조 영상의 인덱스, 예측 모션 벡터(MVP), 레지듀얼 신호를 포함하는 정보들은 엔트로피 코딩되어 복호화기로 전송될 수 있다.The motion predictor may perform motion prediction based on the reference image interpolated by the reference image interpolator. Various methods may be used to calculate the motion vector. The motion vector may have a motion vector value in integer pixel units or in 1/2 or 1/4 pixel units based on interpolated pixels. In an embodiment, the motion prediction unit may predict the prediction unit of the current block by using a different motion prediction method. Various methods may be used as the motion prediction method, including a merge method, an advanced motion vector prediction (AMVP) method, and a skip method. As described above, information including the index of the reference image selected by the
화면내 예측부(115)는 화면간 예측과 달리 현재 영상 내의 픽셀 정보인 현재 블록 주변의 참조 픽셀 정보들을 기초로 하여 예측 블록을 생성할 수 있다. 상기 예측 블록의 주변 블록들은 화면간 예측을 수행한 블록인 경우, 즉, 참조 픽셀이 화면간 예측을 수행한 픽셀인 경우에는 화면간 예측을 수행한 블록에 포함되는 참조 픽셀을 주변의 화면내 예측을 수행한 블록의 참조 픽셀 정보로 대체하여 사용할 수도 있다. Unlike inter prediction, the
또한, 화면내 예측부(115)는 화면내 예측 모드를 부호화하기 위하여 이웃 블록들로부터 획득한 가장 가능성 있는 화면내 예측 모드(MPM : Most Probable mode)를 이용할 수 있다. 본 발명의 다양한 실시예에 따르면, 상기 가장 가능성 있는 화면내 예측 모드들로 구성되는 가장 가능성 있는 화면내 예측 모드 리스트(MPM List)는 다양한 방법으로 구성될 수 있다. Also, the
화면내 예측부(115)가 화면내 예측을 수행하는 경우에도 예측이 수행되는 처리 단위와 예측 방법 및 구체적인 내용이 정해지는 처리 단위는 서로 다를 수 있다. 예를 들어, 예측 모드가 예측 단위(PU)로 정해져서 상기 예측 단위로 예측이 수행될 수도 있고, 예측 모드는 예측 단위로 정해지되 예측의 수행은 변환 단위(TU)로 수행될 수도 있다. 일 실시예에서, 예측 모드가 코딩 블록(CU) 단위로 결정되고, 상기 코딩 블록 단위와 예측 단위가 동일하여 상기 코딩 블록 단위로 예측이 수행될 수도 있다.Even when the
화면내 예측의 예측 모드는 65개의 방향성 예측 모드 및 적어도 2 개 이상의 비방향성 모드를 포함할 수 있다. 상기 비방향성 모드는 DC 예측 모드 및 플래너 모드(Planar Mode)를 포함할 수 있다. 상기 67개의 화면간 예측 모드의 개수는 예시적일 뿐, 본 발명이 이에 한정되는 것은 아니며, 다양한 방법으로 예측하기 위하여 더 많은 방향성 또는 비방향성 모드로 화면내 예측을 수행할 수 있다.The prediction mode of intra prediction may include 65 directional prediction modes and at least two non-directional modes. The non-directional mode may include a DC prediction mode and a planar mode. The number of the 67 inter prediction modes is only an example, and the present invention is not limited thereto. In order to make predictions in various ways, intra prediction may be performed in more directional or non-directional modes.
일 실시예에서, 화면내 예측은 참조 픽셀에 필터를 적용한 후 예측 블록을 생성할 수 있다. 이 경우, 상기 참조 픽셀에 필터를 적용할지 여부는 현재 블록의 화면내 예측 모드 및/또는 크기에 따라 결정될 수 있다.In an embodiment, intra prediction may generate a prediction block after applying a filter to a reference pixel. In this case, whether to apply the filter to the reference pixel may be determined according to the intra prediction mode and/or size of the current block.
예측 단위(PU)는 더 이상 분할되지 않는 코딩 유닛(CU)으로부터 다양한 사이즈 및 형태로 결정될 수 있다. 예를 들어, 화면간 예측의 경우 예측 단위는 2N x 2N, 2N x N, N x 2N 또는 N x N와 같은 크기를 가질 수 있다. 화면내 예측의 경우 예측 단위는 2N x 2N 또는 N x N (N은 정수)와 같은 크기를 가질 수 있으나, 이와 같은 정방향 크기 뿐만 아니라 비정방향 크기 모양으로도 화면내 예측을 수행할 수 있다. 이 경우, N x N 크기의 예측 단위는 특정한 경우에만 적용하도록 설정할 수도 있다. 또한, 상술한 크기의 예측 단위 이외에도, N x mN, mN x N, 2N x mN 또는 mN x 2N (m은 분수 또는 정수임) 와 같은 크기를 갖는 화면내 예측 단위를 더 정의하여 사용할 수도 있다.A prediction unit (PU) may be determined in various sizes and shapes from a coding unit (CU) that is no longer split. For example, in the case of inter prediction, the prediction unit may have a size such as 2N x 2N, 2N x N, N x 2N, or N x N. In the case of intra prediction, the prediction unit may have a size such as 2N x 2N or N x N (where N is an integer), but intra prediction can be performed not only with such a forward size but also with a non-forward size shape. In this case, the N x N prediction unit may be set to be applied only in a specific case. In addition to the above-mentioned size of the prediction unit, an intra prediction unit having a size such as N x mN, mN x N, 2N x mN, or mN x 2N (m is a fraction or an integer) may be further defined and used.
화면내 예측부(115)에서 생성된 예측 블록과 원본 블록 사이의 레지듀얼 값(레지듀얼 블록 또는 레지듀얼 신호)은 변환부(120)에 입력될 수 있다. 또한, 예측을 위하여 사용되는 예측 모드 정보, 보간 필터 정보 등은 레지듀얼 값과 함께 엔트로피 부호화부(135)에서 부호화되어 복호화기로 전달될 수 있다.A residual value (a residual block or a residual signal) between the prediction block generated by the
변환부(120)는 변환 단위로 원본 블록과 예측부(110, 115)를 통하여 생성된 예측 단위의 레지듀얼 값 정보를 포함하는 레지듀얼 블록을 DCT(Discrete Cosine Transform), DST(Discrete Sine Transform), KLT(Karhunen Loeve Transform)과 같은 변환 방법을 이용하여 변환시킬 수 있다. 레지듀얼 블록을 변환하기 위하여 DCT, DST 또는 KLT 를 적용할지는 레지듀얼 블록을 생성하기 위하여 사용된 예측 단위의 화면내 예측 모드 정보를 기초로 결정할 수 있다.The
변환부(120)에서의 변환 블록은 TU일 수 있고, 상기 변환 블록은 정방형(square) 모양의 블록 및/또는 비정방형(non-square) 모양의 블록을 포함할 수 있고, 상기 변환 블록들은 정방형 쿼드 트리(square quad tree) 구조, 비정방형 쿼드 트리(non-square quad tree) 구조 또는 바이너리 트리(binary tree) 구조를 가질 수 있다. 일 실시예에서, 변환 단위의 크기는 소정의 최대 및 최소 크기의 범위 내에서 정해질 수 있다. 또한, 하나의 변환 블록은 서브 변환 블록으로 더 분할될 수 있으며, 상기 서브 변환 블록들은 정방형(square) 모양의 블록 및/또는 비정방형(non-square) 모양의 블록을 포함할 수 있고, 상기 서브 변환 블록들은 정방형 쿼드 트리(square quad tree) 구조, 비정방형 쿼드 트리(non-square quad tree) 구조 또는 바이너리 트리(binary tree) 구조를 가질 수 있다. 상기와 같은 다양한 크기, 모양, 및 구조를 갖는 변환 블록은 잔차 신호의 지역적 특성을 효과적으로 고려하여 부호화하기 위하여 이용될 수 있다. The transform block in the
양자화부(125)는 변환부(120)에서 변환된 레지듀얼 값들을 양자화하여 양자화 계수를 생성할 수 있다. 일 실시예에서, 상기 변환된 레지듀얼 값들은 주파수 영역으로 변환된 값일 수 있다. 상기 양자화 계수는 변환 단위에 따라 또는 영상의 중요도에 따라 변경될 수 있으며, 양자화부(125)에서 산출된 값은 역양자화부(140) 및 재정렬부(130)에 제공될 수 있다.The
재정렬부(130)는 양자화부(125)로부터 제공된 양자화 계수를 재정렬할 수 있다. 재정렬부(130)는 상기 양자화 계수를 재정렬함으로써 엔트로피 부호화부(135)에서의 부호화 효율을 향상시킬 수 있다. 재정렬부(130)는 계수 스캐닝(Coefficient Scanning) 방법을 통하여 2차원 블록 형태의 양자화 계수들을 1차원의 벡터 형태로 재정렬할 수 있다. 상기 계수 스캐닝 방법은 변환 단위의 크기 및 화면내 예측 모드에 따라 어떠한 스캔 방법이 사용될지 여부가 결정될 수 있다. 상기 계수 스캐닝 방법은 지그-재그 스캔, 2차원의 블록 형태의 계수를 열 방향으로 스캔하는 수직 스캔, 및 2차원의 블록 형태 계수를 행 방향으로 스캔하는 수평 스캔을 포함할 수 있다. 일 실시예에서, 재정렬부(130)는 양자화부에서 전송되는 계수들의 확률적인 통계를 기반으로 계수 스캐닝의 순서를 변경함으로써 엔트로피 부호화부(135)에서의 엔트로피 부호화 효율을 높일 수도 있다.The
엔트로피 부호화부(135)는 재정렬부(130)에 의하여 재정렬된 양자화 계수들에 대한 엔트로피 부호화를 수행할 수 있다. 엔트로피 부호화는 예를 들어, 지수 골롬(Exponential Golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Content-Adaptive Binary Arithmetic Coding)과 같은 다양한 부호화 방법을 이용할 수 있다. The
엔트로피 부호화부(135)는 재정렬부(130) 및 예측부(110, 115)로부터 전달받은 코딩 유닛의 양자화 계수 정보 및 블록 타입 정보, 예측 모드 정보, 분할 단위 정보, 예측 유닛 정보 및 전송 단위 정보, 모션 벡터 정보, 참조 영상 정보, 블록의 보간 정보, 필터링 정보와 같은 다양한 정보를 부호화할 수 있다. 또한, 일 실시예에서 엔트로피 부호화부(135)는 필요한 경우에, 전송하는 파라미터 셋 또는 신택스에 일정한 변경을 가할 수도 있다. The
역양자화부(140)는 양자화부(125)에서 양자화된 값들을 역양자화하고, 역변환부(145)는 역양자화부(140)에서 역양자화된 값들을 역변화한다. 역양자화부(140) 및 역변환부(145)에서 생성된 레지듀얼 값은 예측부(110,115)에서 예측된 예측 블록과 합쳐져 복원 블록(Reconstructed Block)이 생성될 수 있다. 상기 생성된 복원 블록들로 구성된 영상은 모션보상 영상 또는 MC 영상(Motion Compensated Picture)일 수 있다.The
상기 모션보상 영상은 필터부(150)에 입력될 수 있다. 필터부(150)는 디블록킹 필터부, 오프셋 보정부(Sample Adaptive Offset, SAO), 및 적응적 루프 필터부(Adaptive Loop Filter, ALF)를 포함할 수 있으며, 요약하자면, 상기 모션보상 영상는 디블록킹 필터부에서 디블록킹 필터가 적용되어 블록킹 잡음(blocking artifact)를 감소 또는 제거 시킨 후, 오프셋 보정부에 입력되어 오프셋을 보정시킬 수 있다. 상기 오프셋 보정부에서 출력된 영상은 상기 적응적 루프 필터부에 입력되어 ALF(Adaptive Loop Filter) 필터를 통과하며, 상기 필터를 통과한 영상은 메모리(155)로 전송될 수 있다.The motion compensation image may be input to the
필터부(150)에 대하여 구체적으로 설명하면, 상기 디블록킹 필터부는 복원된 영상에서 블록 간의 경계에 생성된 블록 내의 왜곡을 제거할 수 있다. 디블록킹을 수행할지 여부를 판단하기 위해서는 블록에 포함된 몇 개의 열 또는 행에 포함된 픽셀을 기초로 현재 블록에 디블록킹 필터를 적용할지 여부를 판단할 수 있다. 블록에 디블록킹 필터를 적용하는 경우, 필요한 디블록킹 필터링 강도에 따라 강한 필터(Strong Filter) 또는 약한 필터(Weak Filter)를 적용할 수 있다. 또한, 디블록킹 필터를 적용함에 있어 수직 필터링 및 수평 필터링 수행시 수평 방향 필터링 및 수직 방향 필터링이 병행 처리되도록 할 수 있다.In detail with respect to the
오프셋 보정부는 디블록킹 필터가 적용된 레지듀얼 블록에 대하여, 픽셀 단위로 원본 영상과의 오프셋을 보정할 수 있다. 특정 영상에 대한 오프셋을 보정하기 위하여 영상에 포함된 픽셀을 일정한 수의 영역으로 구분한 후, 오프셋을 수행할 영역을 결정하고, 해당 영역에 오프셋을 적용하는 방법(Band Offset) 또는 각 픽셀의 에지 정보를 고려하여 오프셋을 적용하는 방법(Edge Offset)의 형태로 적용될 수 있다. 그러나, 일 실시예에서 화면간 예측에 사용되는 복원 블록에 대하여는 필터부(150)에서 필터링을 적용하지 아니할 수 있다.The offset correcting unit may correct an offset with respect to the residual block to which the deblocking filter is applied in units of pixels from the original image. In order to correct the offset for a specific image, a method of dividing pixels included in an image into a certain number of regions, determining an region to be offset, and applying the offset to the region (Band Offset) or the edge of each pixel It may be applied in the form of a method of applying an offset in consideration of information (Edge Offset). However, in an embodiment, the
적응적 루프 필터부(Adaptive Loop Filter, ALF)는 필터링한 복원 영상과 원래의 영상을 비교한 값을 기초로, 고효율을 적용하는 경우에만 수행될 수 있다. 영상에 포함된 픽셀을 소정의 그룹으로 나눈 후, 해당 그룹에 적용될 하나의 필터를 결정하여 그룹마다 차별적으로 필터링을 수행할 수 있다. 상기 ALF를 적용할지 여부에 관련된 정보는 휘도 신호는 부호화 단위(Coding Unit, CU) 별로 전송될 수 있고, 각각의 블록에 따라 적용될 ALF 필터의 모양 및 필터 계수는 달라질 수 있다. 또한, 적용 대상 블록의 특성에 관계없이 동일한 형태(고정된 형태)의 ALF 필터가 적용될 수도 있다.The adaptive loop filter (ALF) may be performed only when high efficiency is applied based on a value obtained by comparing the filtered reconstructed image and the original image. After dividing the pixels included in the image into a predetermined group, one filter to be applied to the corresponding group may be determined and filtering may be performed differentially for each group. As for information related to whether to apply the ALF, the luminance signal may be transmitted for each coding unit (CU), and the shape and filter coefficients of the ALF filter to be applied may vary according to each block. Also, the ALF filter of the same type (fixed type) may be applied regardless of the characteristics of the application block.
메모리(155)는 필터부(150)을 통하여 산출된 복원 블록 또는 영상을 저장할 수 있다. 메모리(155)에 저장된 복원 블록 또는 영상은 화면간 예측을 수행하는 화면간 예측부(110) 또는 화면내 예측부(115)에 제공될 수 있다. 화면내 예측부(115)에서 사용되는 복원 블록들의 화소값은 디블록킹 필터부, 오프셋 보정부, 및 적응적 루프 필터부가 적용되지 아니한 데이터들 일 수 있다.The
도 2는 본 발명의 일 실시예에 따른 영상 복호화 장치를 개략적으로 나타낸 블록도이다. 도 2 를 참조하면, 영상 복호화 장치(200)는 엔트로피 복호화부(210), 재정렬부(215), 역양자화부(220), 역변환부(225), 화면간 예측부(230), 화면내 예측부(235), 필터부(240), 메모리(245)를 포함한다.2 is a block diagram schematically illustrating an image decoding apparatus according to an embodiment of the present invention. Referring to FIG. 2 , the
영상 부호화 장치로부터 영상 비트스트림이 입력되는 경우, 입력된 비트스트림은 부호화 장치에서 영상 정보가 처리된 절차의 역과정으로 복호화될 수 있다. 예를 들어, 영상 부호화 장치에서 엔트로피 부호화를 수행하기 위하여 CAVLC와 같은 가변 길이 부호화(Variable Length Coding: VLC, 이하 "VLC"라 함)가 사용된 경우에는, 엔트로피 복호화부(210)도 부호화 장치에서 사용한 VLC 테이블과 동일한 VLC 테이블로 구현하여 엔트로피 복호화를 수행할 수 있다. 또한, 부호화 장치에서 엔트로피 부호화를 수행하기 위하여 CABAC을 이용한 경우에는 엔트로피 복호화부(210)에서 이에 대응하여 CABAC을 이용한 엔트로피 복호화를 수행할 수 있다.When an image bitstream is input from the image encoding apparatus, the input bitstream may be decoded by a reverse process of a procedure of processing image information in the encoding apparatus. For example, when variable length coding (VLC, hereinafter referred to as "VLC") such as CAVLC is used to perform entropy encoding in the image encoding apparatus, the
엔트로피 복호화부(210)에서는 복호화된 정보 중 예측 블록을 생성하기 위한 정보를 화면간 예측부(230) 및 화면내 예측부(235)로 제공하고, 엔트로피 복호화부에서 엔트로피 복호화가 수행된 레지듀얼 값은 재정렬부(215)로 입력될 수 있다.The
재정렬부(215)는 엔트로피 복호화부(210)에서 엔트로피 복호화된 비트스트림을 영상 부호화기에서 재정렬한 방법을 기초로 재정렬할 수 있다. 재정렬부(215)는 부호화 장치에서 수행된 계수 스캐닝에 관련된 정보를 제공받고 부호화 장치에서 수행된 스캐닝 순서에 기초하여 역으로 스캐닝하는 방법을 통하여 재정렬을 수행할 수 있다.The
역양자화부(220)는 부호화 장치에서 제공된 양자화 파라미터와 재정렬된 블록의 계수값을 기초로 역양자화를 수행할 수 있다. 역변환부(225)는 영상 부호화 장치에서 수행된 양자화 결과에 대하여, 부호화 장치의 변환부가 수행한 DCT, DST, 또는 KLT 에 대해 역DCT, 역DST, 또는 역KLT를 수행할 수 있다. 역변환은 부호화 장치에서 결정된 전송 단위 또는 영상의 분할 단위를 기초로 수행될 수 있다. 인코딩 장치의 변환부에서는 예측 방법, 현재 블록의 크기 및 예측 방향과 같은 정보에 따라 DCT, DST, 또는 KLT를 선택적으로 수행할 수 있고, 복호화 장치의 역변환부(225)는 부호화 장치의 변환부에서 수행된 변환 정보를 기초로 역변환 방법이 결정되어 역변환을 수행할 수 있다.The
예측부(230, 235)는 엔트로피 복호화부(210)에서 제공된 예측 블록 생성과 관련된 정보와 메모리(245)에서 제공된 이전에 복호화된 블록 및/또는 영상 정보를 기초로 예측 블록을 생성할 수 있다. 복원 블록은 예측부(230, 235)에서 생성된 예측 블록과 역변환부(225)에서 제공된 레지듀얼 블록을 이용하여 생성될 수 있다. 예측부(230, 235)에서 수행하는 구체적인 예측의 방법은 부호화 장치의 예측부(110, 115)에서 수행되는 예측의 방법과 동일할 수 있다.The
예측부(230, 235)는 예측 단위 판별부(미도시), 화면간 예측부(230), 및 화면내 예측부(235)를 포함할 수 있다. 예측 단위 판별부는 엔트로피 복호화부(210)에서 입력되는 예측 단위 정보, 화면내 예측 방법의 예측 모드 정보, 화면간 예측 방법의 모션 예측 관련 정보와 같은 다양한 정보를 입력 받아, 현재 코딩 블록에서의 예측 블록을 구분하고, 예측 블록이 화면간 예측을 수행하는지 아니면 화면내 예측을 수행하는지 여부를 판별할 수 있다.The
화면간 예측부(230)는 영상 부호화기에서 제공된 현재 예측 블록의 화면간 예측에 필요한 정보를 이용하여 현재 예측 블록이 포함된 현재 영상의 이전 영상 또는 이후 영상 중 적어도 하나의 영상에 포함된 정보를 기초로 현재 예측 블록에 대한 화면간 예측을 수행할 수 있다. The
구체적으로 화면간 예측에서는 현재 블록에 대하여, 참조 영상을 선택하고 현재 블록에 대한 참조 블록을 선택하여 현재 블록에 대한 예측 블록을 생성할 수 있다. 이 때, 참조 영상의 정보를 이용하기 위하여, 현재 영상의 주변 블록들의 정보를 이용할 수 있다. 예를 들어, 스킵(skip) 모드, 머지(merge) 모드, 및 AMVP(Advanced Motion Vector Prediction)와 같은 방법을 이용하여 주변 블록의 정보에 기반하여 현재 블록에 대한 예측 블록을 생성할 수 있다.Specifically, in inter prediction, a prediction block for the current block may be generated by selecting a reference image for the current block and selecting a reference block for the current block. In this case, in order to use the information of the reference image, information on neighboring blocks of the current image may be used. For example, a prediction block for the current block may be generated based on information on the neighboring block by using a skip mode, a merge mode, and a method such as AMVP (Advanced Motion Vector Prediction).
AMVP 모드에서는 현재 블록의 시간상 및 공간상 주변 블록을 이용하여 모션 정보 후보자를 선택하여 예측 모션 벡터 리스트를 구성할 수 있다. 또한, 부호화 장치로부터 수신한 현재 블록의 예측 모션 벡터로 선택된 모션 정보 후보자에 대한 인덱스 정보 및 차분 모션 벡터(MVD)를 이용하여 현재 블록의 모션 벡터를 복호화할 수 있다. In the AMVP mode, a prediction motion vector list may be configured by selecting a motion information candidate using temporal and spatial neighboring blocks of the current block. In addition, the motion vector of the current block may be decoded using index information and differential motion vector (MVD) on the motion information candidate selected as the prediction motion vector of the current block received from the encoding apparatus.
또한, Merge 모드에서도 현재 블록의 시간상 및 공간상 주변 블록을 이용하여 머지 후보로서 모션 정보 후보자들을 획득할 수 있다. 이들 중 부호화 장치로부터 수신한 현재 블록의 모션 정보 후보자에 대한 인덱스 정보를 이용하여 현재 블록의 모션 벡터를 획득할 수 있다. 상기 모션 벡터 후보자들은 현재 블록의 공간적 이웃 블록으로부터 공간적 모션 벡터 후보자로서 획득되거나 상기 현재 블록의 참조 영상에 포함되는 대응 블록으로부터 시간적 모션 벡터 후보자로서 획득될 수 있다.Also, in the merge mode, motion information candidates may be obtained as merge candidates by using temporal and spatial neighboring blocks of the current block. Among them, the motion vector of the current block may be obtained by using index information on the motion information candidate of the current block received from the encoding apparatus. The motion vector candidates may be obtained as spatial motion vector candidates from a spatial neighboring block of the current block or may be obtained as temporal motion vector candidates from a corresponding block included in the reference image of the current block.
예측 블록은 1/2 픽셀 샘플 단위와 1/4 픽셀 샘플 단위와 같이 정수 이하의 샘플 단위로 생성될 수 있다. 이 경우, 모션 벡터 역시 정수 픽셀 이하의 단위로 표현될 수 있다. 예를 들어, 휘도 픽셀에 대해서는 1/4 픽셀 단위로, 색차 픽셀에 대하여는 1/8 픽셀 단위로 표현될 수 있다.The prediction block may be generated in units of samples equal to or less than an integer, such as 1/2 pixel sample unit and 1/4 pixel sample unit. In this case, the motion vector may also be expressed in units of integer pixels or less. For example, the luminance pixel may be expressed in units of 1/4 pixels and the chrominance pixels may be expressed in units of 1/8 pixels.
현재 블록의 화면간 예측에 필요한 모션 벡터 및 참조 영상 인덱스를 포함하는 모션정보는 부호화 장치로부터 수신한 스킵 플래그, 머지 플래그 등을 확인하고 이에 대응하여 유도될 수 있다.Motion information including a motion vector and a reference picture index required for inter prediction of the current block may be derived by checking a skip flag, a merge flag, etc. received from the encoding apparatus and corresponding thereto.
화면내 예측부(235)는 현재 영상 내의 픽셀 정보를 기초로 예측 블록을 생성할 수 있다. 예측 단위가 화면내 예측을 수행한 예측 단위인 경우에는 영상 부호화기에서 제공된 예측 단위의 화면내 예측 모드 정보를 기초로 화면내 예측을 수행할 수 있다. 상기 예측 단위의 주변 블록들은 화면간 예측을 수행한 블록인 경우, 즉, 참조 픽셀이 화면간 예측을 수행한 픽셀인 경우에는 화면간 예측을 수행한 블록에 포함되는 참조 픽셀을 주변의 화면내 예측을 수행한 블록의 참조 픽셀 정보로 대체하여 사용할 수도 있다. The
또한, 화면내 예측부(235)는 화면내 예측 모드를 부호화하기 위하여 이웃 블록들로부터 획득한 가장 가능성 있는 화면내 예측 모드(MPM: Most Probable Mode)을 이용할 수 있다. 일 실시예에서, 상기 가장 가능성 있는 화면내 예측 모드는 현재 블록의 공간적 이웃 블록의 화면내 예측 모드를 이용할 수 있다. Also, the
일 실시예에서, 화면내 예측부(235)에서 예측이 수행되는 처리 단위와 예측 방법 및 구체적인 내용이 정해지는 처리 단위는 서로 다를 수 있다. 예를 들어, 예측 단위로 예측 모드가 정해져 예측 단위로 예측이 수행될 수 있고, 예측 단위로 예측 모드가 정해지고 변환 단위로 화면내 예측이 수행될 수도 있다.In an embodiment, a processing unit in which prediction is performed by the
이 경우, 예측 블록(PU)은 더 이상 분할되지 않는 코딩 블록(CU)으로부터 다양한 사이즈 및 형태로 결정될 수 있다. 예를 들어, 화면내 예측의 경우 예측 블록은 2N x 2N 또는 N x N (N은 정수)와 같은 크기를 가질 수 있으나, 이와 같은 정방향 크기 뿐만 아니라 비정방향 크기 모양인 N x mN, mN x N, 2N x mN 또는 mN x 2N (m은 분수 또는 정수임)으로도 화면내 예측을 수행할 수 있다. 이 경우, N x N 크기의 예측 단위는 특정한 경우에만 적용하도록 설정할 수도 있다. In this case, the prediction block PU may be determined in various sizes and shapes from the coding block CU that is no longer split. For example, in the case of intra prediction, the prediction block may have a size such as 2N x 2N or N x N (N is an integer). , 2N x mN or mN x 2N (m is a fraction or an integer) can also perform intra prediction. In this case, the N x N prediction unit may be set to be applied only in a specific case.
또한, 변환 블록(TU)도 다양한 사이즈 및 형태로 결정될 수 있다. 예를 들어, 변환 블록은 2N x 2N 또는 N x N (N은 정수)와 같은 크기를 가질 수 있으나, 이와 같은 정방향 크기 뿐만 아니라 비정방향 크기 모양인 N x mN, mN x N, 2N x mN 또는 mN x 2N (m은 분수 또는 정수임)으로도 화면내 예측을 수행할 수 있다. 이 경우, N x N 크기의 예측 단위는 특정한 경우에만 적용하도록 설정할 수도 있다. 일 실시예에서, 변환 블록은 정방형(square) 구조, 비정방형(non-square) 구조, 정방형 쿼드 트리(square quad tree) 구조, 비정방형 쿼드 트리(non-square quad tree) 구조, 또는 바이너리 트리(binary tree) 구조로 갖는 블록들 중 하나일 수 있다. 일 실시예에서, 변환 블록의 크기는 소정의 최대 및 최소 크기의 범위 내에서 정해질 수 있다. 또한, 하나의 변환 블록은 서브 변환 블록으로 분할될 수 있으며, 이 경우 상기 서브 변환 블록들도 정방형(square) 구조, 비정방형(non-square) 구조, 정방형 쿼드 트리(square quad tree) 구조, 비정방형 쿼드 트리(non-square quad tree) 구조, 또는 바이너리 트리(binary tree) 구조로 분할될 수 있다. In addition, the transform block (TU) may also be determined in various sizes and shapes. For example, the transform block may have a size such as 2N x 2N or N x N (N is an integer), but not only such a forward size but also a non-forward size shape of N x mN, mN x N, 2N x mN, or In-picture prediction can also be performed with mN x 2N (m is a fraction or an integer). In this case, the N x N prediction unit may be set to be applied only in a specific case. In one embodiment, the transform block is a square structure, a non-square structure, a square quad tree structure, a non-square quad tree structure, or a binary tree ( It may be one of blocks having a binary tree) structure. In an embodiment, the size of the transform block may be determined within a range of a predetermined maximum and minimum size. In addition, one transform block may be divided into sub-transform blocks. In this case, the sub-transform blocks also have a square structure, a non-square structure, a square quad tree structure, and a non-transform block. It may be divided into a non-square quad tree structure or a binary tree structure.
화면내 예측부(235)에는 AIS(Adaptive Intra Smoothing) 필터부, 참조 픽셀 보간부, DC 필터부를 포함할 수 있다. 상기 AIS 필터부는 현재 블록의 참조 픽셀에 필터링을 수행하는 부분으로써 현재 예측 단위의 예측 모드에 따라 필터의 적용 여부를 결정하여 적용할 수 있다. 영상 부호화기에서 제공된 예측 단위의 예측 모드 및 AIS 필터 정보를 이용하여 현재 블록의 참조 픽셀에 AIS 필터링을 수행할 수 있다. 현재 블록의 예측 모드가 AIS 필터링을 수행하지 아니하는 모드인 경우에는, 상기 AIS 필터부는 현재 블록에 적용되지 아니할 수 있다.The
참조 픽셀 보간부는 예측 단위의 예측 모드가 참조 픽셀을 보간한 샘플값을 기초로 화면내 예측을 수행하는 예측 단위인 경우에, 참조 픽셀을 보간하여 정수값 이하의 픽셀 단위의 참조 픽셀을 생성할 수 있다. 현재 예측 단위의 예측 모드가 참조 픽셀을 보간하지 아니하고 예측 블록을 생성하는 예측 모드인 경우, 참조 픽셀은 보간되지 아니할 수 있다. DC 필터부는 현재 블록의 예측 모드가 DC 모드인 경우에 필터링을 통하여 예측 블록을 생성할 수 있다.When the prediction mode of the prediction unit is a prediction unit that performs intra prediction based on a sample value obtained by interpolating the reference pixel, the reference pixel interpolator interpolates the reference pixel to generate a reference pixel of a pixel unit having an integer value or less. there is. When the prediction mode of the current prediction unit is a prediction mode that generates a prediction block without interpolating the reference pixel, the reference pixel may not be interpolated. When the prediction mode of the current block is the DC mode, the DC filter unit may generate the prediction block through filtering.
복원된 블록 및/또는 영상은 필터부(240)로 제공될 수 있다. 필터부(240)는 복원된 블록 및/또는 영상에 디블록킹 필터부, 오프셋 보정부(Sample Adaptive Offset) 및/또는 적응적 루프 필터부를 포함할 수 있다. 상기 디블록킹 필터부는 영상 부호화기로부터 해당 블록 또는 영상에 디블록킹 필터가 적용되었는지 여부를 나타내는 정보 및 디블록킹 필터가 적용된 경우 강한 필터 또는 약한 필터를 적용하였는지를 나타내는 정보를 제공받을 수 있다. 상기 디블록킹 필터부는 영상 부호화기에서 제공된 디블록킹 필터 관련 정보를 제공받고, 영상 복호화기에서 해당 블록에 대한 디블록킹 필터링을 수행할 수 있다.The reconstructed block and/or image may be provided to the
상기 오프셋 보정부는 부호화시 영상에 적용된 오프셋 보정의 종류 및 오프셋 값 정보 등을 기초로 복원된 영상에 오프셋 보정을 수행할 수 있다. 상기 적응적 루프 필터부는 부호화기로부터 제공된 적응적 루프 필터의 적용 여부에 관한 정보, 적응적 루프 필터의 계수 정보와 같은 정보들을 기초로 부호화 단위로 적용될 수 있다. 상기 적응적 루프 필터와 관련된 정보들은 특정 파라미터 셋(parameter set)에 포함되어 제공될 수 있다.The offset correction unit may perform offset correction on the reconstructed image based on the type of offset correction applied to the image during encoding and information on the offset value. The adaptive loop filter unit may be applied as a coding unit based on information such as information on whether or not the adaptive loop filter is applied and information on coefficients of the adaptive loop filter provided from the encoder. The information related to the adaptive loop filter may be provided in a specific parameter set.
메모리(245)는 복원된 영상 또는 블록을 저장하여 이후에 참조 영상 또는 참조 블록으로 사용할 수 있고, 또한 복원된 영상을 출력부로 제공할 수 있다.The
본 명세서에서는 설명의 편의를 위하여 생략하였지만, 복호화 장치에 입력되는 비트스트림은 파싱(parsing) 단계를 거쳐 엔트로피 복호화부로 입력될 수 있다. 또한, 엔트로피 복호화부에서 파싱 과정을 수행하도록 할 수 있다.Although omitted herein for convenience of description, the bitstream input to the decoding apparatus may be input to the entropy decoding unit through a parsing step. Also, the entropy decoding unit may perform a parsing process.
본 명세서에서 코딩은 경우에 따라 부호화 또는 복호화로 해석될 수 있고, 정보(information)는 값(values), 파라미터(parameter), 계수(coefficients), 성분(elements), 플래그(flag) 등을 모두 포함하는 것으로 이해될 수 있다. '화면' 또는 '영상(picture)'는 일반적으로 특정 시간대의 하나의 영상을 나타내는 단위를 의미하며, '슬라이스(slice)', '프레임(frame)' 등은 실제 비디오 신호의 코딩에 있어서 영상의 일부를 구성하는 단위이며, 필요에 따라서는 영상과와 서로 혼용되어 사용될 수 있다.In the present specification, coding may be interpreted as encoding or decoding in some cases, and information includes all values, parameters, coefficients, elements, flags, and the like. can be understood as 'Screen' or 'picture' generally means a unit representing one image in a specific time period, and 'slice' and 'frame' are It is a unit constituting a part, and may be used interchangeably with image if necessary.
'픽셀(pixel)', '픽셀' 또는 'pel'은 하나의 영상을 구성하는 최소의 단위를 나타낸다. 또한, 특정한 픽셀의 값을 나타내는 용어로서, '샘플(sample)'을 사용할 수 있다. 샘플은 휘도(Luma) 및 색차(Chroma) 성분으로 나누어질 수 있으나, 일반적으로는 이를 모두 포함하는 용어로 사용될 수 있다. 상기에서 색차 성분은 정해진 색상들 간의 차이를 나타내는 것으로 일반적으로 Cb 및 Cr로 구성된다.A 'pixel', 'pixel' or 'pel' represents the smallest unit constituting one image. Also, as a term indicating a value of a specific pixel, a 'sample' may be used. A sample may be divided into a luminance (Luma) and a chroma (Chroma) component, but in general, a term including both of them may be used. In the above, the color difference component represents a difference between predetermined colors and is generally composed of Cb and Cr.
'유닛(unit)'은 상술한 부호화 유닛, 예측 유닛, 변환 유닛과 같이 영상 처리의 기본 단위 또는 영상의 특정 위치를 지칭하며, 경우에 따라서는 '블록' 또는 '영역(area)'등의 용어와 서로 혼용하여 사용될 수 있다. 또한, 블록은 M개의 열과 N개의 행으로 구성된 샘플들 또는 변환 계수(transform coefficient)들의 집합을 나타내는 용어로 사용될 수도 있다.A 'unit' refers to a basic unit of image processing or a specific position of an image, such as the above-described coding unit, prediction unit, and transformation unit, and in some cases, terms such as 'block' or 'area' and may be used interchangeably. Also, a block may be used as a term indicating a set of samples or transform coefficients composed of M columns and N rows.
도 3 및 도 4는 일반적인 방법에 따른 변환 블록의 구조 및 16x16 변환 블록을 구성하기 위한 변환 계수 그룹을 설명하기 위한 것이다. 3 and 4 are for explaining the structure of a transform block according to a general method and a transform coefficient group for configuring the 16x16 transform block.
도 3을 참조하면, 하나의 코딩 블록(CB)은 복수 개의 변환 블록들(TB0, TB1,...,TB12)을 포함할 수 있다. 상기 복수 개의 변환 블록들은 다양한 모양 및/또는 크기를 갖는 변환 블록들을 포함할 수 있다. 상기 변환 블록은 정방형 모양의 블록 및 비정방형 모양의 블록을 포함할 수 있고, 상기 변환 블록은 정방형 쿼드 트리(square quad tree) 구조, 비정방형 쿼드 트리(non-square quad tree) 구조, 또는 바이너리 트리(binary tree) 구조로 갖는 블록들 중 하나일 수 있다.Referring to FIG. 3 , one coding block CB may include a plurality of transform blocks TB0, TB1, ..., TB12. The plurality of transform blocks may include transform blocks having various shapes and/or sizes. The transform block may include a block having a square shape and a block having a non-square shape, and the transform block may include a square quad tree structure, a non-square quad tree structure, or a binary tree. It may be one of blocks having a (binary tree) structure.
도 4를 참조하면, 변환 블록(10)은 적어도 하나 이상의 변환 계수 그룹(CG0,CG1,...,CG15)을 포함할 수 있다. 예를 들어, 변환 블록(10)이 16x16 크기의 블록이고, 상기 변환 블록에 포함되는 변환 계수 그룹의 크기는 4x4 일 수 있다. 즉, 16x16 크기의 변환 블록은 16 개의 4x4 크기의 변환 계수 그룹을 포함할 수 있으며, 상기 변환 계수 그룹의 인덱스는 도 4에 나타낸 바와 같은 변환 계수 스캔 순서를 따를 수 있다.Referring to FIG. 4 , the
도 5는 일반적인 방법에 따른 변환 계수 그룹 및 상기 변환 계수 그룹의 변환 스캔 방법을 설명하기 위한 것이다.5 is a diagram for describing a transform coefficient group and a transform scan method of the transform coefficient group according to a general method.
도 5를 참조하면, 일반적으로는 변환 블록(20)의 변환 계수 그룹 스캔 순서는 변환 계수의 스캔 순서와 동일할 수 있다. 예를 들면, 변환 블록(20)이 8x8 크기이고, 변환 계수 그룹의 크기가 4x4 크기의 블록이며, 변환 블록(20)에 대하여 업-라이트 다이아고날(Up-right diagonal) 스캔 방법을 사용하는 경우, 변환 계수 그룹은 변환 계수와 동일한 스캔 방법을 적용한다. 도 5에서 나타낸 바와 같이, 변환 블록(20)의 우측 하단의 변환 계수 그룹인 CG3에 포함된 변환 계수 15 부터 0까지 업-라이트 다이아고날 방법으로 변환 계수를 스캔하고, 이후 우측 상단의 변환 계수 그룹인 CG2에 대하여 동일한 방법으로 변환 계수를 스캔한 후, 좌측 하단의 변환 계수 그룹 CG1, 좌측 상단의 변환 계수 그룹 CG0의 순서로 상기 변환 계수 그룹에 포함된 변환 계수들을 동일한 방법으로 스캔할 수 있다. Referring to FIG. 5 , in general, the scan order of the transform coefficient groups of the
도 6a 내지 도 6d는 일반적인 방법에 따른 변환 계수 그룹 및 상기 변환 계수 그룹의 스캔 방법의 다양한 예를 설명하기 위한 것이다. 도 6a 내지 도 6c는 화면내 예측 모드에서의 변환 계수 그룹의 스캔 방법을 나타내며, 도 6d는 화면간 예측 모드에서 변환 계수 그룹의 스캔 방법을 나타낸다.6A to 6D are for describing a transform coefficient group according to a general method and various examples of a scanning method of the transform coefficient group. 6A to 6C show a scanning method of a transform coefficient group in an intra prediction mode, and FIG. 6D shows a scanning method of a transform coefficient group in an inter prediction mode.
도 6a 내지 도 6c를 참조하면, 화면내 예측의 경우 우측 하단으로부터 좌측 상단 순서로 스캔하는 업-라이트 다이아고날 스캔(Up-right diagonal scan, 도 6a), 우측으로부터 좌측으로, 하단으로부터 상단의 방향으로 스캔하는 호리젠탈 스캔(Horizontal scan, 도 6b), 및 하단으로부터 상단으로, 우측으로부터 좌측의 방향으로 스캔하는 버티칼 스캔(Vertical scan, 도 6c) 방법들을 이용할 수 있다. 도 6d를 참조하면, 화면간 예측의 경우는 업-라이트 다이아고날 스캔 방법만을 이용할 수 있다.Referring to FIGS. 6A to 6C , in the case of intra prediction, an Up-right diagonal scan (FIG. 6A) that scans from the lower right to the upper left, from the right to the left, and from the bottom to the top A horizontal scan (FIG. 6b) of scanning with , and a vertical scan (FIG. 6c) of scanning from the bottom to the top and from the right to the left may be used. Referring to FIG. 6D , in the case of inter-screen prediction, only the up-right diagonal scan method may be used.
일 실시예에서, 화면내 예측에서의 변환 계수 그룹의 스캔 방법은 화면내 예측 모드에 따라 결정될 수 있다. 예를 들어, 화면내 예측 모드가 가로 방향으로의 예측인 화면내 예측 모드 인덱스 6 내지 14인 경우는 버티컬 스캔 방법을 이용하여 변환 계수 그룹이 스캔될 수 있고, 화면내 예측 모드가 세로 방향의 예측인 인덱스 22 내지 30인 경우에는 호리젠탈 스캔 방법이 이용되며, 나머지 화면내 예측 모드에 대해서는 업-라이트 다이아고날 스캔 방법이 이용될 수 있다.In an embodiment, a scanning method of a transform coefficient group in intra prediction may be determined according to an intra prediction mode. For example, when the intra
최근까지의 비디오 코딩에서는 변환 블록으로 항상 정방향 변환 블록을 고려하고 있다. 그러므로, 변환 계수 그룹 및 상기 변환 계수 그룹 내의 변환 계수의 스캔 방법으로도 정방향 변환 블록에 적합하도록 설계되어왔다. 그러나, 변환 블록을 비정방형 변환 블록을 이용하는 경우에는 기존의 변환 계수 그룹 및 변환 계수의 스캔 방법을 적용하는 경우 코딩 효율이 저하될 수 있다. 따라서, 이하 도 7a 내지 도 12b에서는 본 발명의 일 실시예에 따른 코딩 효율을 개선할 수 있는 변환 계수 그룹을 스캔하는 방법에 대하여 설명하기로 한다.In video coding until recently, a forward transform block is always considered as a transform block. Therefore, a transform coefficient group and a scan method of transform coefficients in the transform coefficient group have been designed to be suitable for a forward transform block. However, when a non-square transform block is used as a transform block, coding efficiency may be reduced when an existing transform coefficient group and a scan method of a transform coefficient are applied. Accordingly, a method of scanning a transform coefficient group capable of improving coding efficiency according to an embodiment of the present invention will be described with reference to FIGS. 7A to 12B .
도 7a 및 도 7b는 본 발명의 일 실시예에 따른 변환 블록에 일반적인 스캔 방법을 적용한 예를 설명하기 위한 것이다.7A and 7B are for explaining an example in which a general scan method is applied to a transform block according to an embodiment of the present invention.
도 7a를 참조하면, 현재 변환 블록 TB1 (30a)이 비정방형 블록이고, 8x16 의 크기를 갖는 경우에 변환 계수 그룹 및 변환 계수를 스캔하는 방법으로 기존의 방법을 적용하면 3 가지 스캔 방법 중 선택될 수 있다. 예를 들면, 현재 변환 블록(30a)에 기존의 3 가지 스캔 방법을 적용하여 변환 계수 그룹을 스캔하는 도시한 예 중에 좌측으로부터 업-라이트 스캔 방법, 버티컬 스캔 방법, 및 호리젠탈 스캔 방법을 적용하여 변환 계수 그룹을 스캔할 수 있다. Referring to FIG. 7A , when the current
도 7b를 참조하면, 현재 변환 블록 TB2 (30b)가 비정방형 블록이고, 16x8 의 크기를 갖는 경우에 변환 계수 그룹 및 변환 계수를 스캔하는 방법으로 기존의 방법을 적용하면 3 가지 스캔 방법 중 선택될 수 있다. 예를 들면, 현재 변환 블록(30b)에 기존의 3 가지 스캔 방법을 적용하여 변환 계수 그룹을 스캔하는 도시한 예 중에 좌측으로부터 업-라이트 스캔 방법, 버티컬 스캔 방법, 및 호리젠탈 스캔 방법을 적용하여 변환 계수 그룹을 스캔할 수 있다.Referring to FIG. 7B , when the current
도 8은 16x8 변환 블록의 변환 계수에 대하여 일반적인 스캔 방법을 적용한 예를 설명하기 위한 것이다.FIG. 8 is for explaining an example in which a general scan method is applied to transform coefficients of a 16x8 transform block.
도 8을 참조하면, 현재 변환 블록 TB2(30b)에 호리젠탈 스캔 방법을 적용하는 경우 변환 계수 및 변환 계수 그룹은 동일한 스캔 방법인 호리젠탈 방식이 적용될 수 있다. 예를 들면, 복수 개의 변환 계수를 포함하는 복수 개의 변환 계수 그룹은 각 변환 계수 그룹 단위로 스캔될 수 있다. 변환 블록 중 가장 우측 하단에 있는 변환 계수 그룹에 포함된 변환 계수들을 호리젠탈 방식으로 스캔한 후, 상기 가장 우측 하단에 있는 변환 계수 그룹의 좌측에 위치하는 변환 계수 그룹에 포함된 변환 계수들을 호리젠탈 방식으로 스캔할 수 있다. 이후 동일한 방식으로 상기 변환 계수 그룹 단위에서도 호리젠탈 방식으로 스캔될 수 있다.Referring to FIG. 8 , when the horizontal scan method is applied to the current
이러한 변환 과정을 통하여 레지듀얼 신호의 대부분의 에너지는 좌측 상단의 DC 영역으로 모일 수 있다. 그러므로, 엔트로피 코딩의 효율을 위하여는 저주파 영역의 변환 계수 및/또는 변환 계수 그룹들이 작은 값의 스캔 순서를 나타내는 인덱스를 갖는 것이 효율적일 수 있다. 그러나, 비정방형 변환 블록에 대하여 도 7a 내지 도 8에서 나타난 바와 같은 일반적인 변환 계수 그룹의 스캔 순서를 적용하는 경우 저주파 영역의 변환 계수 그룹 이전에 고주파 영역의 변환 계수 그룹이 먼저 코딩될 수 있으므로 코딩 효율이 떨어질 수 있다.Through this conversion process, most of the energy of the residual signal may be gathered in the DC region of the upper left. Therefore, for the efficiency of entropy coding, it may be efficient for the transform coefficients and/or transform coefficient groups of the low frequency region to have an index indicating a scan order of a small value. However, when the scan order of the general transform coefficient group as shown in FIGS. 7A to 8 is applied to the non-square transform block, the transform coefficient group of the high frequency domain can be coded before the transform coefficient group of the low frequency domain, so coding efficiency This can fall.
그러므로, 본 발명의 일 실시예에 따른 변환 스캔 계수의 스캔 방법은 변환 블록을 복수 개의 변환 스캔 계수를 포함하는 상위 영역인 변환 영역으로 분할하고, 상기 분할된 변환 영역별로 변환 스캔 계수를 스캔하는 방법을 포함할 수 있다. Therefore, the method of scanning transform scan coefficients according to an embodiment of the present invention divides a transform block into a transform region that is an upper region including a plurality of transform scan coefficients, and scans the transform scan coefficients for each divided transform region. may include
도 9 및 도 10은 본 발명의 일 실시예에 따른 변환 계수 그룹을 스캔하는 방법을 나타내는 순서도 및 장치를 나타내는 것이다.9 and 10 are flowcharts showing a method for scanning a transform coefficient group and an apparatus according to an embodiment of the present invention.
도 9 및 도 10을 참조하면, 변환부는 변환 계수 그룹을 스캔하기 위하여 변환 영역 정보 획득부(40)에서 변환 블록에 포함되는 복수 개의 변환 계수 그룹을 적어도 하나 이상의 구획으로 분할하는 변환 영역을 나타내는 변환 영역 정보를 획득할 수 있다(S10). 상기 변환 블록은 다양한 크기 및/또는 모양을 가질 수 있다. 일 실시예에서, 상기 변환 블록은 비정방형 모양의 변환 블록일 수 있다. 9 and 10 , the transform unit represents a transform domain in which the transform domain
상기 변환 영역 정보는 상기 변환 블록을 적어도 하나 이상의 영역으로 분할할 수 있으며, 각 변환 영역은 복수 개의 변환 계수 그룹을 포함할 수 있다. 상기 변환 계수 그룹은 복수 개의 변환 계수들을 포함하는 것은 물론이다. 또한, 상기 변환 영역 정보는 인코더로부터 수신되는 정보일 수 있다. 예를 들면, 상기 변환 영역 정보는 시퀀스 파라미터 셋(SPS) 및 슬라이스 헤더 중 적어도 하나 이상으로부터 획득될 수 있으며, 본 발명은 이에 한정되지는 아니하고 어떠한 형태로 어떠한 레벨의 신택스에 포함되어 있는지를 한정하지 아니하고 인코더로부터 수신된 정보이면 무방하다The transform domain information may divide the transform block into at least one domain, and each transform domain may include a plurality of transform coefficient groups. Of course, the transform coefficient group includes a plurality of transform coefficients. Also, the transform domain information may be information received from an encoder. For example, the transformation domain information may be obtained from at least one of a sequence parameter set (SPS) and a slice header, and the present invention is not limited thereto, and the form and level of syntax included in the present invention is not limited thereto. No, it can be any information received from the encoder
일 실시예에서, 상기 변환 영역 정보는 복호화 장치에서 기결정된 방법으로 획득될 수 있다. 예를 들면, 상기 변환 영역 정보는 변환 블록의 가로 길이 및 세로 길이를 바탕으로 변환 영역의 가로 길이 및 세로 길이를 산출하여 변환 영역의 크기 및 개수를 결정함으로써 획득될 수 있다. 또는, 상기 변환 영역 정보는 변환 블록의 가로 및 세로 길이 중 작은 길이를 변환 계수 그룹의 블록 크기로 나눔으로써 변환 영역의 크기 및 개수를 결정할 수도 있다. 이러한 상기 변환 영역 정보가 나타내는 변환 영역의 가로 및 세로의 길이, 모양, 및 개수는 복호화 장치에서 결정된 방법을 따를 수 있으며, 상술한 예에 한정되지 아니한다. In an embodiment, the transform domain information may be obtained by a predetermined method in the decoding apparatus. For example, the transform region information may be obtained by calculating the horizontal length and vertical length of the transform region based on the horizontal length and vertical length of the transform block to determine the size and number of transform regions. Alternatively, the transform region information may determine the size and number of transform regions by dividing the smaller of the horizontal and vertical lengths of the transform block by the block size of the transform coefficient group. The horizontal and vertical lengths, shapes, and number of transformation regions indicated by the transformation region information may follow a method determined by the decoding apparatus, and are not limited to the above-described example.
이후, 변환 계수 그룹 스캔부(50)는 상기 변환 영역 정보에 기초하여 분할된 적어도 하나 이상의 변환 영역 내의 복수 개의 변환 계수 그룹을 스캔할 수 있다. 변환 계수 그룹 스캔부(50)는 분할된 변환 영역들의 변환 계수 그룹들을 스캔하기 위하여, 제 1 변환 영역 스캔부(51) 및 제 2 변환 영역 스캔부(52)를 포함할 수 있다. 상기 변환 영역 스캔부는 제 1 변환 영역 스캔부(51) 및 제 2 변환 영역 스캔부(52)에 한정되지 아니하며, 상기 변환 블록이 분할된 변환 영역의 개수에 대응하여 포함될 수 있다. Thereafter, the transform coefficient
먼저, 제 1 변환 영역 스캔부(51)는 상기 변환 영역 정보에 기초하여 분할된 복수 개의 변환 영역 중 제 1 변환 영역에 포함되는 복수 개의 변환 계수 그룹들을 스캔할 수 있다(S20). 이후, 제 2 변환 영역 스캔부(52)가 제 2 변환 영역에 포함되는 복수 개의 변환 계수 그룹들을 스캔할 수 있다. 만일 변환 영역 스캔부가 세 개 이상 포함되는 경우에는, 차례로 변환 영역에 포함되는 변환 계수 그룹들을 스캔한다 할 것이다.First, the first transform
일 실시예에서, 제 1 변환 영역 스캔부(51)는 제 2 변환 영역 스캔부(52)보다 저주파 영역의 변환 계수 그룹들을 포함할 수 있다. 이와 같이, 본 발명의 변환 계수 그룹들의 스캔 방법은 저주파 영역의 변환 계수 그룹들이 고주파 영역의 변환 계수 그룹들보다 먼저 스캔되도록 스캔 오더가 결정됨으로써, 고주파 영역의 변환 계수 그룹이 먼저 코딩되어 전송되고, 저주파 영역의 변환 계수 그룹들이 큰 값의 스캔 오더 인덱스를 갖아 코딩 효율을 저해시키는 단점을 해소할 수 있게 된다.In an embodiment, the first transform
또한, 일 실시예에서는 변환 영역 정보를 획득하기 이전에 상기 변환 블록이 비정방형 블록인지 여부를 먼저 판단할 수 있다. 고주파 영역에 해당하는 변환 계수 그룹이 저주파 영역에 해당하는 변환 계수 그룹이 비하여 먼저 스캔되어 코딩 효율을 저해시키는 것은, 변환 블록이 비정방형 블록인 경우 빈번하게 발생할 수 있다. 그러므로, 변환 영역 정보를 획득하기 이전에 현재 변환 블록이 비정방형 블록인지 여부를 먼저 판단할 수 있다. Also, in an embodiment, it may be first determined whether the transform block is a non-square block before obtaining transform domain information. A transform coefficient group corresponding to a high frequency domain is scanned earlier than a transform coefficient group corresponding to a low frequency domain, thereby impairing coding efficiency, which may frequently occur when the transform block is a non-square block. Therefore, before obtaining the transform domain information, it may be first determined whether the current transform block is a non-square block.
일 실시예에서, 상기 변환 블록이 비정방형 블록인지 판단하기 위하여 다양한 방법을 채택할 수 있다. 예를 들면, 상기 변환 블록의 가로 길이 및 세로 길이를 비교함으로써 상기 변환 블록이 비정방형 블록인지 판단할 수 있다. 또는, 상기 변환 블록의 크기 및 모양에 대한 정보를 부호화 장치로부터 수신하거나 복호화 장치치에서 기획득된 상기 변환 블록의 분할 정보, 방향 정보, α, β및 픽셀 정보 중 어느 하나 이상을 기초로 하여 판단될 수 있다. In an embodiment, various methods may be employed to determine whether the transform block is a non-square block. For example, it may be determined whether the transform block is a non-square block by comparing the horizontal and vertical lengths of the transform block. Alternatively, information on the size and shape of the transform block is received from the encoding device or determined based on any one or more of partition information, direction information, α, β, and pixel information of the transform block specially acquired by the decoding device can be
또한, 상기 변환 블록의 타입을 나타내는 변환 블록 타입 정보에 기초하여 판단될 수도 있다. 상기 변환 블록 타입 정보는 부호화 장치로부터 수신될 수도 있으나, 복호화 장치에서 상기 변환 블록의 분할 정보, 방향 정보, 픽셀 정보, 및 가로 길이와 세로 길이 정보 중 어느 하나 이상을 기초로 하여 산출될 수도 있다. 이와 같은 방법으로 상기 변환 블록이 비정방형 블록으로 판단되는 경우, 도 9 및 도 10을 참조하여 상술한 방법으로 변환 블록의 변환 영역별로 상기 변환 영역에 포함된 변환 계수 그룹을 스캔할 수 있다. Also, it may be determined based on transform block type information indicating the type of the transform block. The transform block type information may be received from the encoding apparatus, or may be calculated by the decoding apparatus based on at least one of partition information, direction information, pixel information, and horizontal length and vertical length information of the transform block. When the transform block is determined to be a non-square block in this way, the transform coefficient group included in the transform region may be scanned for each transform region of the transform block by the method described above with reference to FIGS. 9 and 10 .
도 11a 및 도 11b는 본 발명의 일 실시예에 따른 비정방형 변환 블록을 위한 변환 계수 그룹을 스캔하는 방법을 설명하기 위한 것이다.11A and 11B are for explaining a method of scanning a transform coefficient group for a non-square transform block according to an embodiment of the present invention.
도 11a를 참조하면, 본 발명의 비정방형 변환 블록(60a, 60b)은 가로 길이(A) 및 세로 길이(B)를 가질 수 있다. AxB 크기를 갖는 비정방형 변환 블록(60a, 60b)은 복수 개의 변환 계수 그룹을 포함하며, αxβ 크기의 변환 블록 영역으로 분할될 수 있다. 상기 α 및 β는 변환 블록에 포함되는 변환 계수 그룹의 수를 나타낸다. 즉, αxβ 크기의 영역은 가로 방향에 대하여 α 개의 변환 계수 그룹이 있고, 세로 방향에 대하여 β 개의 변환 계수 그룹이 있는 영역을 나타낼 수 있다. 일 실시예에서, 변환 영역 정보는 상기 α 및 β에 대한 정보를 포함할 수 있다. 또한, 변환 영역 정보는 변환 영역의 가로 및 세로 크기를 나타내는 정보를 포함할 수 있다. 예를 들면, 비정방형 변환 블록(60a)이 8x16 의 크기를 갖는 경우, 변환 영역의 구조를 나타내는 αxβ 는 2x2 이고, 변환 블록(60a)을 분할하는 변환 영역의 크기는 8x8 일 수 있다. Referring to FIG. 11A , the
이러한 변환 영역 정보는 상위 파라미터나 이전의 복호화 과정에서 산출될 수 있고, 간단하게는, 비정방형 변환 블록의 가로 및 세로 길이 중 작은 길이를 변환 계수 블록의 크기로 나눈 수로부터 산출될 수 있다. 그러나, 본 발명에서 변환 영역 정보를 획득하는 방법은 이에 제한되지 아니한다.Such transform domain information may be calculated as an upper parameter or in a previous decoding process, and may simply be calculated from the number obtained by dividing the smaller of the horizontal and vertical lengths of the non-square transform block by the size of the transform coefficient block. However, the method of obtaining transform domain information in the present invention is not limited thereto.
도 11b를 참조하면, 복수 개의 변환 영역으로 분할된 변환 블록(60a, 60b)은, 각 변환 영역마다 상위 파라미터 또는 상위 과정으로부터 결정된 스캔 방법을 적용하여 변환 계수 그룹을 스캔할 수 있다. 예를 들어, 16x8의 크기를 갖는 변환 블록(60b)가 8x8 의 크기를 갖는 변환 영역(αxβ = 2x2)으로 분할되고, 업-라이트 스캔 방법으로 변환 영역 및 변환 계수 그룹이 스캔되는 경우, CG Region 1 내의 변환 계수 그룹이 먼저 업-라이트 스캔 방법으로 스캔되고, 이후 CG Region 2 내의 변환 계수 그룹이 업-라이트 스캔 방법으로 스캔될 수 있다.Referring to FIG. 11B , the transform blocks 60a and 60b divided into a plurality of transform regions may scan the transform coefficient group by applying a scan method determined from a higher parameter or higher process to each transform region. For example, when the
도 12a 내지 도 13d는 본 발명의 일 실시예에 따른 비정방형 변환 블록을 위한 변환 계수 그룹을 스캔하는 다양한 방법을 설명하기 위한 것이다.12A to 13D are for explaining various methods of scanning a transform coefficient group for a non-square transform block according to an embodiment of the present invention.
도 12a 내지 도 12d를 참조하면, 변환 블록(70)이 변환 블록의 작은 변 길이를 갖는 변환 영역으로 분할된 경우의 변환 계수 그룹은 다양한 방법으로 스캔될 수 있다. 도 12a에서 나타난 바와 같이, 변환 블록(70)이 16x32 의 크기를 갖는 경우, 각각의 변환 영역 CG Region 0, CG Region 1 (71, 72)은 16x16 의 크기를 가질 수 있다. 여기서 가로 및 세로 방향으로의 변환 영역의 크기를 나타내는 α 및 β는 α=β=4 일 수 있다. 12A to 12D , when the
일 실시예에서, 변환 블록(70)은 변환 영역별로 각각의 변환 영역에 포함된 변환 계수 그룹을 차례로 스캔할 수 있다. 예를 들면, 도 12b에 나타난 바와 같이, 변환 블록(70)이 업-라이트 스캔 방법으로 스캔되는 경우에는 하단의 제 2 변환 영역(CG Region 1)에 포함된 제 32 변환 계수 그룹(CG 31)으로부터 제 17 변환 계수 그룹(CG 16)이 차례로 스캔되고, 이후 제 1 변환 영역(CG Region 0)에 포함된 제 16 변환 계수 그룹(CG 15)으로부터 제 1 변환 계수 그룹(CG 0)이 차례로 스캔될 수 있다. 또한, 변환 블록이 두 개의 변환 영역으로 분할되고, 버티컬 스캔 방법 및 호리젠탈 스캔 방법을 상기 변환 블록에 적용하는 경우는 도 12c 및 도 12d에 나타난 것과 동일하다.In an embodiment, the
도 13a 내지 도 13d를 참조하면, 변환 블록(80)이 변환 블록(80)의 작은 변 길이를 갖는 변환 영역으로 분할된 경우의 변환 계수 그룹은 다양한 방법으로 스캔될 수 있다. 도 13a에서 나타난 바와 같이, 변환 블록(80)이 32x16 의 크기를 갖는 경우, 각각의 변환 영역 CG Region 0, CG Region 1 (81, 82)은 16x16 의 크기를 가질 수 있다. 여기서 가로 및 세로 방향으로의 변환 영역의 개수를 나타내는 α 및 β는 α=β=4 일 수 있다. 13A to 13D , when the
일 실시예에서, 변환 블록(80)은 변환 영역별로 각각의 변환 영역에 포함된 변환 계수 그룹을 차례로 스캔할 수 있다. 예를 들면, 도 13b에 나타난 바와 같이, 변환 블록(80)이 업-라이트 스캔 방법으로 스캔되는 경우에는 우측의 제 2 변환 영역(82)에 포함된 제 32 변환 계수 그룹(CG 31)으로부터 제 17 변환 계수 그룹(CG 16)이 업라이트 방식에 따라 차례로 스캔되고, 이후 제 1 변환 영역(CG Region 0)에 포함된 제 16 변환 계수 그룹(CG 15)으로부터 제 1 변환 계수 그룹(CG 0)이 차례로 스캔될 수 있다. 또한, 도 13c에 나타난 바와 같이, 변환 블록(80)이 버티컬 스캔 방법으로 스캔되는 경우에는 우측의 제 2 변환 영역(82)에 포함된 제 32 변환 계수 그룹(CG 31)으로부터 제 17 변환 계수 그룹(CG 16)이 버티컬 방식에 따라 차례로 스캔되고, 이후 제 1 변환 영역(CG Region 0)에 포함된 제 16 변환 계수 그룹(CG 15)으로부터 제 1 변환 계수 그룹(CG 0)이 차례로 스캔될 수 있다. 변환 블록이 두 개의 변환 영역으로 분할되고, 호리젠탈 스캔 방법을 상기 변환 블록에 적용하는 경우는 도 13d에 나타난 것과 동일하다. In an embodiment, the
이와 같이 변환 블록을 복수 개의 변환 계수 그룹을 포함하는 적어도 하나 이상의 변환 영역으로 분할하고 상기 변환 영역별로 스캔하는 방법에 따르면, 저주파 영역의 변환 계수 그룹을 고주파 영역의 변환 계수 그룹보다 먼저 스캔하여 전송하게 되므로 코딩 효율을 높일 수 있다.As described above, according to the method of dividing a transform block into at least one transform domain including a plurality of transform coefficient groups and scanning for each transform domain, the transform coefficient group of the low frequency domain is scanned before the transform coefficient group of the high frequency domain. Therefore, coding efficiency can be improved.
이상에서 설명한 본 발명이 전술한 실시예 및 첨부된 도면에 한정되지 않으며, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러가지 치환, 변형 및 변경이 가능하다는 것은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.It is common in the art to which the present invention pertains that the present invention described above is not limited to the above-described embodiments and the accompanying drawings, and that various substitutions, modifications and changes are possible within the scope without departing from the technical spirit of the present invention. It will be clear to those who have knowledge.
Claims (10)
상기 변환 영역 정보를 이용하여 상기 변환 블록을 상기 적어도 2개 이상의 변환 영역들로 분할하는 단계;
상기 변환 영역 정보로부터 상기 분할된 변환 영역들 각각의 스캔 방법을 획득하는 단계; 및
상기 스캔 방법에 따라 상기 분할된 제 1 변환 영역 및 제 2 변환 영역에 포함된 복수의 변환 계수 그룹들을 스캔하는 단계를 포함하며,
상기 변환 계수 그룹은 복수의 변환 계수를 포함하는 비디오 신호의 복호화 방법.Receiving a bitstream including transform region information included in a transform block and indicating transform regions in which the transform block is divided into at least two or more horizontal or vertical directions;
dividing the transform block into the at least two transform domains using the transform domain information;
obtaining a scan method of each of the divided transform regions from the transform region information; and
scanning a plurality of transform coefficient groups included in the divided first transform region and the second transform region according to the scanning method;
The transform coefficient group includes a plurality of transform coefficients.
상기 변환 영역 정보는 시퀀스 파라미터 셋(SPS) 및 슬라이스 헤더 중 적어도 하나 이상으로부터 획득되는 것을 특징으로 하는 비디오 신호의 복호화 방법.The method of claim 1,
The transform domain information is obtained from at least one of a sequence parameter set (SPS) and a slice header.
상기 변환 영역 정보는 인코더로부터 수신되는 것을 특징으로 하는 비디오 신호의 복호화 방법.The method of claim 1,
The video signal decoding method, characterized in that the transform domain information is received from an encoder.
상기 변환 블록의 타입을 결정하는 단계를 더 포함하는 것을 특징으로 하는 비디오 신호의 복호화 방법.The method of claim 1,
The method of decoding a video signal, characterized in that it further comprises determining the type of the transform block.
상기 변환 블록의 타입을 결정하는 단계는 상기 변환 블록의 가로 길이 및 세로 길이를 기초로 하여 수행되는 것을 특징으로 하는 비디오 신호의 복호화 방법.5. The method of claim 4,
The determining of the type of the transform block is performed based on a horizontal length and a vertical length of the transform block.
상기 변환 영역 정보로부터 상기 분할된 변환 영역들 각각의 스캔 방법을 획득하고, 상기 스캔 방법에 따라 상기 분할된 제 1 변환 영역 및 제 2 변환 영역에 포함된 복수의 변환 계수 그룹들을 스캔하는 변환 계수 스캔부를 포함하며,
상기 변환 계수 그룹은 복수의 변환 계수를 포함하는 비디오 신호의 복호화 장치.Receives a bitstream including transform region information included in a transform block and indicating transform regions in which the transform block is divided into at least two horizontal or vertical directions, and generating the transform block by using the transform region information a transform region dividing unit dividing the at least two transform regions; and
A transform coefficient scan for obtaining a scan method of each of the divided transform regions from the transform region information, and scanning a plurality of transform coefficient groups included in the divided first transform region and the second transform region according to the scan method includes wealth,
The transform coefficient group includes a plurality of transform coefficients.
상기 변환 영역 정보는 시퀀스 파라미터 셋(SPS) 및 슬라이스 헤더 중 적어도 하나 이상으로부터 획득되는 것을 특징으로 하는 비디오 신호의 복호화 장치.7. The method of claim 6,
The transform domain information is obtained from at least one of a sequence parameter set (SPS) and a slice header.
상기 변환 영역 정보는 인코더로부터 수신되는 것을 특징으로 하는 비디오 신호의 복호화 장치.7. The method of claim 6,
The video signal decoding apparatus, characterized in that the transform domain information is received from an encoder.
상기 비트스트림은 상기 변환 블록의 타입에 대한 정보를 더 포함하는 것을 특징으로 하는 비디오 신호의 복호화 장치.7. The method of claim 6,
The video signal decoding apparatus, wherein the bitstream further includes information on the type of the transform block.
상기 변환 블록의 타입에 대한 정보는 상기 변환 블록의 가로 길이 및 세로 길이를 기초로 하며,
상기 변환 영역 분할부는 상기 변환 블록의 타입에 대한 정보를 기초로 하여 상기 변환 블록의 타입을 결정하는 것을 특징으로 하는 비디오 신호의 복호화 장치.10. The method of claim 9,
Information on the type of the transform block is based on the horizontal length and vertical length of the transform block,
and the transform domain divider determines the type of the transform block based on information on the type of the transform block.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230049183A KR20230054805A (en) | 2016-06-17 | 2023-04-14 | A method of decoding a video signal and an apparatus having the same |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20160075787 | 2016-06-17 | ||
KR1020160075787 | 2016-06-17 | ||
KR1020170060576A KR102378803B1 (en) | 2016-06-17 | 2017-05-16 | A method of decoding a video signal and an apparatus having the same |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170060576A Division KR102378803B1 (en) | 2016-05-28 | 2017-05-16 | A method of decoding a video signal and an apparatus having the same |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230049183A Division KR20230054805A (en) | 2016-06-17 | 2023-04-14 | A method of decoding a video signal and an apparatus having the same |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220040451A true KR20220040451A (en) | 2022-03-30 |
KR102523384B1 KR102523384B1 (en) | 2023-04-20 |
Family
ID=80948400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220035103A KR102523384B1 (en) | 2016-06-17 | 2022-03-22 | A method of decoding a video signal and an apparatus having the same |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102523384B1 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120082375A (en) * | 2011-01-13 | 2012-07-23 | 삼성전자주식회사 | Method and appratus for encoding video using selective scan mode, method and appratus for decoding video using selective scan mode |
KR20120100836A (en) * | 2011-03-03 | 2012-09-12 | 한국전자통신연구원 | Method for transform coefficient scan and apparatus thereof |
KR20130064781A (en) * | 2010-09-27 | 2013-06-18 | 엘지전자 주식회사 | Method for partitioning block and decoding device |
KR20140074346A (en) * | 2011-11-04 | 2014-06-17 | 인포브릿지 피티이 엘티디 | Method of generating quantized block |
-
2022
- 2022-03-22 KR KR1020220035103A patent/KR102523384B1/en active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130064781A (en) * | 2010-09-27 | 2013-06-18 | 엘지전자 주식회사 | Method for partitioning block and decoding device |
KR20120082375A (en) * | 2011-01-13 | 2012-07-23 | 삼성전자주식회사 | Method and appratus for encoding video using selective scan mode, method and appratus for decoding video using selective scan mode |
KR20120100836A (en) * | 2011-03-03 | 2012-09-12 | 한국전자통신연구원 | Method for transform coefficient scan and apparatus thereof |
KR20140074346A (en) * | 2011-11-04 | 2014-06-17 | 인포브릿지 피티이 엘티디 | Method of generating quantized block |
Also Published As
Publication number | Publication date |
---|---|
KR102523384B1 (en) | 2023-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11917149B2 (en) | Method for constructing tile structure and apparatus therefor | |
JP7391958B2 (en) | Video signal encoding/decoding method and equipment used in the method | |
JP7423624B2 (en) | Video signal encoding/decoding method and equipment | |
KR20170108367A (en) | Method and apparatus for processing a video signal based on intra prediction | |
KR20230054805A (en) | A method of decoding a video signal and an apparatus having the same | |
KR20180086094A (en) | Method and apparatus for encoding or decoding video signal | |
KR101468078B1 (en) | Method and apparatus for intra prediction | |
KR102345458B1 (en) | A method of setting advanced motion vector predictor list and an apparatus having the same | |
KR20210035062A (en) | Method and apparatus for encoding/decoding image and recording medium for storing bitstream | |
KR20230074086A (en) | Method and apparatus for encoding or decoding video signal | |
KR102435502B1 (en) | Method and apparatus for encoding or decoding video signal | |
KR20180032775A (en) | Method and apparatus for processing a video signal based on adaptive block patitioning | |
KR102447951B1 (en) | A method of decoding a video signal and an apparatus having the same | |
KR102523384B1 (en) | A method of decoding a video signal and an apparatus having the same | |
KR20240157009A (en) | A method of decoding a video signal and an apparatus having the same | |
KR102525555B1 (en) | A method and an apparatus for encoding/decoding a residual block based on quantization parameter | |
KR102410326B1 (en) | Method and apparatus for encoding/decoding a video signal | |
KR20220134476A (en) | Method for encoding/decoding a video signal and recording medium storing a bitsteram generated based on the method | |
KR20210082877A (en) | Method for encoding/decoding video signal and apparatus therefor | |
KR20210082876A (en) | Method for encoding/decoding video signal and apparatus therefor | |
KR20210108836A (en) | Video signal encoding method and apparatus and video decoding method and apparatus | |
KR20210108834A (en) | Video signal encoding method and apparatus and video decoding method and apparatus | |
KR20210101829A (en) | Video signal encoding method and apparatus and video decoding method and apparatus | |
KR20210113922A (en) | Video signal encoding method and apparatus and video decoding method and apparatus | |
KR20210103763A (en) | Video signal encoding method and apparatus and video decoding method and apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
AMND | Amendment | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) |