KR102246634B1 - Video encoding and decoding method and apparatus using the same - Google Patents

Video encoding and decoding method and apparatus using the same Download PDF

Info

Publication number
KR102246634B1
KR102246634B1 KR1020140132543A KR20140132543A KR102246634B1 KR 102246634 B1 KR102246634 B1 KR 102246634B1 KR 1020140132543 A KR1020140132543 A KR 1020140132543A KR 20140132543 A KR20140132543 A KR 20140132543A KR 102246634 B1 KR102246634 B1 KR 102246634B1
Authority
KR
South Korea
Prior art keywords
picture
poc
decoding
value
decoded
Prior art date
Application number
KR1020140132543A
Other languages
Korean (ko)
Other versions
KR20150043972A (en
Inventor
강정원
이하현
이진호
최진수
김진웅
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to CN201480064335.8A priority Critical patent/CN105765978B/en
Priority to PCT/KR2014/009409 priority patent/WO2015053525A1/en
Priority to US15/027,101 priority patent/US10142638B2/en
Publication of KR20150043972A publication Critical patent/KR20150043972A/en
Priority to US16/157,217 priority patent/US10306244B2/en
Application granted granted Critical
Publication of KR102246634B1 publication Critical patent/KR102246634B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation

Abstract

본 발명에 따른 복수의 계층을 지원하는 영상의 복호화 방법은 복호화에 필요한 파라미터들을 초기화하는 단계와; 복호 대상 픽처의 식별자인 POC를 계산하는 단계와; 상기 대상 복호 픽처의 화면 간 예측을 위하여 참조 픽처 집합을 구성하고 참조 픽처 형태를 표시하는 단계와; 상기 대상 복호 픽처의 출력 여부를 결정하는 단계와; 상기 참조 픽처 집합에 기초하여 생성된 참조 픽처 리스트 내의 참조 픽처를 이용하여 상기 대상 복화 픽처에 대한 움직임 예측 및 움직임 보상을 수행하는 단계를 포함하고, 상기 POC를 계산하는 단계는 동일한 억세스 유닛의 기본 계층의 픽처가 IDR 픽처인 경우 상기 복호 대상 픽처의 POC는 0으로 설정하고, 상기 기본 계층의 픽처가 BLA 픽처 또는 CRA 픽처인 경우, 상기 복호 대상 픽처의 MSB는 0으로 설정될 수 있다.The method for decoding an image supporting a plurality of layers according to the present invention includes the steps of initializing parameters required for decoding; Calculating a POC that is an identifier of a picture to be decoded; Constructing a reference picture set and displaying a reference picture shape for inter prediction of the target decoded picture; Determining whether to output the target decoded picture; And performing motion prediction and motion compensation for the target decoded picture using a reference picture in a reference picture list generated based on the reference picture set, and calculating the POC comprises a base layer of the same access unit When the picture of is an IDR picture, the POC of the picture to be decoded is set to 0, and when the picture of the base layer is a BLA picture or a CRA picture, the MSB of the picture to be decoded may be set to 0.

Figure 112014094117135-pat00004
Figure 112014094117135-pat00004

Description

영상의 부호화/복호화 방법 및 이를 이용하는 장치{VIDEO ENCODING AND DECODING METHOD AND APPARATUS USING THE SAME}Video encoding/decoding method and apparatus using the same {VIDEO ENCODING AND DECODING METHOD AND APPARATUS USING THE SAME}

본 발명은 영상의 부호화 및 복호화 처리에 관한 것으로서, 보다 상세하게는 비트스트림 임의 접근을 지원하는 영상의 부/복호화 방법 및 그 장치에 관한 것이다.The present invention relates to an image encoding and decoding process, and more particularly, to an image encoding/decoding method and an apparatus for supporting random access to a bitstream.

최근 HD(High Definition) 해상도를 가지는 방송 서비스가 국내뿐만 아니라 세계적으로 확대되면서, 많은 사용자들이 고해상도, 고화질의 영상에 익숙해지고 있으며 이에 따라 많은 기관들이 차세대 영상기기에 대한 개발에 박차를 가하고 있다. 또한 HDTV와 더불어 HDTV의 4배 이상의 해상도를 갖는 UHD(Ultra High Definition)에 대한 관심이 증대되면서 보다 높은 해상도, 고화질의 영상에 대한 압축기술이 요구되고 있다.Recently, as broadcasting services having high definition (HD) resolution are expanded not only domestically but also globally, many users are getting accustomed to high-resolution and high-definition images, and accordingly, many organizations are spurring the development of next-generation video devices. In addition, as interest in UHD (Ultra High Definition) having a resolution of 4 times or more than HDTV in addition to HDTV is increasing, a compression technology for higher resolution and high-definition images is required.

영상 압축을 위해, 시간적으로 이전 및/또는 이후의 픽쳐로부터 현재 픽쳐에 포함된 화소값을 예측하는 인터(inter) 예측 기술, 현재 픽쳐 내의 화소 정보를 이용하여 현재 픽쳐에 포함된 화소값을 예측하는 인트라(intra) 예측 기술, 출현 빈도가 높은 심볼(symbol)에 짧은 부호를 할당하고 출현 빈도가 낮은 심볼에 긴 부호를 할당하는 엔트로피 부호화 기술 등이 사용될 수 있다.For image compression, an inter prediction technology that temporally predicts a pixel value included in a current picture from a previous and/or subsequent picture, and predicts a pixel value included in the current picture using pixel information in the current picture. An intra prediction technique, an entropy encoding technique in which a short code is assigned to a symbol with a high frequency of appearance, and a long code is assigned to a symbol with a low frequency of occurrence, may be used.

영상 압축 기술에는 유동적인 네트워크 환경을 고려하지 않고 하드웨어의 제한적인 동작 환경하에서 일정한 네트워크 대역폭을 제공하는 기술이 있다. 그러나 수시로 대역폭이 변화하는 네트워크 환경에 적용되는 영상 데이터를 압축하기 위해서는 새로운 압축 기술이 요구되고, 이를 위해 스케일러블(scalable) 비디오 부호화/복호화 방법이 사용될 수 있다. Image compression technology includes a technology that provides a constant network bandwidth under a limited operating environment of hardware without considering a flexible network environment. However, a new compression technique is required to compress image data applied to a network environment in which the bandwidth changes frequently, and for this purpose, a scalable video encoding/decoding method may be used.

본 발명은 비트스트림의 임의 시점부터 복호화가 가능하도록 하는 방법 및 이를 이용하는 장치를 제공한다.The present invention provides a method for enabling decoding from an arbitrary point in a bitstream and an apparatus using the same.

구체적으로, 본 발명의 일 실시예는 임의 접근 시점의 AU(access unit) 내에 IRAP(intra random access point) 픽처와 IRAP가 아닌 픽처(non- intra random access point picture)가 존재하거나, IRAP 픽처만 존재하지만 NAL 유닛 타입이 두 개 이상인 경우에 해당 AU 내의 픽처들의 POC 값을 설정하는 방법 및 이를 이용하는 장치를 제공한다. Specifically, in an embodiment of the present invention, an IRAP (intra random access point) picture and a non-IRAP picture (non-intra random access point picture) exist within an access unit (AU) at a random access point, or only an IRAP picture exists. However, when two or more NAL unit types are used, a method of setting POC values of pictures in a corresponding AU and an apparatus using the same are provided.

본 발명의 일 실시예는 임의 시점부터 비트스트림을 복호화할 때, 해당 시점에 포함된 픽처가 임의 접근이 불가능한 픽처가 포함된 경우에도 동일 AU 내의 POC 값을 동일하게 설정함으로써 복호 픽처 버퍼 내 픽처 관리를 용이하게 하는 방법 및 이를 이용하는 장치를 제공한다. According to an embodiment of the present invention, when decoding a bitstream from an arbitrary point in time, even when a picture included in the corresponding point in time includes a picture that cannot be accessed randomly, the POC value in the same AU is set equally to manage pictures in the decoded picture buffer. It provides a method for facilitating and an apparatus using the same.

본 발명의 일 실시예에 따른 복수의 계층을 지원하는 영상의 복호화 방법은 복호화에 필요한 파라미터들을 초기화하는 단계와; 복호 대상 픽처의 식별자인 POC를 계산하는 단계와; 상기 대상 복호 픽처의 화면 간 예측을 위하여 참조 픽처 집합을 구성하고 참조 픽처 형태를 표시하는 단계와; 상기 참조 픽처 집합에 포함되지만, 복호 픽처 버퍼 내에 존재하지 않는 픽처를 위한 가상 참조 픽처를 생성하는 단계와; 상기 대상 복호 픽처의 출력 여부를 결정하는 단계와; 상기 참조 픽처 집합에 기초하여 생성된 참조 픽처 리스트 내의 참조 픽처를 이용하여 상기 대상 복화 픽처에 대한 움직임 예측 및 움직임 보상을 수행하는 단계를 포함할 수 있고, 상기 POC를 계산하는 단계는 동일한 억세스 유닛의 기본 계층의 픽처가 IDR 픽처인 경우 상기 복호 대상 픽처의 POC는 0으로 설정하고, 상기 기본 계층의 픽처가 BLA 픽처 또는 CRA 픽처인 경우, 상기 복호 대상 픽처의 MSB는 0으로 설정될 수 있다. According to an embodiment of the present invention, a method for decoding an image supporting a plurality of layers includes: initializing parameters necessary for decoding; Calculating a POC that is an identifier of a picture to be decoded; Constructing a reference picture set and displaying a reference picture shape for inter prediction of the target decoded picture; Generating a virtual reference picture for a picture included in the reference picture set but not in a decoded picture buffer; Determining whether to output the target decoded picture; It may include performing motion prediction and motion compensation for the target decoded picture by using a reference picture in a reference picture list generated based on the reference picture set, and calculating the POC comprises: When the picture of the base layer is an IDR picture, the POC of the picture to be decoded is set to 0, and when the picture of the base layer is a BLA picture or a CRA picture, the MSB of the picture to be decoded may be set to 0.

본 발명의 일 실시예에 따르면, 비트스트림의 임의 시점부터 복호화가 가능하도록 하는 방법 및 이를 이용하는 장치가 제공된다.According to an embodiment of the present invention, a method for enabling decoding from an arbitrary point in a bitstream and an apparatus using the same are provided.

구체적으로, 본 발명의 일 실시예에 따르면, 임의 접근 시점의 AU(access unit) 내에 IRAP(intra random access point) 픽처와 IRAP가 아닌 픽처(non- intra random access point picture)가 존재하거나, IRAP 픽처만 존재하지만 NAL 유닛 타입이 두 개 이상인 경우에 해당 AU 내의 픽처들의 POC 값을 설정하는 방법 및 이를 이용하는 장치가 제공된다. Specifically, according to an embodiment of the present invention, an IRAP (intra random access point) picture and a non-IRAP picture (non-intra random access point picture) exist in an access unit (AU) at a random access point, or an IRAP picture However, when there are two or more NAL unit types, a method of setting POC values of pictures in a corresponding AU and an apparatus using the same are provided.

본 발명의 일 실시예에 따르면, 임의 시점부터 비트스트림을 복호화함할 때, 해당 시점에 포함된 픽처가 임의 접근이 불가능한 픽처가 포함된 경우에도 동일 AU 내의 POC 값을 동일하게 설정함으로써 복호 픽처 버퍼 내 픽처 관리를 용이하게 하는 방법 및 이를 이용하는 장치가 제공된다.According to an embodiment of the present invention, when decoding a bitstream from an arbitrary point in time, a decoded picture buffer by setting the same POC value in the same AU even when a picture included in the corresponding view includes a picture that cannot be accessed randomly. A method for facilitating management of my pictures and an apparatus using the same are provided.

도 1은 영상 부호화 장치의 일 실시예에 따른 구성을 나타내는 블록도이다.
도 2는 영상 복호화 장치의 일 실시예에 따른 구성을 나타내는 블록도이다.
도 3은 본 발명이 적용될 수 있는, 복수 계층을 이용한 스케일러블 비디오 코딩 구조의 일 실시예를 개략적으로 나타내는 개념도이다.
도 4는 본 발명의 일 실시예에 따른 영상의 복호화 방법을 설명하기 위한 제어 흐름도이다.
도 5는 본 발명에 따라 픽처의 POC를 계산하는 것을 설명하기 위한 도면이다.
1 is a block diagram illustrating a configuration of an image encoding apparatus according to an embodiment.
2 is a block diagram illustrating a configuration of an image decoding apparatus according to an embodiment.
3 is a conceptual diagram schematically showing an embodiment of a scalable video coding structure using multiple layers to which the present invention can be applied.
4 is a control flowchart illustrating a method of decoding an image according to an embodiment of the present invention.
5 is a diagram for explaining calculating a POC of a picture according to the present invention.

이하, 도면을 참조하여 본 발명의 실시 형태에 대하여 구체적으로 설명한다. 본 명세서의 실시예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 명세서의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In describing the embodiments of the present specification, when it is determined that a detailed description of a related known configuration or function may obscure the subject matter of the present specification, a detailed description thereof will be omitted.

어떤 구성 요소가 다른 구성 요소에 “연결되어” 있다거나 “접속되어” 있다고 언급된 때에는, 그 다른 구성 요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있으나, 중간에 다른 구성 요소가 존재할 수도 있다고 이해되어야 할 것이다. 아울러, 본 발명에서 특정 구성을 “포함”한다고 기술하는 내용은 해당 구성 이외의 구성을 배제하는 것이 아니며, 추가적인 구성이 본 발명의 실시 또는 본 발명의 기술적 사상의 범위에 포함될 수 있음을 의미한다. When a component is referred to as being “connected” or “connected” to another component, it is understood that it may be directly connected or connected to the other component, but other components may exist in the middle. It should be. In addition, the description of "including" a specific configuration in the present invention does not exclude configurations other than the corresponding configuration, and means that additional configurations may be included in the scope of the implementation of the present invention or the scope of the technical idea of the present invention.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.Terms such as first and second may be used to describe various elements, but the elements should not be limited by the terms. The above terms are used only for the purpose of distinguishing one component from another component. For example, without departing from the scope of the present invention, a first element may be referred to as a second element, and similarly, a second element may be referred to as a first element.

또한 본 발명의 실시예에 나타나는 구성부들은 서로 다른 특징적인 기능들을 나타내기 위해 독립적으로 도시되는 것으로, 각 구성부들이 분리된 하드웨어나 하나의 소프트웨어 구성단위로 이루어짐을 의미하지 않는다. 즉, 각 구성부는 설명의 편의상 각각의 구성부로 나열하여 포함한 것으로 각 구성부 중 적어도 두 개의 구성부가 합쳐져 하나의 구성부로 이루어지거나, 하나의 구성부가 복수 개의 구성부로 나뉘어져 기능을 수행할 수 있고 이러한 각 구성부의 통합된 실시예 및 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리범위에 포함된다.In addition, the constituent units shown in the embodiments of the present invention are shown independently to represent different characteristic functions, and does not mean that each constituent unit is formed of separate hardware or a single software constituent unit. That is, each constituent part is listed and included as a respective constituent part for convenience of explanation, and at least two of the constituent parts are combined to form one constituent part, or one constituent part is divided into a plurality of constituent parts to perform a function Integrated embodiments and separate embodiments of the components are also included in the scope of the present invention as long as they do not depart from the essence of the present invention.

또한, 일부의 구성 요소는 본 발명에서 본질적인 기능을 수행하는 필수적인 구성 요소는 아니고 단지 성능을 향상시키기 위한 선택적 구성 요소일 수 있다. 본 발명은 단지 성능 향상을 위해 사용되는 구성 요소를 제외한 본 발명의 본질을 구현하는데 필수적인 구성부만을 포함하여 구현될 수 있고, 단지 성능 향상을 위해 사용되는 선택적 구성 요소를 제외한 필수 구성 요소만을 포함한 구조도 본 발명의 권리범위에 포함된다.
In addition, some of the components are not essential components that perform essential functions in the present invention, but may be optional components only for improving performance. The present invention can be implemented by including only components essential to implement the essence of the present invention excluding components used for performance improvement, and a structure including only essential components excluding optional components used for performance improvement Also included in the scope of the present invention.

도 1은 영상 부호화 장치의 일 실시예에 따른 구성을 나타내는 블록도이다. 스케일러블(scalable) 비디오 부호화/복호화 방법 또는 장치는 스케일러빌리티(scalability)를 제공하지 않는 일반적인 영상 부호화/복호화 방법 또는 장치의 확장(extension)에 의해 구현될 수 있으며, 도 1의 블록도는 스케일러블 비디오 부호화 장치의 기초가 될 수 있는 영상 부호화 장치의 일 실시예를 나타낸다.1 is a block diagram illustrating a configuration of an image encoding apparatus according to an embodiment. A scalable video encoding/decoding method or apparatus may be implemented by a general video encoding/decoding method or apparatus that does not provide scalability, and the block diagram of FIG. 1 is scalable. It shows an embodiment of an image encoding apparatus that can be the basis of a video encoding apparatus.

도 1을 참조하면, 상기 영상 부호화 장치(100)는 움직임 예측부(111), 움직임 보상부(112), 인트라 예측부(120), 스위치(115), 감산기(125), 변환부(130), 양자화부(140), 엔트로피 부호화부(150), 역양자화부(160), 역변환부(170), 가산기(175), 필터부(180) 및 참조영상 버퍼(190)를 포함한다.Referring to FIG. 1, the image encoding apparatus 100 includes a motion prediction unit 111, a motion compensation unit 112, an intra prediction unit 120, a switch 115, a subtractor 125, and a transform unit 130. , A quantization unit 140, an entropy encoding unit 150, an inverse quantization unit 160, an inverse transform unit 170, an adder 175, a filter unit 180, and a reference image buffer 190.

영상 부호화 장치(100)는 입력 영상에 대해 인트라(intra) 모드 또는 인터(inter) 모드로 부호화를 수행하고 비트스트림(bit stream)을 출력할 수 있다. 인트라 예측은 화면 내 예측, 인터 예측은 화면 간 예측을 의미한다. 인트라 모드인 경우 스위치(115)가 인트라로 전환되고, 인터 모드인 경우 스위치(115)가 인터로 전환된다. 영상 부호화 장치(100)는 입력 영상의 입력 블록에 대한 예측 블록을 생성한 후, 입력 블록과 예측 블록의 차분을 부호화할 수 있다.The image encoding apparatus 100 may encode an input image in an intra mode or an inter mode and output a bit stream. Intra prediction means intra prediction, and inter prediction means inter prediction. In the intra mode, the switch 115 is switched to intra, and in the inter mode, the switch 115 is switched to inter. After generating a prediction block for an input block of an input image, the image encoding apparatus 100 may encode a difference between the input block and the prediction block.

인트라 모드인 경우, 인트라 예측부(120)는 현재 블록 주변의 이미 부호화된 블록의 화소값을 이용하여 공간적 예측을 수행하여 예측 블록을 생성할 수 있다.In the case of the intra mode, the intra prediction unit 120 may generate a prediction block by performing spatial prediction using pixel values of an already coded block around the current block.

인터 모드인 경우, 움직임 예측부(111)는, 움직임 예측 과정에서 참조 영상 버퍼(190)에 저장되어 있는 참조 영상에서 입력 블록과 가장 매치가 잘 되는 영역을 찾아 움직임 벡터를 구할 수 있다. 움직임 보상부(112)는 움직임 벡터와 참조 영상 버퍼(190)에 저장되어 있는 참조 영상을 이용하여 움직임 보상을 수행함으로써 예측 블록을 생성할 수 있다. In the case of the inter mode, the motion prediction unit 111 may find a region in the reference image stored in the reference image buffer 190 that best matches the input block in the motion prediction process to obtain a motion vector. The motion compensation unit 112 may generate a prediction block by performing motion compensation using a motion vector and a reference image stored in the reference image buffer 190.

감산기(125)는 입력 블록과 생성된 예측 블록의 차분에 의해 잔여 블록(residual block)을 생성할 수 있다. 변환부(130)는 잔여 블록에 대해 변환(transform)을 수행하여 변환 계수(transform coefficient)를 출력할 수 있다. 그리고 양자화부(140)는 입력된 변환 계수를 양자화 파라미터에 따라 양자화하여 양자화된 계수(quantized coefficient)를 출력할 수 있다. The subtractor 125 may generate a residual block based on a difference between the input block and the generated prediction block. The transform unit 130 may transform the residual block and output a transform coefficient. In addition, the quantization unit 140 may quantize the input transform coefficient according to a quantization parameter and output a quantized coefficient.

엔트로피 부호화부(150)는, 양자화부(140)에서 산출된 값들 또는 부호화 과정에서 산출된 부호화 파라미터 값 등을 기초로, 심볼(symbol)을 확률 분포에 따라 엔트로피 부호화하여 비트스트림(bit stream)을 출력할 수 있다. 엔트로피 부호화 방법은 다양한 값을 갖는 심볼을 입력 받아, 통계적 중복성을 제거하면서, 복호 가능한 2진수의 열로 표현하는 방법이다. The entropy encoding unit 150 entropy-encodes a symbol according to a probability distribution based on values calculated by the quantization unit 140 or an encoding parameter value calculated during an encoding process to generate a bit stream. Can be printed. The entropy encoding method is a method of receiving symbols having various values, removing statistical redundancy, and expressing them as a sequence of decodeable binary numbers.

여기서, 심볼이란 부호화/복호화 대상 구문 요소(syntax element) 및 부호화 파라미터(coding parameter), 잔여 신호(residual signal)의 값 등을 의미한다. 부호화 파라미터는 부호화 및 복호화에 필요한 매개변수로서, 구문 요소와 같이 부호화 장치에서 부호화되어 복호화 장치로 전달되는 정보뿐만 아니라, 부호화 혹은 복호화 과정에서 유추될 수 있는 정보를 포함할 수 있으며 영상을 부호화하거나 복호화할 때 필요한 정보를 의미한다. 부호화 파라미터는 예를 들어 인트라/인터 예측모드, 이동/움직임 벡터, 참조 영상 색인, 부호화 블록 패턴, 잔여 신호 유무, 변환 계수, 양자화된 변환 계수, 양자화 파라미터, 블록 크기, 블록 분할 정보 등의 값 또는 통계를 포함할 수 있다. 또한 잔여 신호는 원신호와 예측 신호의 차이를 의미할 수 있고, 또한 원신호와 예측 신호의 차이가 변환(transform)된 형태의 신호 또는 원신호와 예측 신호의 차이가 변환되고 양자화된 형태의 신호를 의미할 수도 있다. 잔여 신호는 블록 단위에서는 잔여 블록이라 할 수 있다.Here, the symbol means a syntax element to be encoded/decoded, a coding parameter, a value of a residual signal, and the like. An encoding parameter is a parameter necessary for encoding and decoding, and may include information that can be inferred during encoding or decoding as well as information encoded by the encoding device and transmitted to the decoding device, such as a syntax element, and encodes or decodes an image. It means the information you need when doing it. Encoding parameters include values such as intra/inter prediction mode, motion/motion vector, reference image index, coded block pattern, residual signal presence, transform coefficient, quantized transform coefficient, quantization parameter, block size, block division information, etc., or Can include statistics. In addition, the residual signal may mean the difference between the original signal and the predicted signal, and a signal in which the difference between the original signal and the predicted signal is transformed, or the difference between the original signal and the predicted signal is transformed and quantized. It can also mean. The residual signal may be referred to as a residual block in block units.

엔트로피 부호화가 적용되는 경우, 높은 발생 확률을 갖는 심볼에 적은 수의 비트가 할당되고 낮은 발생 확률을 갖는 심볼에 많은 수의 비트가 할당되어 심볼이 표현됨으로써, 부호화 대상 심볼들에 대한 비트열의 크기가 감소될 수 있다. 따라서 엔트로피 부호화를 통해서 영상 부호화의 압축 성능이 높아질 수 있다. When entropy coding is applied, a small number of bits are allocated to a symbol having a high probability of occurrence and a large number of bits are allocated to a symbol having a low probability of occurrence, thereby expressing the symbol, so that the size of the bit string for the symbols to be encoded is reduced. Can be reduced. Accordingly, compression performance of image encoding may be improved through entropy encoding.

엔트로피 부호화를 위해 지수 골룸(exponential golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 부호화 방법이 사용될 수 있다. 예를 들어, 엔트로피 부호화부(150)에는 가변 길이 부호화(VLC: Variable Lenghth Coding/Code) 테이블과 같은 엔트로피 부호화를 수행하기 위한 테이블이 저장될 수 있고, 엔트로피 부호화부(150)는 저장된 가변 길이 부호화(VLC) 테이블을 사용하여 엔트로피 부호화를 수행할 수 있다. 또한 엔트로피 부호화부(150)는 대상 심볼의 이진화(binarization) 방법 및 대상 심볼/빈(bin)의 확률 모델(probability model)을 도출한 후, 도출된 이진화 방법 또는 확률 모델을 사용하여 엔트로피 부호화를 수행할 수도 있다.For entropy encoding, encoding methods such as exponential golomb, Context-Adaptive Variable Length Coding (CAVLC), and Context-Adaptive Binary Arithmetic Coding (CABAC) may be used. For example, the entropy encoding unit 150 may store a table for performing entropy encoding such as a variable length encoding (VLC) table, and the entropy encoding unit 150 may store the stored variable length encoding Entropy coding can be performed using the (VLC) table. In addition, the entropy encoder 150 derives a binarization method of a target symbol and a probability model of a target symbol/bin, and then performs entropy encoding using the derived binarization method or a probability model. You may.

양자화된 계수는 역양자화부(160)에서 역양자화되고 역변환부(170)에서 역변환될 수 있다. 역양자화, 역변환된 계수는 가산기(175)를 통해 예측 블록과 더해지고 복원 블록이 생성될 수 있다. The quantized coefficient may be inverse quantized by the inverse quantization unit 160 and may be inversely transformed by the inverse transform unit 170. The inverse quantized and inverse transformed coefficients are added to the prediction block through the adder 175, and a reconstructed block may be generated.

복원 블록은 필터부(180)를 거치고, 필터부(180)는 디블록킹 필터(deblocking filter), SAO(Sample Adaptive Offset), ALF(Adaptive Loop Filter) 중 적어도 하나 이상을 복원 블록 또는 복원 픽쳐에 적용할 수 있다. 필터부(180)를 거친 복원 블록은 참조 영상 버퍼(190)에 저장될 수 있다.
The restoration block passes through the filter unit 180, and the filter unit 180 applies at least one of a deblocking filter, a sample adaptive offset (SAO), and an adaptive loop filter (ALF) to a restoration block or a reconstructed picture. can do. The reconstructed block that has passed through the filter unit 180 may be stored in the reference image buffer 190.

도 2는 영상 복호화 장치의 일 실시예에 따른 구성을 나타내는 블록도이다. 도 1에서 상술한 바와 같이 스케일러블 비디오 부호화/복호화 방법 또는 장치는 스케일러빌리티를 제공하지 않는 일반적인 영상 부호화/복호화 방법 또는 장치의 확장에 의해 구현될 수 있으며, 도 2의 블록도는 스케일러블 비디오 복호화 장치의 기초가 될 수 있는 영상 복호화 장치의 일 실시예를 나타낸다.2 is a block diagram illustrating a configuration of an image decoding apparatus according to an embodiment. As described above in FIG. 1, the scalable video encoding/decoding method or apparatus may be implemented by a general video encoding/decoding method or apparatus that does not provide scalability, and the block diagram of FIG. 2 is a scalable video decoding method. It shows an embodiment of an image decoding apparatus that can be the basis of the apparatus.

도 2를 참조하면, 상기 영상 복호화 장치(200)는 엔트로피 복호화부(210), 역양자화부(220), 역변환부(230), 인트라 예측부(240), 움직임 보상부(250), 필터부(260) 및 참조 영상 버퍼(270)를 포함한다.Referring to FIG. 2, the image decoding apparatus 200 includes an entropy decoding unit 210, an inverse quantization unit 220, an inverse transform unit 230, an intra prediction unit 240, a motion compensation unit 250, and a filter unit. 260 and a reference image buffer 270.

영상 복호화 장치(200)는 부호화 장치에서 출력된 비트스트림을 입력 받아 인트라 모드 또는 인터 모드로 복호화를 수행하고 재구성된 영상, 즉 복원 영상을 출력할 수 있다. 인트라 모드인 경우 스위치가 인트라로 전환되고, 인터 모드인 경우 스위치가 인터로 전환될 수 있다. 영상 복호화 장치(200)는 입력 받은 비트스트림으로부터 복원된 잔여 블록(residual block)을 얻고 예측 블록을 생성한 후 복원된 잔여 블록과 예측 블록을 더하여 재구성된 블록, 즉 복원 블록을 생성할 수 있다.The image decoding apparatus 200 may receive a bitstream output from the encoding apparatus, perform decoding in an intra mode or an inter mode, and output a reconstructed image, that is, a reconstructed image. In the case of the intra mode, the switch may be switched to intra, and in the case of the inter mode, the switch may be switched to inter. The image decoding apparatus 200 may generate a reconstructed block, that is, a reconstructed block, by obtaining a residual block reconstructed from an input bitstream, generating a prediction block, and adding the reconstructed residual block and the prediction block.

엔트로피 복호화부(210)는, 입력된 비트스트림을 확률 분포에 따라 엔트로피 복호화하여, 양자화된 계수(quantized coefficient) 형태의 심볼을 포함한 심볼들을 생성할 수 있다. 엔트로피 복호화 방법은 2진수의 열을 입력 받아 각 심볼들을 생성하는 방법이다. 엔트로피 복호화 방법은 상술한 엔트로피 부호화 방법과 유사하다.The entropy decoder 210 may entropy-decode the input bitstream according to a probability distribution to generate symbols including symbols in the form of quantized coefficients. The entropy decoding method is a method of generating each symbol by receiving a string of binary numbers. The entropy decoding method is similar to the entropy encoding method described above.

양자화된 계수는 역양자화부(220)에서 역양자화되고 역변환부(230)에서 역변환되며, 양자화된 계수가 역양자화/역변환 된 결과, 복원된 잔여 블록(residual block)이 생성될 수 있다. The quantized coefficients are inverse quantized in the inverse quantization unit 220 and inversely transformed in the inverse transform unit 230, and as a result of the inverse quantization/inverse transformation of the quantized coefficients, a reconstructed residual block may be generated.

인트라 모드인 경우, 인트라 예측부(240)는 현재 블록 주변의 이미 부호화된 블록의 화소값을 이용하여 공간적 예측을 수행하여 예측 블록을 생성할 수 있다. 인터 모드인 경우, 움직임 보상부(250)는 움직임 벡터 및 참조 영상 버퍼(270)에 저장되어 있는 참조 영상을 이용하여 움직임 보상을 수행함으로써 예측 블록을 생성할 수 있다. In the case of the intra mode, the intra prediction unit 240 may generate a prediction block by performing spatial prediction using pixel values of an already coded block around the current block. In the case of the inter mode, the motion compensation unit 250 may generate a prediction block by performing motion compensation using a motion vector and a reference image stored in the reference image buffer 270.

복원된 잔여 블록과 예측 블록은 가산기(255)를 통해 더해지고, 더해진 블록은 필터부(260)를 거친다. 필터부(260)는 디블록킹 필터, SAO, ALF 중 적어도 하나 이상을 복원 블록 또는 복원 픽쳐에 적용할 수 있다. 필터부(260)는 재구성된 영상, 즉 복원 영상을 출력한다. 복원 영상은 참조 영상 버퍼(270)에 저장되어 화면 간 예측에 사용될 수 있다.The reconstructed residual block and prediction block are added through an adder 255, and the added block passes through a filter unit 260. The filter unit 260 may apply at least one of a deblocking filter, SAO, and ALF to a reconstructed block or a reconstructed picture. The filter unit 260 outputs a reconstructed image, that is, a reconstructed image. The reconstructed image may be stored in the reference image buffer 270 and used for inter prediction.

상기 영상 복호화 장치(200)에 포함되어 있는 엔트로피 복호화부(210), 역양자화부(220), 역변환부(230), 인트라 예측부(240), 움직임 보상부(250), 필터부(260) 및 참조 영상 버퍼(270) 중 영상의 복호화에 직접적으로 관련된 구성요소들, 예컨대, 엔트로피 복호화부(210), 역양자화부(220), 역변환부(230), 인트라 예측부(240), 움직임 보상부(250), 필터부(260) 등을 다른 구성요소와 구분하여 복호화부 또는 디코딩부로 표현할 수 있다. An entropy decoding unit 210, an inverse quantization unit 220, an inverse transform unit 230, an intra prediction unit 240, a motion compensation unit 250, and a filter unit 260 included in the image decoding apparatus 200 And components of the reference image buffer 270 directly related to decoding of an image, for example, an entropy decoding unit 210, an inverse quantization unit 220, an inverse transform unit 230, an intra prediction unit 240, and motion compensation. The unit 250, the filter unit 260, and the like may be separated from other components and expressed as a decoding unit or a decoding unit.

또한, 영상 복호화 장치(200)는 비트스트림에 포함되어 있는 인코딩된 영상에 관련된 정보를 파싱하는 도시하지 않은 파싱부를 더 포함할 수 있다. 파싱부는 엔트로피 복호화부(210)를 포함할 수도 있고, 엔트로피 복호화부(210)에 포함될 수도 있다. 이러한 파싱부는 또한 디코딩부의 하나의 구성요소로 구현될 수도 있다.
In addition, the image decoding apparatus 200 may further include a parsing unit (not shown) for parsing information related to the encoded image included in the bitstream. The parsing unit may include an entropy decoding unit 210 or may be included in the entropy decoding unit 210. This parsing unit may also be implemented as a component of the decoding unit.

도 3은 본 발명이 적용될 수 있는, 복수 계층을 이용한 스케일러블 비디오 코딩 구조의 일 실시예를 개략적으로 나타내는 개념도이다. 도 3에서 GOP(Group of Picture)는 픽쳐군 즉, 픽쳐의 그룹을 나타낸다.3 is a conceptual diagram schematically showing an embodiment of a scalable video coding structure using multiple layers to which the present invention can be applied. In FIG. 3, a group of pictures (GOP) represents a picture group, that is, a group of pictures.

영상 데이터를 전송하기 위해서는 전송 매체가 필요하며, 그 성능은 다양한 네트워크 환경에 따라 전송 매체별로 차이가 있다. 이러한 다양한 전송 매체 또는 네트워크 환경에의 적용을 위해 스케일러블 비디오 코딩 방법이 제공될 수 있다.A transmission medium is required to transmit image data, and its performance is different for each transmission medium according to various network environments. A scalable video coding method may be provided for application to such various transmission media or network environments.

스케일러블 비디오 코딩 방법은 계층(layer) 간의 텍스쳐 정보, 움직임 정보, 잔여 신호 등을 활용하여 계층간 중복성을 제거하여 부호화/복호화 성능을 높이는 코딩 방법이다. 스케일러블 비디오 코딩 방법은, 전송 비트율, 전송 에러율, 시스템 자원 등의 주변 조건에 따라, 공간적, 시간적, 화질적 관점에서 다양한 스케일러빌리티를 제공할 수 있다.The scalable video coding method is a coding method that improves encoding/decoding performance by removing inter-layer redundancy by utilizing texture information, motion information, and residual signals between layers. The scalable video coding method can provide various scalability in terms of spatial, temporal, and image quality according to surrounding conditions such as a transmission bit rate, a transmission error rate, and system resources.

스케일러블 비디오 코딩은, 다양한 네트워크 상황에 적용 가능한 비트스트림을 제공할 수 있도록, 복수 계층(multiple layers) 구조를 사용하여 수행될 수 있다. 예를 들어 스케일러블 비디오 코딩 구조는, 일반적인 영상 부호화 방법을 이용하여 영상 데이터를 압축하여 처리하는 기본 계층을 포함할 수 있고, 기본 계층의 부호화 정보 및 일반적인 영상 부호화 방법을 함께 사용하여 영상 데이터를 압축 처리하는 향상 계층을 포함할 수 있다.Scalable video coding may be performed using a multiple layers structure to provide a bitstream applicable to various network conditions. For example, the scalable video coding structure may include a base layer that compresses and processes image data using a general image encoding method, and compresses image data by using both encoding information of the base layer and a general image encoding method. It may include an enhancement layer to process.

여기서, 계층(layer)은 공간(spatial, 예를 들어, 영상 크기), 시간(temporal, 예를 들어, 부호화 순서, 영상 출력 순서, 프레임 레이트), 화질, 복잡도 등을 기준으로 구분되는 영상 및 비트스트림(bitstream)의 집합을 의미한다. 또한 기본 계층은 하위 계층, 참조 계층 또는 Base layer, 향상 계층은 상위 계층, Enhancement layer를 의미할 수 있다. 또한 복수의 계층들은 서로 간에 종속성을 가질 수도 있다.Here, the layer is an image and a bit divided based on spatial (e.g., image size), temporal (e.g., encoding order, image output order, frame rate), quality, complexity, etc. It means a set of streams (bitstream). In addition, the base layer may refer to a lower layer, a reference layer or a base layer, and an enhancement layer may refer to an upper layer and an enhancement layer. Also, multiple layers may have dependencies on each other.

도 3을 참조하면, 예를 들어 기본 계층은 SD(standard definition), 15Hz의 프레임율, 1Mbps 비트율로 정의될 수 있고, 제1 향상 계층은 HD(high definition), 30Hz의 프레임율, 3.9Mbps 비트율로 정의될 수 있으며, 제2 향상 계층은 4K-UHD(ultra high definition), 60Hz의 프레임율, 27.2Mbps 비트율로 정의될 수 있다. 상기 포맷(format), 프레임율, 비트율 등은 하나의 실시예로서, 필요에 따라 달리 정해질 수 있다. 또한 사용되는 계층의 수도 본 실시예에 한정되지 않고 상황에 따라 달리 정해질 수 있다. Referring to FIG. 3, for example, the base layer may be defined as SD (standard definition), a frame rate of 15 Hz, and a 1 Mbps bit rate, and the first enhancement layer is a high definition (HD), a frame rate of 30 Hz, and a bit rate of 3.9 Mbps. The second enhancement layer may be defined as 4K-UHD (ultra high definition), a frame rate of 60 Hz, and a bit rate of 27.2 Mbps. The format, frame rate, bit rate, etc. are one embodiment and may be differently determined as necessary. Also, the number of layers to be used is not limited to this embodiment and may be determined differently according to circumstances.

예를 들어, 전송 대역폭이 4Mbps라면 상기 제1향상계층 HD의 프레임 레이트를 줄여서 15Hz이하로 전송할 수 있다. 스케일러블 비디오 코딩 방법은 상기 도 3의 실시예에서 상술한 방법에 의해 시간적, 공간적, 화질적 스케일러빌리티를 제공할 수 있다.For example, if the transmission bandwidth is 4 Mbps, the frame rate of the first enhancement layer HD may be reduced to transmit at 15 Hz or less. The scalable video coding method may provide temporal, spatial, and quality scalability by the method described above in the embodiment of FIG. 3.

비트스트림 내 복수의 계층을 지원하는 비디오의 부호화 및 복호화, 즉 스케일러블 코딩(scalable coding)의 경우, 복수의 계층간에는 강한 연관성(correlation)이 존재하기 때문에 이런 연관성을 이용하여 예측을 수행하면 데이터의 중복 요소를 제거할 수 있고 영상의 부호화 성능을 향상시킬 수 있다. 다른 계층의 정보를 이용하여 예측의 대상이 되는 현재 레이어의 예측을 수행하는 것을 이하에서는 계층간 예측(inter-layer prediction)이라고 표현한다. 스케일러블 비디오 코딩은 이하 부호화 관점에서는 스케일러블 비디오 부호화, 복호화 관점에서는 스케일러블 비디오 복호화와 동일한 의미를 가진다. In the case of encoding and decoding video that supports multiple layers in the bitstream, that is, scalable coding, there is a strong correlation between the multiple layers. Redundant elements can be removed and video encoding performance can be improved. Hereinafter, prediction of a current layer to be predicted using information of another layer is referred to as inter-layer prediction. The scalable video coding has the same meaning as the scalable video coding from the viewpoint of encoding and the scalable video decoding from the viewpoint of decoding.

복수의 계층들은 해상도, 프레임 레이트, 컬러 포맷 중 적어도 하나가 서로 다를 수 있으며, 계층간 예측 시 해상도의 조절을 위하여 레이어의 업샘플링 또는 다운샘플링이 수행될 수 있다.
The plurality of layers may have at least one of a resolution, a frame rate, and a color format different from each other, and up-sampling or down-sampling of a layer may be performed to adjust a resolution during inter-layer prediction.

스케일러블 영상 부/복호화(SVC: scalable video coding)에서의 임의 접근에 대하여 설명하기 위하여 하기와 같은 점이 고려될 수 있다.The following points may be considered in order to describe a random approach in scalable video coding (SVC).

비트스트림은 적어도 하나 이상의 스케일러빌리티, 예를 들어, 공간, 화질, 시점 스케일러빌리티를 지원할 수 있으며, 이와 같이 적어도 하나 이상의 계층 구조를 갖는 비디오가 임의 접근이 가능하도록 부/복호화될 수 있다.The bitstream may support at least one or more scalability, for example, spatial, image quality, and view scalability, and a video having at least one hierarchical structure as described above may be encoded/decoded so that random access is possible.

계층의 개수는 하나 이상의 복수 개일 수 있으며, 최하위 계층을 기본 계층이라고 할 수 있다. 이하에서는, 예시적으로 계층의 개수가 3개 인 경우에 대하여 설명한다. 물론 본 발명은 계층의 개수에 한정되지 않고 적용될 수 있다.The number of layers may be one or more, and the lowest layer may be referred to as a base layer. Hereinafter, a case where the number of layers is three will be described as an example. Of course, the present invention can be applied without being limited to the number of layers.

상위 계층 및 하위 계층은 단일 루프(single loop) 또는 다중 루프(multiple loop)의 방법으로 부/복호화될 수 있다.The upper layer and the lower layer may be encoded/decoded in a single loop or multiple loop method.

부호화 장치에서 비트스트림의 임의 접근 가능 시점(random access point)이 생성되는 경우, 복호화 장치는 부호화 장치에서 생성된 임의 접금 가능 시점부터 비트스트림의 복호화를 수행할 수 있다.When a random access point of the bitstream is generated by the encoding device, the decoding device may decode the bitstream from the random access point generated by the encoding device.

임의 접근 가능 시점의 억세스 유닛(access unit, AU) 내에 포함된 기본 계층은 IRAP(intra random access point) 픽처로 부호화되고 상위 계층들은 IRAP 픽처가 아닌 픽처(이하, non-IRAP 픽처) 혹은 IRAP 픽처들로 부호화될 수 있다. 억세스 유닛은 동일 시점에 디스플레이될 수 있는(having same output time) NAL 유닛들 또는 픽처들의 집합을 의미한다. The base layer included in the access unit (AU) of the randomly accessible view is encoded as an IRAP (intra random access point) picture, and the upper layers are pictures other than IRAP pictures (hereinafter, non-IRAP pictures) or IRAP pictures Can be encoded as The access unit refers to a set of NAL units or pictures that can be displayed at the same time (having the same output time).

한편, 임의 접근 시점에 해당하는 계층의 모든 픽처들이 임의 접근이 가능한 방식으로 부호화된 경우에만 해당 시점부터 비트스트림의 복호화가 가능하였다. 다시 말해 임의 접근 가능 시점에 해당하는 계층들 가운데 임의 접근이 불가능한 픽처가 포함된 경우에는 동일 억세스 유닛 내의 POC 값이 동일하지 않으므로 복호 픽처 버퍼(decoded picture buffer, 이하 DPB) 내에서 픽처 관리가 어렵게 되는 문제가 발생할 수 있다.On the other hand, only when all pictures of a layer corresponding to a random access view are encoded in a manner that allows random access, decoding of the bitstream from the corresponding view is possible. In other words, if a picture that cannot be randomly accessed is included among the layers corresponding to the random access point, the POC value in the same access unit is not the same, making it difficult to manage the picture in the decoded picture buffer (DPB). Problems can arise.

본 발명은 이러한 문제점을 해결하기 위하여 임의 시점부터 비트스트림을 복호화함에 있어, 해당 시점에 포함된 픽처가 임의 접근이 불가능한 픽처가 포함된 경우에도 동일 억세스 유닛 내의 POC 값을 동일하게 설정함으로써 DPB 내 용이한 픽처 관리가 가능하도록 한다. POC 값을 동일하게 설정함으로써 해당 임의 접근 시점부터 비트스트림을 복호할 수 있게 된다.
In order to solve this problem, the present invention is to decode a bitstream from an arbitrary point in time, and even when a picture included in the corresponding point of time contains a picture that cannot be accessed randomly, the POC value in the same access unit is set equally to facilitate DPB content. It makes it possible to manage one picture. By setting the same POC value, the bitstream can be decoded from a corresponding random access point.

도 4는 본 발명의 일 실시예에 따른 영상의 복호화 방법을 설명하기 위한 제어 흐름도이다. 도 4를 통해 설명되는 발명의 내용은 영상의 복호화 방법뿐만 아니라 영상의 부호화 방법에도 동일하게 적용될 수 있다. 4 is a control flowchart illustrating a video decoding method according to an embodiment of the present invention. The content of the invention described with reference to FIG. 4 can be applied equally to a method of encoding an image as well as a method of decoding an image.

우선, 영상의 복호화 장치는 복호화에 필요한 파라미터들을 초기화 할 수 있다(S410).First, the apparatus for decoding an image may initialize parameters necessary for decoding (S410).

임의 접근 가능 시점부터 비트스트림을 복호화하는 경우에 다음과 같은 순서로 복호화에 필요한 파라미터들을 초기화 할 수 있다.In the case of decoding a bitstream from a random access point, parameters necessary for decoding can be initialized in the following order.

임의 접근 가능 시점의 AU에 포함되는 기본 계층이 IRAP 픽처, 즉, IDR(instantaneous decoding refresh) 픽처, BLA(broken link access) 픽처 또는 CRA(clean random access) 픽처인 경우 임의 접근 가능 시점의 AU에 포함되는 모든 픽처가 비트스트림 내에 포함된 각 계층의 첫 번째 픽처임을 알리는 플래그, 예를 들어, FirstPicInLayerDecodedFlag와 같은 플래그를 다음과 같이 초기화 할 수 있다.If the base layer included in the AU at the randomly accessible time is an IRAP picture, that is, an instantaneous decoding refresh (IDR) picture, a broken link access (BLA) picture, or a clean random access (CRA) picture, it is included in the AU at the randomly accessible time A flag indicating that all the pictures to be used are the first pictures of each layer included in the bitstream, for example, a flag such as FirstPicInLayerDecodedFlag can be initialized as follows.

현재 부/복호화 대상 픽처가 IRAP 픽처이며 임의 접근 가능 시점의 AU에 포함되어 있는 기본 계층(nuh_layer_id =0)의 픽처인 경우에 가능한 모든 상위 계층의 상기 플래그 값을 ‘0’으로 초기화할 수 있다. When the current sub/decoding target picture is an IRAP picture and a picture of a base layer (nuh_layer_id = 0) included in an AU at a random access point, the flag values of all possible upper layers may be initialized to '0'.

즉, 예를 들어, 최대 가능한 상위 계층의 수가 63인 경우, 즉nuh_layer_id=63인 경우에 0<i<=63에 대해 FirstPicInLayerDecodedFlag[i]는 0으로 설정될 수 있다. That is, for example, when the maximum possible number of upper layers is 63, that is, when nuh_layer_id=63, FirstPicInLayerDecodedFlag[i] may be set to 0 for 0<i<=63.

현재 부/복호하고자하는 픽처의 식별자인 POC를 출력 순서에 따라 값이 증가하도록 계산한다(S420).The POC, which is the identifier of the picture to be currently encoded/decoded, is calculated so that the value increases according to the output order (S420).

픽처 오더 카운터(Picture Order Count, POC)는 부호화된 비디오 비트스트림(coded video stream)에서 동일한 nuh_layer_id를 가지는 계층 내의 픽처들을 식별하기 위한 식별자로, DPB에서 출력되는 순서가 늦을 수록 그 값이 증가할 수 있다. 즉, POC는 픽처가 DPB로부터 출력되어 디스플레이될 수 있는 디스플레이 순서(display order)며, IDR 픽처의 POC는 그 값이 ‘0’이 될 수 있다.A picture order counter (POC) is an identifier for identifying pictures in a layer having the same nuh_layer_id in a coded video stream, and the value may increase as the order of output from the DPB is delayed. have. That is, the POC is a display order in which a picture can be output and displayed from the DPB, and the POC of an IDR picture can have a value of '0'.

POC 값은 POC_MSB(most significatn bit)와 POC_LSB(least significatn bit)로 구성되며, 전체 POC는 MSB와 LSB의 합으로 계산될 수 있다(POC = POC_MSB + POC_LSB). 이 때 POC_LSB 값은 해당 픽처의 슬라이스 헤더에서 시그널링되며, 최대 LSB를 나타내는 MaxPOCLSB 값은 시퀀스 파라미터 세트(sequence parameter set)에서 시그널링 될 수 있다.The POC value is composed of a most significatn bit (POC_MSB) and a least significatn bit (POC_LSB), and the total POC can be calculated as the sum of MSB and LSB (POC = POC_MSB + POC_LSB). In this case, the POC_LSB value is signaled in the slice header of the corresponding picture, and the MaxPOCLSB value indicating the maximum LSB may be signaled in a sequence parameter set.

Non-IRAP 픽처의 경우 POC_MSB는 이전에 부호화/복호화된 시간적 서브 레이어의 식별자를 나타내는 temporal_id가 ‘0’인 픽처들 가운데 현재 픽처와 가까운 픽처의 POC_MSB(이하, prevPOCMSB라고 표현함), POC_LSB(이하, prevPOCLSB라고 표현함)와 현재 부/복호화하고자 하는 픽처의 POC_LSB값으로 계산될 수 있다.In the case of a non-IRAP picture, POC_MSB is a POC_MSB (hereinafter referred to as prevPOCMSB), POC_LSB (hereinafter referred to as prevPOCLSB) of a picture close to the current picture among pictures whose temporal_id indicating an identifier of a temporal sublayer that has been previously encoded/decoded is '0'. ) And the POC_LSB value of the picture to be currently encoded/decoded.

IDR 픽처의 POC 값은 항상 ‘0’으로 가정될 수 있으며, CRA 픽처가 비트스트림의 가장 처음 픽처인 경우 혹은 BLA 픽처의 경우, 픽처의 POC_MSB 값은 ‘0’으로 가정되고 POC_LSB 값은 슬라이스 헤더에서 시그널링될 수 있다. CRA 픽처가 비트스트림의 가장 처음 픽처가 아닌 경우는 non-IRAP 픽처와 동일하게 POC값이 계산될 수 있다.The POC value of the IDR picture can always be assumed to be '0', and when the CRA picture is the first picture in the bitstream or in the case of a BLA picture, the POC_MSB value of the picture is assumed to be '0', and the POC_LSB value is assumed to be '0' in the slice header. Can be signaled. When the CRA picture is not the first picture in the bitstream, the POC value may be calculated in the same manner as the non-IRAP picture.

동일한 AU 내의 모든 픽처들은 동일한 POC 값을 가질 수 있다.All pictures in the same AU may have the same POC value.

동일한 AU 내에 IRAP 픽처와 Non-IRAP 픽처가 동시에 존재하거나, IRAP 픽처만 존재하지만 IRAP 픽처들의 NAL 유닛 타입이 두 개 이상인 경우에는 POC값을 동일하게 할 수 있다. 이를 위하여 슬라이스 헤더에 poc_reset_flag과 같은 플래그 정보를 시그널링할 수 있고, 복호화 장치는 poc_reset_flag 값이 ‘1’인 경우에는 해당 픽처의 POC 값을 ‘0’ 혹은 POC_MSB값을 ‘0’으로 리셋할 수 있다.When an IRAP picture and a non-IRAP picture exist in the same AU at the same time, or only an IRAP picture exists, but two or more NAL unit types of IRAP pictures are present, the POC value may be the same. To this end, flag information such as poc_reset_flag may be signaled in the slice header, and the decoding apparatus may reset the POC value of the picture to '0' or the POC_MSB value to '0' when the poc_reset_flag value is '1'.

도 5는 본 발명에 따라 픽처의 POC를 계산하는 것을 설명하기 위한 도면이다. 도 5는 단계 S420을 설명하기 위한 도면으로 임의 접근 가능 시점인 AU (AU A)내에서 기본 계층은 IRAP 픽처이고, 상위 계층들은 non-IRAP 픽처들로 부호화된 경우의 실시예를 나타낸다. 픽처의 POC를 계산은 다음 두 경우로 구분하여 설명될 수 있다.5 is a diagram for explaining calculating a POC of a picture according to the present invention. FIG. 5 is a diagram for explaining step S420, and shows an embodiment in which a base layer is an IRAP picture and upper layers are encoded as non-IRAP pictures in an AU (AU A) that is a randomly accessible view. Calculation of the POC of a picture can be described by dividing into the following two cases.

제1 경우Case 1

해당 AU가 절체되지 않고, 즉 임의 접근 시점으로 사용되지 않아 이전에 부호화된 AU들을 포함하는 비트스트림이 복호화되는 경우, 해당 AU에 포함되는 픽처들의 복호화 과정은 다음과 같은 순서로 진행될 수 있다.When a bitstream including AUs previously coded because the corresponding AU is not switched, that is, is not used as a random access point, is decoded, the decoding process of pictures included in the corresponding AU may proceed in the following order.

(a) 현재 부/복호화하고자 하는 대상 픽처의 초기 POC 값은 다음과 같이 설정될 수 있다.(a) The initial POC value of the target picture to be currently encoded/decoded may be set as follows.

해당 픽처가 IDR 픽처인 경우 POC값은 ‘0’로 설정될수 있다.When the picture is an IDR picture, the POC value may be set to '0'.

해당 픽처가 BLA 픽처이거나, 비트스트림의 해당 계층의 첫 번째 픽처로서 CRA 픽처인 경우, POC_MSB 값은 0 이고 POC 값은 해당 슬라이스 헤더에서 시그널링되는 POC_LSB 값으로 설정될 수 있다.When the corresponding picture is a BLA picture or a CRA picture as the first picture of the corresponding layer of the bitstream, the POC_MSB value is 0 and the POC value may be set as the POC_LSB value signaled in the corresponding slice header.

해당 픽처가 CRA 픽처이거나 Non-IRAP 픽처인 경우, 슬라이스 헤더에 시그널링된 POC_LSB 값을 이용하여 일반적인 POC 설정 방식(상술한 바와 같이, 이전에 부호화/복호화된 temporal_id가 ‘0’인 픽처들 가운데 현재 픽처와 가까운 픽처의 POC_MSB(prevPOCMSB라고 명명)와 POC_LSB(prevPOCLSB라고 명명), 그리고 현재 부/복호화하고자 하는 픽처의 POC_LSB값으로 계산할 수 있다)에 따라 POC값(‘POC1’)이 설정될 수 있다.When the corresponding picture is a CRA picture or a non-IRAP picture, a general POC setting method using the POC_LSB value signaled in the slice header (as described above, the current picture among pictures whose temporal_id is '0' previously encoded/decoded The POC value ('POC1') may be set according to the POC_MSB (named prevPOCMSB) and POC_LSB (named prevPOCLSB) of the picture close to, and can be calculated as the POC_LSB value of the picture to be currently encoded/decoded.

(b) poc_reset_flag가 ‘1’인 슬라이스를 포함하는 픽처에 대하여, DPB 내에 픽처들이 존재하는 경우 DPB 내의 모든 픽처들의 POC 값은 ‘POC1’값 만큼 감소시킬 수 있다.(b) For a picture including a slice with a poc_reset_flag of '1', when pictures exist in the DPB, the POC values of all the pictures in the DPB may be reduced by a value of'POC1'.

(c) poc_reset_flag가 ‘1’인 슬라이스를 포함하는 픽처의 POC 값은 ‘0’으로 설정될 수 있다.(c) A POC value of a picture including a slice having a poc_reset_flag of '1' may be set to '0'.

제2 경우Case 2

해당 AU가 절체되어 임의 접근 시점으로 사용되는 경우, 즉, 비트스트림의 첫 번째 AU로써 복호되는 경우 예를 들어, 기본 계층(layer 0)의 픽처가 IRAP 픽처이고 부호화된 비트스트림의 첫 번째 픽처인 경우이거나, BLA 픽처인 경우, 해당 AU에 포함되는 픽처들의 복호화 과정은 다음과 같은 순서로 진행될 수 있다.When the corresponding AU is switched and used as a random access point, that is, when it is decoded as the first AU of the bitstream, for example, the picture of the base layer (layer 0) is an IRAP picture and the first picture of the encoded bitstream is In the case of a case or a BLA picture, the decoding process of pictures included in the corresponding AU may be performed in the following order.

(a) 현재 부/복호화하고자 하는 대상 픽처의 초기 POC값은 다음과 같이 설정될 수 있다.(a) The initial POC value of the target picture to be currently encoded/decoded may be set as follows.

해당 픽처가 IDR 픽처인 경우 POC값은 ‘0’로 설정될 수 있다.When the corresponding picture is an IDR picture, the POC value may be set to '0'.

해당 픽처가 BLA 픽처이거나, 비트스트림의 해당 계층의 첫 번째 픽처이며 CRA 픽처인 경우, POC_MSB 값은 0 이고 POC 값은 해당 슬라이스 헤더에서 시그널링되는 POC_LSB 값으로 설정될 수 있다.When the corresponding picture is a BLA picture, or is the first picture of the corresponding layer of the bitstream and is a CRA picture, the POC_MSB value may be 0 and the POC value may be set as the POC_LSB value signaled in the corresponding slice header.

해당 픽처가 Non-IRAP 픽처인 경우(예를 들어, 현재 계층의 nuh_layer_id=i 이며, FirstPicInLayerDecodedFlag[i]=0인 경우), POC값(‘POC1’)은 아래의 방법 중 하나를 이용하여 설정될 수 있다. If the picture is a Non-IRAP picture (for example, when nuh_layer_id=i of the current layer and FirstPicInLayerDecodedFlag[i]=0), the POC value ('POC1') can be set using one of the following methods. I can.

(a-1) 슬라이스 헤더에 시그널링 된 POC_LSB 값을 이용하여 상술된 통상적인 POC 설정 방식에 따라 POC값(‘POC1’)이 설정될 수 있다. 이때, 현재 AU가 임의 접근 시점으로 사용됨에 따라, 이전에 부호화/복호화된 temporal_id가 ‘0’인 픽처들이 존재하지 않으므로 prevPOCMSB와 prevPOCLSB 값은 모두 ‘0’으로 설정될 수 있다. (a-1) A POC value (“POC1”) may be set according to the conventional POC setting method described above using the POC_LSB value signaled in the slice header. In this case, as the current AU is used as a random access point, there are no pictures with a previously encoded/decoded temporal_id of '0', so that both prevPOCMSB and prevPOCLSB values may be set to '0'.

(a-2) 동일 AU의 기본 계층에 BLA 혹은 CRA 픽처가 존재하는 경우, 현재 복호화 대상 픽처의 POC_MSB 값은 ‘0’으로 설정될 수 있다. 이 경우, 현재 복호화하고자 하는 픽처의 POC 값(‘POC1’)은 현재 픽처의 슬라이스 헤더에서 시그널링되는 POC_LSB값으로 설정된다. (a-2) When a BLA or CRA picture exists in the base layer of the same AU, the POC_MSB value of the current decoding target picture may be set to '0'. In this case, the POC value (“POC1”) of the current picture to be decoded is set to the POC_LSB value signaled in the slice header of the current picture.

(a-3) 현재 복호 대상픽처의 POC 값은 계산되지 않을 수 있다.(a-3) The POC value of the current decoding target picture may not be calculated.

(a-4) 동일 AU의 기본 계층에 IDR 픽처가 존재하는 경우, 현재 복호 대상 픽처의 POC 값은 계산되지 않고 ‘0’으로 설정될 수 있다. (a-4) When an IDR picture exists in the base layer of the same AU, the POC value of the current decoding target picture may not be calculated and may be set to '0'.

(b) 현재 복호 대상 픽처의 POC 값이 계산된 경우, poc_reset_flag가 ‘1’인 슬라이스를 포함하는 픽처에 대하여, DPB 내에 픽처들이 존재하는 경우 DPB 내의 모든 픽처들의 POC 값은 ‘POC1’값 만큼 감소시킬 수 있다.(b) When the POC value of the current decoding target picture is calculated, for a picture including a slice with a poc_reset_flag of '1', when there are pictures in the DPB, the POC value of all pictures in the DPB is reduced by the value of'POC1'. I can make it.

(c) poc_reset_flag가 ‘1’인 슬라이스를 포함하는 픽처의 POC 값은 ‘0’으로 설정될 수 있다.(c) A POC value of a picture including a slice having a poc_reset_flag of '1' may be set to '0'.

다음으로, 영상의 복호화 장치는 현재 부/복호화 대상 픽처의 화면 간 예측을 위하여 참조 픽처 집합(reference picture set)을 구성하고 참조 픽처 형태 표시(reference picture marking)를 수행한다(S430).Next, the apparatus for decoding an image configures a reference picture set and performs reference picture marking for inter-screen prediction of the current encoding/decoding target picture (S430).

POC를 초기화 하는 poc_reset_flag가 ‘0’인 경우, 해당 픽처의 슬라이스 참조 픽처들의 POC 값 혹은 POC_LSB 값은 다음과 같이 계산될 수 있다.When poc_reset_flag for initializing POC is '0', the POC value or POC_LSB value of the slice reference pictures of the corresponding picture may be calculated as follows.

(1) 단기 참조 픽처(short-term reference picture)들의 경우 해당 슬라이스 헤더에 시그널링 되는 각 단기 참조 픽처를 나타내는 delta_POC 값과 현재 픽처의 POC 값인 ‘POC1’값을 이용하여 단기 참조 픽처들의 POC 값이 계산된다.(1) In the case of short-term reference pictures, the POC values of short-term reference pictures are calculated using the delta_POC value representing each short-term reference picture signaled in the corresponding slice header and the POC value of the current picture,'POC1'. do.

이때 delta_POC 값은 현재 픽처와 i번째 단기 참조 픽처의 POC 차이 값이거나, (i+1)번째 단기 참조 픽처와 i번째 단기 참조 픽처의 차이값일 수 있다.In this case, the delta_POC value may be a POC difference value between the current picture and the i-th short-term reference picture, or may be a difference value between the (i+1)-th short-term reference picture and the i-th short-term reference picture.

(2) 장기 참조 픽처(long-term reference picture)들의 경우, 각 장기 참조 픽처에 대한 POC_LSB 값 및 POC_MSB 값을 계산하기 위한 값(delta_poc_msb_cycle_lt)과 현재 픽처의 POC 값인 ‘POC1’값을 이용하여 장기 참조 픽처들의 POC_LSB 혹은 POC 값이 계산된다. delta_poc_msb_cycle_lt는 해당 슬라이스 헤더에서 시그널링 될 수 있다. (2) In the case of long-term reference pictures, long-term reference is made using a value for calculating the POC_LSB and POC_MSB values for each long-term reference picture (delta_poc_msb_cycle_lt) and the POC value of the current picture,'POC1'. POC_LSB or POC values of pictures are calculated. delta_poc_msb_cycle_lt may be signaled in the corresponding slice header.

장기 참조 픽처에 대하여는 기본적으로 POC_LSB만 시그널링되고, 시그널링되는 POC_LSB 값만 가지고 장기 POC를 식별한다. 다만, 복수의 참조 픽처 중 해당 장기 참조 픽처의 POC_LSB와 동일한 POC를 갖는 참조 픽처가 존재하는 경우 POC_MSB값을 계산하기 위한 값(delta_poc_msb_cycle_lt)이 추가로 시그널링되며, 이를 통하여 각 참조 픽처들의 POC를 식별할 수 있도록 한다.For a long-term reference picture, only POC_LSB is signaled by default, and a long-term POC is identified with only the signaled POC_LSB value. However, if a reference picture having the same POC as the POC_LSB of the corresponding long-term reference picture exists among the plurality of reference pictures, a value for calculating the POC_MSB value (delta_poc_msb_cycle_lt) is additionally signaled, and through this, the POC of each reference picture can be identified. To be able to.

한편, poc_reset_flag가 ‘1’인 경우, 해당 픽처의 슬라이스 참조 픽처들의 POC 값 혹은 POC_LSB 값은 다음과 같이 계산할 수 있다. Meanwhile, when poc_reset_flag is '1', the POC value or POC_LSB value of the slice reference pictures of the corresponding picture can be calculated as follows.

(1) 단기 참조 픽처(short-term reference picture)들의 경우 해당 슬라이스 헤더에 시그널링 되는 각 단기 참조 픽처를 나타내는 delta_POC 값과 현재 픽처의 POC 값인 ‘0’값을 이용하여 단기 참조 픽처들의 POC 값을 계산한다.(1) For short-term reference pictures, POC values of short-term reference pictures are calculated using delta_POC indicating each short-term reference picture signaled in the corresponding slice header and a POC value of '0' of the current picture. do.

이때 delta_POC 값은 현재 픽처와 i번째 단기 참조 픽처의 POC 차이 값이거나, (i+1)번째 단기 참조 픽처와 i번째 단기 참조 픽처의 차이값일 수 있다.In this case, the delta_POC value may be a POC difference value between the current picture and the i-th short-term reference picture, or may be a difference value between the (i+1)-th short-term reference picture and the i-th short-term reference picture.

(2) 장기 참조 픽처(long-term reference picture)들의 경우 각 장기 참조 픽처에 대한 POC_LSB 값 및 POC_MSB 값을 계산하기 위한 값(delta_poc_msb_cycle_lt)과 현재 픽처의 POC 값인 ‘0’값과 현재 픽처의 슬라이스 헤더에서 시그널링되는 POC_LSB값을 이용하여 장기 참조 픽처들의 POC_LSB값 혹은 POC 값을 계산한다. delta_poc_msb_cycle_lt는 해당 장기 참조 픽처의 슬라이스 헤더에서 시그널링 될 수 있다. (2) In the case of long-term reference pictures, values for calculating the POC_LSB and POC_MSB values for each long-term reference picture (delta_poc_msb_cycle_lt), the POC value of the current picture, '0', and the slice header of the current picture The POC_LSB value or POC value of the long-term reference pictures is calculated using the POC_LSB value signaled in. delta_poc_msb_cycle_lt may be signaled in the slice header of the corresponding long-term reference picture.

장기 참조 픽처에 대하여는 기본적으로 POC_LSB만 시그널링되고, 시그널링되는 POC_LSB 값만 가지고 장기 POC를 식별한다. 다만, 복수의 참조 픽처 중 해당 장기 참조 픽처의 POC_LSB와 동일한 POC를 갖는 참조 픽처가 존재하는 경우 POC_MSB값을 계산하기 위한 값(delta_poc_msb_cycle_lt)이 추가로 시그널링되며, 이를 통하여 각 참조 픽처들의 POC를 식별할 수 있도록 한다.For a long-term reference picture, only POC_LSB is signaled by default, and a long-term POC is identified with only the signaled POC_LSB value. However, if a reference picture having the same POC as the POC_LSB of the corresponding long-term reference picture exists among the plurality of reference pictures, a value for calculating the POC_MSB value (delta_poc_msb_cycle_lt) is additionally signaled, and through this, the POC of each reference picture can be identified. To be able to.

이와 같이, poc_reset_flag가 ‘1’이면, poc_reset_flag가 ‘1’인 슬라이스를 포함하는 픽처의 슬라이스 헤더에 시그널링되는 참조 픽처들의 POC값 혹은 POC_LSB 값을, DPB에 존재하는 픽처들의 POC 값을 감소시킨 것과 일치하도록 현재 픽처의 ‘POC1’값을 사용하여 조정할 수 있다.As described above, if poc_reset_flag is '1', the POC value or POC_LSB value of reference pictures signaled in the slice header of the picture including the slice with poc_reset_flag '1' coincides with decreasing the POC value of pictures existing in the DPB. It can be adjusted using the'POC1' value of the current picture.

참조 픽처의 POC가 계산되면, 참조 픽처 집합이 구성되고 DPB 내의 참조 픽쳐의 존재 여부에 따라 참조 픽처의 형태가 표시될 수 있다.When the POC of the reference picture is calculated, a reference picture set is constructed, and the shape of the reference picture may be displayed according to the presence or absence of the reference picture in the DPB.

영상 복호화 장치는 참조 픽처 집합에 포함되지만, DPB 내에 존재하지 않는 픽처를 위한 가상 참조 픽처를 생성할 수 있다(S440). The video decoding apparatus may generate a virtual reference picture for a picture that is included in the reference picture set, but does not exist in the DPB (S440).

현재 픽처가 참조하거나 현재 픽처 이후에 부/복호되는 픽처들이 참조하기 위하여 단계 S430에서 구성된 단기 참조 픽처들과 장기 참조 픽처들 가운데 현재 DPB 내에 존재하지 않는 픽처들은 가상으로 생성되어 DPB에 저장될 수 있다. Pictures that do not exist in the current DPB among the short-term reference pictures and long-term reference pictures configured in step S430 to refer to the current picture or to refer to pictures that are encoded/decoded after the current picture may be virtually generated and stored in the DPB. .

생성되는 가상 픽처들의 POC 값은 단계 S430에서 계산된 각 참조 픽처들의 POC값을 가진다. 가상 참조 픽처에 대하여 DPB에서 출력되는지 여부를 알려주는 PicOutputFlag 값은 ‘0’으로 설정되고, 이로 인하여 생성된 가상 참조픽처는 출력되지 않는다.The POC values of the generated virtual pictures have the POC values of each reference picture calculated in step S430. The PicOutputFlag value indicating whether the virtual reference picture is output from the DPB is set to '0', and the virtual reference picture generated thereby is not output.

다음으로, 영상 복호화 장치는 현재 부/복호화 대상 픽처의 출력 여부를 결정할 수 있다(S450).Next, the video decoding apparatus may determine whether to output the current encoding/decoding target picture (S450).

해당 AU가 절체되지 않고, 즉 임의 접근 시점으로 사용되지 않아 이전에 부호화된 AU들을 포함하여 인코딩된 비트스트림 그대로 복호화되는 경우, 해당 AU에 포함되는 픽처들은 모두 정상 복호화가 가능하다. 따라서 원래 출력하고자 했던 계층(output layer)들의 PicOutputFlag는 ‘1’로 설정된다. If the corresponding AU is not switched, that is, is not used as a random access point, and thus the encoded bitstream including previously encoded AUs is decoded as it is, all pictures included in the corresponding AU can be normally decoded. Therefore, the PicOutputFlag of the original output layers is set to '1'.

한편, 해당 AU가 절체되어 임의 접근 시점으로 사용되는 경우, 예를 들어, 기본 계층(layer 0)의 픽처가 IRAP 픽처이고 부호화된 비트스트림의 첫 번째 픽처인 경우이거나, BLA 픽처인 경우와 같이 즉, 해당 AU가 비트스트림의 첫 번째 AU로써 복호되는 경우 다음과 같이 출력 여부가 결정된다. On the other hand, when the corresponding AU is switched and used as a random access point, for example, when a picture of the base layer (layer 0) is an IRAP picture and is the first picture of an encoded bitstream, or a BLA picture, that is, , When the corresponding AU is decoded as the first AU of the bitstream, whether to output is determined as follows.

(1) 해당 AU에 포함되는 픽처들 가운데 기본 계층만 IRAP 픽처이고 첫 번째 상위 계층(Layer 1)의 픽처가 non-IRAP 픽처인 경우, 기본 계층의 복호화된 픽처의 PicOutputFlag는 ‘1’로 설정되고 나머지 계층들의 복호화된 픽처들의 PicOutputFlag는 ‘0’으로 설정될 수 있다.(1) Among pictures included in the AU, when only the base layer is an IRAP picture and the picture of the first upper layer (Layer 1) is a non-IRAP picture, the PicOutputFlag of the decoded picture of the base layer is set to '1', and PicOutputFlag of decoded pictures of the remaining layers may be set to '0'.

(2) 해당 AU에 포함되는 픽처들 가운데 기본 계층과 첫 번째 상위 계층(Layer 1)이 IRAP 픽처이고 두 번째 상위 계층(Layer 2)이 non-IRAP 픽처인 경우, 첫 번째 상위 계층의 복호화된 픽처의 PicOutputFlag는 ‘1’으로 설정되고, 만약 기본 계층이 출력 계층인 경우에는 기본 계층의 복호화된 픽처의 PicOutputFlag 역시 ‘1’로 설정된다.(2) If the base layer and the first upper layer (Layer 1) of the pictures included in the AU are IRAP pictures and the second upper layer (Layer 2) is a non-IRAP picture, the decoded picture of the first upper layer PicOutputFlag of is set to '1', and if the base layer is an output layer, the PicOutputFlag of the decoded picture of the base layer is also set to '1'.

즉, 영상 복호화 장치는 기본 계층부터 n번째 계층까지 IRAP 픽처들로 이루어진 경우 원래 출력하고자 했던 계층이 기본 계층부터 n번째 계층에 포함되어 있는 경우에는 해당 출력 계층들에 해당하는 복호화된 픽처의 PicOutputFlag를 ‘1’로 설정하고, 만약 n+1번째 계층 내지 최상위 계층에 원래 출력하고자 했던 출력 계층이 포함되어 있는 경우에는 n번째 계층의 복호화된 픽처의 PicOutputFlag를 ‘1’로 설정할 수 있다. That is, when the IRAP pictures from the base layer to the nth layer are composed of IRAP pictures from the base layer to the n-th layer, the video decoding apparatus determines the PicOutputFlag of the decoded pictures corresponding to the output layers when the originally intended layer is included in the base layer to the n-th layer. It is set to '1', and if an output layer originally intended to be output is included in the n+1th layer or the uppermost layer, the PicOutputFlag of the decoded picture of the nth layer may be set to '1'.

픽처의 출력 여부가 결정되면, 영상 복호화 장치는 참조 픽처 리스트 내의 참조 픽처를 이용하여 현재 부/복호화 대상 영상에 대한 움직임 예측 및 움직임 보상을 수행한다(S460).When it is determined whether to output a picture, the image decoding apparatus performs motion prediction and motion compensation on the current encoding/decoding target image by using the reference picture in the reference picture list (S460).

본 단계에서는 통상적인 화면 간 예측 방법으로 참조 픽처 리스트 내의 참조픽처를 이용하여 현재 부/복호화 대상 영상에 대한 움직임 예측 및 움직임 보상이 수행될 수 있다. In this step, motion prediction and motion compensation for a current encoding/decoding target image may be performed using a reference picture in a reference picture list as a conventional inter prediction method.

참조 픽처를 이용항 화면 간 예측이 수행되면, 복호화에 필요한 파라미터가 재설정될 수 있다(S470).When inter prediction is performed using a reference picture, a parameter required for decoding may be reset (S470).

영상 복호화 장치는 현재 부/복호화 대상 픽처가 포함된 계층, 예를 들어, nuh_layer_id = i인 계층의 FirstPicInLayerDecodedFlag[i]가 0인 경우, FirstPicInLayerDecodedFlag[i]를 1로 설정할 수 있다. The video decoding apparatus may set FirstPicInLayerDecodedFlag[i] to 1 when FirstPicInLayerDecodedFlag[i] of the layer including the current sub/decoding target picture, for example, nuh_layer_id = i is 0.

이와 같이, 본 발명에 따를 경우, 임의 접근 시점의 AU(access unit) 내에 IRAP(intra random access point) 픽처와 IRAP가 아닌 픽처(non- intra random access point picture)가 존재하거나 IRAP 픽처만 존재하고, NAL 유닛 타입이 두 개 이상인 경우에 해당 AU 내의 픽처들의 POC 값을 설정하는 방법 및 이를 이용하는 장치가 제공된다.As described above, according to the present invention, an IRAP (intra random access point) picture and a non-IRAP picture (non-intra random access point picture) or only an IRAP picture exist in the access unit (AU) at the random access point, A method of setting POC values of pictures in a corresponding AU when two or more NAL unit types are used and an apparatus using the same are provided.

상술한 실시예에서, 방법들은 일련의 단계 또는 블록으로서 순서도를 기초로 설명되고 있으나, 본 발명은 단계들의 순서에 한정되는 것은 아니며, 어떤 단계는 상술한 바와 다른 단계와 다른 순서로 또는 동시에 발생할 수 있다. 또한, 당해 기술 분야에서 통상의 지식을 가진 자라면 순서도에 나타난 단계들이 배타적이지 않고, 다른 단계가 포함되거나, 순서도의 하나 또는 그 이상의 단계가 본 발명의 범위에 영향을 미치지 않고 삭제될 수 있음을 이해할 수 있을 것이다.In the above-described embodiment, the methods are described on the basis of a flowchart as a series of steps or blocks, but the present invention is not limited to the order of steps, and certain steps may occur in a different order or concurrently with those described above. have. In addition, those of ordinary skill in the art understand that the steps shown in the flowchart are not exclusive, other steps are included, or one or more steps in the flowchart may be deleted without affecting the scope of the present invention. You can understand.

상술한 실시예는 다양한 양태의 예시들을 포함한다. 다양한 양태들을 나타내기 위한 모든 가능한 조합을 기술할 수는 없지만, 해당 기술 분야의 통상의 지식을 가진 자는 다른 조합이 가능함을 인식할 수 있을 것이다. 따라서, 본 발명은 이하의 특허청구범위 내에 속하는 모든 다른 교체, 수정 및 변경을 포함한다고 할 것이다.The above-described embodiments include examples of various aspects. It is not possible to describe all possible combinations for representing the various aspects, but one of ordinary skill in the art will recognize that other combinations are possible. Accordingly, the present invention will be said to include all other replacements, modifications and changes falling within the scope of the following claims.

100 : 영상 부호화 장치 111: 움직임 예측부
112: 움직임 보상부 120 : 인트라 예측부
115 : 스위치 125 : 감산기
130 : 변환부 140 : 양자화부
150 : 엔트로피 부호화부 160 : 역양자화부
170 : 역변환부 180 : 필터부
100: image encoding device 111: motion prediction unit
112: motion compensation unit 120: intra prediction unit
115: switch 125: subtractor
130: transform unit 140: quantization unit
150: entropy encoding unit 160: inverse quantization unit
170: inverse transform unit 180: filter unit

Claims (7)

복수의 계층을 지원하는 영상의 복호화 방법에 있어서,
복호화에 필요한 파라미터들을 초기화하는 단계와;
현재 픽처의 식별자인 POC(Picture Of Count)를 계산하는 단계와;
상기 현재 픽처의 화면 간 예측을 위하여 참조 픽처 리스트를 생성하는 단계와;
상기 참조 픽처 리스트 내의 참조 픽처를 이용하여 상기 현재 픽처에 대한 화면 간 예측을 수행하는 단계를 포함하고,
상기 POC를 계산하는 단계는 동일한 억세스 유닛의 기본 계층의 픽처가 IDR (instantaneous decoding refresh) 픽처이고 상기 동일 억세스 유닛에 상기 IDR 픽처가 아닌 non-IDR 픽처가 적어도 하나 존재하는 경우, 상기 현재 픽처를 포함하는 상기 동일 억세스 유닛의 모든 픽처의 POC는 0으로 설정되는 것을 특징으로 하는 영상의 복호화 방법.
In a video decoding method supporting a plurality of layers,
Initializing parameters necessary for decoding;
Calculating a picture of count (POC) that is an identifier of a current picture;
Generating a reference picture list for inter prediction of the current picture;
Comprising the step of performing inter prediction for the current picture by using a reference picture in the reference picture list,
In the calculating of the POC, when a picture of a base layer of the same access unit is an instantaneous decoding refresh (IDR) picture and at least one non-IDR picture other than the IDR picture exists in the same access unit, the current picture is included. And POCs of all pictures of the same access unit are set to 0.
제1항에 있어서,
상기 POC를 계산하는 단계는,
상기 기본 계층의 픽처가 BLA(broken link access) 픽처 또는 비트스트림의 첫 번째 CRA(clean random access) 픽처인 경우, 상기 현재 픽처의 MSB(Most Significant Bit)는 0으로 설정되는 것을 특징으로 하는 영상의 복호화 방법.
The method of claim 1,
The step of calculating the POC,
When the picture of the base layer is a broken link access (BLA) picture or a first clean random access (CRA) picture of a bitstream, the MSB (Most Significant Bit) of the current picture is set to 0. Decryption method.
제1항에 있어서,
상기 복호화에 필요한 파라미터들을 초기화하는 단계는,
상기 현재 픽처가 IRAP(intra random access point) 인 경우, 계층의 첫 번째 픽처임을 지시하는 플래그를 기 정의된 값으로 설정하는 것을 특징으로 하는 영상의 복호화 방법.
The method of claim 1,
Initializing the parameters required for the decoding,
When the current picture is an intra random access point (IRAP), a flag indicating that the picture is the first picture in the layer is set to a predefined value.
제3항에 있어서,
상기 기 정의된 값은 계층의 첫번째 픽처임을 지시하는 값인 것을 특징으로 하는 영상의 복호화 방법.
The method of claim 3,
The predetermined value is a value indicating that the picture is the first picture of a layer.
제3항에 있어서,
상기 현재 픽처가 IRAP(intra random access point) 인 경우, 모든 계층의 상기 플래그를 기 정의된 값으로 설정하는 것을 특징으로 하는 영상의 복호화 방법.
The method of claim 3,
When the current picture is an intra random access point (IRAP), the flags of all layers are set to a predefined value.
제1항에 있어서,
상기 참조 픽처 리스트 내의 참조 픽처를 이용하여 상기 현재 픽처에 대한 화면 간 예측을 수행하는 단계 이후, 상기 현재 픽처의 출력 여부가 결정되는 것을 특징으로 하는 영상의 복호화 방법.
The method of claim 1,
After the step of performing inter prediction on the current picture by using a reference picture in the reference picture list, it is determined whether to output the current picture.
제1항에 있어서,
상기 참조 픽처 리스트 내의 참조 픽처를 이용하여 상기 현재 픽처에 대한 화면 간 예측을 수행하는 단계 이후, 상기 복호화에 필요한 파라미터는 재설정되는 것을 특징으로 하는 영상의 복호화 방법.



The method of claim 1,
After the step of performing inter prediction on the current picture by using a reference picture in the reference picture list, a parameter necessary for the decoding is reset.



KR1020140132543A 2013-10-11 2014-10-01 Video encoding and decoding method and apparatus using the same KR102246634B1 (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201480064335.8A CN105765978B (en) 2013-10-11 2014-10-07 Method for encoding/decoding image and the device using it
PCT/KR2014/009409 WO2015053525A1 (en) 2013-10-11 2014-10-07 Method for encoding/decoding image and device using same
US15/027,101 US10142638B2 (en) 2013-10-11 2014-10-07 Method for encoding/decoding image and device using same
US16/157,217 US10306244B2 (en) 2013-10-11 2018-10-11 Method for encoding/decoding image and device using same

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020130121357 2013-10-11
KR20130121357 2013-10-11

Publications (2)

Publication Number Publication Date
KR20150043972A KR20150043972A (en) 2015-04-23
KR102246634B1 true KR102246634B1 (en) 2021-05-03

Family

ID=53036359

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140132543A KR102246634B1 (en) 2013-10-11 2014-10-01 Video encoding and decoding method and apparatus using the same

Country Status (1)

Country Link
KR (1) KR102246634B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210392361A1 (en) * 2018-12-27 2021-12-16 Huawei Technologies Co., Ltd. On Intra Random Access Point Pictures and Leading Pictures in Video Coding

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220272321A1 (en) * 2019-06-19 2022-08-25 Electronics And Telecommunications Research Institute Method, device, and recording medium for encoding/decoding image using reference picture

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Byeongdoo Choi et al, "MV-HEVC/SHVC HLS: Alignment of picture order counts", (JCTVC-O0140), JCT-VC of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 15th Meeting: Geneva, CH (2013.10.23.)
Jung Won Kang et al, "MV-HEVC/SHVC HLS: On cross-layer POC alignment for layer-wise startup", (JCTVC-O0211), JCT-VC of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 15th Meeting: Geneva, CH (2013.10.23.)
Krishna Rapaka et al, "MV-HEVC/SHVC HLS: Comments on latest MV-HEVC and SHVC draft specs", (JCTVC-O0223), JCT-VC of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 15th Meeting: Geneva, CH (2013.10.23.)
Ying Chen et al, "MV-HEVC/SHVC HLS: Cross-layer POC alignment", (JCTVC-N0244), JCT-VC of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 14th Meeting: Vienna, AT (2013.07.25.)*

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210392361A1 (en) * 2018-12-27 2021-12-16 Huawei Technologies Co., Ltd. On Intra Random Access Point Pictures and Leading Pictures in Video Coding
US11563967B2 (en) * 2018-12-27 2023-01-24 Huawei Technologies Co., Ltd. On intra random access point pictures and leading pictures in video coding

Also Published As

Publication number Publication date
KR20150043972A (en) 2015-04-23

Similar Documents

Publication Publication Date Title
JP7171654B2 (en) Interlayer prediction method and apparatus based on temporal sublayer information
KR102079803B1 (en) Image decoding method and apparatus using same
KR102517340B1 (en) Video decoding method and apparatus using the same
US10306244B2 (en) Method for encoding/decoding image and device using same
KR102551896B1 (en) Method and apparatus for image encoding/decoding
KR102160958B1 (en) Video-encoding method, video-decoding method, and apparatus implementing same
US20200288155A1 (en) Video encoding and decoding method and apparatus using the same
US20150103912A1 (en) Method and apparatus for video encoding/decoding based on multi-layer
KR102226893B1 (en) Video decoding method and apparatus using the same
KR102412637B1 (en) Method and apparatus for image encoding/decoding
KR102431741B1 (en) Method and apparatus for image encoding/decoding
KR102246634B1 (en) Video encoding and decoding method and apparatus using the same
KR20140043240A (en) Method and apparatus for image encoding/decoding
KR102257754B1 (en) Video encoding and decoding method and apparatus using the same
US20130188740A1 (en) Method and apparatus for entropy encoding/decoding
KR102271878B1 (en) Video encoding and decoding method and apparatus using the same
KR20150043977A (en) Method and apparatus for video encoding/decoding based on multi-layer

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant