KR20180054693A

KR20180054693A - 비디오 신호의 인코딩, 디코딩 방법 및 그 장치

Info

Publication number: KR20180054693A
Application number: KR1020187010417A
Authority: KR
Inventors: 구문모; 예세훈; 손은용; 김규운; 허진; 남정학; 이범식
Original assignee: 엘지전자 주식회사
Priority date: 2015-10-13
Filing date: 2016-10-13
Publication date: 2018-05-24
Also published as: US20180309996A1; US10523945B2; WO2017065534A1

Abstract

본 발명은, 비디오 신호를 인코딩하는 방법에 있어서, 상기 비디오 신호로부터 액티비티 정보를 획득하는 단계, 여기서 상기 액티비티 정보는 영상의 에지 특성에 대한 정보를 나타내고, 에지 방향성 정보 또는 에지 레벨 정보 중 적어도 하나를 포함함; 상기 액티비티 정보에 기초하여 조건부 비선형 변환(Conditionally Non-linear Transform, CNT) 설정 정보를 결정하는 단계; 및 상기 CNT 설정 정보에 기초하여 CNT 예측 코딩을 수행하는 단계를 포함하되, 상기 CNT 예측 코딩은 이전에 디코딩된 모든 픽셀값을 이용하여 예측을 수행하는 것을 특징으로 하는 방법을 제공한다.

Description

비디오 신호의 인코딩, 디코딩 방법 및 그 장치

본 발명은 비디오 신호의 인코딩, 디코딩 방법 및 그 장치에 관한 것이며, 보다 상세하게는, 조건부 비선형 변환(Conditionally Non-linear Transform, 이하 ‘CNT’라 함) 코딩 기술에 기반하여 비디오 신호를 처리하는 방법 및 장치에 관한 것이다.

압축 부호화란 디지털화한 정보를 통신 회선을 통해 전송하거나, 저장 매체에 적합한 형태로 저장하기 위한 일련의 신호 처리 기술을 의미한다. 영상, 이미지, 음성 등의 미디어가 압축 부호화의 대상이 될 수 있으며, 특히 영상을 대상으로 압축 부호화를 수행하는 기술을 비디오 영상 압축이라고 일컫는다.

차세대 비디오 컨텐츠는 고해상도(high spatial resolution), 고프레임율(high frame rate) 및 영상 표현의 고차원화(high dimensionality of scene representation)라는 특징을 갖게 될 것이다. 그러한 컨텐츠를 처리하기 위해서는 메모리 저장(memory storage), 메모리 액세스율(memory access rate) 및 처리 전력(processing power) 측면에서 엄청난 증가를 가져올 것이다.

따라서, 차세대 비디오 컨텐츠를 보다 효율적으로 처리하기 위한 코딩 툴을 디자인할 필요가 있다.

특히, 예측 코딩의 경우 예측 에러 샘플을 획득함에 있어서 어떠한 통계적인 의존성을 이용할 수 없고, 변환 코딩의 경우 샘플의 예측 값을 획득함에 있어서 단지 최초 이용가능한 데이터에만 의존해야 한다는 단점이 있다. 그러한 이유로 예측 신호가 높은 퀄러티를 갖기 어려우므로, 이를 효율적으로 극복할 필요가 있다.

본 발명은, 가장 최근에 복원한 데이터를 이용하여 예측을 수행하는 방법을 제안하고자 한다.

본 발명은, CNT(Conditionally Non-linear Transform) 코딩 기술을 이용하여 타겟 유닛을 처리하는 방법을 제안하고자 한다.

본 발명은, 새로운 예측/변환 코딩의 융합에 기초하여 각 코딩 방식의 장점을 모두 적용할 수 있는 방법을 제안하고자 한다.

본 발명은, 액티비티 정보(activity information)를 이용하여 CNT 설정 정보를 결정하는 방법을 제안하고자 한다.

본 발명은, 액티비티 정보(activity information)에 기초하여 CNT 설정 정보를 전송하는 방법을 제안하고자 한다.

본 발명은, CNT 코딩 기술의 부가 정보를 처리하는 방법을 제안하고자 한다.

본 발명은, CNT 플래그 정보를 정의 또는 전송하는 방법을 제안하고자 한다.

본 발명은, 이웃 블록의 액티비티 정보(activity information)에 기초하여 현재 블록의 액티비티 정보를 유추함으로써 CNT 설정 정보를 구성하는 방법을 제공한다.

본 발명은, 원본 픽쳐의 액티비티 정보(activity information)를 분석하여 CNT 예측 모드, CNT 플래그 및 CNT 부가 정보의 CABAC(Context-adaptive binary arithmetic coding) 컨텍스트 모델링(context modeling) 방식을 구성하는 방법을 제공한다.

본 발명은, SPS(Sequence Parameter Set) 및/또는 PPS(Picture Parameter Set) 레벨에서 CNT 설정 정보를 전송하는 방법을 제공한다.

본 발명은, CNT 설정 정보를 구성하는 설정 세트(configuration set)을 미리 정해 놓고 설정 세트를 가리키는 인덱스를 전송하는 방법을 제공한다.

본 발명은, CNT 코딩에 대응되는 MPM(Most Probable Modes) 후보 리스트(candidate list)를 만드는 방법을 제공한다.

본 발명은, CNT 잔여 모드 플래그(CNT remaining mode flag)를 전송하여 MPM 후보들 이외의 잔여 모드들을 지정하는 방법을 제안한다.

본 발명은, CNT 예측 모드를 가리키는 MPM 인덱스를 정의함으로써 CNT 플래그 전송을 생략할 수 있는 방법을 제공한다.

본 발명은, MPM 플래그가 0인 경우에 대해서만 CNT 플래그를 전송하는 방법을 제공한다.

본 발명은, 특정 예측 모드에 대해서만 CNT 플래그를 전송하는 방법을 제공한다.

본 발명은, 이웃 블록의 예측 방향에 기초하여 현재 블록에 대해 CNT 플래그를 추가적으로 전송할 예측 모드들을 구성하는 방법을 제공한다.

본 발명은, 이웃 블록이 CNT 코딩되었는지 여부에 기초하여 현재 블록에 대해 CNT 플래그를 추가적으로 전송할 예측 모드들을 구성하는 방법을 제공한다.

본 발명은, 두 레벨 이상의 계층을 두어 CNT 플래그를 전송하는 방법을 제공한다.

본 발명은, 변환 도메인 상에서 픽셀 간 상관 관계를 고려하는 CNT 코딩 방법을 제공한다.

본 발명은, CNT 코딩 방식을 이용하여 비디오 신호를 처리하는 방법을 제공한다.

본 발명은, 예측 과정을 수행할 때 이미 복원된 모든 신호를 고려함으로써 최적의 변환 계수(optimized transform coefficient)를 획득하는 방법을 제공한다.

본 발명은 정지 영상 또는 동영상으로부터 추출한 액티비티 정보를 분석하고, 이를 이용하여 해당 영상 또는 블록에 대해 최적의 CNT 설정 정보를 구성함으로써 영상에 대한 압축 데이터량을 현저히 감소시킬 수 있다.

또한, 본 발명은 정지 영상 또는 동영상에 대해 CNT를 적용할 때, CNT 적용 여부를 나타내는 CNT 플래그를 효율적으로 코딩함으로써 CNT 플래그 전송량을 감소시킬 수 있고, 이를 통해 압축 효율을 향상시킬 수 있다.

또한, 본 발명은, 변환 도메인 상에서 픽셀 간 상관 관계를 고려하는 CNT 코딩 기술을 이용함으로써 압축 효율을 향상시킬 수 있다.

또한, 본 발명은 예측 코딩과 변환 코딩을 융합함으로써 각 코딩 방식의 장점을 모두 살릴 수 있다. 즉, 이미 복원된 신호들을 모두 이용함으로써 보다 정교하고 향상된 예측을 수행할 수 있고, 예측 에러 샘플의 통계적 종속성을 이용할 수 있다. 그리고, 단일 차원에 대해 예측과 변환을 동시에 적용하여 코딩함으로써 매끄럽지 않거나(non-smooth) 비정지적인(non-stationary) 신호를 포함하는 고화질 영상에 대해 보다 효율적으로 코딩할 수 있다.

도 1은 본 발명이 적용되는 실시예로서, 비디오 신호의 인코딩이 수행되는 인코더의 개략적인 블록도를 나타낸다.
도 2는 본 발명이 적용되는 실시예로서, 비디오 신호의 디코딩이 수행되는 디코더의 개략적인 블록도를 나타낸다.
도 3은 본 발명이 적용되는 실시예로서, CNT(Conditionally Non-linear Transform) 코딩 기술이 적용되는 인코더의 개략적인 블록도를 나타낸다.
도 4는 본 발명이 적용되는 실시예로서, CNT(Conditionally Non-linear Transform) 코딩 기술이 적용되는 디코더의 개략적인 블록도를 나타낸다.
도 5는 본 발명이 적용되는 실시예로써, CNT(Conditionally Non-linear Transform) 코딩 방법을 설명하기 위한 개략적인 흐름도를 나타낸다.
도 6은 본 발명이 적용되는 실시예로써, CNT(Conditionally Non-linear Transform) 코딩 방법에 기초하여 최적의 예측 신호를 생성하는 방법을 설명하기 위한 흐름도이다.
도 7은 본 발명이 적용되는 실시예로써, 액티비티 정보에 기초하여 CNT 설정 정보를 결정하는 방법을 설명하기 위한 흐름도이다.
도 8은 본 발명이 적용되는 실시예로써, CNT 플래그에 기초하여 CNT 디코딩을 수행하는 방법을 설명하기 위한 흐름도이다.
도 9는 본 발명이 적용되는 실시예로써, 이웃 블록의 액티비티 정보에 기초하여 현재 블록의 CNT 설정 정보를 결정하는 방법을 설명하기 위한 흐름도이다.
도 10은 본 발명이 적용되는 실시예로써, CNT 설정 정보를 전송하기 위한 신택스를 나타낸다.
도 11은 본 발명이 적용되는 실시예로서, 인트라 예측 모드를 인코딩하는 방법을 설명하기 위한 흐름도이다.
도 12는 본 발명이 적용되는 실시예로서, 인트라 예측 모드를 디코딩하는 방법을 설명하기 위한 흐름도이다.
도 13은 본 발명이 적용되는 실시예로써, CNT 예측 코딩 적용 여부에 따라 최적의 예측 모드를 결정하는 방법을 설명하기 위한 흐름도이다.
도 14는 본 발명이 적용되는 실시예로써, MPM 인덱스에 기초하여 CNT 예측 코딩을 수행하는 방법을 설명하기 위한 흐름도이다.
도 15 내지 19는 본 발명이 적용되는 실시예들로써, CNT 설정 정보 및/또는 CNT 코딩 정보를 효율적으로 전송하기 위한 신택스들을 나타낸다.

발명의 실시를 위한 최선의 형태

본 발명에서, 상기 액티비티 정보가 상기 비디오 신호의 전체 원본 영상으로부터 획득되는 경우, 상기 CNT 설정 정보는 상기 전체 원본 영상에 적용되는 것을 특징으로 한다.

본 발명에서, 상기 액티비티 정보가 상기 비디오 신호의 복원된 이웃 블록으로부터 획득되는 경우, 상기 CNT 설정 정보는 현재 블록에 적용되는 것을 특징으로 한다.

본 발명에서, 상기 현재 블록에 대한 에지 방향성 정보는 좌측 이웃 블록과 상측 이웃 블록의 예측 방향성 정보가 동일한지 여부에 기초하여 유도되는 것을 특징으로 한다.

본 발명에서, 상기 좌측 이웃 블록과 상기 상측 이웃 블록의 예측 방향성 정보가 동일하면 상기 현재 블록은 동일한 에지 방향성 정보를 갖고, 상기 좌측 이웃 블록과 상기 상측 이웃 블록의 예측 방향성 정보가 다르면 상기 현재 블록은 에지 레벨 정보가 큰 이웃 블록의 에지 방향성 정보로 설정되는 것을 특징으로 한다.

본 발명에서, 상기 CNT 설정 정보는 CNT 플래그를 전송하기 위한 전송 단위 정보, CNT 플래그 코딩시 이용된 CABAC 컨텍스트 모델을 나타내는 컨텍스트 모델 인덱스 정보, 또는 CNT 예측 모드를 나타내는 CNT 예측 모드 세트 중 적어도 하나를 포함하는 것을 특징으로 한다.

본 발명에서, 상기 CNT 예측 모드의 개수는 상기 에지 방향성 정보에 기초하여 결정되는 것을 특징으로 한다.

본 발명에서, 상기 CNT 설정 정보는 시퀀스 파라미터 셋, 픽쳐 파라미터 셋, 픽쳐, CTU, CU, PU, 또는 블록 중 적어도 하나의 레벨을 통해 전송되는 것을 특징으로 한다.

본 발명은, 비디오 신호를 디코딩하는 방법에 있어서, 복원된 이웃 블록으로부터 액티비티 정보를 획득하는 단계, 여기서 상기 액티비티 정보는 영상의 에지 특성에 대한 정보를 나타내고, 에지 방향성 정보 또는 에지 레벨 정보 중 적어도 하나를 포함함; 상기 액티비티 정보에 기초하여 현재 블록에 대한 CNT 설정 정보를 유도하는 단계; 및 상기 CNT 설정 정보에 기초하여 상기 현재 블록에 대해 CNT 예측 코딩을 수행하는 단계를 포함하되, 상기 CNT 예측 코딩은 CNT 예측 모드에 따라 이전에 디코딩된 모든 픽셀값을 이용하여 예측을 수행하는 것을 특징으로 하는 방법을 제공한다.

본 발명에서, 상기 방법은, 상기 비디오 신호로부터 상기 현재 블록에 대한 CNT 플래그를 추출하는 단계를 더 포함하되, 상기 CNT 플래그는 상기 현재 블록에 대해 CNT 코딩이 적용되는지 여부를 나타내고, 상기 CNT 플래그에 따라 상기 현재 블록에 대해 CNT 코딩이 적용되는 경우, 상기 CNT 예측 코딩이 수행되는 것을 특징으로 한다.

본 발명은, 비디오 신호를 인코딩하는 장치에 있어서, 상기 비디오 신호로부터 액티비티 정보를 획득하는 에지 검출부; 및 상기 액티비티 정보에 기초하여 조건부 비선형 변환(Conditionally Non-linear Transform, CNT) 설정 정보를 결정하고, 상기 CNT 설정 정보에 기초하여 CNT 예측 코딩을 수행하는 예측부를 포함하되, 상기 액티비티 정보는 영상의 에지 특성에 대한 정보를 나타내고, 에지 방향성 정보 또는 에지 레벨 정보 중 적어도 하나를 포함하고, 상기 CNT 예측 코딩은 CNT 예측 모드에 따라 이전에 디코딩된 모든 픽셀값을 이용하여 예측을 수행하는 것을 특징으로 하는 장치를 제공한다.

본 발명은, 비디오 신호를 디코딩하는 장치에 있어서, 복원된 이웃 블록으로부터 액티비티 정보를 획득하고, 상기 액티비티 정보에 기초하여 현재 블록에 대한 CNT 설정 정보를 결정하고, 상기 CNT 설정 정보에 기초하여 상기 현재 블록에 대해 CNT 예측 코딩을 수행하는 예측부; 및 CNT 예측 코딩 결과값을 이용하여 상기 현재 블록을 복원하는 복원부를 포함하되, 상기 액티비티 정보는 영상의 에지 특성에 대한 정보를 나타내고, 에지 방향성 정보 또는 에지 레벨 정보 중 적어도 하나를 포함하고, 상기 CNT 예측 코딩은 CNT 예측 모드에 따라 이전에 디코딩된 모든 픽셀값을 이용하여 예측을 수행하는 것을 특징으로 하는 장치를 제공한다.

발명의 실시를 위한 형태

이하, 첨부된 도면을 참조하여 본 발명의 실시예의 구성과 그 작용을 설명하며, 도면에 의해서 설명되는 본 발명의 구성과 작용은 하나의 실시예로서 설명되는 것이며, 이것에 의해서 본 발명의 기술적 사상과 그 핵심 구성 및 작용이 제한되지는 않는다.

아울러, 본 발명에서 사용되는 용어는 가능한 한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 특정한 경우는 출원인이 임의로 선정한 용어를 사용하여 설명한다. 그러한 경우에는 해당 부분의 상세 설명에서 그 의미를 명확히 기재하므로, 본 발명의 설명에서 사용된 용어의 명칭만으로 단순 해석되어서는 안 될 것이며 그 해당 용어의 의미까지 파악하여 해석되어야 함을 밝혀두고자 한다.

또한, 본 발명에서 사용되는 용어들은 발명을 설명하기 위해 선택된 일반적인 용어들이나, 유사한 의미를 갖는 다른 용어가 있는 경우 보다 적절한 해석을 위해 대체 가능할 것이다. 예를 들어, 신호, 데이터, 샘플, 픽쳐, 프레임, 블록 등의 경우 각 코딩 과정에서 적절하게 대체되어 해석될 수 있을 것이다.

또한, 본 명세서에서 설명되는 실시예들의 개념과 방법들은, 다른 실시예들에도 적용가능하며, 본 명세서에서 모두 명시하여 기재하지 않더라도 본 발명의 기술적 사상 범위 내에서 각 실시예들의 조합도 적용가능할 것이다.

도 1은 본 발명이 적용되는 실시예로서, 비디오 신호의 인코딩이 수행되는 인코더의 개략적인 블록도를 나타낸다.

도 1을 참조하면, 인코더(100)는 영상 분할부(110), 변환부(120), 양자화부(130), 역양자화부(140), 역변환부(150), 필터링부(160), 복호 픽쳐 버퍼(DPB: Decoded Picture Buffer)(170), 인터 예측부(180), 인트라 예측부(185) 및 엔트로피 인코딩부(190)를 포함하여 구성될 수 있다.

영상 분할부(110)는 인코더(100)에 입력된 입력 영상(Input image)(또는, 픽쳐, 프레임)를 하나 이상의 처리 유닛으로 분할할 수 있다. 예를 들어, 상기 처리 유닛은 코딩 트리 유닛(CTU: Coding Tree Unit), 코딩 유닛(CU: Coding Unit), 예측 유닛(PU: Prediction Unit) 또는 변환 유닛(TU: Transform Unit)일 수 있다.

다만, 상기 용어들은 본 발명에 대한 설명의 편의를 위해 사용할 뿐이며, 본 발명은 해당 용어의 정의에 한정되지 않는다. 또한, 본 명세서에서는 설명의 편의를 위해, 비디오 신호를 인코딩 또는 디코딩하는 과정에서 이용되는 단위로써 코딩 유닛이라는 용어를 사용하지만, 본 발명은 그에 한정되지 않으며 발명 내용에 따라 적절하게 해석 가능할 것이다.

인코더(100)는 입력 영상 신호에서 인터 예측부(180) 또는 인트라 예측부(185)로부터 출력된 예측 신호(prediction signal)를 감산하여 잔여 신호(residual signal)를 생성할 수 있고, 생성된 잔여 신호는 변환부(120)로 전송된다.

변환부(120)는 잔여 신호에 변환 기법을 적용하여 변환 계수(transform coefficient)를 생성할 수 있다. 변환 과정은 정사각형의 동일한 크기를 갖는 픽셀 블록에 적용될 수도 있고, 정사각형이 아닌 가변 크기의 블록에도 적용될 수 있다.

양자화부(130)는 변환 계수를 양자화하여 엔트로피 인코딩부(190)로 전송하고, 엔트로피 인코딩부(190)는 양자화된 신호(quantized signal)를 엔트로피 코딩하여 비트스트림으로 출력할 수 있다.

양자화부(130)로부터 출력된 양자화된 신호(quantized signal)는 예측 신호를 생성하기 위해 이용될 수 있다. 예를 들어, 양자화된 신호(quantized signal)는 루프 내의 역양자화부(140) 및 역변환부(150)를 통해 역양자화 및 역변환을 적용함으로써 잔여 신호를 복원할 수 있다. 복원된 잔여 신호를 인터 예측부(180) 또는 인트라 예측부(185)로부터 출력된 예측 신호(prediction signal)에 더함으로써 복원 신호(reconstructed signal)가 생성될 수 있다.

한편, 위와 같은 압축 과정에서 인접한 블록들이 서로 다른 양자화 파라미터에 의해 양자화됨으로써 블록 경계가 보이는 열화가 발생될 수 있다. 이러한 현상을 블록킹 열화(blocking artifacts)라고 하며, 이는 화질을 평가하는 중요한 요소 중의 하나이다. 이러한 열화를 줄이기 위해 필터링 과정을 수행할 수 있다. 이러한 필터링 과정을 통해 블록킹 열화를 제거함과 동시에 현재 픽쳐에 대한 오차를 줄임으로써 화질을 향상시킬 수 있게 된다.

필터링부(160)는 복원 신호에 필터링을 적용하여 이를 재생 장치로 출력하거나 복호 픽쳐 버퍼(170)에 전송한다. 복호 픽쳐 버퍼(170)에 전송된 필터링된 신호는 인터 예측부(180)에서 참조 픽쳐로 사용될 수 있다. 이처럼, 필터링된 픽쳐를 화면간 예측 모드에서 참조 픽쳐로 이용함으로써 화질 뿐만 아니라 부호화 효율도 향상시킬 수 있다.

복호 픽쳐 버퍼(170)는 필터링된 픽쳐를 인터 예측부(180)에서의 참조 픽쳐로 사용하기 위해 저장할 수 있다.

인터 예측부(180)는 복원 픽쳐(reconstructed picture)를 참조하여 시간적 중복성 및/또는 공간적 중복성을 제거하기 위해 시간적 예측 및/또는 공간적 예측을 수행한다. 여기서, 예측을 수행하기 위해 이용되는 참조 픽쳐는 이전 시간에 부호화/복호화 시 블록 단위로 양자화와 역양자화를 거친 변환된 신호이기 때문에, 블로킹 아티팩트(blocking artifact)나 링잉 아티팩트(ringing artifact)가 존재할 수 있다.

따라서, 인터 예측부(180)는 이러한 신호의 불연속이나 양자화로 인한 성능 저하를 해결하기 위해, 로우패스 필터(lowpass filter)를 적용함으로써 픽셀들 사이의 신호를 서브 픽셀 단위로 보간할 수 있다. 여기서, 서브 픽셀은 보간 필터를 적용하여 생성된 가상의 화소를 의미하고, 정수 픽셀은 복원된 픽쳐에 존재하는 실제 화소를 의미한다. 보간 방법으로는 선형 보간, 양선형 보간(bi-linear interpolation), 위너 필터(wiener filter) 등이 적용될 수 있다.

보간 필터는 복원 픽쳐(reconstructed picture)에 적용되어 예측의 정밀도를 향상시킬 수 있다. 예를 들어, 인터 예측부(180)는 정수 픽셀에 보간 필터를 적용하여 보간 픽셀을 생성하고, 보간 픽셀들(interpolated pixels)로 구성된 보간 블록(interpolated block)을 예측 블록(prediction block)으로 사용하여 예측을 수행할 수 있다.

인트라 예측부(185)는 현재 부호화를 진행하려고 하는 블록의 주변에 있는 샘플들을 참조하여 현재 블록을 예측할 수 있다. 상기 인트라 예측부(185)는 인트라 예측을 수행하기 위해 다음과 같은 과정을 수행할 수 있다. 먼저, 예측 신호를 생성하기 위해 필요한 참조 샘플을 준비할 수 있다. 그리고, 준비된 참조 샘플을 이용하여 예측 신호를 생성할 수 있다. 이후, 예측 모드를 부호화하게 된다. 이때, 참조 샘플은 참조 샘플 패딩 및/또는 참조 샘플 필터링을 통해 준비될 수 있다. 참조 샘플은 예측 및 복원 과정을 거쳤기 때문에 양자화 에러가 존재할 수 있다. 따라서, 이러한 에러를 줄이기 위해 인트라 예측에 이용되는 각 예측 모드에 대해 참조 샘플 필터링 과정이 수행될 수 있다.

상기 인트라 예측부(185)는 크게 예측 모드 코딩과 잔차 신호 코딩으로 나뉠 수 있다. 예측 모드를 코딩할 때는 이웃 블록의 예측 모드를 현재 블록의 예측 모드에 대한 예측값으로 이용할 수 있다. 따라서, 이웃 블록들의 예측 모드가 정확할수록 현재 블록의 예측 모드에 대한 예측이 정확해질 수 있다.

상기 인터 예측부(180) 또는 상기 인트라 예측부(185)를 통해 생성된 예측 신호(prediction signal)는 복원 신호를 생성하기 위해 이용되거나 잔여 신호를 생성하기 위해 이용될 수 있다.

또한, 상기 인터 예측부(180) 또는 상기 인트라 예측부(185)는 본 발명이 적용되는 CNT 코딩 방법에 기초하여 이전에 복원된 모든 신호(all previously reconstructed signal)를 이용하여 예측 신호(prediction signal)를 생성할 수 있다.

도 2는 본 발명이 적용되는 실시예로서, 비디오 신호의 디코딩이 수행되는 디코더의 개략적인 블록도를 나타낸다.

도 2를 참조하면, 디코더(200)는 파싱부(미도시), 엔트로피 디코딩부(210), 역양자화부(220), 역변환부(230), 필터링부(240), 복호 픽쳐 버퍼(DPB: Decoded Picture Buffer Unit)(250), 인터 예측부(260), 인트라 예측부(265) 및 복원부(미도시)를 포함하여 구성될 수 있다.

그리고, 디코더(200)를 통해 출력된 복원 영상 신호(reconstructed video signal)는 재생 장치를 통해 재생될 수 있다.

디코더(200)는 도 1의 인코더(100)로부터 출력된 비디오 신호를 수신하고, 파싱부(미도시)를 통해 상기 비디오 신호로부터 신택스 요소들을 파싱할 수 있다. 파싱된 신호는 엔트로피 디코딩부(210)를 통해 엔트로피 디코딩되거나 다른 기능 유닛으로 전송될 수 있다.

역양자화부(220)에서는 양자화 스텝 사이즈 정보를 이용하여 엔트로피 디코딩된 신호로부터 변환 계수(transform coefficient)를 획득한다.

역변환부(230)에서는 변환 계수를 역변환하여 잔여 신호(residual signal)를 획득하게 된다.

획득된 잔여 신호를 인터 예측부(260) 또는 인트라 예측부(265)로부터 출력된 예측 신호(prediction signal)에 더함으로써 복원 신호(reconstructed signal)가 생성된다.

필터링부(240)는 복원 신호(reconstructed signal)에 필터링을 적용하여 이를 재생 장치로 출력하거나 복호 픽쳐 버퍼부(250)에 전송한다. 복호 픽쳐 버퍼부(250)에 전송된 필터링된 신호는 인터 예측부(260)에서 참조 픽쳐로 사용될 수 있다.

본 명세서에서, 인코더(100)의 필터링부(160), 인터 예측부(180) 및 인트라 예측부(185)에서 설명된 실시예들은 각각 디코더의 필터링부(240), 인터 예측부(260) 및 인트라 예측부(265)에도 동일하게 적용될 수 있다.

도 3 및 도 4는 본 발명이 적용되는 실시예들로서, CNT(Conditionally Non-linear Transform) 코딩 기술이 적용되는 인코더 및 디코더의 개략적인 블록도를 나타낸다.

기존 코덱에서 N개의 데이터에 대해 변환 계수(transform coefficient)들을 획득하고자 하는 경우, N개의 원본 데이터(original data)로부터 N개의 예측 데이터를 한꺼번에 뺀 후 획득된 N개의 레지듀얼 데이터(residual data) 또는 예측 에러(prediction error)에 대해 변환 코딩(transform coding)을 적용하게 된다. 이러한 경우, 예측 과정과 변환 과정이 순차적으로 이루어진다.

그러나, N개의 픽셀들로 이루어진 영상 데이터에 대해 픽셀 단위로 가장 최근에 복원한 데이터를 가지고 예측을 수행하면 가장 정확한 예측 결과를 얻을 수 있을 것이다. 이러한 이유로, N개 픽셀 단위로 예측과 변환을 순차적으로 적용하는 것은 최적의 코딩 방식이라고 할 수 없을 것이다.

한편, 픽셀 단위로 가장 최근에 복원한 데이터를 얻기 위해서는 이미 획득된 변환 계수(transform coefficient)들에 대해 역변환을 수행하여 레지듀얼 데이터를 복원하고, 이후 예측 데이터와 더해야 한다. 하지만, 기존의 코딩 방식에서는 N개의 데이터에 대해 예측이 끝나야만 변환을 적용하여 변환 계수(transform coefficient)들을 획득할 수 있으므로, 픽셀 단위로 데이터를 복원하는 것 자체가 불가능하다.

따라서, 본 발명에서는 이전에 복원된 신호와 컨텍스트 신호를 이용하여 변환 계수를 획득하는 방법을 제안한다.

상기 도 3의 인코더(300)는 최적화부(310), 양자화부(320) 및 엔트로피 인코딩부(330)를 포함하고, 상기 도 4의 디코더(400)는 엔트로피 디코딩부(410), 역양자화부(420), 역변환부(430) 및 복원부(440)를 포함한다.

도 3의 인코더(300)를 살펴보면, 최적화부(310)에서는 최적화된 변환 계수를 획득한다. 상기 최적화부(310)는 최적화된 변환 계수를 획득하기 위해 다음과 같은 실시예들을 적용할 수 있다.

먼저, 본 발명이 적용되는 실시예를 설명하기 위해, 신호를 복원하기 위한 복원 함수를 다음 수학식 1과 같이 정의할 수 있다.

여기서,

는 복원 신호를 나타내고, c는 디코딩된 변환 계수를 나타내며, y는 컨텍스트 신호를 나타낸다. R (c,y)는 복원 신호를 생성하기 위해 c와 y를 이용하는 비선형 복원 함수(nonlinear reconstruction function)를 나타낸다.

본 발명이 적용되는 일실시예로써, 최적화된 변환 계수를 획득하기 위해 향상된 비선형 예측자(advanced non-linear predictor)를 생성하는 방법을 제안한다.

본 실시예에서, 예측 신호는 이미 복원된 값들과 변환 계수와의 관계로 정의될 수 있다. 즉, 본 발명이 적용되는 인코더 및 디코더는 예측 과정을 수행할 때 이미 복원된 모든 신호를 고려하여 최적의 예측 신호(optimized prediction signal)를 생성할 수 있다. 또한, 상기 예측 신호를 생성하기 위한 예측 함수로써 비선형 예측 함수(non-linear prediction function)를 적용할 수 있다.

따라서, 각각의 디코딩된 변환 계수들은 전체 복원 과정에 영향을 미치고, 예측 에러 벡터에 포함되어 있는 예측 에러의 제어를 가능하게 한다. 예를 들어, 예측 에러 신호는 다음 수학식 2와 같이 정의될 수 있다.

여기서, e는 예측 에러 신호를 나타내고, c는 디코딩된 변환 계수를 나타내며, T는 변환 행렬을 나타낸다.

이때, 복원 신호는 다음 수학식 3과 같이 정의될 수 있다.

여기서,

는 n번째 복원 신호를 나타내고, e_n 은 n번째 예측 에러 신호를 나타내며, y는 컨텍스트 신호(context signal)를 나타낸다. R_n 은 복원 신호를 생성하기 위해 e_n 과 y를 이용하는 비선형 복원 함수를 나타낸다.

예를 들어, 상기 비선형 복원 함수 R_n 은 다음 수학식 4와 같이 정의될 수 있다.

여기서, P_n은 예측 신호를 생성하기 위해 상기 변수들로 구성된 비선형 예측 함수(non-linear prediction function)를 나타낸다.

상기 비선형 예측 함수(non-linear prediction function)로는, 예를 들어, 미디언 함수(median function)이거나, 랭크 오더 필터(rank order filter) 또는 비선형 함수의 결합뿐만 아니라 선형 함수들의 조합일 수 있다. 그리고, 상기 비선형 예측 함수(non-linear prediction function) P_n()은 각각 서로 다른 비선형 함수일 수 있다.

다른 일실시예로, 본 발명이 적용되는 인코더(300) 및 디코더(400)는 상기 비선형 예측 함수(non-linear prediction function)를 선택하기 위한 후보 함수들의 저장소를 포함할 수 있다.

예를 들어, 상기 최적화부(310)는 최적의 변환 계수(optimized transform coefficient)를 생성하기 위해 최적의 비선형 예측 함수를 선택할 수 있다. 이때, 상기 최적의 비선형 예측 함수는 상기 저장소에 저장된 후보 함수들로부터 선택될 수 있다.

상기와 같이, 최적의 비선형 예측 함수를 선택함으로써 상기 최적화부(310)는 최적의 변환 계수(optimized transform coefficient)를 생성할 수 있다.

한편, 출력된 변환 계수는 양자화부(320)로 전송되고, 상기 양자화부(320)는 상기 변환 계수를 양자화하여 엔트로피 인코딩부(330)로 전송한다.

상기 엔트로피 인코딩부(330)는 상기 양자화된 변환 계수를 엔트로피 인코딩하여 압축된 비트스트림을 출력할 수 있게 된다.

도 4의 디코더(400)는 상기 도 3의 인코더로부터 출력된 비트스트림을 수신하여, 엔트로피 디코딩부(410)를 통해 엔트로피 디코딩을 수행하고, 역양자화부(420)를 통해 역양자화를 수행할 수 있다. 이때, 역양자화부(420)를 통해 출력된 신호는 최적화된 변환 계수를 의미할 수 있다.

역변환부(430)는 상기 최적화된 변환 계수를 수신하여 역변환 과정을 수행하며, 상기 역변환 과정을 통해 예측 에러 신호를 생성하게 된다.

복원부(440)에서는 상기 예측 에러 신호와 예측 신호를 합하여 복원 신호를 생성하게 된다. 이때, 상기 예측 신호의 경우, 상기 도 3에서 설명한 다양한 실시예들이 적용될 수 있다.

도 5는 본 발명이 적용되는 실시예로써, CNT(Conditionally Non-linear Transform) 코딩 방법을 설명하기 위한 개략적인 흐름도를 나타낸다.

인코더에서는 모든 이전에 복원된 신호와 컨텍스트 신호 중 적어도 하나에 기초하여 복원 신호를 생성할 수 있다(S510). 여기서, 상기 컨텍스트 신호는 이전에 복원된 신호, 이전에 복원된 인트라 코딩된 신호, 현재 프레임의 이미 복원된 부분 또는 복원될 신호의 디코딩과 관련된 다른 정보 중 적어도 하나를 포함할 수 있다. 상기 복원 신호는 예측 신호와 예측 에러 신호의 합으로 이루어질 수 있고, 상기 예측 신호와 상기 예측 에러 신호 각각은 이전에 복원된 신호와 컨텍스트 신호 중 적어도 하나에 기초하여 생성될 수 있다.

인코더는 최적화 함수를 최소화하는 최적의 변환 계수를 획득할 수 있다(S520). 여기서, 상기 최적화 함수는 왜곡 성분, 레이트 성분 및 라그랑즈 승수(Lagrange multiplier) λ를 포함할 수 있다. 상기 왜곡 성분은 원 비디오 신호와 복원 신호 간의 차이로 구성될 수 있고, 상기 레이트 성분은 이전에 획득된 변환 계수를 포함할 수 있다. λ는 왜곡 성분과 레이트 성분의 균형을 유지하는 실수를 나타낸다.

상기 획득된 변환 계수는 양자화 및 엔트로피 인코딩을 통해 디코더로 전송된다(S530).

한편, 디코더에서는 전송된 변환 계수를 수신하여, 엔트로피 디코딩, 역양자화 및 역변환 과정을 통해 예측 에러 벡터를 획득하게 된다. 디코더 내의 예측부에서는 이미 복원된 이용가능한 모든 샘플을 이용하여 예측 신호를 생성하게 되며, 예측 신호와 복원된 예측 에러 벡터에 기초하여 비디오 신호를 복원할 수 있다. 이때, 예측 신호를 생성하는 과정은 상기 인코더에서 설명한 실시예들이 적용될 수 있다.

도 6은 본 발명이 적용되는 실시예로써, CNT(Conditionally Non-linear Transform) 코딩 방법에 기초하여 최적의 예측 신호를 생성하는 방법을 설명하기 위한 흐름도이다.

본 발명은 이미 복원된 신호(previously reconstructed signal)와 컨텍스트 신호(context signal)를 이용하여 예측 신호를 생성할 수 있다(S610). 예를 들어, 상기 이미 복원된 신호(previously reconstructed signal)는 상기 수학식 3에서 정의된 복원 신호를 의미할 수 있다. 그리고, 상기 예측 신호를 생성하기 위해서는 비선형 예측 함수가 적용될 수 있으며, 각각의 예측 신호에는 서로 다른 비선형 예측 함수가 적응적으로 적용될 수 있다.

상기 예측 신호는 수신된 예측 에러 신호(e(i))에 합산되어(S620), 복원 신호를 생성하게 된다(S630). 이때, 상기 S620 단계는 가산기(Adder)(미도시)를 통해 수행될 수 있다.

상기 생성된 복원 신호는 향후의 참조(future reference)를 위해 저장될 수 있다(S640). 이렇게 저장된 신호는 계속해서 다음 예측 신호를 생성하기 위해 이용될 수 있다.

이와 같이, 예측 신호를 생성하는 과정에서 이용 가능한 데이터에 대한 제한 사항을 제거함으로써, 즉 이미 복원된 모든 신호를 이용하여 예측 신호를 생성함으로써 보다 향상된 압축 효율을 제공할 수 있게 된다.

도 7은 본 발명이 적용되는 실시예로써, 액티비티 정보에 기초하여 CNT 설정 정보를 결정하는 방법을 설명하기 위한 흐름도이다.

본 발명은, 액티비티 정보(activity information)를 이용하여 CNT 설정 정보를 결정하는 방법을 제공한다.

여기서, 상기 액티비티 정보는 영상의 에지 특성(edge property)에 대한 정보를 나타내고, 에지 방향성 정보 또는 에지 레벨 정보 중 적어도 하나를 포함할 수 있다.

그리고, 상기 에지 방향성 정보는 블록 내 에지들의 방향성을 나타내는 정보이고, 상기 에지 레벨 정보는 블록 내 에지들이 얼마나 선명한지를 나타내는 세기 정보(intensity information)이다.

상기 CNT 설정 정보는 CNT 코딩을 수행하기 위해 필요한 설정 정보를 의미한다. 예를 들어, 상기 CNT 설정 정보는 CNT 플래그를 전송하기 위한 전송 단위 정보, CNT 플래그 코딩시 이용된 CABAC 컨텍스트 모델을 나타내는 컨텍스트 모델 인덱스 정보, 또는 CNT 예측 모드를 나타내는 CNT 예측 모드 세트 중 적어도 하나를 포함할 수 있다. 한편, 본 명세서에서, 상기 CNT 설정 정보는 CNT 코딩 모드라고 부를 수도 있다.

본 발명은, 원본 영상의 액티비티 정보(activity information)를 분석하여 CNT 예측 모드, CNT 플래그 및 CNT 부가 정보의 CABAC(Context-adaptive binary arithmetic coding) 컨텍스트 모델링(context modeling) 방식을 구성하는 방법을 제공한다.

여기서, CNT 예측 모드는 CNT 코딩 방식에 기초하여 예측을 수행하는 모드를 의미하며, 예를 들어 상기 CNT 예측 모드는 인트라 예측 모드에 기초하여 설정될 수 있다. 구체적 예로, CNT 방향성 모드인 경우, 해당 예측 방향으로 이전의 디코딩된 픽셀을 이용하여 예측을 수행할 수 있다.

상기 인트라 예측 모드는 다음 표 1과 같이 정의될 수 있다.

인트라 예측 모드(Intra prediction mode)	관련 명칭(Associated name)
0	인트라 플래너(INTRA_PLANAR)
1	인트라 DC(INTRA_DC)
2...34	인트라 방향성 2 ... 인트라 방향성 34(INTRA_ANGULAR2 ... INTRA_ANGULAR34)

예를 들어, 상기 CNT 예측 모드는 다음 표 2와 같이 정의될 수 있다.

CNT 예측 모드(CNT prediction mode)	관련 명칭(Associated name)
0	CNT 플래너(CNT_PLANAR)
1	CNT DC(CNT_DC)
2...34	CNT 방향성 2 ... CNT 방향성 34(CNT_ANGULAR2 ... CNT_ANGULAR34)

위 표 2는 일실시예일 뿐이며, 상기 CNT 예측 모드의 구성은 영상의 액티비티 정보에 기초하여 결정될 수 있다. 예를 들어, 영상의 액티비티 정보가 수평 방향 또는 수직 방향에 대한 빈도수가 높은 경우, 상기 CNT 예측 모드는 수평 방향 또는 수직 방향을 중심으로 정의될 수 있다.

또는, 상기 CNT 예측 모드는 35개 중 일부 특정된 모드만으로 구성될 수 있다. 또는, 35개의 예측 모드 중 일부 모드는 CNT 예측 모드로 구성되고 나머지 모드는 표 1의 인트라 예측 모드로 구성될 수도 있다.

본 발명은, 액티비티 정보(activity information)에 기초하여 CNT 설정 정보를 전송하는 방법을 제공한다.

본 발명은, 시퀀스 파라미터 셋(Sequence Parameter Set, SPS) 및/또는 픽쳐 파라미터 셋(Picture Parameter Set, PPS), 픽쳐, CTU, CU, PU, 또는 블록 중 적어도 하나의 레벨에서 CNT 설정 정보를 전송하는 방법을 제공한다.

본 발명은, CNT 설정 정보를 구성하는 설정 세트(configuration set)를 미리 정해 놓고 설정 세트를 가리키는 인덱스를 전송하는 방법을 제공한다.

상기 도 7을 살펴보면, 먼저, 인코더는 액티비티 정보를 획득할 수 있다(S710). 여기서, 상기 액티비티 정보는 영상의 에지 특성(edge property)에 대한 정보를 나타내고, 에지 방향성 정보 또는 에지 레벨 정보 중 적어도 하나를 포함할 수 있다.

상기 에지 방향성 정보는 다음 수학식 5와 같이 정의될 수 있고, 상기 에지 레벨 정보는 다음 수학식 6과 같이 정의될 수 있다.

여기서, V_i,j는 수직 방향의 에지 분포를 나타내고, H_i,j는 수평 방향의 에지 분포를 나타내며, I_i,j는 강도(intensity)를 나타낸다. i,j는 블록 내 픽셀의 위치를 나타내며, 4x4 블록의 경우 i,j = 0,1,2,3 이다.

상기 수학식 5를 보면, 수평 방향의 에지 분포 H_i,j가 클 경우 상기 에지 방향성 정보 Dir_b는 1 이고, 수직 방향의 에지 분포 V_i,j가 클 경우 상기 에지 방향성 정보 Dir_b는 2 이고, 그 이외의 경우는 0이며 이는 방향성이 없음을 의미할 수 있다.

이처럼, 4x4 블록의 1D 라플라시안 값(Dir_b)에 따라 상기 에지 방향성 정보 Dir_b는 3가지 방향성을 가질 수 있으며, 2D 라플라시안 값(Act_b)의 크기에 따라 총 5 개의 에지 레벨 값을 가질 수 있다.

에지가 많으면 픽셀 값의 급격한 변화로 인해 액티비티 값이 커진다. CNT 예측 코딩은 인접 픽셀 값을 활용하여 예측을 수행하므로, 에지로 인한 픽셀 값의 급격한 변화를 잘 대응할 수 있다. 따라서, 액티비티 정보에 기초하여 CNT 설정 정보를 보다 효율적으로 구성할 수 있다.

일실시예로, 상기 액티비티 정보는 원본 영상 또는 복원 영상을 이용하여 획득할 수 있다. 원본 영상은 인코더에서만 이용가능하고 복원 영상은 인코더와 디코더 모두에서 이용가능하다.

그런데, 복원 영상으로부터 액티비티 정보를 획득하려고 하는 경우, 현재 블록이 아직 복원되지 않았기 때문에 액티비티 정보를 알 수가 없다. 따라서, 이 경우 현재 블록은 시간적 또는 공간적으로 이웃한 블록의 액티비티 정보로부터 유도할 수 있다. 원본 영상과 복원 영상에 대한 액티비티 정보를 CNT 코딩에 활용하는 방식들로 다음과 같은 실시예들이 가능하다.

일실시예로, 액티비티 정보가 비디오 신호의 전체 원본 영상으로부터 획득되는 경우, CNT 설정 정보는 상기 전체 원본 영상에 적용될 수 있다.

원본 영상으로부터 액티비티 정보를 획득하는 경우, 인코더는 상기 액티비티 정보로부터 적용할 CNT 설정 정보를 구성할 수 있다.

일실시예로, 영상의 액티비티 정보가 수평 방향 또는 수직 방향에 대한 빈도수가 높은 경우, 상기 CNT 예측 모드는 수평 방향 또는 수직 방향을 중심으로 정의될 수 있다.

예를 들어, 상기 CNT 예측 모드는 35개 중 일부 특정된 모드만으로 구성될 수 있다. 또는, 35개 예측 모드 중 일부 모드는 CNT 예측 모드로 구성되고 나머지 모드는 인트라 예측 모드로 구성될 수 있다. 구체적 예로, 액티비티 정보가 수평 방향에 대한 빈도수가 높은 경우, 수평 방향에 대응되는 모드는 CNT 예측 모드로 설정하고 나머지는 인트라 예측 모드로 설정할 수 있다. 이를 통해 CNT 예측 모드가 선택될 확률을 높일 수 있다.

일실시예로, 픽쳐 내에 에지 레벨값이 작은 블록들이 넓게 분포되어 있는 경우 CNT 플래그는 계층적으로 전송될 수 있다.

또는, 픽쳐 내에 에지 레벨값이 큰 블록들이 전반적으로 분포되어 있는 경우 CNT 플래그는 하위 레벨 단위(예를 들어, PU)로 전송될 수 있다.

이를 통해 불필요한 CNT 플래그 전송을 막을 수 있다.

일실시예로, 액티비티 정보(에지 방향성 정보 및 에지 레벨 정보)에 기초하여 CNT 설정 정보에 대한 CABAC 컨텍스트 모델링(context modeling)을 다르게 적용할 수 있다. 예를 들어, 픽쳐 내에 에지 레벨값이 작은 블록들이 많은 경우에는, CNT 플래그가 0인 경우에 대한 초기 확률 값을 높게 잡을 수 있다.

반면, 픽쳐 내에 에지 레벨값이 큰 블록들이 많은 경우에는, 현재 블록의 CNT 적용 여부가 주변 블록들의 CNT 적용 여부와 상관성이 높을 수 있으므로, 주변 블록들의 CNT 플래그 값들에 따라 다른 컨텍스트를 적용하도록 구성할 수 있다.

일실시예로, 픽쳐 내에 에지 레벨값이 큰 블록들의 빈도가 높을수록 CNT 예측 모드의 개수를 줄여 CNT 예측 모드 세트를 전송하기 위한 비트 수를 줄일 수 있다.

에지 레벨값이 클수록 인접하는 복원 픽셀들로부터 픽셀 값을 예측하는 방식(CNT 코딩 방식)의 이득이 크기 때문에, CNT 예측 모드의 개수를 늘려서 지원하는 방향들을 세분화하기 보다는 CNT 예측 모드의 개수를 줄여서 전송해야 할 부가 정보량을 줄이는 것이 코딩 효율 면에서 유리할 수 있다.

상기 인코더는 액티비티 정보에 기초하여 CNT 설정 정보를 결정할 수 있다(S720). 여기서, CNT 설정 정보는 CNT 코딩을 수행하기 위해 필요한 설정 정보를 의미할 수 있다. 예를 들어, 상기 CNT 설정 정보는 CNT 플래그를 전송하기 위한 전송 단위 정보, CNT 플래그 코딩시 이용된 CABAC 컨텍스트 모델을 나타내는 컨텍스트 모델 인덱스 정보, 또는 CNT 예측 모드를 나타내는 CNT 예측 모드 세트 중 적어도 하나를 포함할 수 있다.

일실시예로, 상기 CNT 설정 정보는 시퀀스 파라미터 셋, 픽쳐 파라미터 셋, 픽쳐, CTU, CU, PU, 또는 블록 중 적어도 하나의 레벨을 통해 전송될 수 있다.

다른 실시예로, 본 발명은 CNT 설정 정보를 구성하는 설정 세트(configuration set)를 미리 정해 놓고 설정 세트를 가리키는 인덱스를 전송할 수 있다. 여기서, 상기 설정 세트는 CNT 예측 모드, CNT 예측 모드의 개수, 계층적 CNT 플래그 지원 유무, CNT 플래그를 전송하기 위한 전송 단위 정보, CNT 플래그 코딩시 이용된 CABAC 컨텍스트 모델을 나타내는 컨텍스트 모델 인덱스 정보, 또는 CNT 예측 모드를 나타내는 CNT 예측 모드 세트 중 적어도 하나를 포함할 수 있다.

다른 실시예로, 상기 CNT 설정 정보를 구성하는 주기도 시퀀스 파라미터 셋, 픽쳐 파라미터 셋, 픽쳐, CTU, CU, PU, 또는 블록 중 적어도 하나의 레벨에서 결정될 수 있다.

다른 실시예로, 상기 설정 세트는 SPS를 통해 일괄적으로 전송한 후, PPS에서 이들 중 하나를 선택하는 인덱스만을 전송하도록 할 수도 있다.

상기 인코더는 CNT 설정 정보에 기초하여 CNT 코딩을 수행할 수 있다(S730).

여기서, CNT 코딩이라 함은 이전에 디코딩된 모든 픽셀을 이용하여 코딩을 수행하는 것을 의미하며, CNT 예측 코딩을 포함할 수 있다.

도 8은 본 발명이 적용되는 실시예로써, CNT 플래그에 기초하여 CNT 디코딩을 수행하는 방법을 설명하기 위한 흐름도이다.

상기 도 8을 살펴보면, 디코더는 CNT 설정 정보를 파싱하여(S810), 영상 전체에 대한 CNT 설정 정보를 구성할 수 있다.

상기 디코더는 CNT 플래그를 확인 또는 추출(파싱)할 수 있다(S820). 여기서, 상기 CNT 플래그는 계층적인 레벨 단위로 획득될 수 있다. 이 경우, 상기 CNT 플래그에 따라 해당 레벨 단위로 상기 CNT 설정 정보가 적용될 수도 있다.

그리고, 상기 디코더는 상기 CNT 플래그에 따라 해당 레벨의 CNT 설정 정보에 기초하여 CNT 디코딩을 수행할 수 있다(S830).

도 9는 본 발명이 적용되는 실시예로써, 이웃 블록의 액티비티 정보에 기초하여 현재 블록의 CNT 설정 정보를 결정하는 방법을 설명하기 위한 흐름도이다.

상기 도 9를 살펴보면, 디코더는 이웃 블록의 액티비티 정보를 획득할 수 있다(S910). 이와 같이, 액티비티 정보가 비디오 신호의 복원된 이웃 블록으로부터 획득되는 경우, CNT 설정 정보는 현재 블록에 적용될 수 있다.

상기 디코더는 상기 이웃 블록의 액티비티 정보에 기초하여 현재 블록의 CNT 설정 정보를 유도할 수 있다(S920).

일실시예로, 현재 블록에 대한 에지 방향성 정보는 좌측 이웃 블록과 상측 이웃 블록의 예측 방향성 정보가 동일한지 여부에 기초하여 유도될 수 있다.

일실시예로, 좌측 이웃 블록과 상측 이웃 블록의 예측 방향성 정보가 동일하면, 현재 블록은 이와 동일한 에지 방향성 정보를 가질 수 있다. 그리고, 좌측 이웃 블록과 상측 이웃 블록의 예측 방향성 정보가 다르면, 현재 블록의 에지 방향성 정보는 에지 레벨 정보가 큰 이웃 블록의 에지 방향성 정보로 설정되거나 무방향으로 설정될 수 있다.

일실시예로, 현재 블록의 에지 레벨 정보는 좌측 이웃 블록의 에지 레벨 값과 상측 이웃 블록의 에지 레벨 값의 평균값, 최소값, 최대값 중 어느 하나로부터 유도될 수 있다.

만약, 액티비티 정보의 통계적 분석을 통해 특정 액티비티 분포에 대해 CNT의 적용 여부를 알 수 있는 경우, CNT 플래그를 전송하지 않을 수 있다.

또한, 액티비티 값의 범위에 따라 CNT 플래그 코딩에 적용할 CABAC 컨텍스트 모델을 별도로 구성하여, 유도한 액티비티 값으로부터 해당 컨텍스트 모델을 지정할 수 있도록 구성하는 것도 가능하다.

한편, 상기 디코더는, 상기 CNT 설정 정보에 기초하여 CNT 디코딩을 수행할 수 있다(S930).

도 10은 본 발명이 적용되는 실시예로써, CNT 설정 정보를 전송하기 위한 신택스를 나타낸다.

상기 도 10을 살펴보면, 상기 CNT 설정 정보는 CNT 플래그를 전송하기 위한 전송 단위 정보, CNT 플래그 코딩시 이용된 CABAC 컨텍스트 모델을 나타내는 컨텍스트 모델 인덱스 정보, 또는 CNT 예측 모드를 나타내는 CNT 예측 모드 세트 중 적어도 하나를 포함하는 것을 확인할 수 있다.

예를 들어, 상기 전송 단위 정보는 CNT_flag_transfer_unit_size 로 정의될 수 있고(1010), 상기 컨텍스트 모델 인덱스 정보는 CNT_flag_context_model_idx 로 정의될 수 있고(1020), 상기 CNT 예측 모드 세트는 CNT_directional_mode_cfg_idx로 정의될 수 있다(1030).

또한, 상기 CNT 설정 정보는 시퀀스 파라미터 셋, 픽쳐 파라미터 셋, 픽쳐, CTU, CU, PU, 또는 블록 중 적어도 하나의 레벨을 통해 전송될 수 있으며, 예를 들어 도 10의 경우 픽쳐 파라미터 셋에서 상기 CNT 설정 정보를 정의하고 있는 것을 확인할 수 있다.

도 11은 본 발명이 적용되는 실시예로서, 인트라 예측 모드를 인코딩하는 방법을 설명하기 위한 흐름도이다.

일반적으로 영상에 대한 블록 분할이 되면, 코딩하려는 현재 블록과 이웃 블록은 비슷한 영상 특성을 갖게 된다. 인트라 예측 모드의 경우, 현재 블록과 이웃 블록은 서로 동일하거나 비슷한 인트라 예측 모드를 가질 확률이 높다. 따라서, 인코더는 현재 블록의 예측 모드를 인코딩하기 위해 이웃 블록의 예측 모드를 이용할 수 있다.

상기 도 11은 인트라 예측 모드를 기준으로 설명하고 있으나, 본 발명에서 정의하는 CNT 예측 모드가 이용되는 경우 유사한 방식으로 CNT 예측 모드를 코딩하기 위해 적용될 수 있을 것이다.

먼저, 인코더는 이웃 블록이 인트라 코딩된 경우, 이웃 블록의 예측 모드를 확인 또는 유도할 수 있다(S1110).

예를 들어, 좌측 이웃 블록의 예측 모드와 상측 이웃 블록의 예측 모드를 기초로 현재 블록의 예측 모드를 결정할 수 있고, 이때 해당 이웃 블록의 예측 모드를 MPM(Most Probable Modes)으로 결정할 수 있다. 여기서, MPM이라 함은 인트라 예측 모드 코딩시 현재 블록과 이웃 블록의 유사성을 고려하여 중복되는 정보의 손실을 막고 코딩 효율을 향상시키기 위해 이용되는 모드를 의미할 수 있다. MPM을 결정하는 것은, MPM(most probable modes) 후보(또는, MPM 리스트)를 리스트 업(list up)한다고 표현할 수도 있다.

상기 인코더는 상기 좌측 이웃 블록의 예측 모드와 상기 상측 이웃 블록의 예측 모드가 같은지 여부를 확인할 수 있다(S1120).

만약, 상기 좌측 이웃 블록의 예측 모드와 상기 상측 이웃 블록의 예측 모드가 같지 않은 경우, 첫번째 MPM은 상기 좌측 이웃 블록의 예측 모드로 설정될 수 있고, 두번째 MPM은 상기 상측 이웃 블록의 예측 모드로 설정될 수 있으며, 세번째 MPM은 인트라 플래너 모드, 인트라 DC 모드, 또는 인트라 수직 모드 중 어느 하나로 설정될 수 있다(S1130).

한편, 상기 좌측 이웃 블록의 예측 모드와 상기 상측 이웃 블록의 예측 모드가 같은 경우, 상기 인코더는 상기 좌측 이웃 블록의 예측 모드가 2보다 작은지 여부를 확인할 수 있다(S1140).

만약, 상기 좌측 이웃 블록의 예측 모드가 2보다 작은 경우, 첫번째 MPM은 인트라 플래너 모드로 설정될 수 있고, 두번째 MPM은 인트라 DC 모드로 설정될 수 있으며, 세번째 MPM은 인트라 수직 모드로 설정될 수 있다(S1150).

한편, 상기 좌측 이웃 블록의 예측 모드가 2보다 작은 않은 경우, 첫번째 MPM은 상기 좌측 이웃 블록의 예측 모드로 설정될 수 있고, 두번째 MPM은 (좌측 이웃 블록의 예측 모드-1)로 설정될 수 있으며, 세번째 MPM은 (좌측 이웃 블록의 예측 모드+1)로 설정될 수 있다(S1160).

그리고, 상기 인코더는 현재 블록에 적용될 최적의 인트라 예측 모드가 앞서 구성된 MPM 후보 내에 속하는지 판단할 수 있다.

만약, 현재 블록의 인트라 예측 모드가 MPM 후보에 속하는 경우, 인코더는 MPM 플래그과 MPM 인덱스를 인코딩할 수 있다. 여기서, MPM 플래그는 현재 블록의 인트라 예측 모드는 주변의 인트라 예측된 블록으로부터 유도(즉, 현재 블록의 인트라 예측 모드가 MPM 내 속함)되는지 여부를 지시할 수 있다.

또한, MPM 인덱스는 상기 MPM 후보 중에서 현재 블록의 인트라 예측 모드로서 어떠한 MPM 후보가 적용되는지를 나타낼 수 있다.

반면, 현재 블록의 인트라 예측 모드가 MPM 후보에 속하지 않는 경우, 인코더는 현재 블록의 인트라 예측 모드를 인코딩할 수 있다.

상기에서 설명한 바와 같이, 인코더는 현재 블록의 예측 모드를 인코딩하기 위해 이웃 블록의 예측 모드를 이용할 수 있다.

도 12는 본 발명이 적용되는 실시예로서, 인트라 예측 모드를 디코딩하는 방법을 설명하기 위한 흐름도이다.

상기 도 12는 인트라 예측 모드를 기준으로 설명하고 있으나, 본 발명에서 정의하는 CNT 예측 모드가 이용되는 경우 유사한 방식으로 CNT 예측 모드를 디코딩하기 위해 적용될 수 있을 것이다.

디코더는 현재 블록(또는 현재 PU)에 대해 예측 모드가 MPM에 포함되어 있는지 여부를 나타내는 플래그 정보를 획득할 수 있다(S1210). 예를 들어, 상기 플래그 정보는 prev_intra_luma_pred_flag 로 표시될 수 있으며, 상기 디코더는 상기 플래그 정보에 따라 현재 블록의 예측 모드가 MPM에 포함되어 있는지 여부를 확인할 수 있다(S1220).

만약, 상기 현재 블록의 예측 모드가 MPM에 포함되어 있는 경우, 상기 디코더는 MPM 인덱스를 획득할 수 있다(S1230). 예를 들어, prev_intra_luma_pred_flag = 1 이면, 상기 디코더는 MPM 인덱스를 획득할 수 있다.

그리고, 상기 디코더는 상기 MPM 인덱스가 가리키는 인트라 예측 모드에 기초하여 현재 블록에 대한 예측값을 획득하고, 이를 이용하여 상기 현재 블록을 복원할 수 있다.

반면, 상기 현재 블록의 예측 모드가 MPM에 포함되어 있지 않은 경우, 상기 디코더는 상기 현재 블록의 잔여 예측 모드를 획득할 수 있다(S1240). 여기서, 상기 잔여 예측 모드는 MPM에 포함되지 않은 나머지 예측 모드를 의미할 수 있으며, rem_intra_luma_pred_mode 로 표현할 수 있다. 예를 들어, 상기 잔여 예측 모드는 인트라 플래너 모드, 인트라 DC 모드 및 인트라 수직 모드를 제외한 나머지 예측 모드를 의미할 수 있다.

마찬가지로, 상기 디코더는 상기 잔여 예측 모드에 대응되는 인트라 예측 모드에 기초하여 현재 블록에 대한 예측값을 획득하고, 이를 이용하여 상기 현재 블록을 복원할 수 있다.

위와 같이, MPM을 이용하는 경우, 부호화 모드의 개수가 N개라고 할 때 이를 표현하기 위한 최소한의 비트가 Log₂(N)인 반면, MPM은 인트라 모드의 개수보다 적게 할당하기 때문에 훨씬 적은 비트로 현재 블록의 모드를 표현할 수 있다.

예를 들어, 인트라 예측 모드 개수가 35개이고 MPM의 개수는 3개라고 가정하면, 만일 MPM 모드를 전혀 사용하지 않는다면 35개의 인트라 예측 모드를 표현하기 위해서 6 비트의 정보가 전송되어야 한다. 반면, 3개의 MPM을 사용하고 현재 블록의 인트라 예측 모드가 MPM의 후보 중 한 개라면 2 비트만으로 정보 전달이 가능하며, 만약 MPM 모드가 아니더라도 MPM으로 표현할 수 있는 3개의 인트라 예측 모드는 제외하고 나머지 32개의 인트라 예측 모드 중에서 한 개의 모드가 선택될 수 있으므로 비트수를 감소시킬 수 있다.

도 13은 본 발명이 적용되는 실시예로써, CNT 예측 코딩 적용 여부에 따라 최적의 예측 모드를 결정하는 방법을 설명하기 위한 흐름도이다.

본 발명은 CNT 코딩을 위한 효율적인 부가 정보 코딩 방법을 제공한다. RD(Rate-Distortion) 비용을 줄이는 관점에서, 부가 정보량을 줄이는 것이 단순히 예측 정확성을 높이는 것보다 유리할 수 있다. 따라서, 선택 가능한 CNT 예측 모드의 개수를 줄이거나 MPM(Most Probable Mode) 후보들에 대해서만 CNT 코딩을 적용하는 방식을 이용할 경우 부가 정보량을 줄여서 코딩 효율을 높일 수 있다.

상기 도 13은 CNT 예측 모드 및/또는 인트라 예측 모드의 후보들로부터 최적의 예측 모드를 선택하여 해당 부가 정보를 코딩하는 방법을 나타낸다.

먼저, 인코더는 영상 전체 또는 현재 블록에 대해 CNT 예측 코딩을 적용할지 여부를 확인할 수 있다(S1310).

확인 결과, CNT 예측 코딩이 적용되는 경우, 상기 인코더는 현재 블록에 대해 CNT 예측 코딩을 수행할 수 있다(S1320). 반면, CNT 예측 코딩이 적용되지 않는 경우, 상기 인코더는 현재 블록에 대해 인트라 예측 코딩을 수행할 수 있다(S1330).

상기 인코더는 상기 CNT 예측 코딩과 상기 인트라 예측 코딩 간의 RD 비용을 비교함으로써 최적의 예측 모드를 결정할 수 있다(S1340).

상기 인코더는 상기 최적의 예측 모드에 따라 예측을 수행할 수 있다(S1350).

한편, 디코더는 비트스트림으로부터 부가 정보를 파싱할 수 있다. 여기서, 상기 부가 정보는 CNT 설정 정보 또는 CNT 플래그 중 적어도 하나를 포함할 수 있다. CNT 코딩이 적용되는 경우, 상기 디코더는 CNT 예측 모드 후보 리스트를 생성할 수 있다. 예를 들어, MPM 후보들에 대해서만 CNT 코딩이 적용될 수 있는 경우 MPM 후보들만으로 CNT 예측 모드 후보 리스트를 구성할 수 있다.

그리고, 상기 디코더는 CNT 예측 모드 세트에 기초하여 상기 CNT 예측 모드 후보 리스트로부터 CNT 예측 모드를 결정할 수 있다.

상기 디코더는 상기 CNT 예측 모드에 기초하여 CNT 예측 코딩을 수행할 수 있다.

반면, CNT 코딩이 적용되지 않는 경우, 상기 디코더는 CNT 예측 모드가 아닌 후보 리스트(예를 들어, 인트라 예측 모드 후보 리스트)를 생성할 수 있다. 이하, 앞서 설명한 방식과 유사한 과정이 수행될 수 있다.

도 14는 본 발명이 적용되는 실시예로써, MPM 인덱스에 기초하여 CNT 예측 코딩을 수행하는 방법을 설명하기 위한 흐름도이다.

먼저, 디코더는 비트스트림으로부터 MPM 인덱스를 획득할 수 있다(S1410). 여기서, 상기 MPM 인덱스는 MPM 후보 중에서 현재 블록의 예측 모드로서 어떠한 MPM 모드가 적용되는지를 나타낼 수 있다. 예를 들어, 상기 MPM 인덱스가 3인 경우 CNT 예측 모드를 의미할 수 있다.

상기 디코더는 상기 MPM 인덱스에 기초하여 CNT 예측 코딩이 적용되는지 여부를 결정할 수 있다(S1420).

상기 MPM 인덱스에 기초하여 CNT 예측 코딩이 적용되는 경우, 상기 디코더는 CNT 적용 후보 리스트를 생성할 수 있다(S1430).

상기 디코더는 CNT 예측 모드에 기초하여 CNT 예측 코딩을 수행할 수 있다(S1440). 여기서, 상기 CNT 예측 모드는 CNT 예측 모드 세트에 기초하여 상기 CNT 예측 모드 후보 리스트로부터 선택될 수 있다.

반면, 상기 MPM 인덱스에 기초하여 CNT 예측 코딩이 적용되지 않는 경우, 상기 디코더는 CNT 미적용 후보 리스트(예를 들어, 인트라 예측 모드 후보 리스트)를 생성할 수 있다(S1450).

상기 디코더는 인트라 예측 모드에 기초하여 인트라 예측 코딩을 수행할 수 있다(S1460).

상기 CNT 예측 코딩 또는 상기 인트라 예측 코딩에 따라 생성된 예측값을 이용하여 상기 현재 블록을 복원할 수 있다(S1470).

도 15 내지 19는 본 발명이 적용되는 실시예들로써, CNT 설정 정보 및/또는 CNT 코딩 정보를 효율적으로 전송하기 위한 신택스들을 나타낸다.

도 15는 CNT 플래그를 전송하는 방법을 나타낸다.

상기 도 15를 살펴보면, MPM 후보들에 대해서만 CNT 코딩이 적용될 수 있는 경우 MPM 후보들만으로 CNT 예측 모드 후보 리스트를 구성할 수 있다.

이 경우, CNT 플래그(1510)를 prev_intra_luma_pred_flag 다음으로 옮김으로써 CNT 플래그의 전송량을 줄일 수 있다.

또한, CNT 플래그 값에 따라 CNT만의 MPM 후보들을 구성할 수 있다. 즉, CNT 플래그가 0인 경우는 인트라 예측 모드에서 이용되는 MPM 후보들을 그대로 사용하고, CNT 플래그가 1인 경우에는 CNT가 적용되기에 보다 적합한 일부 예측 모드들을 선택하여 MPM 후보들을 구성할 수 있다.

첫번째 예로, 앞서 설명한 인트라 예측 모드의 MPM 후보 리스트와 동일한 후보들을 사용할 수 있다.

두번째 예로, CNT에 대한 MPM 후보의 개수를 늘릴 수 있다. 예를 들어, CNT MPM 후보를 4개 이상으로 늘릴 수 있다. 구체적 예로, 이웃 블록의 모드 방향성이 수평 방향인 경우, 수평 방향의 CNT 예측 모드를 4개 이상으로 선택하여 MPM 후보로 설정할 수 있다. 만약, 지원 가능한 CNT 예측 모드의 개수가 MPM 후보의 수보다 훨씬 많은 경우, 확률 높은 MPM 후보들을 선택하게 되면 MPM 모드에서만 CNT를 적용하면서 발생하는 선택폭의 제약을 극복할 수도 있다.

세번째 예로, 지원 가능한 CNT 예측 모드의 개수가 적은 경우 가능한 CNT 예측 모드들을 모두 MPM 후보로 설정할 수 있다. 예를 들어, 가능한 CNT 예측 모드가 8개인 경우 CNT 예측 모드에 대한 MPM 후보의 수는 8개로 설정할 수 있다. 이때, CNT 예측 모드에 대한 확률 분포에 따라 MPM 인덱스를 가변 또는 고정 길이로 시그널링할 수 있다.

도 16은 CNT 잔여 모드 플래그(CNT remaining mode flag)를 전송하는 방법을 나타낸다.

상기 도 16을 살펴보면, 가능한 모든 CNT 예측 모드들을 지정할 수 있도록 MPM 후보들 이외에 나머지 CNT 잔여 모드들을 선택하기 위한 CNT 잔여 모드 플래그(CNT remaining mode flag)를 정의할 수 있다.

예를 들어, CNT 플래그를 추출하고(1610), 상기 CNT 플래그가 1인 경우에만(1620) CNT 잔여 모드 플래그를 추출하도록 할 수 있다(1630).

그리고, CNT 잔여 모드 플래그가 1인 경우(1640) MPM 후보들 이외의 CNT 잔여 모드들을 가리키는 인덱스(CNT remaining mode index)를 뒤이어 추출하도록 할 수 있다(1650).

한편, CNT 플래그가 0이거나, CNT 플래그가 1이되 CNT 잔여 모드 플래그가 0인 경우(1660), MPM 인덱스를 추출할 수 있다(1670). 그 이외의 경우에는 잔여 인트라 예측 모드를 추출할 수 있다(1680).

도 17은 CNT 잔여 모드 플래그(CNT remaining mode flag)를 전송하지 않고 CNT 잔여 모드를 전송하는 방법을 나타낸다.

CNT 잔여 모드 플래그가 0인 경우에는 MPM 인덱스를 전송하여 MPM 후보들 중 하나를 선택하게 된다. 따라서, CNT 잔여 모드 플래그를 전송하지 않고 CNT 잔여 모드를 지원하는 방법도 가능하다. 예를 들어, MPM 인덱스가 0 ~ 2일 때는 기존 MPM 후보들을 가리키도록 하고 MPM 인덱스가 3일 때 CNT 잔여 모드 인덱스를 전송하도록 구성할 수 있다.

상기 도 17을 살펴보면, 디코더는 CNT 플래그 및 MPM 인덱스를 추출할 수 있다(1710, 1720),

그리고, 상기 CNT 플래그가 1이고 상기 MPM 인덱스가 3인 경우(1730), CNT 잔여 모드 인덱스를 추출할 수 있다(1740).

그 이외의 경우에는 잔여 인트라 예측 모드를 추출할 수 있다(1750).

도 18은 MPM 후보들에 대해서만 CNT를 적용하는 구성에서 CNT 플래그를 전송하지 않고 CNT 적용 여부를 나타내도록 할 수 있다.

예를 들어, MPM 인덱스가 0 ~ 2인 경우에는 인트라 예측 모드를 적용하고 MPM 인덱스가 3인 경우에만 CNT 예측 모드를 적용하도록 설정할 수 있다.

상기 도 18을 살펴보면, 디코더는 MPM 인덱스를 추출할 수 있고, 상기 MPM 인덱스가 3인 경우(1810), CNT 예측 모드를 가리키는 CNT 예측 모드 세트(CNT_mode_idx)를 추출할 수 있다(1820).

그 이외의 경우에는 잔여 인트라 예측 모드를 추출할 수 있다(1830).

도 19는 MPM 후보가 아닌 경우에 대해서만 CNT를 적용하는 방법을 나타낸다.

상기 도 19를 살펴보면, 디코더는 현재 블록(또는 현재 PU)에 대해 예측 모드가 MPM에 포함되어 있는지 여부를 나타내는 플래그(prev_intra_luma_pred_flag)를 추출할 수 있다.

만약, 상기 현재 블록의 예측 모드가 MPM에 포함되어 있는 경우, 상기 디코더는 MPM 인덱스를 획득할 수 있다.

그렇지 않은 경우, 상기 디코더는 CNT 플래그를 추출할 수 있다(1910).

상기 CNT 플래그가 1이면(1920), CNT 예측 모드 세트를 추출할 수 있다(1930).

그 이외의 경우에는 잔여 인트라 예측 모드를 추출할 수 있다(1940).

다른 실시예로, CNT 플래그는 특정 예측 모드에 대해서만 전송하도록 구성할 수 있다. 예를 들어, CNT 코딩에서 (인트라 예측 모드 기준으로) 0, 1, 2, 10, 18, 26, 34번 모드만 지원되는 경우, 해당 모드가 선택된 경우에만 CNT 플래그를 전송하여 CNT 예측 코딩의 적용 여부를 가리키도록 할 수 있다. 이와 관련하여 다음과 같은 실시예들이 적용될 수도 있다.

첫번째 예로, MPM 후보들의 사용 여부와 상관없이 CNT가 적용될 수 있는 모드들에 대해서는 모두 CNT 플래그를 전송할 수 있다.

두번째 예로, MPM 플래그가 1인 경우(MPM 후보 사용)에 한해 CNT가 적용될 수 있는 모드들에 대해 CNT 플래그를 전송할 수 있다.

세번째 예로, MPM 플래그가 0인 경우(MPM 후보들을 사용하지 않음)에 대해서만 CNT가 적용될 수 있는 모드들에 대해 CNT 플래그를 전송할 수 있다.

네번째 예로, 이웃 블록의 인트라 방향성 모드에 따라 CNT 플래그를 추가로 전송할 모드들을 선별할 수 있다. 예를 들어, 좌측 이웃 블록과 상측 이웃 블록이 모두 수평 모드로 코딩된 경우 수평 방향에 대응되는 모드들에 대해서만 CNT 플래그를 전송할 수 있다. 즉, 현재 블록이 CNT로 코딩될 때 수평 방향으로 코딩될 확률이 높다고 판단하여 수평 방향에 대응되는 모드들에 대해서만 CNT를 적용하는 것이다.

다섯번째 예로, 이웃 블록이 CNT 방식으로 코딩되었는지 여부에 따라 현재 블록의 CNT 플래그 전송 방식을 변경할 수 있다. 예를 들어, 좌측 이웃 블록과 상측 이웃 블록이 모두 CNT로 코딩된 경우 현재 블록이 CNT로 코딩될 확률이 높다고 판단하여 모든 예측 모드에 대해 CNT 플래그를 전송한다.

만약, 주변 블록들 중 CNT로 코딩된 블록이 없는 경우 MPM 후보들에 대해서만 CNT 플래그를 보내거나 MPM 후보가 아닌 모드들에 대해서만 CNT 플래그를 전송하도록 구성할 수도 있다.

여섯번째 예로, 상기 5가지 실시예들을 혼합하여 사용할 수 있다. 예를 들어, MPM 후보들이 아닌 경우에 한해서만 네번째 실시예와 다섯번째 실시예를 적용할 수 있다.

다른 실시예로, CNT 플래그를 계층적으로 전송할 수 있다. 예를 들어 N x N 크기 이상의 블록 내부에 CNT 코딩된 블록이 존재하는지 여부를 가리키는 계층적 CNT 플래그(hierarchical CNT flag)를 전송할 수 있다.

상기 계층적 CNT 플래그가 1인 경우에 한해서만 N x N 블록을 구성하는 내부 블록들에 대해 각기 CNT 플래그를 전송하도록 구성할 수 있다. 관련하여 다음과 같은 실시예들이 적용될 수 있다.

첫번째 예로, NxN 블록에 대해 계층적 CNT 플래그를 전송한다고 구성했다 할지라도 만약 N x N보다 큰 블록에 대해 내부가 분할되지 않고 단일 블록으로 코딩되는 경우, 이 블록에 대해 계층적 CNT 플래그 하나만을 보내도록 구성할 수 있다.

두번째 예로, 계층적 CNT 플래그를 보내는 최소 단위를 N x N 블록으로 하지 않고 CU(Coding Unit)로 설정할 수 있다.

세번째 예로, 계층은 2개 이상의 레벨로 구성될 수 있다. 상기 예시는 N x N 이상의 블록 하나에 대해서만 계층적 CNT 플래그를 보내는 구성이지만, N’ x N’ 블록에 (N’ > N) 대해서 계층적 CNT 플래그를 보내서 내부에 CNT 코딩된 블록이 존재하는지 여부를 확인한 후, 내부에 N x N 블록이 존재하면 다시 계층적 CNT 플래그를 보내도록 구성할 수도 있다.

또는, LCU 단위의 계층적 CNT 플래그를 먼저 전송한 후 내부에 CU가 존재하면 다시 계층적 CNT 플래그를 전송하도록 구성할 수 있다. 또한, CU 내부의 PU들에 대해서는 각기 CNT 플래그를 전송하여 CNT 적용 여부를 나타내도록 구성할 수 있다.

상기 기술된 것과 같이, 본 발명에서 설명한 실시예들은 프로세서, 마이크로 프로세서, 컨트롤러 또는 칩 상에서 구현되어 수행될 수 있다. 예를 들어, 상기 도 1 내지 4 에서 도시한 기능 유닛들은 컴퓨터, 프로세서, 마이크로 프로세서, 컨트롤러 또는 칩 상에서 구현되어 수행될 수 있다.

또한, 본 발명이 적용되는 디코더 및 인코더는 멀티미디어 방송 송수신 장치, 모바일 통신 단말, 홈 시네마 비디오 장치, 디지털 시네마 비디오 장치, 감시용 카메라, 비디오 대화 장치, 비디오 통신과 같은 실시간 통신 장치, 모바일 스트리밍 장치, 저장 매체, 캠코더, 주문형 비디오(VoD) 서비스 제공 장치, 인터넷 스트리밍 서비스 제공 장치, 3차원(3D) 비디오 장치, 화상 전화 비디오 장치, 및 의료용 비디오 장치 등에 포함될 수 있으며, 비디오 신호 및 데이터 신호를 처리하기 위해 사용될 수 있다.

또한, 본 발명이 적용되는 처리 방법은 컴퓨터로 실행되는 프로그램의 형태로 생산될 수 있으며, 컴퓨터가 판독할 수 있는 기록 매체에 저장될 수 있다. 본 발명에 따른 데이터 구조를 가지는 멀티미디어 데이터도 또한 컴퓨터가 판독할 수 있는 기록 매체에 저장될 수 있다. 상기 컴퓨터가 판독할 수 있는 기록 매체는 컴퓨터로 읽을 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 상기 컴퓨터가 판독할 수 있는 기록 매체는, 예를 들어, 블루레이 디스크(BD), 범용 직렬 버스(USB), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크 및 광학적 데이터 저장 장치를 포함할 수 있다. 또한, 상기 컴퓨터가 판독할 수 있는 기록 매체는 반송파(예를 들어, 인터넷을 통한 전송)의 형태로 구현된 미디어를 포함한다. 또한, 인코딩 방법으로 생성된 비트 스트림이 컴퓨터가 판독할 수 있는 기록 매체에 저장되거나 유무선 통신 네트워크를 통해 전송될 수 있다.

이상, 전술한 본 발명의 바람직한 실시예는, 예시의 목적을 위해 개시된 것으로, 당업자라면 이하 첨부된 특허청구범위에 개시된 본 발명의 기술적 사상과 그 기술적 범위 내에서, 다양한 다른 실시예들을 개량, 변경, 대체 또는 부가 등이 가능할 것이다.

Claims

비디오 신호를 인코딩하는 방법에 있어서,
상기 비디오 신호로부터 액티비티 정보를 획득하는 단계, 여기서 상기 액티비티 정보는 영상의 에지 특성에 대한 정보를 나타내고, 에지 방향성 정보 또는 에지 레벨 정보 중 적어도 하나를 포함함;
상기 액티비티 정보에 기초하여 조건부 비선형 변환(Conditionally Non-linear Transform, CNT) 설정 정보를 결정하는 단계; 및
상기 CNT 설정 정보에 기초하여 CNT 예측 코딩을 수행하는 단계
를 포함하되,
상기 CNT 예측 코딩은 이전에 디코딩된 모든 픽셀값을 이용하여 예측을 수행하는 것을 특징으로 하는 방법.
제1항에 있어서,
상기 액티비티 정보가 상기 비디오 신호의 전체 원본 영상으로부터 획득되는 경우, 상기 CNT 설정 정보는 상기 전체 원본 영상에 적용되는 것을 특징으로 하는 방법.
제1항에 있어서,
상기 액티비티 정보가 상기 비디오 신호의 복원된 이웃 블록으로부터 획득되는 경우, 상기 CNT 설정 정보는 현재 블록에 적용되는 것을 특징으로 하는 방법.
제3항에 있어서,
상기 현재 블록에 대한 에지 방향성 정보는 좌측 이웃 블록과 상측 이웃 블록의 예측 방향성 정보가 동일한지 여부에 기초하여 유도되는 것을 특징으로 하는 방법.
제4항에 있어서,
상기 좌측 이웃 블록과 상기 상측 이웃 블록의 예측 방향성 정보가 동일하면 상기 현재 블록은 동일한 에지 방향성 정보를 갖고,
상기 좌측 이웃 블록과 상기 상측 이웃 블록의 예측 방향성 정보가 다르면 상기 현재 블록은 에지 레벨 정보가 큰 이웃 블록의 에지 방향성 정보로 설정되는 것을 특징으로 하는 방법.
제1항에 있어서,
상기 CNT 설정 정보는 CNT 플래그를 전송하기 위한 전송 단위 정보, CNT 플래그 코딩시 이용된 CABAC 컨텍스트 모델을 나타내는 컨텍스트 모델 인덱스 정보, 또는 CNT 예측 모드를 나타내는 CNT 예측 모드 세트 중 적어도 하나를 포함하는 것을 특징으로 하는 방법.
제6항에 있어서,
상기 CNT 예측 모드의 개수는 상기 에지 방향성 정보에 기초하여 결정되는 것을 특징으로 하는 방법.
제6항에 있어서,
상기 CNT 설정 정보는 시퀀스 파라미터 셋, 픽쳐 파라미터 셋, 픽쳐, CTU, CU, PU, 또는 블록 중 적어도 하나의 레벨을 통해 전송되는 것을 특징으로 하는 방법.
비디오 신호를 디코딩하는 방법에 있어서,
복원된 이웃 블록으로부터 액티비티 정보를 획득하는 단계, 여기서 상기 액티비티 정보는 영상의 에지 특성에 대한 정보를 나타내고, 에지 방향성 정보 또는 에지 레벨 정보 중 적어도 하나를 포함함;
상기 액티비티 정보에 기초하여 현재 블록에 대한 CNT 설정 정보를 유도하는 단계; 및
상기 CNT 설정 정보에 기초하여 상기 현재 블록에 대해 CNT 예측 코딩을 수행하는 단계
를 포함하되,
상기 CNT 예측 코딩은 CNT 예측 모드에 따라 이전에 디코딩된 모든 픽셀값을 이용하여 예측을 수행하는 것을 특징으로 하는 방법.
제9항에 있어서, 상기 방법은,
상기 비디오 신호로부터 상기 현재 블록에 대한 CNT 플래그를 추출하는 단계를 더 포함하되,
상기 CNT 플래그는 상기 현재 블록에 대해 CNT 코딩이 적용되는지 여부를 나타내고,
상기 CNT 플래그에 따라 상기 현재 블록에 대해 CNT 코딩이 적용되는 경우, 상기 CNT 예측 코딩이 수행되는 것을 특징으로 하는 방법.
제9항에 있어서,
상기 현재 블록에 대한 에지 방향성 정보는 좌측 이웃 블록과 상측 이웃 블록의 예측 방향성 정보가 동일한지 여부에 기초하여 유도되는 것을 특징으로 하는 방법.
제9항에 있어서,
상기 CNT 예측 모드의 개수는 상기 현재 블록에 대한 에지 방향성 정보에 기초하여 결정되는 것을 특징으로 하는 방법.
비디오 신호를 인코딩하는 장치에 있어서,
상기 비디오 신호로부터 액티비티 정보를 획득하는 에지 검출부; 및
상기 액티비티 정보에 기초하여 조건부 비선형 변환(Conditionally Non-linear Transform, CNT) 설정 정보를 결정하고, 상기 CNT 설정 정보에 기초하여 CNT 예측 코딩을 수행하는 예측부
를 포함하되,
상기 액티비티 정보는 영상의 에지 특성에 대한 정보를 나타내고, 에지 방향성 정보 또는 에지 레벨 정보 중 적어도 하나를 포함하고,
상기 CNT 예측 코딩은 CNT 예측 모드에 따라 이전에 디코딩된 모든 픽셀값을 이용하여 예측을 수행하는 것을 특징으로 하는 장치.
비디오 신호를 디코딩하는 장치에 있어서,
복원된 이웃 블록으로부터 액티비티 정보를 획득하고, 상기 액티비티 정보에 기초하여 현재 블록에 대한 CNT 설정 정보를 결정하고, 상기 CNT 설정 정보에 기초하여 상기 현재 블록에 대해 CNT 예측 코딩을 수행하는 예측부; 및
CNT 예측 코딩 결과값을 이용하여 상기 현재 블록을 복원하는 복원부
를 포함하되,
상기 액티비티 정보는 영상의 에지 특성에 대한 정보를 나타내고, 에지 방향성 정보 또는 에지 레벨 정보 중 적어도 하나를 포함하고,
상기 CNT 예측 코딩은 CNT 예측 모드에 따라 이전에 디코딩된 모든 픽셀값을 이용하여 예측을 수행하는 것을 특징으로 하는 장치.