WO2019013363A1

WO2019013363A1 - 영상 코딩 시스템에서 주파수 도메인 잡음 감소 방법 및 장치

Info

Publication number: WO2019013363A1
Application number: PCT/KR2017/007357
Authority: WO
Inventors: 김승환; 파루리시탈; 서정동; 유선미; 임재현; 허진
Original assignee: 엘지전자 주식회사
Priority date: 2017-07-10
Filing date: 2017-07-10
Publication date: 2019-01-17
Also published as: US20200145649A1

Abstract

본 발명의 인코딩 장치에 의하여 수행되는 영상 인코딩 방법은 현재 블록에 대한 예측된 블록(predicted block)을 도출하는 단계, 상기 예측된 블록을 변환(transform)하여 주파수 도메인 예측된 블록(predicted block)을 도출하는 단계, 상기 주파수 도메인 예측된 블록 및 주파수 상관계수들을 기반으로 주파수 도메인 수정된(modified) 예측된 블록을 도출하는 단계, 상기 주파수 도메인 수정된 예측된 블록을 역변환하여 수정된 예측된 블록을 생성하는 단계, 상기 현재 블록에 대한 원본(original) 블록과 상기 수정된 예측된 블록을 기반으로 레지듀얼 블록을 도출하는 단계, 및 상기 예측 모드에 대한 정보 및 상기 레지듀얼 블록에 대한 레지듀얼 정보를 인코딩하여 출력하는 단계를 포함함을 특징으로 한다. 본 발명에 따르면 인트라 예측 또는 인터 예측 결과 발생하는 노이즈를 줄일 수 있고, 예측 성능을 높일 수 있다.

Description

영상 코딩 시스템에서 주파수 도메인 잡음 감소 방법 및 장치

본 발명은 영상 코딩 기술에 관한 것으로서 보다 상세하게는 영상 코딩 시스템에서 주파수 도메인 잡음 감소 방법 및 장치에 관한 것이다.

최근 HD(High Definition) 영상 및 UHD(Ultra High Definition) 영상과 같은 고해상도, 고품질의 영상에 대한 수요가 다양한 분야에서 증가하고 있다. 영상 데이터가 고해상도, 고품질이 될수록 기존의 영상 데이터에 비해 상대적으로 전송되는 정보량 또는 비트량이 증가하기 때문에 기존의 유무선 광대역 회선과 같은 매체를 이용하여 영상 데이터를 전송하거나 기존의 저장 매체를 이용해 영상 데이터를 저장하는 경우, 전송 비용과 저장 비용이 증가된다.

이에 따라, 고해상도, 고품질 영상의 정보를 효과적으로 전송하거나 저장하고, 재생하기 위해 고효율의 영상 압축 기술이 요구된다.

본 발명의 기술적 과제는 영상 코딩 효율을 높이는 방법 및 장치를 제공함에 있다.

본 발명의 다른 기술적 과제는 예측 성능을 높이는 방법 및 장치를 제공함에 있다.

본 발명의 또 다른 기술적 과제는 예측 결과 발생한 노이즈를 제거하는 방법 및 장치를 제공함에 있다.

본 발명의 또 다른 기술적 과제는 부가 정보의 데이터량을 줄이면서 예측 성능을 높이는 방법을 제공함에 있다.

본 발명의 일 실시예에 따르면, 인코딩 장치에 의하여 수행되는 영상 인코딩 방법이 제공된다. 상기 방법은 현재 블록에 대한 예측 모드를 결정하는 단계, 상기 예측 모드를 기반으로 상기 현재 블록에 대한 예측된 블록(predicted block)을 도출하는 단계, 상기 예측된 블록을 변환(transform)하여 주파수 도메인 예측된 블록(predicted block)을 도출하는 단계, 상기 주파수 도메인 예측된 블록 및 주파수 상관계수들을 기반으로 주파수 도메인 수정된(modified) 예측된 블록을 도출하는 단계, 상기 주파수 도메인 수정된 예측된 블록을 역변환하여 수정된 예측된 블록을 생성하는 단계, 상기 현재 블록에 대한 원본(original) 블록과 상기 수정된 예측된 블록을 기반으로 레지듀얼 블록을 도출하는 단계, 및 상기 예측 모드에 대한 정보 및 상기 레지듀얼 블록에 대한 레지듀얼 정보를 인코딩하여 출력하는 단계를 포함함을 특징으로 한다.

본 발명의 다른 일 실시예에 다르면, 영상 인코딩을 수행하는 인코딩 장치가 제공된다. 상기 인코딩 장치는 현재 블록에 대한 예측 모드를 결정하고, 상기 예측 모드를 기반으로 상기 현재 블록에 대한 예측된 블록(predicted block)을 도출하는 예측부, 상기 예측된 블록을 변환(transform)하여 주파수 도메인 예측된 블록(predicted block)을 도출하고, 상기 주파수 도메인 예측된 블록 및 주파수 상관계수들을 기반으로 주파수 도메인 수정된(modified) 예측된 블록을 도출하고, 상기 주파수 도메인 수정된 예측된 블록을 역변환하여 수정된 예측된 블록을 생성하는 주파수 도메인 잡음제거부, 상기 현재 블록에 대한 원본(original) 블록과 상기 수정된 예측된 블록을 기반으로 레지듀얼 블록을 도출하는 감산부, 및 상기 예측 모드에 대한 정보 및 상기 레지듀얼 블록에 대한 레지듀얼 정보를 인코딩하여 출력하는 엔트로피 인코딩부를 포함함을 특징으로 한다.

본 발명의 또 다른 일 실시예에 따르면, 디코딩 장치에 의하여 수행되는 영상 디코딩 방법을 제공한다. 상기 방법은 예측 정보 및 레지듀얼 정보를 포함하는 영상 정보를 수신하는 단계, 상기 예측 정보를 기반으로 현재 블록에 대한 예측 모드를 도출하는 단계, 상기 예측 모드를 기반으로 상기 현재 블록에 대한 예측된 블록(predicted block)을 도출하는 단계, 상기 예측된 블록을 변환(transform)하여 주파수 도메인 예측된 블록(predicted block)을 도출하는 단계, 상기 주파수 도메인 예측된 블록 및 주파수 상관계수들을 기반으로 주파수 도메인 수정된(modified) 예측된 블록을 도출하는 단계, 상기 주파수 도메인 수정된 예측된 블록을 역변환하여 수정된 예측된 블록을 생성하는 단계, 상기 레지듀얼 정보를 기반으로 레지듀얼 블록을 도출하는 단계, 및 상기 수정된 예측된 블록 및 상기 레지듀얼 블록을 기반으로 복원 블록을 생성하는 단계를 포함함을 특징으로 한다.

본 발명의 또 다른 일 실시예에 다르면, 영상 디코딩을 수행하는 디코딩 장치가 제공된다. 상기 디코딩 장치는 예측 정보 및 레지듀얼 정보를 포함하는 영상 정보를 수신하는 엔트로피 디코딩부, 상기 예측 정보를 기반으로 현재 블록에 대한 예측 모드를 도출하고, 상기 예측 모드를 기반으로 상기 현재 블록에 대한 예측된 블록(predicted block)을 도출하는 예측, 상기 예측된 블록을 변환(transform)하여 주파수 도메인 예측된 블록(predicted block)을 도출하고, 상기 주파수 도메인 예측된 블록 및 주파수 상관계수들을 기반으로 주파수 도메인 수정된(modified) 예측된 블록을 도출하고, 상기 주파수 도메인 수정된 예측된 블록을 역변환하여 수정된 예측된 블록을 생성하는 주파수 도메인 잡음제거부, 상기 레지듀얼 정보를 기반으로 레지듀얼 블록을 도출하는 레지듀얼 처리부, 및 상기 수정된 예측된 블록 및 상기 레지듀얼 블록을 기반으로 복원 블록을 생성하는 복원부를 포함함을 특징으로 한다.

본 발명에 따르면 인트라 예측 또는 인터 예측 결과 발생하는 노이즈를 줄일 수 있고, 예측 성능을 높일 수 있다.

본 발명에 따르면 부가 정보의 데이터량을 줄이면서, 예측 성능을 높일 수 있다.

본 발명에 따르면 레지듀얼 정보에 필요한 데이터량을 줄일 수 있고, 전반적인 코딩 효율을 높일 수 있다.

도 1은 본 발명이 적용될 수 있는 비디오 인코딩 장치의 구성을 개략적으로 설명하는 도면이다.

도 2는 본 발명이 적용될 수 있는 비디오 디코딩 장치의 구성을 개략적으로 설명하는 도면이다.

도 3은 본 발명에 따른 비디오 인코딩 장치의 구성을 개략적으로 설명하는 도면이다.

도 4은 본 발명에 따른 비디오 디코딩 장치의 구성을 개략적으로 설명하는 도면이다.

도 5는 본 발명에 따른 주파수 도메인 잡음제거부의 구성을 개략적으로 나타낸다.

도 6은 상관계수들로 구성된 상관계수 블록들을 예시적으로 나타낸다.

도 7은 인터 예측에 있어서, 1/4 분수 단위 샘플 보간에 대한 정수 샘플과 분수 샘플의 위치를 개략적으로 나타낸 것이다.

도 8은 본 발명의 일 예에 따른 분수 샘플들 기반 주파수 도메인 간섭 제거(간섭 감소) 방법을 나타낸다.

도 9는 본 발명의 일 예에 따른 정수 샘플들 기반 주파수 도메인 간섭 제거(간섭 감소) 방법을 나타낸다.

도 10은 상기 현재 블록의 인터 예측을 위한 참조 픽처들 및 움직임 벡터들을 나타낸다.

도 11은 쌍예측이 적용되는 경우 주파수 도메인 잡음제거 방법의 일 예를 나타낸다.

도 12는 쌍예측이 적용되는 경우 주파수 도메인 잡음제거 방법의 다른 일 예를 나타낸다.

도 13은 본 발명의 일 예에 따른 주파수 도메인 잡음 제거 수행 여부 결정 방법을 나타낸다.

도 14은 본 발명의 다른 일 예에 따른 주파수 도메인 잡음 제거 수행 여부 결정 방법을 나타낸다.

도 15는 본 발명의 또 다른 일 예에 따른 주파수 도메인 잡음 제거 수행 여부 결정 방법을 나타낸다.

도 16은 본 발명에 따른 주파수 도메인 잡음 제거 방법의 예를 나타낸다.

도 17은 본 발명에 따른 인코딩 장치에 의한 영상 인코딩 방법을 개략적으로 나타낸다.

도 18은 본 발명에 따른 디코딩 장치에 의한 영상 디코딩 방법을 개략적으로 나타낸다.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정 실시예에 한정하려고 하는 것이 아니다. 본 명세서에서 상용하는 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명의 기술적 사상을 한정하려는 의도로 사용되는 것은 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서 "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부품 도는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

한편, 본 발명에서 설명되는 도면상의 각 구성들은 서로 다른 특징적인 기능들에 관한 설명의 편의를 위해 독립적으로 도시된 것으로서, 각 구성들이 서로 별개의 하드웨어나 별개의 소프트웨어로 구현된다는 것을 의미하지는 않는다. 예컨대, 각 구성 중 두 개 이상의 구성이 합쳐져 하나의 구성을 이룰 수도 있고, 하나의 구성이 복수의 구성으로 나뉘어질 수도 있다. 각 구성이 통합 및/또는 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리범위에 포함된다.

이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 이하, 도면상의 동일한 구성 요소에 대해서는 동일한 참조 부호를 사용하고 동일한 구성 요소에 대해서 중복된 설명은 생략한다.

본 명세서에서 픽처(picture)는 일반적으로 특정 시간대의 하나의 영상을 나타내는 단위를 의미하며, 슬라이스(slice)는 코딩에 있어서 픽처의 일부를 구성하는 단위이다. 하나의 픽처는 복수의 슬라이스로 구성될 수 있으며, 필요에 따라서 픽처 및 슬라이스는 서로 혼용되어 사용될 수 있다.

픽셀(pixel) 또는 펠(pel)은 하나의 픽처(또는 영상)을 구성하는 최소의 단위를 의미할 수 있다. 또한, 픽셀에 대응하는 용어로서 '샘플(sample)'이 사용될 수 있다. 샘플은 일반적으로 픽셀 또는 픽셀의 값을 나타낼 수 있으며, 휘도(luma) 성분의 픽셀/픽셀값만을 나타낼 수도 있고, 채도(chroma) 성분의 픽셀/픽셀 값만을 나타낼 수도 있다.

유닛(unit)은 영상 처리의 기본 단위를 나타낸다. 유닛은 픽처의 특정 영역 및 해당 영역에 관련된 정보 중 적어도 하나를 포함할 수 있다. 유닛은 경우에 따라서 블록(block) 또는 영역(area) 등의 용어와 혼용하여 사용될 수 있다. 일반적인 경우, MxN 블록은 M개의 열과 N개의 행으로 이루어진 샘플들 또는 변환 계수(transform coefficient)들의 집합을 나타낼 수 있다.

도 1을 참조하면, 비디오 인코딩 장치(100)는 픽처 분할부(105), 예측부(110), 감산부(115), 변환부(120), 양자화부(125), 재정렬부(130), 엔트로피 인코딩부(135), 레지듀얼 처리부(140), 가산부(150), 필터부(155) 및 메모리(160)을 포함할 수 있다. 레지듀얼 처리부(140)는 역양자화부(141) 및 역변환부(142)를 포함할 수 있다.

픽처 분할부(105)는 입력된 픽처를 적어도 하나의 처리 유닛(processing unit)으로 분할할 수 있다.

일 예로, 처리 유닛은 코딩 유닛(coding unit, CU)이라고 불릴 수 있다. 이 경우 코딩 유닛은 최대 코딩 유닛(largest coding unit, LCU)으로부터 QTBT (Quad-tree binary-tree) 구조에 따라 재귀적으로(recursively) 분할될 수 있다. 예를 들어, 하나의 코딩 유닛은 쿼드 트리 구조 및/또는 바이너리 트리 구조를 기반으로 하위(deeper) 뎁스의 복수의 코딩 유닛들로 분할될 수 있다. 이 경우 예를 들어 쿼드 트리 구조가 먼저 적용되고 바이너리 트리 구조가 나중에 적용될 수 있다. 또는 바이너리 트리 구조가 먼저 적용될 수도 있다. 더 이상 분할되지 않는 최종 코딩 유닛을 기반으로 본 발명에 따른 코딩 절차가 수행될 수 있다. 이 경우 영상 특성에 따른 코딩 효율 등을 기반으로, 최대 코딩 유닛이 바로 최종 코딩 유닛으로 사용될 수 있고, 또는 필요에 따라 코딩 유닛은 재귀적으로(recursively) 보다 하위 뎁스의 코딩 유닛들로 분할되어 최적의 사이즈의 코딩 유닛이 최종 코딩 유닛으로 사용될 수 있다. 여기서 코딩 절차라 함은 후술하는 예측, 변환, 및 복원 등의 절차를 포함할 수 있다.

다른 예로, 처리 유닛은 코딩 유닛(coding unit, CU) 예측 유닛(prediction unit, PU) 또는 변환 유닛(transform unit, TU)을 포함할 수도 있다. 코딩 유닛은 최대 코딩 유닛(largest coding unit, LCU)으로부터 쿼드 트리 구조를 따라서 하위(deeper) 뎁스의 코딩 유닛들로 분할(split)될 수 있다. 이 경우 영상 특성에 따른 코딩 효율 등을 기반으로, 최대 코딩 유닛이 바로 최종 코딩 유닛으로 사용될 수 있고, 또는 필요에 따라 코딩 유닛은 재귀적으로(recursively) 보다 하위 뎁스의 코딩 유닛들로 분할되어 최적의 사이즈의 코딩 유닛이 최종 코딩 유닛으로 사용될 수 있다. 최소 코딩 유닛(smallest coding unit, SCU)이 설정된 경우 코딩 유닛은 최소 코딩 유닛보다 더 작은 코딩 유닛으로 분할될 수 없다. 여기서 최종 코딩 유닛이라 함은 예측 유닛 또는 변환 유닛으로 파티셔닝 또는 분할되는 기반이 되는 코딩 유닛을 의미한다. 예측 유닛은 코딩 유닛으로부터 파티셔닝(partitioning)되는 유닛으로서, 샘플 예측의 유닛일 수 있다. 이 때, 예측 유닛은 서브 블록(sub block)으로 나뉠 수도 있다. 변환 유닛은 코딩 유닛으로부터 쿼드 트리 구조를 따라서 분할 될 수 있으며, 변환 계수를 유도하는 유닛 및/또는 변환 계수로부터 레지듀얼 신호(residual signal)를 유도하는 유닛일 수 있다. 이하, 코딩 유닛은 코딩 블록(coding block, CB), 예측 유닛은 예측 블록(prediction block, PB), 변환 유닛은 변환 블록(transform block, TB) 으로 불릴 수 있다. 예측 블록 또는 예측 유닛은 픽처 내에서 블록 형태의 특정 영역을 의미할 수 있고, 예측 샘플의 어레이(array)를 포함할 수 있다. 또한, 변환 블록 또는 변환 유닛은 픽처 내에서 블록 형태의 특정 영역을 의미할 수 있고, 변환 계수 또는 레지듀얼 샘플의 어레이를 포함할 수 있다.

예측부(110)는 처리 대상 블록(이하, 현재 블록이라 함)에 대한 예측을 수행하고, 상기 현재 블록에 대한 예측 샘플들을 포함하는 예측된 블록(predicted block)을 생성할 수 있다. 예측부(110)에서 수행되는 예측의 단위는 코딩 블록일 수 있고, 변환 블록일 수도 있고, 예측 블록일 수도 있다.

예측부(110)는 현재 블록에 인트라 예측이 적용되는지 인터 예측이 적용되는지를 결정할 수 있다. 일 예로, 예측부(110)는 CU 단위로 인트라 예측 또는 인터 예측이 적용되는지를 결정할 수 있다.

인트라 예측의 경우에, 예측부(110)는 현재 블록이 속하는 픽처(이하, 현재 픽처) 내의 현재 블록 외부의 참조 샘플을 기반으로 현재 블록에 대한 예측 샘플을 유도할 수 있다. 이 때, 예측부(110)는 (i) 현재 블록의 주변(neighboring) 참조 샘플들의 평균(average) 혹은 인터폴레이션(interpolation)을 기반으로 예측 샘플을 유도할 수 있고, (ii) 현재 블록의 주변 참조 샘플들 중 예측 샘플에 대하여 특정 (예측) 방향에 존재하는 참조 샘플을 기반으로 상기 예측 샘플을 유도할 수도 있다. (i)의 경우는 비방향성 모드 또는 비각도 모드, (ii)의 경우는 방향성(directional) 모드 또는 각도(angular) 모드라고 불릴 수 있다. 인트라 예측에서 예측 모드는 예를 들어 33개의 방향성 예측 모드와 적어도 2개 이상의 비방향성 모드를 가질 수 있다. 비방향성 모드는 DC 예측 모드 및 플래너 모드(Planar 모드)를 포함할 수 있다. 예측부(110)는 주변 블록에 적용된 예측 모드를 이용하여, 현재 블록에 적용되는 예측 모드를 결정할 수도 있다.

인터 예측의 경우에, 예측부(110)는 참조 픽처 상에서 움직임 벡터에 의해 특정되는 샘플을 기반으로, 현재 블록에 대한 예측 샘플을 유도할 수 있다. 예측부(110)는 스킵(skip) 모드, 머지(merge) 모드, 및 MVP(motion vector prediction) 모드 중 어느 하나를 적용하여 현재 블록에 대한 예측 샘플을 유도할 수 있다. 스킵 모드와 머지 모드의 경우에, 예측부(110)는 주변 블록의 움직임 정보를 현재 블록의 움직임 정보로 이용할 수 있다. 스킵 모드의 경우, 머지 모드와 달리 예측 샘플과 원본 샘플 사이의 차(레지듀얼)가 전송되지 않는다. MVP 모드의 경우, 주변 블록의 움직임 벡터를 움직임 벡터 예측자(Motion Vector Predictor)로 이용하여 현재 블록의 움직임 벡터 예측자로 이용하여 현재 블록의 움직임 벡터를 유도할 수 있다.

인터 예측의 경우에, 주변 블록은 현재 픽처 내에 존재하는 공간적 주변 블록(spatial neighboring block)과 참조 픽처(reference picture)에 존재하는 시간적 주변 블록(temporal neighboring block)을 포함할 수 있다. 상기 시간적 주변 블록을 포함하는 참조 픽처는 동일 위치 픽처(collocated picture, colPic)라고 불릴 수도 있다. 움직임 정보(motion information)는 움직임 벡터와 참조 픽처 인덱스를 포함할 수 있다. 예측 모드 정보와 움직임 정보 등의 정보는 (엔트로피) 인코딩되어 비트스트림 형태로 출력될 수 있다.

스킵 모드와 머지 모드에서 시간적 주변 블록의 움직임 정보가 이용되는 경우에, 참조 픽처 리스트(reference picture list) 상의 최상위 픽처가 참조 픽처로서 이용될 수도 있다. 참조 픽처 리스트(Picture Order Count)에 포함되는 참조 픽처들은 현재 픽처와 해당 참조 픽처 간의 POC(Picture order count) 차이 기반으로 정렬될 수 있다. POC는 픽처의 디스플레이 순서에 대응하며, 코딩 순서와 구분될 수 있다.

감산부(115)는 원본 샘플과 예측 샘플 간의 차이인 레지듀얼 샘플을 생성한다. 스킵 모드가 적용되는 경우에는, 상술한 바와 같이 레지듀얼 샘플을 생성하지 않을 수 있다.

변환부(120)는 변환 블록 단위로 레지듀얼 샘플을 변환하여 변환 계수(transform coefficient)를 생성한다. 변환부(120)는 해당 변환 블록의 사이즈와, 해당 변환 블록과 공간적으로 겹치는 코딩 블록 또는 예측 블록에 적용된 예측 모드에 따라서 변환을 수행할 수 있다. 예컨대, 상기 변환 블록과 겹치는 상기 코딩 블록 또는 상기 예측 블록에 인트라 예측이 적용되었고, 상기 변환 블록이 4×4의 레지듀얼 어레이(array)라면, 레지듀얼 샘플은 DST(Discrete Sine Transform) 변환 커널을 이용하여 변환되고, 그 외의 경우라면 레지듀얼 샘플은 DCT(Discrete Cosine Transform) 변환 커널을 이용하여 변환할 수 있다.

양자화부(125)는 변환 계수들을 양자화하여, 양자화된 변환 계수를 생성할 수 있다.

재정렬부(130)는 양자화된 변환 계수를 재정렬한다. 재정렬부(130)는 계수들 스캐닝(scanning) 방법을 통해 블록 형태의 양자화된 변환 계수들을 1차원 벡터 형태로 재정렬할 수 있다. 여기서 재정렬부(130)는 별도의 구성으로 설명하였으나, 재정렬부(130)는 양자화부(125)의 일부일 수 있다.

엔트로피 인코딩부(135)는 양자화된 변환 계수들에 대한 엔트로피 인코딩을 수행할 수 있다. 엔트로피 인코딩은 예를 들어 지수 골롬(exponential Golomb), CAVLC(context-adaptive variable length coding), CABAC(context-adaptive binary arithmetic coding) 등과 같은 인코딩 방법을 포함할 수 있다. 엔트로피 인코딩부(135)는 양자화된 변환 계수 외 비디오 복원에 필요한 정보들(예컨대 신택스 요소(syntax element)의 값 등)을 함께 또는 별도로 인코딩할 수도 있다. 엔트로피 인코딩된 정보들은 비트스트림 형태로 NAL(network abstraction layer) 유닛 단위로 전송 또는 저장될 수 있다.

역양자화부(141)는 양자화부(125)에서 양자화된 값(양자화된 변환 계수)들을 역양자화하고, 역변환부(142)는 역양자화부(141)에서 역양자화된 값들을 역변환하여 레지듀얼 샘플을 생성한다.

가산부(150)는 레지듀얼 샘플과 예측 샘플을 합쳐서 픽처를 복원한다. 레지듀얼 샘플과 예측 샘플은 블록 단위로 더해져서 복원 블록이 생성될 수 있다. 여기서 가산부(150)는 별도의 구성으로 설명하였으나, 가산부(150)는 예측부(110)의 일부일 수 있다. 한편, 가산부(150)는 복원부 또는 복원 블록 생성부로 불릴 수도 있다.

복원된 픽처(reconstructed picture)에 대하여 필터부(155)는 디블록킹 필터 및/또는 샘플 적응적 오프셋(sample adaptive offset)을 적용할 수 있다. 디블록킹 필터링 및/또는 샘플 적응적 오프셋을 통해, 복원 픽처 내 블록 경계의 아티팩트나 양자화 과정에서의 왜곡이 보정될 수 있다. 샘플 적응적 오프셋은 샘플 단위로 적용될 수 있으며, 디블록킹 필터링의 과정이 완료된 후 적용될 수 있다. 필터부(155)는 ALF(Adaptive Loop Filter)를 복원된 픽처에 적용할 수도 있다. ALF는 디블록킹 필터 및/또는 샘플 적응적 오프셋이 적용된 후의 복원된 픽처에 대하여 적용될 수 있다.

메모리(160)는 복원 픽처(디코딩된 픽처) 또는 인코딩/디코딩에 필요한 정보를 저장할 수 있다. 여기서 복원 픽처는 상기 필터부(155)에 의하여 필터링 절차가 완료된 복원 픽처일 수 있다. 상기 저장된 복원 픽처는 다른 픽처의 (인터) 예측을 위한 참조 픽처로 활용될 수 있다. 예컨대, 메모리(160)는 인터 예측에 사용되는 (참조) 픽처들을 저장할 수 있다. 이 때, 인터 예측에 사용되는 픽처들은 참조 픽처 세트(reference picture set) 혹은 참조 픽처 리스트(reference picture list)에 의해 지정될 수 있다.

도 2를 참조하면, 비디오 디코딩 장치(200)는 엔트로피 디코딩부(210), 레지듀얼 처리부(220), 예측부(230), 가산부(240), 필터부(250) 및 메모리(260)을 포함할 수 있다. 여기서 레지듀얼 처리부(220)는 재정렬부(221), 역양자화부(222), 역변환부(223)을 포함할 수 있다.

비디오 정보를 포함하는 비트스트림이 입력되면, 비디오 디코딩 장치는(200)는 비디오 인코딩 장치에서 비디오 정보가 처리된 프로세스에 대응하여 비디오를 복원할 수 있다.

예컨대, 비디오 디코딩 장치(200)는 비디오 인코딩 장치에서 적용된 처리 유닛을 이용하여 비디오 디코딩을 수행할 수 있다. 따라서 비디오 디코딩의 처리 유닛 블록은 일 예로 코딩 유닛일 수 있고, 다른 예로 코딩 유닛, 예측 유닛 또는 변환 유닛일 수 있다. 코딩 유닛은 최대 코딩 유닛으로부터 쿼드 트리 구조 및/또는 바이너리 트리 구조를 따라서 분할될 수 있다.

예측 유닛 및 변환 유닛이 경우에 따라 더 사용될 수 있으며, 이 경우 예측 블록은 코딩 유닛으로부터 도출 또는 파티셔닝되는 블록으로서, 샘플 예측의 유닛일 수 있다. 이 때, 예측 유닛은 서브 블록으로 나뉠 수도 있다. 변환 유닛은 코딩 유닛으로부터 쿼드 트리 구조를 따라서 분할 될 수 있으며, 변환 계수를 유도하는 유닛 또는 변환 계수로부터 레지듀얼 신호를 유도하는 유닛일 수 있다.

엔트로피 디코딩부(210)는 비트스트림을 파싱하여 비디오 복원 또는 픽처 복원에 필요한 정보를 출력할 수 있다. 예컨대, 엔트로피 디코딩부(210)는 지수 골롬 부호화, CAVLC 또는 CABAC 등의 코딩 방법을 기초로 비트스트림 내 정보를 디코딩하고, 비디오 복원에 필요한 신택스 엘리먼트의 값, 레지듀얼에 관한 변환 계수의 양자화된 값 들을 출력할 수 있다.

보다 상세하게, CABAC 엔트로피 디코딩 방법은, 비트스트림에서 각 구문 요소에 해당하는 빈을 수신하고, 디코딩 대상 구문 요소 정보와 주변 및 디코딩 대상 블록의 디코딩 정보 혹은 이전 단계에서 디코딩된 심볼/빈의 정보를 이용하여 문맥(context) 모델을 결정하고, 결정된 문맥 모델에 따라 빈(bin)의 발생 확률을 예측하여 빈의 산술 디코딩(arithmetic decoding)를 수행하여 각 구문 요소의 값에 해당하는 심볼을 생성할 수 있다. 이때, CABAC 엔트로피 디코딩 방법은 문맥 모델 결정 후 다음 심볼/빈의 문맥 모델을 위해 디코딩된 심볼/빈의 정보를 이용하여 문맥 모델을 업데이트할 수 있다.

엔트로피 디코딩부(210)에서 디코딩된 정보 중 예측에 관한 정보는 예측부(230)로 제공되고, 엔트로피 디코딩부(210)에서 엔트로피 디코딩이 수행된 레지듀얼 값, 즉 양자화된 변환 계수는 재정렬부(221)로 입력될 수 있다.

재정렬부(221)는 양자화되어 있는 변환 계수들을 2차원의 블록 형태로 재정렬할 수 있다. 재정렬부(221)는 인코딩 장치에서 수행된 계수 스캐닝에 대응하여 재정렬을 수행할 수 있다. 여기서 재정렬부(221)는 별도의 구성으로 설명하였으나, 재정렬부(221)는 역양자화부(222)의 일부일 수 있다.

역양자화부(222)는 양자화되어 있는 변환 계수들을 (역)양자화 파라미터를 기반으로 역양자화하여 변환 계수를 출력할 수 있다. 이 때, 양자화 파라미터를 유도하기 위한 정보는 인코딩 장치로부터 시그널링될 수 있다.

역변환부(223)는 변환 계수들을 역변환하여 레지듀얼 샘플들을 유도할 수 있다.

예측부(230)는 현재 블록에 대한 예측을 수행하고, 상기 현재 블록에 대한 예측 샘플들을 포함하는 예측된 블록(predicted block)을 생성할 수 있다. 예측부(230)에서 수행되는 예측의 단위는 코딩 블록일 수도 있고, 변환 블록일 수도 있고, 예측 블록일 수도 있다.

예측부(230)는 상기 예측에 관한 정보를 기반으로 인트라 예측을 적용할 것인지 인터 예측을 적용할 것인지를 결정할 수 있다. 이 때, 인트라 예측과 인터 예측 중 어느 것을 적용할 것인지를 결정하는 단위와 예측 샘플을 생성하는 단위는 상이할 수 있다. 아울러, 인터 예측과 인트라 예측에 있어서 예측 샘플을 생성하는 단위 또한 상이할 수 있다. 예를 들어, 인터 예측과 인트라 예측 중 어느 것을 적용할 것인지는 CU 단위로 결정할 수 있다. 또한 예를 들어, 인터 예측에 있어서 PU 단위로 예측 모드를 결정하고 예측 샘플을 생성할 수 있고, 인트라 예측에 있어서 PU 단위로 예측 모드를 결정하고 TU 단위로 예측 샘플을 생성할 수도 있다.

인트라 예측의 경우에, 예측부(230)는 현재 픽처 내의 주변 참조 샘플을 기반으로 현재 블록에 대한 예측 샘플을 유도할 수 있다. 예측부(230)는 현재 블록의 주변 참조 샘플을 기반으로 방향성 모드 또는 비방향성 모드를 적용하여 현재 블록에 대한 예측 샘플을 유도할 수 있다. 이 때, 주변 블록의 인트라 예측 모드를 이용하여 현재 블록에 적용할 예측 모드가 결정될 수도 있다.

인터 예측의 경우에, 예측부(230)는 참조 픽처 상에서 움직임 벡터에 의해 참조 픽처 상에서 특정되는 샘플을 기반으로 현재 블록에 대한 예측 샘플을 유도할 수 있다. 예측부(230)는 스킵(skip) 모드, 머지(merge) 모드 및 MVP 모드 중 어느 하나를 적용하여 현재 블록에 대한 예측 샘플을 유도할 수 있다. 이때, 비디오 인코딩 장치에서 제공된 현재 블록의 인터 예측에 필요한 움직임 정보, 예컨대 움직임 벡터, 참조 픽처 인덱스 등에 관한 정보는 상기 예측에 관한 정보를 기반으로 획득 또는 유도될 수 있다

스킵 모드와 머지 모드의 경우에, 주변 블록의 움직임 정보가 현재 블록의 움직임 정보로 이용될 수 있다. 이 때, 주변 블록은 공간적 주변 블록과 시간적 주변 블록을 포함할 수 있다.

예측부(230)는 가용한 주변 블록의 움직임 정보로 머지 후보 리스트를 구성하고, 머지 인덱스가 머지 후보 리스트 상에서 지시하는 정보를 현재 블록의 움직임 벡터로 사용할 수 있다. 머지 인덱스는 인코딩 장치로부터 시그널링될 수 있다. 움직임 정보는 움직임 벡터와 참조 픽처를 포함할 수 있다. 스킵 모드와 머지 모드에서 시간적 주변 블록의 움직임 정보가 이용되는 경우에, 참조 픽처 리스트 상의 최상위 픽처가 참조 픽처로서 이용될 수 있다.

스킵 모드의 경우, 머지 모드와 달리 예측 샘플과 원본 샘플 사이의 차이(레지듀얼)이 전송되지 않는다.

MVP 모드의 경우, 주변 블록의 움직임 벡터를 움직임 벡터 예측자(motion vector predictor)로 이용하여 현재 블록의 움직임 벡터가 유도될 수 있다. 이 때, 주변 블록은 공간적 주변 블록과 시간적 주변 블록을 포함할 수 있다.

일 예로, 머지 모드가 적용되는 경우, 복원된 공간적 주변 블록의 움직임 벡터 및/또는 시간적 주변 블록인 Col 블록에 대응하는 움직임 벡터를 이용하여, 머지 후보 리스트가 생성될 수 있다. 머지 모드에서는 머지 후보 리스트에서 선택된 후보 블록의 움직임 벡터가 현재 블록의 움직임 벡터로 사용된다. 상기 예측에 관한 정보는 상기 머지 후보 리스트에 포함된 후보 블록들 중에서 선택된 최적의 움직임 벡터를 갖는 후보 블록을 지시하는 머지 인덱스를 포함할 수 있다. 이 때, 예측부(230)는 상기 머지 인덱스를 이용하여, 현재 블록의 움직임 벡터를 도출할 수 있다.

다른 예로, MVP(Motion Vector Prediction) 모드가 적용되는 경우, 복원된 공간적 주변 블록의 움직임 벡터 및/또는 시간적 주변 블록인 Col 블록에 대응하는 움직임 벡터를 이용하여, 움직임 벡터 예측자 후보 리스트가 생성될 수 있다. 즉, 복원된 공간적 주변 블록의 움직임 벡터 및/또는 시간적 주변 블록인 Col 블록에 대응하는 움직임 벡터는 움직임 벡터 후보로 사용될 수 있다. 상기 예측에 관한 정보는 상기 리스트에 포함된 움직임 벡터 후보 중에서 선택된 최적의 움직임 벡터를 지시하는 예측 움직임 벡터 인덱스를 포함할 수 있다. 이 때, 예측부(230)는 상기 움직임 벡터 인덱스를 이용하여, 움직임 벡터 후보 리스트에 포함된 움직임 벡터 후보 중에서, 현재 블록의 예측 움직임 벡터를 선택할 수 있다. 인코딩 장치의 예측부는 현재 블록의 움직임 벡터와 움직임 벡터 예측자 간의 움직임 벡터 차분(MVD)을 구할 수 있고, 이를 인코딩하여 비트스트림 형태로 출력할 수 있다. 즉, MVD는 현재 블록의 움직임 벡터에서 상기 움직임 벡터 예측자를 뺀 값으로 구해질 수 있다. 이 때, 예측부(230)는 상기 예측에 관한 정보에 포함된 움직임 벡터 차분을 획득하고, 상기 움직임 벡터 차분과 상기 움직임 벡터 예측자의 가산을 통해 현재 블록의 상기 움직임 벡터를 도출할 수 있다. 예측부는 또한 참조 픽처를 지시하는 참조 픽처 인덱스 등을 상기 예측에 관한 정보로부터 획득 또는 유도할 수 있다.

가산부(240)는 레지듀얼 샘플과 예측 샘플을 더하여 현재 블록 혹은 현재 픽처를 복원할 수 있다. 가산부(240)는 레지듀얼 샘플과 예측 샘플을 블록 단위로 더하여 현재 픽처를 복원할 수도 있다. 스킵 모드가 적용된 경우에는 레지듀얼이 전송되지 않으므로, 예측 샘플이 복원 샘플이 될 수 있다. 여기서는 가산부(240)를 별도의 구성으로 설명하였으나, 가산부(240)는 예측부(230)의 일부일 수도 있다. 한편, 가산부(240)는 복원부 또는 복원 블록 생성부로 불릴 수도 있다.

필터부(250)는 복원된 픽처에 디블록킹 필터링 샘플 적응적 오프셋, 및/또는 ALF 등을 적용할 수 있다. 이 때, 샘플 적응적 오프셋은 샘플 단위로 적용될 수 있으며, 디블록킹 필터링 이후 적용될 수도 있다. ALF는 디블록킹 필터링 및/또는 샘플 적응적 오프셋 이후 적용될 수도 있다.

메모리(260)는 복원 픽처(디코딩된 픽처) 또는 디코딩에 필요한 정보를 저장할 수 있다. 여기서 복원 픽처는 상기 필터부(250)에 의하여 필터링 절차가 완료된 복원 픽처일 수 있다. 예컨대, 메모리(260)는 인터 예측에 사용되는 픽처들을 저장할 수 있다. 이 때, 인터 예측에 사용되는 픽처들은 참조 픽처 세트 혹은 참조 픽처 리스트에 의해 지정될 수도 있다. 복원된 픽처는 다른 픽처에 대한 참조 픽처로서 이용될 수 있다. 또한, 메모리(260)는 복원된 픽처를 출력 순서에 따라서 출력할 수도 있다.

상술한 바와 같이 인트라 예측 또는 인트라 예측이 수행되는 경우, 현재 블록에 대한 예측 샘플들을 포함하는 예측된 블록을 생성할 수 있다. 여기서 상기 예측된 블록은 공간 도메인(또는 픽셀 도메인)에서의 예측 샘플들을 포함한다. 상기 예측된 블록은 인코딩 장치 및 디코딩 장치에서 동일하게 도출되며, 상기 인코딩 장치는 원본 블록의 원본 샘플 값 자체가 아닌 상기 원본 블록과 상기 예측된 블록 간의 레지듀얼에 대한 정보(레지듀얼 정보)를 디코딩 장치로 시그널링함으로써 영상 코딩 효율을 높일 수 있다. 디코딩 장치는 상기 레지듀얼 정보를 기반으로 레지듀얼 샘플들을 포함하는 레지듀얼 블록을 도출하고, 상기 레지듀얼 블록과 상기 예측된 블록을 합하여 복원 샘플들을 포함하는 복원 블록을 생성할 수 있고, 복원 블록들을 포함하는 복원 픽처를 생성할 수 있다. 인코딩 장치 또한 인터 예측을 위한 참조 픽처로 활용하기 위하여 상기 레지듀얼 블록과 상기 예측된 블록을 합하여 복원 블록을 생성할 수 있고, 복원 블록들을 포함하는 복원 픽처를 생성할 수 있다.

한편, 비디오 코딩 시스템에서 다양하고 정교한 예측 방법들이 사용되고 있으나, 예측된 블록은 복원 블록과 어느정도 차이가 발생할 수 있다. 예를 들어, 인트라 예측이 적용되는 경우 일반적으로 특정 예측 방향으로부터 샘플들을 복사하여 예측 샘플들로 사용하거나, 또는 주변 샘플들의 평균값 또는 양방향 보간값을 이용하여 예측 샘플들을 도출한다. 따라서 예측된 블록은 전반적으로는 복원 블록과 유사할 수 있으나, 샘플 단위에서 보면 대응하는 위상의 복원 샘플과 어느정도 차이가 발생할 수 있다. 또한, 인터 예측이 적용되는 경우 이미 디코딩된 참조 픽처 상에서 움직임 벡터가 가리키는 특정 위치의 참조 블록을 이용하여 예측된 블록을 도출하므로, 참조 픽처와 현재 픽처 간의 시간 차이에 따른, 객체의 이동, 회전 등에 의하여 예측된 블록은 복원 블록과 차이가 발생할 수 있다. 이러한 차이는 잡음(noise)라고 불릴 수 있으며, 레지듀얼 샘플들의 값을 증가시키고 레지듀얼 정보의 시그널링에 필요한 비트들의 양을 증가시킬 수 있다. 본 발명에 따르면, 예측된 블록에 대하여 주파수 도메인에서의 처리를 통하여 수정된 예측된 블록을 도출할 수 있으며, 이를 통하여 레지듀얼 정보에 필요한 비트들의 양을 줄일 수 있으며, 전반적인 코딩 효율이 향상될 수 있다. 본 발명에 따른 예측된 블록에 대한 주파수 도메인에서의 처리는 주파수 도메인 잡음 감소(frequency domain noise reduction, RDNR)라고 불릴 수 있다.

도 3을 참조하면, 비디오 인코딩 장치(300)는 픽처 분할부(305), 예측부(310), 감산부(315), 변환부(320), 양자화부(325), 재정렬부(330), 엔트로피 인코딩부(335), 레지듀얼 처리부(340), 가산부(350), 필터부(355), 메모리(360)뿐 아니라 주파수 도메인 잡음제거부(311)을 포함할 수 있다. 주파수 도메인 잡음제거부(311)는 예측부(310)에 포함될 수 있으며, 별도의 유닛으로 구분될 수도 있다.

픽처 분할부(305), 예측부(310), 감산부(315), 변환부(320), 양자화부(325), 재정렬부(330), 엔트로피 인코딩부(335), 레지듀얼 처리부(340), 가산부(350), 필터부(355), 메모리(360)는 도 1에서 상술한 바와 같다. 다만, 예측부(310)에서 생성된 예측된 블록은 주파수 도메인 잡음제거부(311)에서 처리되어, 수정된 예측된 블록이 생성되며, 상기 수정된 예측된 블록이 감산부(315)로 입력되어 원본 블록(원본 샘플)과의 비교를 기반으로 레지듀얼 블록이 생성되는 점에서 차이가 있다. 구체적인 주파수 도메인 잡음제거부(311)의 동작은 도 5 이하에서 후술된다.

도 4를 참조하면, 비디오 디코딩 장치(400)는 엔트로피 디코딩부(410), 레지듀얼 처리부(420), 예측부(430), 가산부(440), 필터부(450), 메모리(460)뿐 아니라 주파수 도메인 잡음제거부(431)을 포함할 수 있다. 주파수 도메인 잡음제거부(431)는 예측부(430)에 포함될 수 있으며, 별도의 유닛으로 구분될 수도 있다.

엔트로피 디코딩부(410), 레지듀얼 처리부(420), 예측부(430), 가산부(440), 필터부(450), 메모리(460)는 도 2에서 상술한 바와 같다. 다만, 예측부(430)에서 생성된 예측된 블록은 주파수 도메인 잡음제거부(431)에서 처리되어 수정된 예측된 블록이 생성되며, 상기 수정된 예측된 블록이 가산부(440)로 입력되어 복원 블록이 생성되는 점에서 차이가 있다. 구체적인 주파수 도메인 잡음제거부(431)의 동작은 도 5 이하에서 후술된다.

도 5를 참조하면, 주파수 도메인 잡음제거부(550)는 예측된 블록(500)에 변환(순변환)을 적용하여 주파수 도메인 예측된 블록(560)을 도출한다. 이 경우 변환은 변환 커널(transform kernel) 및/또는 양자화 파라미터(QP_N)을 기반으로 수행될 수 있다. 상기 주파수 도메인 예측된 블록(560)은 변환 계수들(transform coefficients)을 포함한다.

주파수 도메인 잡음제거부(550)는 상기 변환 계수들에 주파수 상관 계수들(correlation coefficeints)을 곱하여 잡음제거된 주파수 도메인 예측된 블록(570)을 도출한다. 상기 잡음제거된 주파수 도메인 예측된 블록(570)은 주파수 도메인 수정된 예측된 블록이라 불릴 수 있다. 상기 잡음제거된 주파수 도메인 예측된 블록(570)은 수정된 변환 계수들(modified transform coefficients)을 포함한다. 상기 수정된 변환 계수들은 상기 변환 계수들 및 상기 주파수 상관 계수들을 기반으로 도출될 수 있다. 상기 주파수 상관 계수들은 상관계수 블록 형태로 구성될 수 있으며, 주파수 상관 계수 어레이(array)라고 불릴 수도 있다. 상기 주파수 상관 계수들은 인코딩 장치에서 결정하여 디코딩 장치로 시그널링할 수 있다. 또는 상기 주파수 상관 계수들은 조건에 따라 미리 결정될 수 있다. 예를 들어, 인코딩 장치는 RDO(rate-distortion optimization) 최적화 관점에서 상기 예측 블록의 잡음이 최소화되는 상기 주파수 상관 계수들을 도출할 수 있다. 이 경우 인코딩 장치는 상기 주파수 상관 계수들을 나타내는 정보를 디코딩 장치로 전송할 수 있고, 또는 인코딩 장치 및 디코딩 장치에서 주파수 상관 계수들을 미리 정하여 조건에 따라 사용할 수도 있다.

주파수 도메인 잡음제거부(550)는 상기 잡음제거된 주파수 도메인 예측된 블록(570)에 변환(역변환)을 적용하여 공간 도메인의 수정된 예측된 블록(590)을 도출한다. 상기 수정된 예측된 블록(590)은 수정된 예측 샘플들을 포함하며, 상기 수정된 예측 샘플들은 상기 수정된 변환 계수들에 변환을 적용하여 도출될 수 있다. 이 경우 변환은 상기 순변환에 사용되었던 상기 변환 커널(transform kernel) 및/또는 상기 양자화 파라미터(QP_N)을 기반으로 수행될 수 있다.

상기 절차를 통하여 잡음이 감소 또는 제거된 공간 도메인의 수정된 예측 블록을 도출할 수 있으며, 이후 기존의 코딩 절차와 같이 인코딩 장치는 원본 블록과 상기 수정된 예측 블록 간의 차이를 통해 레지듀얼 블록을 생성할 수 있고, 디코딩 장치는 수신한 레지듀얼 정보로부터 도출한 레지듀얼 블록과 상기 수정된 예측 블록을 합하여 복원 블록 및 복원 픽처를 생성할 수 있다. 이 경우 예측된 블록에 존재하는 잡음을 주파수 도메인에서 효과적으로 제거함으로써 레지듀얼 에너지(즉, 레지듀얼 정보에 필요한 데이터량)를 감소시켜 영상 압축효율을 높일 수 있다.

상술한 본 발명에 따른 주파수 도메인 잡음 감소 방법에서 사용되는 상기 주파수 상관계수들 및 상기 변환 커널의 결정은 다음과 같이 수행될 수 있다.

주파수 도메인 잡음 감소는 상술한 바와 같이 예측 블록에 대한 (변환을 통하여 획득한) 변환 계수들과 주파수 상관 계수들을 기반으로 수행될 수 있다. 이 경우 각 변환 계수와 해당 변환 계수의 주파수 위치에 대응하는 주파수 상관 계수 C_ij를 이용하여 계산할 수 있다. 여기서 (i, j)는 상기 주파수 위치의 수평, 수직 성분을 나타낸다. 상기 주파수 상관 계수의 값은 해당 주파수 위치에서 존재하는 잡음의 크기에 반비례할 수 있다. 예를 들어, 만약 해당 주파수 위치에 잡음이 존재하지 않는 경우 C_ij는 1 값을 가질 수 있으며, 이 경우 해당 주파수 위치의 변환 계수의 신뢰도는 100%에 해당하여, 잡음감소(또는 잡음제거) 과정에서 영향을 받지 않을 수 있다. 다른 예로, 만약 해당 주파수 위치에 잡음이 일부 존재하는 경우 C_ij는 0.5의 값을 가질 수 있으며, 이 경우 해당 주파수 위치의 변환 계수는 잡음감소 과정에서 영향을 받는다.

주파수 도메인에서 잡음 감소 후 수정된 변환 계수(U_ij)는 다음과 같이 도출될 수 있다.

여기서, U_ij는 수정된 변환 계수이고, 주파수 도메인에서 잡음을 제거한 신뢰계수로 볼 수 있다. C_ij는 주파수 상관계수이다. 여기서 C_ij는 0 이상 1 이하이다. P_ij는 예측 블록에 대한 변환을 통하여 도출된 변환 계수를 나타낸다. 여기서, i, j는 각각 주파수 도메인에서 해당 계수의 위치의 수평, 수직 성분을 나타낸다. A×B는 스칼라 값 A와 B 간의 곱셈을 나타낸다.

C_ij는 예를 들어, 코딩 전에 온라인 또는 오프라인 학습(training)을 통하여 미리 계산될 수 있다. 이 경우 비트스트림을 통해 디코딩 장치로 전송될 수 있으며, 또는 오프라인 학습을 통해 미리 계산된 C_ij 값이 미리 정의 (또는 저장)되어 사용될 수도 있다.

한편, 상기 수학식 1에 언급된 주파수 상관계수 외에도 효과적인 잡음제거를 위하여 추가적인 상관계수가 가중치로 사용될 수 있다. 이는 가중 계수(weight coefficient)라고 불릴 수 있다.

여기서, K_ij는 상기 가중계수이다. K_ij는 미리 결정되거나 시그널링될 수 있다. 또는 K_ij는 양자화 파라미터(QP)에 의존하여 결정될 수 있다. 또는 K_ij는 현재 블록의 크기 및 현재 블록의 모양 (정방형, 비정방형)에 따라 의존적으로 결정될 수도 있다.

P_ij는 예측 블록에 대한 변환을 통하여 도출된 변환 계수이며, 이 경우 상기 예측 블록의 변환에 사용되는 양자화 파라미터는 레지듀얼 블록(레지듀얼 신호)를 인코딩할 때 사용되는 양자화 파라미터와 동일할 수 있고, 또는 다를 수 있다. 만약, 다른 양자화 파라미터가 사용될 경우, 상기 예측 블록의 변환에 사용되는 양자화 파라미터를 나타내기 위하여 상기 레지듀얼 신호를 인코딩할 때 사용되는 양자화 파라미터와의 차분값이 전송될 수도 있다.

한편, 주파수 상관계수인 C_ij는 다음 도 6과 같이 상관계수 블록의 형태로 나타내어질 수 있다.

도 6은 상관계수들로 구성된 상관계수 블록들을 예시적으로 나타낸다. 도 6에서는 4x4 사이즈의 상관계수 블록들을 예시적으로 나타내었다.

도 6을 참조하면, 상관계수 블록은 주파수 상관계수들을 포함하며, 상기 주파수 상관계수들을 주파수 위치에 따라 구분될 수 있다. 이 경우 상기 주파수 상관계수들은 해당 주파수 위치에 따라 대응하는 변환 계수들(예측 블록의 변환을 통하여 도출된 변환 계수들)과 곱해지고, 이를 통하여 수정된 변환 계수들이 도출될 수 있다.

주파수 도메인 잡음제거부는 상기와 같은 여러 종류의 상관계수 블록들 중 미리 정의된 상관계수 블록을 사용하거나 또는 하나의 상관계수 블록을 선택하여 사용할 수 있다.

일 예로, 블록의 특성에 따라 이용 가능한 다수의 상관계수 블록들 중 미리 정의된 하나가 선택될 수 있다.

다른 예로, 인코딩 장치는 블록의 특성에 따라 이용 가능한 다수의 상관계수 블록들 중 하나를 선택하고, 상기 선택된 상관계수 블록을 명시하기 위한 정보(예를 들어, 상관계수 인텍스 정보)를 비트스트림을 통하여 디코딩 장치로 전송될 수 있다.

여기서, 블록의 특성은 예를 들어 현재 블록의 부호화 타입 (ex. 인터 예측, 인트라 예측), 인터 예측이 적용되는 경우 현재 블록의 예측에 사용되는 움직임 벡터의 개수, 움직임 벡터의 해상도 (ex. 정수 샘플 단위, 하프 샘플 단위, 쿼터 샘플 단위 등), 현재 블록의 크기 또는 모양 (ex. 정방형, 비정방형), 현재 블록의 코딩에 사용된 양자화 파라미터의 값, 현재 블록에 인터 예측 모드가 적용되는 경우 스킵 모드, 머지 모드, MVP(AMVP) 모드의 적용 여부 및 현재 블록에 인트라 예측이 적용되는 경우 인트라 예측 모드(인트라 방향성 모드#0, #1, #2..., 인트라 플래너 모드, 인트라 DC 모드) 중 적어도 하나를 포함할 수 있다.

한편, 상술한 절차를 통하여 결정된 상관계수 블록은 상기 수학식 2에 나타난 가중계수 K_ij에 의하여 추가적으로 갱신될 수 있다. 이 경우 상기 가중계수는 특정 값으로 공통적으로 결정될 수 있으며, 주파수 위치에 따라 적응적으로 결정될 수도 있다. 상기 가중계수는 상술한 블록의 특성을 기반으로 결정될 수도 있다.

한편, 주파수 도메인 잡음 감소 방법에서는 어떠한 종류의 변환 커널을 사용하는지에 따라 그 효과가 달라질 수 있다. 본 발명에서는 다음과 같은 변환 커널들이 사용될 수 있다.

일 예로, 미리 정의된 변환 커널이 일괄적으로 사용될 수 있다. 예를 들어, DCT2, DCT5, DCT8, DST1, DST7 등 변환 커널들이 사용될 수 있으며, 상기 변환 커널들 중 미리 정의된 변환 커널이 현재 픽처 내 블록들에 대하여 일괄적으로 사용될 수 있다.

다른 예로, 현재 블록에 연관된 레지듀얼 정보의 코딩에 사용된 변환 커널이 상기 예측 블록의 변환에도 사용될 수 있다. 이 경우 레지듀얼 블록에 대한 변환 특성을 고려하여 예측 블록의 변환이 수행되므로, 노이즈 감소 효과를 향상시킬 수 있으며, 레지듀얼 정보에 필요한 데이터량을 줄일 수 있다.

또 다른 예로, 현재 블록(또는 예측된 블록)의 사이즈를 고려하여 변환 커널을 결정할 수 있다. 이 경우, 특정 사이즈 이상의 예측된 블록에 대하여는 미리 정의된 크기의 변환 커널이 변환을 기반으로 해당 예측된 블록을 분할 및 변환하여 상관계수블록을 통해 주파수영역에서 잡음을 제거할 수 있다. 예를 들어 64x64 사이즈의 예측된 블록이 도출된 경우, 상기 예측된 블록을 4개의 32x32 블록으로 나뉘어 각 32x32 블록 단위로 변환을 적용하고, 32x32 블록 단위로 상관계수블록을 고려하여 고주파 성분의 잡음을 제거할 수 있다.

상기 주파수 상관계수는 인코딩/디코딩을 수행하기 전에 온라인 또는 오프라인 학습(training)을 통해 미리 계산할 수 있으며 해당 값들이 인코딩 장치/부호화 장치에 미리 저장되어 사용될 수 있다.

한편, 현재 블록에 인터 예측이 적용되는 경우, 상술한 바와 같이 상기 현재 블록의 주변 블록을 기반으로 도출된 움직임 벡터를 이용하여 참조 픽처 상에서 참조 블록을 도출하고, 상기 참조 블록의 참조 샘플들을 이용하여 예측된 블록을 도출할 수 있다. 이 경우 인터 예측 성능을 높이기 위하여 상기 움직임 벡터(현재 블록과 참조 블록 사이의 차이값)는 정수 단위 이하의 샘플 해상도(resolution)을 가질 수 있다. 예컨대 루마(luma) 성분에 대해서 1/4 샘플 해상도를 가질 수 있다. 따라서, 참조 픽처 상에서 보간(interpolation)을 통하여 정수 샘플(integer sample or full sample)로부터 1/4 단위 분수 샘플(fractional sample)을 생성하고, 분수 샘플을 포함하는 영역에서 참조 블록을 선택함으로써, 현재 블록에 더 유사한 참조 블록을 도출할 수 있다.

정수 단위 이하의 분수 샘플은 정수 샘플을 기반으로 보간 필터를 통해 생성될 수 있다. 상술한 바와 같이 루마 성분 샘플(이하 루마 샘플)의 경우, 움직임 벡터의 해상도는 1/4 분수 샘플이며, 인코딩 장치 및 디코딩 장치는 보간을 통해 1/4 샘플 단위로 정수 이하 단위의 샘플 정보를 생성할 수 있다. 루마 샘플에 대한 보간을 수행하기 위해, 필터 계수를 달리하는 8탭 보간 필터가 사용될 수 있다.

도 7은 인터 예측에 있어서, 1/4 분수 단위 샘플 보간에 대한 정수 샘플과 분수 샘플의 위치를 개략적으로 나타낸 것이다. 도 7에 도시된 샘플들의 위치 중에, 음영으로 표시(또는 대문자로 표시)된 위치는 정수 샘플에 대응하며, 음영 없이 표시(또는 소문자로 표시)된 위치는 분수 샘플에 대응한다.

아래의 표 1은 샘플 위치에 따른 필터 계수(filter coefficients)의 예를 나타낸 표이다. 예를 들어, 상기 필터 계수들은 루마 성분의 샘플에 적용될 수 있다.

샘플 위치	필터 계수
1/4	{-1, 4, -10, 58, 17, -5, 1, 0}
2/4	{-1, 4, -11, 40, 40, -11, 4, -1}
3/4	{0, 1, -5, 17, 58, -10, 4, -1}

예를 들어, 도 7의 분수 샘플들은 상기 필터 계수를 기반으로 8탭 필터를 적용하여 도출될 수 있다.

이와 같이 현재 블록의 움직임 벡터가 분수 샘들 단위의 값을 가지는 경우, 본 발명에 따른 주파수 도메인 잡음제거(잡음감소) 방법은 참조 픽처의 정수 샘플들의 보간 후 도출된 분수 샘플들을 기반으로 적용될 수 있고, 도는 상기 참조 픽처의 정수 샘플들을 기반으로 적용될 수도 있다.

도 8을 참조하면, 코딩 장치는 참조 픽처 내 정수 샘플들을 도출한다(S810). 코딩 장치는 현재 블록의 움직임 벡터를 기반으로 참조 픽처 내에서 정수 샘플들을 도출할 수 있다. 코딩 장치는 인코딩 장치 또는 디코딩 장치를 포함할 수 있다.

코딩 장치는 상기 움직임 벡터가 정수 샘플단위 값을 갖는지 확인한다(S820). 즉, 코딩 장치는 상기 움직임 벡터가 정수 샘플단위 값을 갖는지 아니면 분수 샘플단위 값을 갖는지 확인한다.

비록 도 8에서는 S820는 S810 이후에 수행되는 것으로 도시되었으나, 이는 예시일 뿐이며, S820은 S810보다 먼저 수행될 수 있고, 또는 동시에 수행될 수도 있다.

만약 S820에서 상기 움직임 벡터가 분수 샘플단위 값을 갖는 경우, 도 7에서 설명한 바와 같이 코딩 장치는 상기 정수 샘플들을 이용한 보간 절차를 통하여 분수 샘플들을 도출하고, 상기 도출된 분수 샘플들을 기반으로 움직임 보상을 수행한다(S830). 즉, 코딩 장치는 상기 분수 샘플들을 현재 블록의 예측 샘플들로 이용하여 예측된 블록을 도출할 수 있다.

코딩 장치는 상기 분수 샘플들을 이용하여 도출된 예측 블록에 주파수 도메인 잡음 제거를 수행한다(S840).

만약 S820에서 상기 움직임 벡터가 정수 샘플단위 값을 갖는 경우, 상기 정수 샘플들을 기반으로 예측된 블록을 도출하고, 앞에서 설명한 바와 같이 주파수 도메인 잡음 제거를 수행할 수 있다.

도 9를 참조하면, 코딩 장치는 참조 픽처 내 정수 샘플들을 도출한다(S910). 코딩 장치는 현재 블록의 움직임 벡터를 기반으로 참조 픽처 내에서 정수 샘플들을 도출할 수 있다. 코딩 장치는 인코딩 장치 또는 디코딩 장치를 포함할 수 있다.

코딩 장치는 상기 정수 샘플들을 기반으로 먼저 주파수 도메인 잡음 제거를 수행한다(S920). 이 경우 코딩 장치는 상기 정수 샘플들을 기반으로 (임시) 예측 샘플들을 도출하고, 상기 (임시) 예측 샘플들을 포함하는 (임시) 예측된 블록을 도출할 수 있다. 코딩 장치는 상기 (임시) 예측된 블록에 대하여 상술한 주파수 도메인 잡음 제거를 수행할 수 있다. 이 경우 수정된 정수 샘플들이 도출될 수 있다.

코딩 장치는 상기 움직임 벡터가 정수 샘플단위 값을 갖는지 확인한다(S930). 즉, 코딩 장치는 상기 움직임 벡터가 정수 샘플단위 값을 갖는지 아니면 분수 샘플단위 값을 갖는지 확인한다.

비록 도 9에서는 S930는 S910 이후에 수행되는 것으로 도시되었으나, 이는 예시일 뿐이며, S930은 S910보다 먼저 수행될 수 있고, 또는 동시에 수행될 수도 있다.

만약 S930에서 상기 움직임 벡터가 분수 샘플단위 값을 갖는 경우, 코딩 장치는 상기 수정된 정수 샘플들을 이용한 보간 절차를 통하여 분수 샘플들을 도출하고, 상기 도출된 분수 샘플들을 기반으로 움직임 보상을 수행한다(S930). 즉, 코딩 장치는 상기 분수 샘플들을 현재 블록의 예측 샘플들로 이용하여 수정된 예측된 블록을 도출할 수 있다.

만약 S930에서 상기 움직임 벡터가 정수 샘플단위 값을 갖는 경우, 상기 정수 샘플들을 기반으로 예측된 블록을 도출하고, 앞에서 설명한 바와 같이 주파수 도메인 잡음 제거를 수행할 수 있다.

도 8에 따른 실시예에 따르면, 만약 현재 블록의 움직임 벡터가 분수 샘플단위 값을 갖는 경우 참조 픽처 상에서 분수 샘플들을 도출한 후에 주파수 도메인 잡음 제거가 적용되었으나, 도 9에 따른 실시예에 따르면, 만약 현재 블록의 움직임 벡터가 분수 샘플단위 값을 갖는 경우에 정수 샘플들에 대하여 먼저 주파수 도메인 잡음 제거를 수행하고, 잡음 제거된 (수정된) 정수 샘플들을 이용하여 보간을 수행하여 예측 효율을 높일 수 있다. 도 7에서 설명된 바와 같이 보간 절차에서 하나의 분수 샘플 도출을 위하여 다수의 정수 샘플들이 필터 계수 기반하여 보간되며, 이 때문에 일부 정수 샘플들에 존재하는 잡음이 다수의 분수 샘플들에 퍼질(spreading) 수 있다. 그러나, 본 실시예와 같이 보간 전에 먼저 주파수 도메인 잡음 제거를 수행하는 경우, 잡음의 퍼짐을 방지하고, 예측 효율을 더 높일 수 있다.

한편, 본 발명은 쌍예측이 적용되는 경우에도 수행될 수 있다. 상술한 내용과 같이 현재 블록에 인터 예측이 적용되는 경우, 상기 인터 예측을 위한 움직임 정보가 도출될 수 있다. 상기 움직임 정보는 L0 방향에 대한 L0 움직임 정보 및/또는 L1 방향에 대한 L1 움직임 정보를 포함할 수 있다. 여기서, 상기 L0 움직임 정보는 상기 현재 블록에 대한 참조 픽처 리스트 L0(List 0, L0)에 포함된 L0 참조 픽처를 가리키는 L0 참조 픽처 인덱스 및 움직임 벡터 L0(Motion Vector L0, MVL0)를 포함할 수 있고, 상기 L1 움직임 정보는 상기 현재 블록에 대한 참조 픽처 리스트 L0(List 1, L1)에 포함된 L1 참조 픽처를 가리키는 L1 참조 픽처 인덱스 및 MVL1를 포함할 수 있다. 여기서, 상기 L0 방향은 과거 방향 또는 순방향이라고 불릴 수도 있다. 또한, 상기 L1 방향은 미래 방향 또는 역방향이라고 불릴 수도 있다. 또한, 상기 참조 픽처 리스트 L0는 상기 현재 픽처보다 출력 순서상 이전 픽처들을 포함할 수 있고, 상기 참조 픽처 리스트 L1는 상기 현재 픽처보다 출력 순서상 이후 픽처들을 포함할 수 있다. 또는 경우에 따라 참조 픽처 리스트 L0는 출력 순서상 이후 픽처들을 더 포함할 수도 있고, 참조 픽처 리스트 L1는 출력 순서상 이전 픽처들을 더 포함할 수도 있다. 여기서 출력 순서는 POC(picture order count)에 대응할 수 있다.

현재 블록에 대한 예측을 수행함에 있어, L0 움직임 정보를 기반으로 인터 예측을 수행하는 경우 LO 예측이라고 불릴 수 있고, L1 움직임 정보를 기반으로 인터 예측을 수행하는 경우 L1 예측이라고 불릴 수 있으며, 상기 L0 움직임 정보 및 L1 움직임 정보를 기반으로 인터 예측을 수행하는 경우 쌍예측(bi-prediction)이라고 불릴 수 있다.

도 10을 참조하면, 상기 현재 블록에 인터 예측이 수행되는 경우, 특히 상기 현재 블록에 쌍예측이 수행되는 경우, 디코딩 장치는 상기 L0 움직임 정보를 기반으로 L0 참조 블록을 도출할 수 있고, 상기 L1 움직임 정보를 기반으로 L1 참조 블록을 도출할 수 있다. 여기서 t-1 시간 영상은 상기 LO 참조 픽처에 대응되고, 상기 t+1 시간 영상은 상기 L1 참조 픽처에 대응된다. MV_P는 상기 L0 움직임 벡터에 대응되고, MV_F는 상기 L1 움직임 벡터에 대응된다.

코딩 장치는 상기 L0 참조 블록의 L0 참조 샘플과 상기 L0 참조 샘플에 대응하는 상기 L1 참조 블록의 L1 참조 샘플의 평균 값을 이용하여 상기 현재 블록의 예측 샘플을 생성할 수 있다. 즉, 코딩 장치는 상기 L0 움직임 정보를 기반으로 상기 L0 참조 샘플을 도출할 수 있고, 상기 L1 움직임 정보를 기반으로 상기 L1 참조 샘플을 도출할 수 있고, 상기 L0 참조 샘플의 샘플값 및 상기 L1 참조 샘플의 샘플값을 더한 값을 1/2하여 상기 예측 샘플을 생성할 수 있다.

이는 다음 수학식과 같이 나타낼 수 있다.

여기서, C_ij는 쌍예측된 예측 샘플을 나타내고, P_ij는 L0 참조 샘플, F_ij는 L1 참조 샘플을 나타낸다. 여기서, i, j는 공간 도메인 좌표 (i, j)의 x성분, y성분을 나타낸다.

이와 같이 쌍예측이 적용되는 경우, 주파수 도메인 잡음제거는 다음과 같이 수행될 수 있다.

도 11을 참조하면, 코딩 장치는 L0 예측을 통하여 L0 참조 샘플을 도출하고(S1110), L1 예측을 통하여 L1 참조 샘플을 도출한다(S1120).

코딩 장치는 도출된 L0 참조 샘플과 L1 참조 샘플을 이용하여 쌍예측 기반 예측 샘플을 도출하고(S1130), 쌍예측된 예측 샘플들을 포함하는 예측된 블록에 주파수 영역 잡음 제거를 수행할 수 있다(S1140).

도 12을 참조하면, 코딩 장치는 L0 예측을 통하여 L0 참조 샘플을 도출하고(S1210), L1 예측을 통하여 L1 참조 샘플을 도출한다(S1220).

코딩 장치는 L0 참조 샘플에 대하여 주파수 도메인 잡음제거(S1215)를 수행하여 수정된 L0 참조 샘플을 도출하고, L1 참조 샘플에 대하여 주파수 도메인 잡음제거(S1225)를 적용하여 수정된 L1 참조 샘플을 도출한다. 이 경우 L0 참조 샘플들은 L0 예측 샘플들에 대응될 수 있고, L1 참조 샘플들은 L1 예측 샘플들에 대응될 수 있다. 상기 L0 참조 샘플에 적용되는 주파수 상관계수와 상기 L1 참조 샘플에 적용되는 주파수 상관계수는 다를 수 있다.

코딩 장치는 상기 수정된 L0 참조 샘플과 상기 수정된 L1 참조 샘플을 평균하여, 수정된 예측 샘플들을 도출할 수 있다(S1230).

한편, 본 발명에 따른 주파수 도메인 잡음 제거 방법은 서브블록 단위 예측을 이용하는 인터 예측에도 적용될 수 있다. 서브블록 단위 예측이 수행되는 경우, 하나의 블록은 복수의 서브블록으로 나누어지며, 이 경우 서브블록 단위로 각기 다른 움직임벡터를 이용하여 예측된 서브블록들을 도출할 수 있다. 이 경우 도 11 및 도 12에 제시된 방법과 유사하게, 예측된 서브블록들의 집합인 예측된 블록에 대하여 주파수 도메인 잡음 제거를 수행할 수 있고, 또는 예측된 서브블록 단위로 각각 주파수 도메인 잡음 제거를 수행하고, 수정된 예측된 서브블록들을 결합하여 수정된 예측된 블록을 도출할 수도 있다. 예측된 서브블록 단위로 각각 주파수 도메인 잡음 제거를 수행하는 경우 예측된 서브블록 단위로 다른 주파수 상관계수를 사용할 수 있는바 예측 성능을 높일 수 있고, 보다 작은 사이즈의 블록 단위로 변환이 수행되는바 변환 복잡도를 낮출 수 있다.

상술한 본 발명에 따른 주파수 도메인 잡음 제거를 포함한 효율적인 코딩을 위하여 주파수 도메인 잡음 제거의 수행 여부에 관한 판단 및 시그널링은 다음과 같은 방법을 통하여 수행될 수 있다.

일 예로, 본 발명에 따른 주파수 도메인 잡음 제거의 수행 여부는 FNDR(frequency domain noise reduction) 플래그를 기반으로 지시될 수 있다. 상기 FDNR 플래그는 예를 들어 FDNR_flag 신텍스 요소의 형태로 비트스트림을 통하여 시그널링될 수 있다.

도 13을 참조하면, 디코딩 장치는 비트스트림을 통하여 수신된 FDNR 플래그를 확인한다(S1310). FDNR 플래그의 값이 1인 경우 디코딩 장치는 주파수 도메인 잡음 제거를 수행하고(S1320), FDNR 플래그의 갑이 0인 경우 디코딩 장치는 주파수 도메인 잡음 제거를 수행하지 않는다. 이 경우 예측된 블록에 포함된 예측 샘플들이 최종 예측 샘플들로 도출될 수 있다. 디코딩 장치는 상기 FDNR 플래그가 존재하지 않는 경우 상기 FDNR 플래그의 값을 0으로 간주할 수 있다. 상기 FDNR 플래그는 CU(CB) 레벨에서 시그널링될 수 있다. 예를 들어, 상기 FNDR_flag 신텍스 요소는 CU 신텍스에 포함되어 시그널링될 수 있다.

한편, 비록 도시되지는 않았으나, 상위 레벨에서 FDNR 가용 여부를 나타내는 플래그를 추가적으로 시그널링 할 수도 있다. 이는 FDNR 가용 플래그(FDNR enable flag)라고 불릴 수 있으며, 예를 들어, VPS(video parameter set), SPS(sequence parameter set), PPS(picture parameter set), 슬라이스 헤더(slice header) 레벨에서 시그널링될 수 있다. 상기 FDNR 플래그는 상기 FDNR 가용 플래그의 값이 1인 경우에 한하여 시그널링될 수 있다. 디코딩 장치는 먼저 FDNR 가용 플래그를 먼저 확인(파싱)하고, 상기 FDNR 가용 플래그의 값이 1인 경우 상기 FDNR 플래그를 확인(파싱)할 수 있다. 상기 FDNR 가용 플래그의 값이 0인 경우 상기 FDNR 플래그는 시그널링되지 않을 수 있다. 이와 같은 계층적 시그널링 구조를 기반으로, 현재 픽처에 FDNR이 가용한 경우에도 블록 단위로 FDNR 적용 여부를 적응적으로 결정할 수 있고, 하나의 FDNR 가용 플래그를 기반으로 하나 또는 복수의 픽처에 대하여 FDNR이 가용하지 않음을 지시함으로써 블록 단위 FDNR 플래그의 전송을 위한 비트수를 절감할 수 있다. 이를 통하여 시그널링 효율을 높일 수 있다.

다른 일 예로, 본 발명에 따른 주파수 도메인 잡음 제거의 수행 여부는 미리 정의된 조건을 기반으로 결정될 수 있다.

도 14를 참조하면, 디코딩 장치는 미리 정의된 조건을 기반으로 주파수 도메인 잡음 제거 수행 여부를 결정한다(S1410). 디코딩 장치는 상기 미리 정의된 조건이 만족되는 경우 주파수 도메인 잡음 제거를 수행할 수 있다(S1420).

상기 미리 정의된 조건은 다음과 같은 사항을 기반으로 정의될 수 있다.

- 해당블록의 사이즈 및 모양(정방형, 비정방형). 예를 들어, 블록의 사이즈가 일정 사이즈 이하이거나 모양이 비정방향인 경우 상기 주파수 도메인 잡음 제거는 수행되지 않을 수 있다.

- 해당블록 내 존재하는 non-zero 계수의 값 및/또는 개수 (여기서 상기 non-zero 계수는 예측된 블록을 순변환한 후 주파수 도메인 예측된 블록에 존재하는 변환 계수를 의미할 수 있다). 예를 들어, 상기 주파수 도메인 예측된 블록에 DC 계수만 존재하고, AC 계수들의 값은 모두 0인 경우, 상기 주파수 도메인 잡음 제거는 수행되지 않을 수 있다.

- 해당블록의 인터 예측에 사용되는 움직임벡터의 개수 (즉, 쌍예측이 적용되는지 여부)

- 움직임 벡터의 해상도 (정수 샘플 단위, 1/2 샘플 단위, 1/4 샘플 단위, 1/8 샘플 단위)

- 해당블록의 컬러 성분 (Y, Cb, Cr)

- 해당블록의 양자화 파라미터

- 해당블록에 대한 레지듀얼 정보 (레지듀얼 샘플들에 대한 변환 계수들 중 non-zero 계수들의 수 및/또는 위치)

- 해당블록의 코딩 모드(인터 예측, 인트라 예측)

- 해당블록에 인트라 예측이 적용되는 경우 인트라 예측 모드 (방향성 예측 모드 #n, 플래너 모드, DC 모드)

- 해당블록에 인터 예측이 적용되는 경우 인터 예측 모드 (스킵 모드, 머지 모드, AMVP 모드), 또는 AMVP 모드가 적용되는 경우 MVD(motion vector difference)의 크기

- 인터 예측에서 이용되는 참조 블록의 샘플 값의 특징 (분산, 에너지 분포, 크로마 성분과 루마 성분의 sobel operation 차이 등)

또 다른 예로, 본 발명에 따른 주파수 도메인 잡음 제거의 수행 여부는 도 13에 개시된 명시적 방법과 도 14에 개시된 암시적 방법의 조합으로 결정될 수 있다.

도 15를 참조하면, 디코딩 장치는 암시적인 조건을 만족하는 경우에만 명시적인 FDNR 플래그를 수신하며, 명시적인 FDNR 플래그를 기반으로 주파수 도메인 잡음 제거 수행여부를 결정할 수 있다. 여기서 암시적인 조건은 도 14에서 상술한 바와 같다.

상술한 본 발명에 따른 주파수 도메인 잡음 제거 수행 여부의 판단을 포함한 주파수 도메인 잡음 제거 방법은 다음과 같이 수행될 수 있다.

도 16을 참조하면, 코딩 장치는 현재 블록에 대한 예측된 블록을 도출하고(S1600), 상기 예측된 블록에 주파수 도메인 잡음 제거의 수행 여부를 판단한다(S1610). 상기 주파수 도메인 잡음 제거의 수행 여부의 판단 방법은 도 13 내지 도 15에서 상술한 방법을 포함할 수 있다. 비록 도 16에서는 S1610은 S1600 이후에 수행되는 것으로 도시되었으나, S1610은 S1600 전에 수행될 수도 있다. 예를 들어, 상기 주파수 도메인 잡음 제거의 수행 여부를 명시적인 플래그 정보 또는 현재 블록의 특성(블록 크기, 예측 모드, 모양 등)을 기반으로 판단하는 경우, 상기 S1610은 S1600 전에 수행될 수도 있다.

S1610에서 상기 주파수 도메인 잡음 제거가 수행되는 것으로 판단된 경우, 코딩 장치는 도출된 예측된 블록에 변환(순변환)을 적용하여 주파수 도메인 예측된 블록을 도출한다(S1620). 이 경우 변환은 변환 커널(transform kernel) 및/또는 양자화 파라미터(QP_N)을 기반으로 수행될 수 있다. 상기 주파수 도메인 예측된 블록은 예측 샘플들에 대한 변환 계수들(transform coefficients)을 포함한다.

한편, 비록 도 16에서는 S1610은 S1600 이후에 수행되는 것으로 도시되었으나, S1610은 S1620 이후에 수행될 수도 있다. 즉, S1620 절차 이후에 상기 주파수 도메인 잡음 제거의 수행 여부를 판단할 수 있다. 예를 들어, 상술한 바와 같이 상기 예측된 블록에 주파수 도메인 잡음 제거의 수행 여부를 판단함에 있어, 상기 예측된 블록의 주파수 변환시 도출된 상기 주파수 도메인 예측된 블록의 상기 변환 계수들 중 non-zero 변환 계수들의 값, 개수 및/또는 분포 등에 기반할 수 있으며, 이 경우를 고려하여 상기 S1610은 S1620 이후에 수행될 수도 있다. 이 경우 S1630 이하의 절차들은 S1610에서 상기 주파수 도메인 잡음 제거가 수행되는 것으로 판단된 경우 수행될 수 있다.

한편, 상기 주파수 도메인 잡음 제거의 수행 여부가 2단계(ex. 1단계: 명시적 판단, 2단계: 암시적 판단)되는 경우, 상기 S1610 절차는 나누어서 수행될 수 있다. 예를 들어, 시그널링된 플래그 정보에 기반하는 명시적인 1단계 판단은 S1610 전 또는 수에 수행되고, 블록 특성에 기반하는 암시적인 2단계 판단은 S1620 전에 수행될 수 있다. 구체적으로 예를 들어, 먼저 명시적인 1단계 판단은 FDNR 플래그에 기반하여 수행하고, 만약 FDNR 플래그이 값이 1인 경우, S1620 수행 후에 암시적인 2단계 판단을 블록 특성(ex, 상기 주파수 도메인 예측된 블록의 상기 변환 계수들 중 non-zero 변환 계수들의 값, 개수 및/또는 분포 등)에 기반하여 수행할 수도 있다.

코딩 장치는 상기 변환 계수들에 주파수 상관 계수들(correlation coefficeints)을 곱하여 잡음제거된 주파수 도메인 예측된 블록을 도출한다(S1630). 상기 잡음제거된 주파수 도메인 예측된 블록은 주파수 도메인 수정된 예측된 블록이라 불릴 수 있다. 상기 잡음제거된 주파수 도메인 예측된 블록은 수정된 변환 계수들(modified transform coefficients)을 포함한다. 상기 수정된 변환 계수들은 상기 변환 계수들 및 상기 주파수 상관 계수들을 기반으로 도출될 수 있다. 상기 주파수 상관 계수들은 상관계수 블록 형태로 구성될 수 있으며, 주파수 상관 계수 어레이(array)라고 불릴 수도 있다. 상기 주파수 상관 계수들은 인코딩 장치에서 결정하여 디코딩 장치로 시그널링할 수 있다. 또는 상기 주파수 상관 계수들은 상술한 바와 같이 해당블록의 특성에 따라 미리 결정될 수 있다.

코딩 장치는 상기 잡음제거된 주파수 도메인 예측된 블록에 변환(역변환)을 적용하여 공간 도메인의 수정된 예측된 블록을 도출한다(S1640). 상기 수정된 예측된 블록은 수정된 예측 샘플들을 포함하며, 상기 수정된 예측 샘플들은 상기 수정된 변환 계수들에 변환을 적용하여 도출될 수 있다. 이 경우 변환은 상기 순변환에 사용되었던 상기 변환 커널(transform kernel) 및/또는 상기 양자화 파라미터(QP_N)을 기반으로 수행될 수 있다.

상기 절차를 통하여 잡음이 감소 또는 제거된 공간 도메인의 수정된 예측 블록을 도출할 수 있으며, 이후 기존의 코딩 절차와 같이 인코딩 장치는 원본 블록과 상기 수정된 예측 블록 간의 차이를 통해 레지듀얼 블록을 생성할 수 있고, 디코딩 장치는 수신한 레지듀얼 정보로부터 도출한 레지듀얼 블록과 상기 수정된 예측 블록을 합하여 복원 블록 및 복원 픽처를 생성할 수 있다.

도 17은 본 발명에 따른 인코딩 장치에 의한 영상 인코딩 방법을 개략적으로 나타낸다. 도 17에서 개시된 방법은 도 3에서 개시된 인코딩 장치에 의하여 수행될 수 있다. 구체적으로 예를 들어, 도 17의 S1700은 상기 인코딩 장치의 예측부, S1710 내지 S1730은 상기 인코딩 장치의 주파수 도메인 잡음제거부, S1740은 상기 인코딩 장치의 엔트로피 인코딩부에 의하여 수행될 수 있다.

인코딩 장치는 현재 블록에 대한 예측된 블록을 도출한다(S1700). 예측된 블록은 상기 현재 블록에 대한 예측 샘플들을 포함한다.

인코딩 장치는 상기 현재 블록에 대한 예측 모드를 결정하고, 상기 결정된 예측 모드에 따라 상기 예측된 블록을 도출할 수 있다. 인코딩 장치는 예를 들어, 인트라 예측, 인터 예측 중 어떤 예측 방법이 적용되는지 결정할 수 있고, 상기 인트라 예측이 적용되는 경우 구체적인 인트랑 예측 모드(ex. 방향성 인트라 모드 #n, 플래너 모드, DC 모드)를 결정할 수 있다. 또한 인코딩 장치는 상기 인터 예측이 적용되는 경우, 구체적인 인터 예측 모드(ex. 스킵 모드, 머지 모드, AMVP 모드)를 결정할 수 있다. 인코딩 장치는 이 경우 RDO를 기반으로 상기 현재 블록에 대한 최적의 예측 모드를 결정할 수 있다.

인코딩 장치는 상기 예측된 블록에 대한 변환을 수행하여, 주파수 도메인 예측된 블록을 도출한다(S1710).

인코딩 장치는 먼저, 상기 현재 블록에 주파수 도메인 잡음 제거(잡음 감소)가 적용되는지 여부를 판단하고, 상기 주파수 도메인 잡음 제거가 적용되는 경우에 상기 예측된 블록에 대한 변환을 수행하여 상기 주파수 도메인 예측된 블록을 도출할 수도 있다. 상기 주파수 도메인 잡음 제거의 적용 여부는 도 13 내지 도 15에서 상술한 방법에 따라 판단될 수 있다.

예를 들어, 인코딩 장치는 상기 현재 블록에 상기 주파수 도메인 잡음 제거가 수행되는 경우 보다 나은 RDO를 갖는 경우, 상기 현재 블록에 상기 주파수 도메인 잡음 제거가 적용되는 것으로 판단하고, FDNR 플래그의 값을 1로 설정하여 시그널링할 수 있다. 인코딩 장치는 계층적으로 FDNR 가용 플래그를 상위 레벨에서 설정하고, 블록 단위로 FDNR 플래그를 설정할 수도 있음은 상술한 바와 같다. 상기 FDNR 가용 플래그는 VPS(video parameter set), SPS(sequence parameter set), PPS(picture parameter set) 또는 슬라이스 헤더를 통하여 전송될 수 있다. 인코딩 장치는 도 14에서 설명된 바와 같은 현재블록의 특성을 기반으로 상기 현재 블록에 상기 주파수 도메인 잡음 제거가 적용되는지 여부를 판단할 수도 있다.

상기 현재 블록에 상기 주파수 도메인 잡음 제거가 적용되는 경우, 인코딩 장치는 예측된 블록에 변환(순변환)을 적용하여 주파수 도메인 예측된 블록을 도출한다. 이 경우 변환은 변환 커널(transform kernel) 및/또는 양자화 파라미터(QP_N)을 기반으로 수행될 수 있다. 상기 주파수 도메인 예측된 블록은 예측 샘플들에 대한 변환을 통하여 도출된 변환 계수들(transform coefficients)을 포함한다.

인코딩 장치는 상기 주파수 도메인 예측된 블록 및 주파수 상관계수들을 기반으로 주파수 도메인 수정된 예측된 블록을 도출한다(S1720). 인코딩 장치는 상기 변환 계수들에 주파수 상관 계수들을 곱하여 주파수 도메인 수정된 예측된 블록을 도출할 수 있다. 상기 주파수 도메인 수정된 예측된 블록은 수정된 변환 계수들(modified transform coefficients)을 포함한다. 상기 수정된 변환 계수들은 상기 변환 계수들 및 상기 주파수 상관 계수들을 기반으로 도출될 수 있다. 상기 주파수 상관 계수들은 상관계수 블록 형태로 구성될 수 있으며, 주파수 상관 계수 어레이(array)라고 불릴 수도 있다. 상기 주파수 상관 계수들은 인코딩 장치에서 결정하여 디코딩 장치로 시그널링할 수 있다. 또는 상기 주파수 상관 계수들은 상술한 바와 같이 해당블록의 특성에 따라 미리 결정될 수 있다.

인코딩 장치는 상기 주파수 도메인 수정된 예측된 블록을 역변환하여 수정된 예측된 블록을 생성한다(S1730). 상기 수정된 예측된 블록은 수정된 예측 샘플들을 포함하며, 상기 수정된 예측 샘플들은 상기 수정된 변환 계수들에 변환을 적용하여 도출될 수 있다. 이 경우 역변환은 상기 순변환에 사용되었던 상기 변환 커널(transform kernel) 및/또는 상기 양자화 파라미터(QP_N)을 기반으로 수행될 수 있다.

인코딩 장치는 원본 블록과 상기 수정된 예측 블록과의 차분을 기반으로 레지듀얼 샘플들을 포함하는 레지듀얼 블록을 도출할 수 있다. 인코딩 장치는 상기 레지듀얼 블록에 대하여 변환 및 양자화를 적용하여 레지듀얼 정보를 생성할 수 있다. 상기 레지듀얼 정보는 양자화된 변환 계수들을 나타내고, 상기 양자화된 변환 계수들은 상기 레지듀얼 블록에 변환을 적용하여 도출된 변환 계수들을 양자화하여 도출될 수 있다.

여기서, 상기 예측된 블록에 적용된 변환과 상기 레지듀얼 블록에 적용된 변환은 동일한 변환 커널이 사용될 수 있다.

인코딩 장치는 상기 수정된 예측된 블록에 포함된 수정된 예측 샘플과 상기 레지듀얼 블록에 포함된 레지듀얼 샘플을 기반으로 복원 샘플을 도출할 수 있다. 즉, 인코딩 장치는 상기 수정된 예측 샘플과 상기 레지듀얼 샘플을 더하여 상기 복원 샘플을 도출할 수 있다.

인코딩 장치는 상기 현재 블록에 대한 예측 정보 및 레지듀얼 정보를 인코딩하여 출력한다(S1740). 상기 예측 정보는 상기 현재 블록에 적용된 예측 모드에 관한 정보 및 상기 현재 블록에 인터 예측이 적용되는 경우 상기 현재 블록의 움직임 정보를 지시하는 정보 등을 포함할 수 있다.

인코딩 장치는 상기 예측 정보 및 상기 레지듀얼 정보를 인코딩하여 비트스트림 형태로 출력할 수 있다. 상기 비트스트림은 현재 픽처를 디코딩하는데 필요한 영상 정보를 나르며 네트워크 또는 저장매체를 통하여 디코딩 장치로 전송될 수 있다. 한편, 인코딩 장치는 FNDR 플래그 및/또는 FDNR 가용 플래그를 인코딩하여 상기 비트스트림 형태로 출력할 수 있다. 이 경우 상기 영상 정보는 상기 FDNR 플래그 및/또는 FDNR 가용 플래그를 포함할 수 있다.

도 18은 본 발명에 따른 디코딩 장치에 의한 영상 디코딩 방법을 개략적으로 나타낸다. 도 18에서 개시된 방법은 도 4에서 개시된 디코딩 장치에 의하여 수행될 수 있다. 구체적으로 예를 들어, S1800은 상기 디코딩 장치의 예측부, S1810 내지 S1830은 상기 디코딩 장치의 주파수 도메인 잡음 제거부, S1840은 상기 디코딩 장치의 복원부에 의하여 수행될 수 있다.

디코딩 장치는 현재 블록에 대한 예측된 블록을 도출한다(S1800). 예측된 블록은 상기 현재 블록에 대한 예측 샘플들을 포함한다.

디코딩 장치는 비트스트림으로부터 획득한 영상 정보를 기반으로 상기 예측된 블록을 도출할 수 있다. 상기 영상 정보는 상기 현재 블록에 대한 예측 정보를 포함하며, 상기 예측 정보는 상기 현재 블록에 적용된 예측 모드에 관한 정보 및 상기 현재 블록에 인터 예측이 적용되는 경우 상기 현재 블록의 움직임 정보를 지시하는 정보 등을 포함할 수 있다.

디코딩 장치는 상기 예측된 블록에 대한 변환을 수행하여, 주파수 도메인 예측된 블록을 도출한다(S1810).

디코딩 장치는 먼저, 상기 현재 블록에 주파수 도메인 잡음 제거(잡음 감소)가 적용되는지 여부를 판단하고, 상기 주파수 도메인 잡음 제거가 적용되는 경우에 상기 예측된 블록에 대한 변환을 수행하여 상기 주파수 도메인 예측된 블록을 도출할 수도 있다. 상기 주파수 도메인 잡음 제거의 적용 여부는 도 13 내지 도 15에서 상술한 방법에 따라 판단될 수 있다.

예를 들어, 상기 영상 정보는 FDNR 플래그 및 상기 FDNR 가용 플래그 중 적어도 하나를 포함할 수 있다. 디코딩 장치는 상기 현재 블록에 대한 상기 FDNR 플래그의 값이 1인 경우 상기 현재 블록에 주파수 도메인 잡음 제거가 적용되는 것으로 판단하고, 상기 예측된 블록을 변환하여 상기 주파수 도메인 예측된 블록을 도출할 수 있다. 상기 FDNR 가용 플래그는 VPS(video parameter set), SPS(sequence parameter set), PPS(picture parameter set) 또는 슬라이스 헤더를 통하여 수신될 수 있으며, 상기 FDNR 가용 플래그의 값이 1인 경우에, 상기 FDNR 플래그는 상기 영상 정보에 포함될 수 있다. 디코딩 장치는 도 14에서 설명된 바와 같은 현재블록의 특성을 기반으로 상기 현재 블록에 상기 주파수 도메인 잡음 제거가 적용되는지 여부를 판단할 수도 있다.

상기 현재 블록에 상기 주파수 도메인 잡음 제거가 적용되는 경우, 인코딩 장치는 예측된 블록에 변환(순변환)을 적용하여 주파수 도메인 예측된 블록을 도출한다. 이 경우 변환은 변환 커널(transform kernel) 및/또는 양자화 파라미터(QP_N)을 기반으로 수행될 수 있다. 상기 주파수 도메인 예측된 블록은 예측 샘플들에 대한 변환을 통하여 도출된 변환 계수들을 포함한다.

예를 들어, 상기 현재 블록에 대한 상기 예측 모드는 인터 예측 모드인 경우, 디코딩 장치는 상기 현재 블록의 주변 블록을 기반으로 상기 현재 블록의 움직임 벡터를 도출하고, 상기 움직임 벡터를 기반으로 상기 예측된 블록을 도출할 수 있다. 만약 상기 움직임 벡터가 분수 샘플 단위의 값을 가지는 경우, 상기 예측된 블록은 참조 픽처 내 정수 샘플들 및 상기 움직임 벡터를 기반으로 도출된 분수 샘플 단위 참조 샘플들을 이용하여 도출된 예측 샘플들을 포함할 수 있다. 이 경우 상기 예측된 블록에 대한 변환은 상기 분수 샘플 단위 참조 샘플들을 이용하여 도출된 예측 샘플들에 대하여 적용될 수 있다. 또는 만약 상기 움직임 벡터가 분수 샘플 단위의 값을 가지는 경우, 상기 예측된 블록에 포함된 예측 샘플들은 상기 참조 픽처 내 정수 샘플들에 대응할 수 있고, 상기 예측된 블록에 대한 변환은 참조 픽처 내 정수 샘플들에 대하여 적용될 수 있다.

다른 예로, 상기 현재 블록에 대한 상기 예측 모드는 인터 예측 모드이고, 상기 현재 블록에 쌍예측이 적용되는 경우, 디코딩 장치는 상기 현재 블록의 적어도 하나의 주변 블록을 기반으로 상기 현재 블록의 L0 움직임 벡터 및 L1 움직임 벡터를 도출하고, 상기 L0 움직임 벡터를 기반으로 L0 참조 블록을 도출하고, 상기 L1 움직임 벡터를 기반으로 L1 참조 블록을 도출하여, 상기 L0 참조 블록 및 상기 L1 참조 블록을 기반으로 상기 예측된 블록을 도출할 수 있다. 이 경우 상기 예측된 블록을 변환함에 있어서, 상기 예측된 블록에 포함된 예측 샘플들에 대하여 상기 변환을 수행하며, 상기 변환의 대상이 되는 예측 샘플은 상기 L0 참조 블록 내 L0 참조 샘플 및 상기 L1 참조 블록 내 L1 참조 샘플의 평균을 통하여 도출될 수 있다. 또는 상기 현재 블록에 쌍예측이 적용되는 경우, 상기 변환의 대상이 되는 상기 예측된 블록은 상기 L0 움직임 벡터를 기반으로 도출된 L0 참조 블록 또는 상기 L1 움직임 벡터를 기반으로 도출된 L1 참조 블록에 대응될 수도 있다.

디코딩 장치는 상기 주파수 도메인 예측된 블록 및 주파수 상관계수들을 기반으로 주파수 도메인 수정된 예측된 블록을 도출한다(S1820). 디코딩 장치는 상기 변환 계수들에 주파수 상관 계수들을 곱하여 주파수 도메인 수정된 예측된 블록을 도출할 수 있다. 상기 주파수 도메인 수정된 예측된 블록은 수정된 변환 계수들(modified transform coefficients)을 포함한다. 상기 수정된 변환 계수들은 상기 변환 계수들 및 상기 주파수 상관 계수들을 기반으로 도출될 수 있다. 상기 주파수 상관 계수들은 상관계수 블록 형태로 구성될 수 있으며, 주파수 상관 계수 어레이(array)라고 불릴 수도 있다. 상기 주파수 상관 계수들은 인코딩 장치에서 결정하여 디코딩 장치로 시그널링할 수 있다. 또는 상기 주파수 상관 계수들은 상술한 바와 같이 해당블록의 특성에 따라 미리 결정될 수 있다.

구체적으로 예를 들어, 상기 영상 정보는 주파수 상관계수 정보를 포함하고, 디코딩 장치는 상기 주파수 상관계수 정보를 기반으로 상기 주파수 상관계수들을 도출할 수 있다. 이 경우, 다수의 주파수 상관계수 집합들이 미리 정의되고, 상기 주파수 상관계수 집합들은 각각 주파수 상관계수들을 포함하며, 상기 주파수 상관계수 정보는 상기 다수의 주파수 상관계수 집합들 중 하나를 가리킬 수 있다.

디코딩 장치는 상기 주파수 도메인 수정된 예측된 블록을 역변환하여 수정된 예측된 블록을 생성한다(S1830). 상기 수정된 예측된 블록은 수정된 예측 샘플들을 포함하며, 상기 수정된 예측 샘플들은 상기 수정된 변환 계수들에 변환을 적용하여 도출될 수 있다. 이 경우 역변환은 상기 순변환에 사용되었던 상기 변환 커널(transform kernel) 및/또는 상기 양자화 파라미터(QP_N)을 기반으로 수행될 수 있다.

디코딩 장치를 레지듀얼 정보를 기반으로 상기 현재 블록에 대한 레지듀얼 블록을 도출할 수 있다. 디코딩 장치는 상기 레지듀얼 정보를 기반으로 양자화된 변환 계수들을 도출하고, 상기 양자화된 변환 계수들을 역양자화하여 변환 계수들을 도출할 수 있다. 디코딩 장치는 상기 변환 계수들을 변환하여 도출된 레지듀얼 샘플들을 포함하는 상기 레지듀얼 블록을 도출할 수 있다. 이 경우 상기 예측된 블록에 적용된 변환과 상기 변환 계수들에 적용된 변환은 동일한 변환 커널이 사용될 수 있다.

디코딩 장치는 상기 수정된 예측된 블록 및 상기 레지듀얼 블록을 기반으로 복원 블록을 생성할 수 있고, 현재 픽처를 복원할 수 있다.

이후 디코딩 장치는 필요에 따라 주관적/객관적 화질을 향상시키기 위하여 디블록킹 필터링 및/또는 SAO 절차와 같은 인루프 필터링 절차를 상기 복원 픽처에 적용할 수 있음은 상술한 바와 같다.

상술한 본 발명에 따른 방법은 소프트웨어 형태로 구현될 수 있으며, 본 발명에 따른 인코딩 장치 및/또는 디코딩 장치는 예를 들어 TV, 컴퓨터, 스마트폰, 셋톱박스, 디스플레이 장치 등의 영상 처리를 수행하는 장치에 포함될 수 있다.

본 발명에서 실시예들이 소프트웨어로 구현될 때, 상술한 방법은 상술한 기능을 수행하는 모듈(과정, 기능 등)로 구현될 수 있다. 모듈은 메모리에 저장되고, 프로세서에 의해 실행될 수 있다. 메모리는 프로세서 내부 또는 외부에 있을 수 있고, 잘 알려진 다양한 수단으로 프로세서와 연결될 수 있다. 프로세서는 ASIC(application-specific integrated circuit), 다른 칩셋, 논리 회로 및/또는 데이터 처리 장치를 포함할 수 있다. 메모리는 ROM(read-only memory), RAM(random access memory), 플래쉬 메모리, 메모리 카드, 저장 매체 및/또는 다른 저장 장치를 포함할 수 있다.

Claims

인코딩 장치에 의하여 수행되는 영상 인코딩 방법에 있어서,

현재 블록에 대한 예측 모드를 결정하는 단계;

상기 예측 모드를 기반으로 상기 현재 블록에 대한 예측된 블록(predicted block)을 도출하는 단계;

상기 예측된 블록을 변환(transform)하여 주파수 도메인 예측된 블록(predicted block)을 도출하는 단계;

상기 주파수 도메인 예측된 블록 및 주파수 상관계수들을 기반으로 주파수 도메인 수정된(modified) 예측된 블록을 도출하는 단계;

상기 주파수 도메인 수정된 예측된 블록을 역변환하여 수정된 예측된 블록을 생성하는 단계;

상기 현재 블록에 대한 원본(original) 블록과 상기 수정된 예측된 블록을 기반으로 레지듀얼 블록을 도출하는 단계; 및

상기 예측 모드에 대한 정보 및 상기 레지듀얼 블록에 대한 레지듀얼 정보를 인코딩하여 출력하는 단계를 포함하는, 영상 인코딩 방법
제1항에 있어서,

상기 레지듀얼 정보는 양자화된 변환 계수들을 나타내고,

상기 양자화된 변환 계수들은 상기 레지듀얼 블록에 변환을 적용하여 도출된 변환 계수들을 양자화하여 도출되며,

상기 예측된 블록에 적용된 변환과 상기 레지듀얼 블록에 적용된 변환은 동일한 변환 커널이 사용되는 것을 특징으로 하는, 영상 인코딩 방법.
디코딩 장치에 의하여 수행되는 영상 디코딩 방법에 있어서,

예측 정보 및 레지듀얼 정보를 포함하는 영상 정보를 수신하는 단계;

상기 예측 정보를 기반으로 현재 블록에 대한 예측 모드를 도출하는 단계;

상기 예측 모드를 기반으로 상기 현재 블록에 대한 예측된 블록(predicted block)을 도출하는 단계;

상기 예측된 블록을 변환(transform)하여 주파수 도메인 예측된 블록(predicted block)을 도출하는 단계;

상기 주파수 도메인 예측된 블록 및 주파수 상관계수들을 기반으로 주파수 도메인 수정된(modified) 예측된 블록을 도출하는 단계;

상기 주파수 도메인 수정된 예측된 블록을 역변환하여 수정된 예측된 블록을 생성하는 단계;

상기 레지듀얼 정보를 기반으로 레지듀얼 블록을 도출하는 단계; 및

상기 수정된 예측된 블록 및 상기 레지듀얼 블록을 기반으로 복원 블록을 생성하는 단계를 포함함을 특징으로 하는, 영상 디코딩 방법.
제3항에 있어서,

상기 영상 정보는 주파수 상관계수 정보를 포함하고,

상기 주파수 상관계수 정보를 기반으로 상기 주파수 상관계수들이 도출되는 것을 특징으로 하는, 영상 디코딩 방법.
제4항에 있어서,

다수의 주파수 상관계수 집합들이 미리 정의되고, 상기 주파수 상관계수 집합들은 각각 주파수 상관계수들을 포함하며,

상기 주파수 상관계수 정보는 상기 다수의 주파수 상관계수 집합들 중 하나를 가리키는 것을 특징으로 하는, 영상 디코딩 방법.
제3항에 잇어서,

상기 레지듀얼 블록을 도출하는 단계는

상기 레지듀얼 정보를 기반으로 양자화된 변환 계수들을 도출하는 단계;

상기 양자화된 변환 계수들을 역양자화하여 변환 계수들을 도출하는 단계;

상기 변환 계수들을 변환하여 도출된 레지듀얼 샘플들을 포함하는 상기 레지듀얼 블록을 도출하는 단계를 포함하되,

상기 예측된 블록에 적용된 변환과 상기 변환 계수들에 적용된 변환은 동일한 변환 커널이 사용되는 것을 특징으로 하는, 영상 디코딩 방법.
제3항에 있어서,

상기 현재 블록에 대한 상기 예측 모드는 인터 예측 모드이고,

상기 예측된 블록을 도출하는 단계는

상기 현재 블록의 주변 블록을 기반으로 상기 현재 블록의 움직임 벡터(motion vector)를 도출하는 단계; 및

상기 움직임 벡터를 기반으로 상기 예측된 블록을 도출하는 단계를 포함하되,

상기 움직임 벡터가 분수 샘플 단위의 값을 가지는 경우, 상기 예측된 블록은 참조 픽처 내 정수 샘플들 및 상기 움직임 벡터를 기반으로 도출된 분수 샘플 단위 참조 샘플들을 이용하여 도출된 예측 샘플들을 포함하고,

상기 예측된 블록에 대한 변환은 상기 분수 샘플 단위 참조 샘플들을 이용하여 도출된 상기 예측 샘플들에 대하여 적용되는 것을 특징으로 하는, 영상 디코딩 방법.
제3항에 있어서,

상기 현재 블록에 대한 상기 예측 모드는 인터 예측 모드이고,

상기 예측된 블록을 도출하는 단계는

상기 현재 블록의 주변 블록을 기반으로 상기 현재 블록의 움직임 벡터(motion vector)를 도출하는 단계; 및

상기 움직임 벡터를 기반으로 상기 예측된 블록을 도출하는 단계를 포함하되,

상기 움직임 벡터가 분수 샘플 단위의 값을 가지는 경우, 상기 예측된 블록에 대한 변환은 참조 픽처 내 정수 샘플들에 대하여 적용되는 것을 특징으로 하는, 영상 디코딩 방법.
제3항에 있어서,

상기 현재 블록에 대한 상기 예측 모드는 인터 예측 모드이고,

상기 현재 블록에 쌍예측이 적용되는 경우, 상기 예측된 블록을 도출하는 단계는

상기 현재 블록의 적어도 하나의 주변 블록을 기반으로 상기 현재 블록의 L0 움직임 벡터 및 L1 움직임 벡터를 도출하는 단계;

상기 L0 움직임 벡터를 기반으로 L0 참조 블록을 도출하는 단계;

상기 L1 움직임 벡터를 기반으로 L1 참조 블록을 도출하는 단계;

상기 L0 참조 블록 및 상기 L1 참조 블록을 기반으로 상기 예측된 블록을 도출하는 단계를 포함하되,

상기 예측된 블록을 변환함에 있어서, 상기 예측된 블록에 포함된 예측 샘플들에 대하여 상기 변환을 수행하며, 상기 변환의 대상이 되는 예측 샘플은 상기 L0 참조 블록 내 L0 참조 샘플 및 상기 L1 참조 블록 내 L1 참조 샘플의 평균을 통하여 도출되는 것을 특징으로 하는, 영상 디코딩 방법.
제3항에 있어서,

상기 현재 블록에 대한 상기 예측 모드는 인터 예측 모드이고,

상기 현재 블록에 쌍예측이 적용되는 경우, 상기 변환의 대상이 되는 상기 예측된 블록은 상기 L0 움직임 벡터를 기반으로 도출된 L0 참조 블록 또는 상기 L1 움직임 벡터를 기반으로 도출된 L1 참조 블록에 대응되는 것을 특징으로 하는, 영상 디코딩 방법.
제3항에 있어서,

상기 영상 정보는 FDNR(frequency domain noise reduction) 플래그를 포함하고,

상기 FDNR 플래그의 값이 1인 경우, 상기 예측된 블록을 변환하여 상기 주파수 도메인 예측된 블록을 도출하는 것을 특징으로 하는, 영상 디코딩 방법.
제11항에 있어서,

상기 영상 정보는 FDNR 가용 플래그를 포함하고,

상기 FDNR 가용 플래그는 VPS(video parameter set), SPS(sequence parameter set), PPS(picture parameter set) 또는 슬라이스 헤더를 통하여 수신되며,

상기 FDNR 가용 플래그의 값이 1인 경우에, 상기 FDNR 플래그는 상기 영상 정보에 포함되는 것을 특징으로 하는, 영상 디코딩 방법.
제3항에 있어서,

현재 블록에 대한 주파수 도메인 잡음 제거의 수행 여부를 판단하는 단계를 더 포함하되,

상기 주파수 도메인 잡음 제거의 수행 여부는 FDNR 플래그 및 현재블록의 특성을 기반으로 미리 정의된 조건의 만족 여부 중 적어도 하나를 기반으로 판단되는 것을 특징으로 하는, 영상 디코딩 방법.
영상 디코딩 장치에 있어서,

예측 정보 및 레지듀얼 정보를 포함하는 영상 정보를 수신하는 엔트로피 디코딩부;

상기 예측 정보를 기반으로 현재 블록에 대한 예측 모드를 도출하고, 상기 예측 모드를 기반으로 상기 현재 블록에 대한 예측된 블록(predicted block)을 도출하는 예측부;

상기 예측된 블록을 변환(transform)하여 주파수 도메인 예측된 블록(predicted block)을 도출하고, 상기 주파수 도메인 예측된 블록 및 주파수 상관계수들을 기반으로 주파수 도메인 수정된(modified) 예측된 블록을 도출하고, 상기 주파수 도메인 수정된 예측된 블록을 역변환하여 수정된 예측된 블록을 생성하는 주파수 도메인 잡음제거부;

상기 레지듀얼 정보를 기반으로 레지듀얼 블록을 도출하는 레지듀얼 처리부; 및

상기 수정된 예측된 블록 및 상기 레지듀얼 블록을 기반으로 복원 블록을 생성하는 복원부를 포함함을 특징으로 하는, 영상 디코딩 장치.
제14항에 있어서,

상기 레지듀얼 처리부는 상기 레지듀얼 정보를 기반으로 양자화된 변환 계수들을 도출하고, 상기 양자화된 변환 계수들을 역양자화하여 변환 계수들을 도출하고, 상기 변환 계수들을 변환하여 도출된 레지듀얼 샘플들을 포함하는 상기 레지듀얼 블록을 도출하고,

상기 예측된 블록에 적용된 변환과 상기 변환 계수들에 적용된 변환은 동일한 변환 커널이 사용되는 것을 특징으로 하는, 영상 디코딩 장치.