KR20220163912A

KR20220163912A - 영상 복잡도에 기반한 적응적 부호화 및 복호화를 위한 방법 및 장치

Info

Publication number: KR20220163912A
Application number: KR1020220159946A
Authority: KR
Inventors: 고현석; 강정원; 김휘용; 임성창; 이진호; 전동산; 최진수
Original assignee: 한국전자통신연구원
Priority date: 2015-10-13
Filing date: 2022-11-25
Publication date: 2022-12-12
Also published as: KR102472462B1; KR20170043461A

Abstract

영상 복잡도에 기반한 적응적 부호화 및 복호화를 위한 방법 및 장치가 개시된다. 부호화 장치 및 복호화 장치는 대상 유닛의 영상 복잡도에 기반하여 대상 유닛의 타입을 결정한다. 부호화 장치 및 복호화 장치는 대상 유닛에 대해 결정된 타입에 따라서 대상 유닛에 대한 인터 예측을 수행한다. 대상 유닛의 타입은 정적 유닛 및 동적 유닛을 포함한다. 대상 유닛의 타입에 따라서, 대상 유닛의 분할의 최대 깊이가 결정되고, 대상 유닛에 대한 탐색 범위가 결정된다.

Description

영상 복잡도에 기반한 적응적 부호화 및 복호화를 위한 방법 및 장치 {METHOD AND APPARATUS FOR ADAPTIVE ENCODING AND DECODING BASED ON IMAGE COMPLEXITY}

아래의 실시예들은 영상의 복호화 방법, 복호화 장치, 부호화 방법 및 부호화 장치에 관한 것으로서, 보다 상세하게는 영상의 복잡도에 기반하여 부호화 및 복호화를 적응적으로 수행하는 방법 및 장치에 관한 것이다.

정보 통신 산업의 지속적인 발달을 통해 HD(High Definition) 해상도를 가지는 방송 서비스가 세계적으로 확산되었다. 이러한 확산을 통해, 많은 사용자들이 고해상도이며 고화질인 영상(image) 및/또는 비디오(video)에 익숙해지게 되었다.

높은 화질에 대한 사용자들의 수요를 만족시키기 위하여, 많은 기관들이 차세대 영상 기기에 대한 개발에 박차를 가하고 있다. 에이치디티브이(High Definition TV; HDTV) 및 풀에이치디(Full HD; FHD) TV뿐만 아니라, FHD TV에 비해 4배 이상의 해상도를 갖는 울트라에이치디(Ultra High Definition; UHD) TV에 대한 사용자들의 관심이 증대하였고, 이러한 관심의 증대에 따라, 더 높은 해상도 및 화질을 갖는 영상에 대한 영상 부호화(encoding)/복호화(decoding) 기술이 요구된다.

영상 부호화(encoding)/복호화(decoding) 장치 및 방법은 고해상도 및 고화질의 영상에 대한 부호화/복호화를 수행하기 위해, 인터(inter) 예측(prediction) 기술, 인트라(intra) 예측 기술 및 엔트로피 부호화 기술 등을 사용할 수 있다. 인터 예측 기술은 시간적으로(temporally) 이전의 픽쳐 및/또는 시간적으로 이후의 픽쳐를 이용하여 현재 픽쳐에 포함된 픽셀의 값을 예측하는 기술일 수 있다. 인트라 예측 기술은 현재 픽쳐 내의 픽셀의 정보를 이용하여 현재 픽쳐에 포함된 픽셀의 값을 예측하는 기술일 수 있다. 엔트로피 부호화 기술은 출현 빈도가 높은 심볼에는 짧은 코드(code)를 할당하고, 출현 빈도가 낮은 심볼에는 긴 코드를 할당하는 기술일 수 있다.

영상의 부호화 및 복호화에 있어서, 예측은 원본 신호와 유사한 예측 신호를 생성하는 것을 의미할 수 있다. 예측은 크게 공간적(spatial) 복원(reconstructed) 영상을 참조하는 예측, 시간적(temporal) 복원 영상을 참조하는 예측 및 그 밖의 심볼에 대한 예측으로 분류될 수 있다. 말하자면, 시간적 참조는 시간적 복원 영상을 참조하는 것을 의미할 수 있고, 공간적 참조는 공간적 복원 영상을 참조하는 것을 의미할 수 있다.

현재 블록은 현재 부호화 또는 복호화의 대상인 블록일 수 있다. 현재 블록은 대상 블록 또는 대상 유닛으로 명명될 수 있다. 부호화에 있어서, 현재 블록은 부호화 대상 블록 또는 부호화 대상 유닛으로 명명될 수 있다. 복호화에 있어서, 현재 블록은 복호화 대상 블록 또는 복호화 대상 유닛으로 명명될 수 있다.

인터(inter) 예측은 시간적 참조 및 공간적 참조를 사용하여 현재 블록을 예측하는 기술일 수 있다. 인트라(intra) 예측은 공간적 참조만을 사용하여 현재 블록을 예측하는 기술일 수 있다.

일반적으로, 다수의 영상들의 블록들의 인터 예측에 있어서, 동일한 인터 예측이 사용된다. 예를 들면, 현재 블록을 포함하는 영상의 영상 특성이 고려되지 않은 채, 동일한 인터 예측이 적용될 수 있다. 항상 동일한 인터 예측이 사용될 경우, 부호화 장치의 복잡도가 증가할 수 있고, 부호화의 효율이 저하될 수 있다. 특히, 정적 영역을 포함하는 코딩(coding) 유닛의 예측에 있어서, 필요 이상의 세분화된 블록들에 대해 인터 예측들이 수행될 경우, 부호화 장치로부터 복호화 장치로 전송되어야 하는 움직임 정보의 양이 증가할 수 있고, 움직임 정보의 양의 증가에 의해 부호화 효율이 저하될 수 있다.

일 실시예는 영상의 특성에 기반한 적응적 부호화 및 복호화를 수행하는 기술을 통해, 부호화 효율을 향상시키는 방법 및 장치를 제공할 수 있다.

일 실시예는 영상의 특성에 기반한 적응적 부호화 및 복호화를 수행하는 기술을 통해, 부호화 장치의 복잡도를 감소시키는 방법 및 장치를 제공할 수 있다.

일 실시예는 정적 영역으로 분류(classify)된 코딩 유닛이 쿼드트리(quadtree)에 기반하여 하위 유닛으로 분할되는 횟수를 제약하는 방법 및 장치를 제공할 수 있다.

일 실시예는 정적 영역으로 분류된 코딩 유닛이 하위 유닛으로 분할되는 횟수를 제약함으로써 코딩 유닛을 보다 큰 크기의 유닛으로서 부호화하는 방법 및 장치를 제공할 수 있다.

일 실시예는 정적 영역으로 분류된 코딩 유닛을 보다 큰 크기의 유닛으로서 부호화함으로써 부호화 장치의 복잡도를 감소시키는 방법 및 장치를 제공할 수 있다.

일 실시예는 정적 영역으로 분류된 코딩 유닛을 보다 큰 크기의 유닛으로서 부호화함으로써 부호화 장치로부터 복호화 장치로 전송되는 움직임 정보의 양을 감소시키는 방법 및 장치를 제공할 수 있다.

일 실시예는, 정적 유닛 및 인접한 이웃 블록 간의 상관도(correlation)가 높다는 가정 하에서, 움직임 벡터의 비트 정밀도(bit precision) 및 탐색 영역(search range)을 감소시키는 방법 및 장치를 제공할 수 있다.

일 실시예는 움직임 벡터의 비트 정밀도 및 탐색 영역을 감소시킴으로써 부호화 효율을 향상시키고, 부호화 장치의 복잡도를 감소시키는 방법 및 장치를 제공할 수 있다.

일 측에 있어서, 대상 유닛의 영상 복잡도에 기반하여 대상 유닛의 타입을 결정하는 단계; 및 상기 결정된 타입에 따라서 상기 대상 유닛에 대한 인터 예측을 수행하는 단계를 포함하는 대상 유닛에 대한 인터 예측 방법이 제공된다.

영상의 특성에 기반한 적응적 부호화 및 복호화를 수행하는 기술을 통해, 부호화 효율을 향상시키는 방법 및 장치가 제공된다.

영상의 특성에 기반한 적응적 부호화 및 복호화를 수행하는 기술을 통해, 부호화 장치의 복잡도를 감소시키는 방법 및 장치가 제공된다.

정적 영역으로 분류(classify)된 코딩 유닛이 쿼드크리(quadtree)에 기반하여 하위 유닛으로 분할되는 횟수를 제약하는 방법 및 장치가 제공된다.

정적 영역으로 분류된 코딩 유닛이 하위 유닛으로 분할되는 횟수를 제약함으로써 코딩 유닛을 보다 큰 크기의 유닛으로서 부호화하는 방법 및 장치를 제공가 제공된다.

정적 영역으로 분류된 코딩 유닛을 보다 큰 크기의 유닛으로서 부호화함으로써 부호화 장치의 복잡도를 감소시키는 방법 및 장치가 제공된다.

정적 영역으로 분류된 코딩 유닛을 보다 큰 크기의 유닛으로서 부호화함으로써 부호화 장치로부터 복호화 장치로 전송되는 움직임 정보의 양을 감소시키는 방법 및 장치가 제공된다.

정적 유닛 및 인접한 이웃 블록 간의 상관도(correlation)가 높다는 가정 하에서, 움직임 벡터의 비트 정밀도(bit precision) 및 탐색 영역(search range)을 감소시키는 방법 및 장치가 제공된다.

움직임 벡터의 비트 정밀도 및 탐색 영역를 감소시킴으로써 부호화 효율을 향상시키고, 부호화 장치의 복잡도를 감소시키는 방법 및 장치가 제공된다.

도 1은 본 발명이 적용되는 부호화 장치의 일 실시예에 따른 구성을 나타내는 블록도이다.
도 2는 본 발명이 적용되는 복호화 장치의 일 실시예에 따른 구성을 나타내는 블록도이다.
도 3은 영상을 부호화 및 복호화할 때의 영상의 분할 구조를 개략적으로 나타내는 도면이다.
도 4a 내지 도 7h는 코딩 유닛(CU)이 포함할 수 있는 예측 유닛(PU)의 형태를 도시한 도면이다.
도 5는 코딩 유닛(CU)에 포함될 수 있는 변환 유닛(TU)의 형태를 도시한 도면이다.
도 6은 인트라 예측 과정의 실시예를 설명하기 위한 도면이다.
도 7은 인터 예측 과정의 실시예를 설명하기 위한 도면이다.
도 8은 일 실시예에 따른 인터 예측 방법의 흐름도이다.
도 9는 일 예에 따른 현재 픽쳐 및 참조 픽쳐의 차분 영상을 나타낸다.
도 10은 일 예에 따른 대상 유닛 및 복원된 이웃 유닛들의 타입 플래그들을 나타낸다.
도 11은 일 실시예에 따른 부호화 장치 및/또는 복호화 장치를 구현하는 전자 장치의 구조도이다.

후술하는 예시적 실시예들에 대한 상세한 설명은, 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 실시예를 실시할 수 있기에 충분하도록 상세히 설명된다. 다양한 실시예들은 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 실시예의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 예시적 실시예들의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다.

도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다. 도면에서의 요소들의 형상 및 크기 등은 보다 명확한 설명을 위해 과장될 수 있다.

어떤 구성요소(component)가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 상기의 2개의 구성요소들이 서로 간에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있으나, 상기의 2개의 구성요소들의 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 또한, 예시적 실시예들에서 특정 구성을 "포함"한다고 기술하는 내용은 상기의 특정 구성 이외의 구성을 배제하는 것이 아니며, 추가적인 구성이 예시적 실시예들의 실시 또는 예시적 실시예들의 기술적 사상의 범위에 포함될 수 있음을 의미한다.

제1 및 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기의 구성요소들은 상기의 용어들에 의해 한정되어서는 안 된다. 상기의 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하여 지칭하기 위해서 사용된다. 예를 들어, 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.

또한 실시예들에 나타나는 구성요소들은 서로 다른 특징적인 기능들을 나타내기 위해 독립적으로 도시되는 것으로, 각 구성요소가 분리된 하드웨어나 하나의 소프트웨어 구성 단위로만 이루어짐을 의미하지 않는다. 즉, 각 구성요소는 설명의 편의상 각각의 구성요소로 나열된 것이다. 예를 들면, 구성요소들 중 적어도 두 개의 구성요소들이 하나의 구성요소로 합쳐질 수 있다. 또한, 하나의 구성요소가 복수의 구성요소들로 나뉠 수 있다. 이러한 각 구성요소의 통합된 실시예 및 분리된 실시예 또한 본질에서 벗어나지 않는 한 권리범위에 포함된다.

또한, 일부의 구성요소는 본질적인 기능을 수행하는 필수적인 구성요소는 아니고 단지 성능을 향상시키기 위한 선택적 구성요소일 수 있다. 실시예들은 실시예의 본질을 구현하는데 필수적인 구성부만을 포함하여 구현될 수 있고, 예를 들면, 단지 성능 향상을 위해 사용되는 구성요소와 같은, 선택적 구성요소가 제외된 구조 또한 권리 범위에 포함된다.

이하에서는, 기술분야에서 통상의 지식을 가진 자가 실시예들을 용이하게 실시할 수 있도록 하기 위하여, 첨부된 도면을 참조하여 실시예들을 상세히 설명하기로 한다. 실시예들을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 명세서의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.

이하에서, 영상은 비디오(video)을 구성하는 하나의 픽쳐를 의미할 수 있으며, 비디오 자체를 나타낼 수도 있다. 예를 들면, "영상의 부호화 및/또는 복호화"는 "비디오의 부호화 및/또는 복호화"를 의미할 수 있으며, "비디오를 구성하는 영상들 중 하나의 영상의 부호화 및/또는 복호화"를 의미할 수도 있다.

우선, 실시예들에서 사용되는 용어를 설명한다.

유닛(unit): "유닛"은 영상의 부호화 및 복호화의 단위를 나타낼 수 있다. 유닛 및 블록(block)의 의미들은 동일할 수 있다. 또한, 용어 "유닛" 및 "블록"은 서로 교체되어 사용될 수 있다.

유닛(또는, 블록)은 샘플의 MxN 배열일 수 있다. M 및 N은 각각 양의 정수일 수 있다. 유닛은 흔히 2차원의 샘플의 배열을 의미할 수 있다. 샘플은 픽셀 또는 픽셀 값일 수 있다.

영상의 부호화 및 복호화에 있어서, 유닛은 하나의 영상의 분할에 의해 생성된 영역일 수 있다. 하나의 영상은 복수의 유닛들로 분할될 수 있다. 영상의 부호화 및 복호화에 있어서, 유닛의 종류에 따라서 유닛에 대한 기정의된 처리가 수행될 수 있다. 기능에 따라서, 유닛의 타입은 매크로 유닛(Macro Unit), 코딩 유닛(Coding Unit; CU), 예측 유닛(Prediction Unit; PU) 및 변환 유닛(transform Unit; TU) 등으로 분류될 수 있다. 하나의 유닛은 유닛에 비해 더 작은 크기를 갖는 하위 유닛으로 더 분할될 수 있다.

블록 분할 정보는 유닛의 깊이(depth)에 관한 정보를 포함할 수 있다. 깊이 정보는 유닛이 분할되는 회수 및/또는 정도를 나타낼 수 있다.

하나의 유닛은 트리 구조(tree structure)에 기반하여 깊이 정보(depth)를 가지면서 계층적으로 복수의 하위 유닛들로 분할될 수 있다. 말하자면, 유닛 및 상기의 유닛의 분할에 의해 생성된 하위 유닛은 노드 및 상기의 노드의 자식 노드에 각각 대응할 수 있다. 각각의 분할된 하위 유닛은 깊이 정보를 가질 수 있다. 유닛의 깊이 정보는 유닛이 분할된 회수 및/또는 정도를 나타내므로, 하위 유닛의 분할 정보는 하위 유닛의 크기에 관한 정보를 포함할 수도 있다.

트리 구조에서, 가장 상위 노드는 분할되지 않은 최초의 유닛에 대응할 수 있다. 가장 상위 노드는 루트 노드(root node)로 칭해질 수 있다. 또한, 가장 상위 노드는 최소의 깊이 값을 가질 수 있다. 이 때, 가장 상위 노드는 레벨 0의 깊이를 가질 수 있다.

레벨 1의 깊이를 갖는 노드는 최초의 유닛이 한 번 분할됨에 따라 생성된 유닛을 나타낼 수 있다. 레벨 2의 깊이를 갖는 노드는 최초의 유닛이 두 번 분할됨에 따라 생성된 유닛을 나타낼 수 있다.

레벨 n의 깊이를 갖는 노드는 최초의 유닛이 n번 분할됨에 따라 생성된 유닛을 나타낼 수 있다.

리프 노드는 가장 하위의 노드일 수 있으며, 더 분할될 수 없는 노드일 수 있다. 리프 노드의 깊이는 최대 레벨일 수 있다. 예를 들면, 최대 레벨의 기정의된 값은 3일 수 있다.

변환 유닛(Transform Unit): 변환 유닛은 변환, 역변환, 양자화, 역양자화, 변환 계수 부호화, 및 변환 계수 복호화 등과 같은 잔차 신호(residual signal) 부호화 및/또는 잔여 신호 복호화에 있어서의 기본 유닛일 수 있다. 하나의 변환 유닛은 더 작은 크기를 갖는 다수의 변환 유닛들 분할될 수 있다.

예측 유닛(Prediction Unit) : 예측 유닛은 예측 또는 보상(compensation)의 수행에 있어서의 기본 단위일 수 있다. 예측 유닛은 분할에 의해 다수의 파티션(partition)들이 될 수 있다. 다수의 파티션들 또한 예측 또는 보상의 수행에 있어서의 기본 단위일 수 있다. 예측 유닛의 분할에 의해 생성된 파티션 또한 예측 유닛일 수 있다.

복원된 이웃 유닛(Reconstructed Neighbor Unit) : 복원된 이웃 유닛은 부호화 대상 유닛 또는 복호화 대상 유닛의 주변에 이미 부호화 또는 복호화되어 복원된 유닛일 수 있다. 복원된 이웃 유닛은 대상 유닛에 대한 공간적(spatial) 인접 유닛 또는 시간적(temporal) 인접 유닛일 수 있다.

예측 유닛 파티션 : 예측 유닛 파티션은 예측 유닛이 분할된 형태를 의미할 수 있다.

파라미터 세트(Parameter Set): 파라미터 세트는 비트스트림 내의 구조(structure) 중 헤더(header) 정보에 해당할 수 있다. 예를 들면, 파라미터 세트는 시퀀스 파라미터 세트(sequence parameter set), 픽쳐 파라미터 세트(picture parameter set) 및 적응 파라미터 세트(adaptation parameter set) 등을 포함할 수 있다.

율왜곡 최적화(ratedistortion optimization): 부호화 장치는 코딩 유닛의 크기, 예측 모드, 예측 유닛의 크기, 움직임 정보 및, 변환 유닛의 크기 등의 조합을 이용해서 높은 부호화 효율을 제공하기 위해 율왜곡 최적화를 사용할 수 있다.

율왜곡 최적화 방식은 상기의 조합들 중에서 최적의 조합을 선택하기 위해 각 조합의 율왜곡 비용(ratedistortion cost)을 계산할 수 있다. 율왜곡 비용은 아래의 수학식 1을 이용하여 계산될 수 있다. 일반적으로 상기 율왜곡 비용이 최소가 되는 조합이 율왜곡 최적화 방식에 있어서의 최적의 조합으로 선택될 수 있다.

D는 왜곡을 나타낼 수 있다. D는 변환 블록 내에서 원래의 변환 계수들 및 복원된 변환 계수들 간의 차이 값들의 제곱들의 평균(mean square error)일 수 있다.

R은 율을 나타낼 수 있다. R은 관련된 문맥 정보를 이용한 비트 율을 나타낼 수 있다.

λ는 라그랑지안 승수(Lagrangian multiplier)를 나타낼 수 있다. R은 예측 모드, 움직임 정보 및 부호화 블록 플래그(coded block flag) 등과 같은 부호화 파라미터 정보뿐만 아니라, 변환 계수의 부호화에 의해 발생하는 비트도 포함할 수 있다.

부호화 장치는 정확한 D 및 R을 계산하기 위해 인터 예측 및/또는 인트라 예측, 변환, 양자화, 엔트로피 부호화, 역양자화, 역변환 등의 과정을 수행하는데, 이러한 과정은 부호화 장치에서의 복잡도를 크게 증가시킬 수 있다.

참조 픽쳐(reference picture) : 참조 픽쳐는 인터 예측 또는 움직임 보상에 사용되는 영상일 수 있다. 참조 픽쳐는 인터 예측 또는 움직임 보상을 위해 대상 유닛이 참조하는 참조 유닛을 포함하는 픽쳐일 수 있다. 픽쳐 및 영상의 의미들은 동일할 수 있다. 또한, 용어 "픽쳐" 및 "영상"은 서로 교체되어 사용될 수 있다.

참조 픽쳐 리스트(reference picture list) : 참조 픽쳐 리스트는 인터 예측 또는 움직임 보상에 사용되는 참조 영상들을 포함하는 리스트일 수 있다. 참조 픽쳐 리스트의 종류는 리스트 조합(List Combined; LC), 리스트 0(List 0; L0) 및 리스트 1(List 1; L1) 등이 있을 수 있다.

움직임 벡터(Motion Vector; MV) : 움직임 벡터는 인터 예측에서 사용되는 2차원의 벡터일 수 있다. 예를 들면, MV는 (mv_x, mv_y)와 같은 형태로 표현될 수 있다. mv_x는 수평(horizontal) 성분을 나타낼 수 있고, mv_y 는 수직(vertical) 성분을 나타낼 수 있다.

MV는 대상 픽쳐 및 참조 픽쳐 간의 오프셋(offset)을 나타낼 수 있다.

탐색 영역(search range) : 탐색 영역은 인터 예측 중 MV에 대한 탐색이 이루어지는 2차원의 영역일 수 있다. 예를 들면, 탐색 영역의 크기는 MxN일 수 있다. M 및 N은 각각 양의 정수일 수 있다.

도 1은 본 발명이 적용되는 부호화 장치의 일 실시예에 따른 구성을 나타내는 블록도이다.

부호화 장치(100)는 비디오 부호화 장치 또는 영상 부호화 장치일 수 있다. 비디오는 하나 이상의 영상들을 포함할 수 있다. 부호화 장치(110)는 비디오의 하나 이상의 영상들을 시간에 따라 순차적으로 부호화할 수 있다.

도 1을 참조하면, 부호화 장치(100)는 인터 예측부(110), 인트라 예측부(120), 스위치(115), 감산기(125), 변환부(130), 양자화부(140), 엔트로피 부호화부(150), 역양자화부(160), 역변환부(170), 가산기(175), 필터부(180) 및 참조 픽쳐 버퍼(190)를 포함할 수 있다.

부호화 장치(100)는 입력 영상에 대해 인트라 모드 및/또는 인터 모드로 부호화를 수행할 수 있다. 입력 영상은 현재 부호화의 대상인 현재 영상으로 칭해질 수 있다.

또한, 부호화 장치(100)는 입력 영상에 대한 부호화를 통해 부호화의 정보를 포함하는 비트스트림을 생성할 수 있고, 생성된 비트스트림을 출력할 수 있다.

인트라 모드가 사용되는 경우, 스위치(115)는 인트라로 전환될 수 있다. 인터 모드가 사용되는 경우, 스위치(115)는 인터로 전환될 수 있다.

부호화 장치(100)는 입력 영상의 입력 블록에 대한 예측 블록을 생성할 수 있다. 또한, 부호화 장치(100)는 예측 블록이 생성된 후, 입력 블록 및 예측 블록의 차분(residual)을 부호화할 수 있다. 입력 블록은 현재 부호화의 대상인 현재 블록으로 칭해질 수 있다.

예측 모드가 인트라 모드인 경우, 인트라 예측부(120)는 현재 블록의 주변에 있는, 이미 부호화된 블록의 픽셀 값을 참조 픽셀로서 이용할 수 있다. 인트라 예측부(120)는 참조 픽셀을 이용하여 현재 블록에 대한 공간적 예측을 수행할 수 있고, 공간적 예측을 통해 현재 블록에 대한 예측 샘플들을 생성할 수 있다.

인터 예측부(110)는 움직임 예측부 및 움직임 보상부를 포함할 수 있다.

예측 모드가 인터 모드인 경우, 움직임 예측부는, 움직임 예측 과정에서 참조 영상으로부터 현재 블록과 가장 매치가 잘 되는 영역을 검색할 수 있고, 현재 블록 및 검색된 영역에 대한 움직임 벡터를 도출할 수 있다. 참조 영상은 참조 픽쳐 버퍼(190)에 저장될 수 있으며, 참조 영상에 대한 부호화 및/또는 복호화가 처리될 때 참조 픽쳐 버퍼(190)에 저장될 수 있다.

움직임 보상부는 움직임 벡터를 이용하는 움직임 보상을 수행함으로써 예측 블록을 생성할 수 있다. 여기에서, 움직임 벡터는 인터 예측에 사용되는 2차원 벡터일 수 있다. 또한 움직임 벡터는 현재 영상 및 참조 영상 간의 오프셋(offset)을 나타낼 수 있다.

감산기(125)는 입력 블록 및 예측 블록의 차분인 잔차 블록(residual block)을 생성할 수 있다. 잔차 블록은 잔차 신호로 칭해질 수도 있다.

변환부(130)는 잔차 블록에 대해 변환(transform)을 수행하여 변환 계수를 생성할 수 있고, 생성된 변환 계수(transform coefficient)를 출력할 수 있다. 여기서, 변환 계수는 잔차 블록에 대한 변환을 수행함으로써 생성된 계수 값일 수 있다. 변환 생략(transform skip) 모드가 적용되는 경우, 변환부(130)는 잔차 블록에 대한 변환을 생략할 수도 있다.

변환 계수에 양자화를 적용함으로써 양자화된 변환 계수 레벨(transform coefficient level)이 생성될 수 있다. 이하, 실시예들에서는 양자화된 변환 계수 레벨도 변환 계수로 칭해질 수 있다.

양자화부(140)는 변환 계수를 양자화 파라미터에 맞춰 양자화함으로써 양자화된 변환 계수 레벨(quantized transform coefficient level)을 생성할 수 있다. 양자화부(140)는 생성된 양자화된 변환 계수 레벨을 출력할 수 있다. 이때, 양자화부(140)에서는 양자화 행렬을 사용하여 변환 계수를 양자화할 수 있다.

엔트로피 부호화부(150)는, 양자화부(140)에서 산출된 값들 및/또는 부호화 과정에서 산출된 부호화 파라미터 값들 등에 기초하여 확률 분포에 따른 엔트로피 부호화를 수행함으로써 비트스트림(bitstream)을 생성할 수 있다. 엔트로피 부호화부(150)는 생성된 비트스트림을 출력할 수 있다.

엔트로피 부호화부(150)는 영상의 픽셀의 정보 외에 영상의 복호화를 위한 정보에 대한 엔트로피 부호화를 수행할 수 있다. 예를 들면, 영상의 복호화를 위한 정보는 신택스 엘리먼트(syntax element) 등을 포함할 수 있다.

부호화 파라미터는 부호화 및/또는 복호화를 위해 요구되는 정보일 수 있다. 부호화 파라미터는 부호화 장치에서 부호화되어 복호화 장치로 전달되는 정보를 포함할 수 있고, 부호화 혹은 복호화 과정에서 유추될 수 있는 정보를 포함할 수 있다. 예를 들면, 복호화 장치로 전달되는 정보로서, 신택스 엘리먼트가 있다.

예를 들면, 부호화 파라미터는 예측 모드, 움직임 벡터, 참조 픽쳐 색인(index), 부호화 블록 패턴(pattern), 잔차 신호 유무, 변환 계수, 양자화된 변환 계수, 양자화 파라미터, 블록 크기, 블록 분할(partition) 정보 등의 값 또는 통계를 포함할 수 있다. 예측 모드는 인트라 예측 모드 또는 인터 예측 모드를 가리킬 수 있다.

잔차 신호는 원 신호 및 예측 신호 간의 차이(difference)를 의미할 수 있다. 또는, 잔차 신호는 원신호 및 예측 신호 간의 차이를 변환(transform)함으로써 생성된 신호일 수 있다. 또는, 잔차 신호는 원 신호 및 예측 신호 간의 차이를 변환 및 양자화함으로써 생성된 신호일 수 있다. 잔차 블록은 블록 단위의 잔차 신호일 수 있다.

엔트로피 부호화가 적용되는 경우, 높은 발생 확률을 갖는 심볼에 적은 수의 비트가 할당될 수 있고, 낮은 발생 확률을 갖는 심볼에 많은 수의 비트가 할당될 수 있다. 이러한 할당을 통해 심볼이 표현됨에 따라, 부호화의 대상인 심볼들에 대한 비트열(bitstring)의 크기가 감소될 수 있다. 따라서, 엔트로피 부호화를 통해서 영상 부호화의 압축 성능이 향상될 수 있다.

또한, 엔트로피 부호화를 위해 지수 골롬(exponential golomb), 문맥적응형 가변 길이 코딩(ContextAdaptive Variable Length Coding; CAVLC) 및 문맥적응형 이진 산술 코딩(ContextAdaptive Binary Arithmetic Coding; CABAC) 등과 같은 부호화 방법이 사용될 수 있다. 예를 들면, 엔트로피 부호화부(150)는 가변 길이 부호화(Variable Lenghth Coding/Code; VLC) 테이블을 이용하여 엔트로피 부호화를 수행할 수 있다. 예를 들면, 엔트로피 부호화부(150)는 대상 심볼에 대한 이진화(binarization) 방법을 도출할 수 있다. 또한, 엔트로프 부호화부(150)는 대상 심볼/빈(bin)의 확률 모델(probability model)을 도출할 수 있다. 엔트로피 부호화부(150)는 도출된 이진화 방법 또는 확률 모델을 사용하여 엔트로피 부호화를 수행할 수도 있다.

부호화 장치(100)에 의해 인터 예측을 통한 부호화를 수행되기 때문에, 부호화된 현재 영상은 이후에 처리되는 다른 영상(들)에 대하여 참조 영상으로서 사용될 수 있다. 따라서, 부호화 장치(100)는 부호화된 현재 영상을 다시 복호화할 수 있고, 복호화된 영상을 참조 영상으로서 저장할 수 있다. 복호화를 위해 부호화된 현재 영상에 대한 역양자화 및 역변환이 처리될 수 있다.

양자화된 계수는 역양자화부(160)에서 역양자화될(inversely quantized) 수 있고. 역변환부(170)에서 역변환될(inversely transformed) 수 있다. 역양자화 및 역변환된 계수는 가산기(175)를 통해 예측 블록과 합해질 수 있다, 역양자화 및 역변환된 계수 및 예측 블록을 합함으로써 복원(reconstructed) 블록이 생성될 수 있다.

복원 블록은 필터부(180)를 거칠 수 있다. 필터부(180)는 디블록킹 필터(deblocking filter), 에스에이오(Sample Adaptive Offset; SAO), 에이엘어프(Adaptive Loop Filter; ALF) 중 적어도 하나 이상을 복원 블록 또는 복원 픽쳐에 적용할 수 있다. 필터부(180)는 적응적(adaptive) 인루프(inloop) 필터로 칭해질 수도 있다.

디블록킹 필터는 블록들 간의 경계에서 발생한 블록 왜곡을 제거할 수 있다. SAO는 코딩 에러에 대한 보상을 위해 픽셀 값에 적정 오프셋(offset) 값을 더할 수 있다. ALF는 복원 영상 및 원래의 영상을 비교한 값에 기반하여 필터링을 수행할 수 있다. 필터부(180)를 거친 복원 블록은 참조 픽쳐 버퍼(190)에 저장될 수 있다.

도 2는 본 발명이 적용되는 복호화 장치의 일 실시예에 따른 구성을 나타내는 블록도이다.

복호화 장치(200)는 비디오 복호화 장치 또는 영상 복호화 장치일 수 있다.

도 2를 참조하면, 복호화 장치(200)는 엔트로피 복호화부(210), 역양자화부(220), 역변환부(230), 인트라 예측부(240), 인터 예측부(250), 가산기(255), 필터부(260) 및 참조 픽쳐 버퍼(270)를 포함할 수 있다.

복호화 장치(200)는 부호화 장치(100)에서 출력된 비트스트림을 수신할 수 있다. 복호화 장치(200)는 비트스트림에 대하여 인트라 모드 및/또는 인터 모드의 복호화를 수행할 수 있다. 또한, 복호화 장치(200)는 복호화를 통해 복원 영상을 생성할 수 있고, 생성된 복원 영상을 출력할 수 있다.

예를 들면, 복호화에 사용되는 예측 모드에 따른 인트라 모드 또는 인터 모드로의 전환은 스위치에 의해 이루어질 수 있다. 복호화에 사용되는 예측 모드가 인트라 모드인 경우 스위치가 인트라로 전환될 수 있다. 복호화에 사용되는 예측 모드가 인터 모드인 경우 스위치가 인터로 전환될 수 있다.

복호화 장치(200)는 입력된 비트스트림으로부터 복원된 잔차 블록(reconstructed residual block)을 획득할 수 있고, 예측 블록을 생성할 수 있다. 복원된 잔차 블록 및 예측 블록이 획득되면, 복호화 장치(200)는 복원된 잔차 블록과 및 예측 블록을 더함으로써 복원 블록을 생성할 수 있다.

엔트로피 복호화부(210)는 확률 분포에 기초하여 비트스트림에 대한 엔트로피 복호화를 수행함으로써 심볼들을 생성할 수 있다. 생성된 심볼들은 양자화된 계수(quantized coefficient) 형태의 심볼을 포함할 수 있다. 여기에서, 엔트로피 복호화 방법은 상술된 엔트로피 부호화 방법과 유사할 수 있다. 예를 들면, 엔트로피 복호화 방법은 상술된 엔트로피 부호화 방법의 역과정일 수 있다.

양자화된 계수는 역양자화부(220)에서 역양자화될 수 있다. 또한, 역양자화된 계수는 역변환부(230)에서 역변환될 수 있다. 양자화된 계수가 역양자화 및 역변환 된 결과로서, 복원된 잔차 블록이 생성될 수 있다. 이때, 역양자화부(220)는 양자화된 계수에 양자화 행렬을 적용할 수 있다.

인트라 모드가 사용되는 경우, 인트라 예측부(240)는 현재 블록 주변의 이미 부호화된 블록의 픽셀 값을 이용하는 공간적 예측을 수행함으로써 예측 블록을 생성할 수 있다.

인터 예측부(250)는 움직임 보상부를 포함할 수 있다. 인터 모드가 사용되는 경우, 움직임 보상부는 움직임 벡터 및 참조 영상을 이용하는 움직임 보상을 수행함으로써 예측 블록을 생성할 수 있다. 참조 영상은 참조 픽쳐 버퍼(270)에 저장될 수 있다.

복원된 잔차 블록 및 예측 블록은 가산기(255)를 통해 더해질 수 있다. 가산기(255)는 복원된 잔차 블록 및 예측 블록을 더함으로써 복원 블록을 생성할 수 있다.

복원 블록은 필터부(260)를 거칠 수 있다. 필터부(260)는 디블록킹 필터, SAO 및 ALF 중 적어도 하나 이상을 복원 블록 또는 복원 픽쳐에 적용할 수 있다. 필터부(260)는 복원 영상을 출력할 수 있다. 복원 영상은 참조 픽쳐 버퍼(270)에 저장되어 인터 예측에 사용될 수 있다.

도 3은 영상을 부호화 및 복호화할 때의 영상의 분할 구조를 개략적으로 나타내는 도면이다.

영상을 효율적으로 분할하기 위해, 부호화 및 복호화에 있어서, 코딩 유닛(Coding Unit; CU)이 사용될 수 있다. 유닛은 1) 영상 샘플들을 포함하는 블록 및 2) 구문 요소(syntax element)을 합쳐서 지칭하는 용어일 수 있다. 예를 들면, "유닛의 분할"은 "유닛에 해당하는 블록의 분할"을 의미할 수 있다.

도 3을 참조하면, 영상(300)은 최대 코딩 유닛(Largest Coding Unit; LCU)의 단위로 순차적으로 분할될 수 있고, 영상(300)의 분할 구조는 LCU에 따라서 결정될 수 있다. 여기서, LCU는 코딩 트리 유닛(Coding Tree Unit; CTU)과 동일한 의미로 사용될 수 있다.

분할 구조는 LCU(310) 내에서의, 영상을 효율적으로 부호화하기 위한, 코딩 유닛(Coding Unit; CU)의 분포를 의미할 수 있다. 이러한 분포는 하나의 CU를 4개의 CU들로 분할할지 여부에 따라 결정될 수 있다. 분할에 의해 생성된 CU의 가로 크기 및 세로 크기는 각각 분할 전의 CU의 가로 크기의 절반 및 세로 크기의 절반일 수 있다. 분할된 CU는 동일한 방식으로 가로 크기 및 세로 크기가 절반으로 감소된 4개의 CU로 재귀적으로 분할될 수 있다.

이때, CU의 분할은 기정의된 깊이까지 재귀적으로 이루어질 수 있다. 깊이 정보는 CU의 크기를 나타내는 정보일 수 있다. 각 CU 별로 깊이 정보가 저장될 수 있다. 예컨대, LCU의 깊이는 0일 수 있고, 최소 코딩 유닛(Smallest Coding Unit; SCU)의 깊이는 기정의된 최대 깊이일 수 있다. 여기서, LCU는 상술된 것과 같이 최대의 코딩 유닛 크기를 가지는 CU일 수 있고, SCU는 최소의 코딩 유닛 크기를 가지는 CU일 수 있다.

LCU(310)로부터 분할이 시작될 수 있고, 분할에 의해 CU의 가로 크기 및 세로 크기가 절반으로 줄어들 때마다 CU의 깊이는 1씩 증가할 수 있다. 각각의 깊이 별로, 분할되지 않는 CU는 2Nx2N 크기를 가질 수 있다. 또한, 분할되는 CU의 경우, 2Nx2N 크기의 CU가 NxN 크기를 가지는 4개의 CU들로 분할될 수 있다. N의 크기는 깊이가 1씩 증가할 때마다 절반으로 감소할 수 있다.

도 3을 참조하면, 깊이가 0인 LCU는 64x64 픽셀들일 수 있다. 0은 최소 깊이일 수 있다. 깊이가 3인 SCU는 8x8 픽셀들일 수 있다. 3은 최대 깊이일 수 있다. 이때, LCU인 64x64 픽셀들의 CU는 깊이 0으로 표현될 수 있다. 32x32 픽셀들의 CU는 깊이 1로 표현될 수 있다. 16x16 픽셀들의 CU는 깊이 2로 표현될 수 있다. SCU인 8x8 픽셀들의 CU는 깊이 3으로 표현될 수 있다.

또한, CU가 분할되는지 여부에 대한 정보는 CU의 분할 정보를 통해 표현될 수 있다. 분할 정보는 1비트의 정보일 수 있다. SCU를 제외한 모든 CU는 분할 정보를 포함할 수 있다. 예를 들면, CU가 분할되지 않는 경우 CU의 분할 정보의 값은 0일 수 있고, CU가 분할되는 경우 CU의 분할 정보의 값은 1일 수 있다.

도 4a 내지 도 4h는 코딩 유닛(CU)이 포함할 수 있는 예측 유닛(PU)의 형태를 도시한 도면이다.

LCU로부터 분할된 CU 중 더 이상 분할되지 않는 CU는 하나 이상의 예측 유닛(Prediction Unit; PU)들로 분할될 수 있다. 이러한 분할 또한, 파티션(partition)로 칭해질 수 있다.

PU는 예측에 대한 기본 단위일 수 있다. PU는 스킵(skip) 모드, 인터 모드 및 인트라 모드 중 어느 하나로 부호화 및 복호화될 수 있다. PU는 각 모드에 따라서 다양한 형태로 분할될 수 있다.

도 4a에서 도시된 것과 같이, 스킵 모드에서는, CU 내에 분할이 존재하지 않을 수 있다. 스킵 모드에서는 분할 없이 PU 및 CU의 크기들이 동일한 2Nx2N 모드(410)가 지원될 수 있다.

인터 모드에서는, CU 내에서 8가지로 분할된 형태들이 지원될 수 있다. 예를 들면, 인터 모드에서는 2Nx2N 모드(410), 2NxN 모드(415), Nx2N 모드(420), NxN 모드(425), 2NxnU 모드(430), 2NxnD 모드(435), nLx2N 모드(440) 및 nRx2N 모드(445)가 지원될 수 있다.

인트라 모드에서는, 2Nx2N 모드(410) 및 NxN 모드(425)가 지원될 수 있다.

도 5는 코딩 유닛(CU)에 포함될 수 있는 변환 유닛(TU)의 형태를 도시한 도면이다.

변환 유닛(Transform Unit; TU)은 CU 내에서 변환, 양자화, 역변환 및 역양자화의 과정을 위해 사용되는 기본 단위일 수 있다. TU는 정사각형 형태 또는 직사각형 형태를 가질 수 있다.

LCU로부터 분할된 CU 중, 더 이상 CU들로 분할되지 않는 CU는 하나 이상의 TU들로 분할될 수 있다. 이때, TU의 분할 구조는 쿼드트리(quadtree) 구조일 수 있다. 예컨대, 도 5에서 도시된 것과 같이, 하나의 CU(510)가 쿼드트리 구조에 따라서 한 번 혹은 그 이상 분할될 수 있다. 분할을 통해, 하나의 CU(510)는 다양한 크기의 TU들로 구성될 수 있다.

도 6은 인트라 예측 과정의 실시예를 설명하기 위한 도면이다.

인트라 예측 모드의 개수는 예측 유닛의 크기에 관계없이 35개로 고정될 수 있다.

예측 모드는 도 6에서 도시된 것과 같이 2개의 비방향성 모드들 및 33개의 방향성 모드들을 포함할 수 있다. 2개의 비방향성 모드들은 디씨(DC) 모드 및 플레너(Planar) 모드를 포함할 수 있다.

예측 모드의 개수는 색 성분(color component)의 타입에 따라 상이할 수 있다. 예를 들면, 색 성분이 휘도(luma) 신호인지 아니면 색차(chroma) 신호인지에 따라 예측 모드의 개수가 다를 수 있다.

PU는 NxN의 크기 또는 2Nx2N의 크기를 갖는, 정사각형 형태를 가질 수 있다. NxN의 크기는 4x4, 8x8, 16x16, 32x32 및 64x64 등을 포함할 수 있다. PU의 단위는 CU, PU 및 TU 중 적어도 하나의 크기일 수 있다.

인트라 부호화 및/또는 복호화는 주변의 복원된 유닛에 포함되는 샘플 값 또는 부호화 파라미터를 이용하여 수행될 수 있다.

도 7은 인터 예측 과정의 실시예를 설명하기 위한 도면이다.

도 7에 도시된 사각형은 영상(또는, 픽쳐)를 나타낼 수 있다. 또한, 도 7에서 화살표는 예측 방향을 나타낼 수 있다. 즉, 영상은 예측 방향에 따라 부호화 및/또는 복호화될 수 있다.

각 영상(또는, 픽쳐)는 부호화 타입에 따라 I 픽쳐(Intra Picture), P 픽쳐(Uniprediction Picture), B 픽쳐(Biprediction Picture)로 분류될 수 있다. 각 픽쳐는 각 픽쳐의 부호화 타입에 따라 부호화될 수 있다.

부호화의 대상인 영상이 I 픽쳐인 경우, 영상은 인터 예측 없이 영상 자체에 대해 부호화될 수 있다. 부호화의 대상인 영상이 P 픽쳐인 경우, 영상은 순방향으로만 참조 픽쳐을 이용하는 인터 예측을 통해 부호화될 수 있다. 부호화의 대상인 영상이 B 픽쳐인 경우, 순방향 및 역방향의 양측으로 참조 픽쳐들을 이용하는 인터 예측을 통해 부호화될 수 있으며, 순방향 및 역방향 중 일 방향으로 참조 픽쳐를 이용하는 인터 예측을 통해 부호화될 수 있다.

참조 픽쳐을 이용하여 부호화 및/또는 복호화되는 P 픽쳐 및 B 픽쳐는 인터 예측이 사용되는 영상으로 간주될 수 있다.

아래에서, 실시예에 따른 인터 모드에서의 인터 예측에 대해 구체적으로 설명된다.

인터 모드에서, 부호화 장치(100) 및 복호화 장치(200)는 부호화 대상 유닛 및 복호화 대상 유닛에 대한 예측 및/또는 움직임 보상을 수행할 수 있다. 예를 들면, 부호화 장치(100) 또는 복호화 장치(200)는 복원된 주변 유닛의 움직임 정보를 부호화 대상 유닛 또는 복호화 대상 유닛의 움직임 정보로 사용함으로써 예측 및/또는 움직임 보상을 수행할 수 있다. 여기에서, 부호화 대상 유닛 또는 복호화 대상 유닛은 예측 유닛 및/또는 예측 유닛 파티션을 의미할 수 있다.

인터 예측은 참조 픽쳐 및 움직임 정보를 이용하여 수행될 수 있다. 또한, 인터 예측은 전술된 스킵 모드를 이용할 수도 있다.

참조 픽쳐(reference picture)는 현재 픽쳐의 이전 픽쳐 또는 현재 픽쳐의 이후 픽쳐 중 적어도 하나일 수 있다. 이때, 인터 예측은 참조 픽쳐에 기반하여 현재 픽쳐의 블록에 대한 예측을 수행할 수 있다. 여기에서, 참조 픽쳐는 블록의 예측에 이용되는 영상을 의미할 수 있다.

이때, 참조 픽쳐 내의 영역은 참조 픽쳐를 지시하는 참조 픽쳐 인덱스(refIdx) 및 후술될 움직임 벡터(motion vector) 등을 이용함으로써 특정될 수 있다.

인터 예측은 참조 픽쳐 및 참조 픽쳐 내에서 현재 블록에 대응하는 참조 블록을 선택할 수 있고, 선택된 참조 블록을 사용하여 현재 블록에 대한 예측 블록을 생성할 수 있다. 현재 블록은 현재 픽쳐의 블록들 중 현재 부호화 또는 복호화의 대상인 블록일 수 있다.

움직임 정보는 부호화 장치(100) 및 복호화 장치(200)의 각각에 의해 인터 예측 중 도출될 수 있다. 또한, 도출된 움직임 정보는 인터 예측을 수행하는데 사용될 수 있다.

이때, 부호화 장치(100) 및 복호화 장치(200)는 복원된 주변 블록(neighboring block)의 움직임 정보 및/또는 콜 블록(collocated block; col block)의 움직임 정보를 이용함으로써 부호화 효율 및/또는 복호화 효율을 향상시킬 수 있다. 콜 블록은 이미 복원된 콜 픽쳐(collocated picture; col picture) 내의 현재 블록에 대응하는 블록일 수 있다.

복원된 주변 블록은 현재 픽쳐 내의 블록이면서, 이미 부호화 및/또는 복호화를 통해 복원된 블록일 수 있다. 복원 블록은 현재 블록에 인접한 이웃 블록 및/또는 현재 블록의 외부 코너에 위치한 블록일 수 있다. 여기에서, 현재 블록의 외부 코너에 위치한 블록이란, 현재 블록에 가로로 인접한 이웃 블록에 세로로 인접한 블록 또는 현재 블록에 세로로 인접한 이웃 블록에 가로로 인접한 블록일 수 있다.

예를 들면, 복원된 주변 유닛은 대상 유닛의 좌측에 위치한 유닛, 대상 유닛의 상단에 위치한 유닛, 대상 유닛의 좌측 하단 코너에 위치한 유닛, 대상 유닛의 우측 상단 코너에 위치한 유닛 또는 대상 유닛의 좌측 상단 코너에 위치한 유닛일 수 있다.

부호화 장치(100) 및 복호화 장치(200)의 각각은 콜 픽쳐 내에서 공간적으로 현재 블록에 대응하는 위치에 존재하는 블록을 결정할 수 있고, 결정된 블록을 기준으로 기정의된 상대적인 위치를 결정할 수 있다. 기정의된 상대적인 위치는 공간적으로 현재 블록에 대응하는 위치에 존재하는 블록의 내부 및/또는 외부의 위치일 수 있다. 또한, 부호화 장치(100) 및 복호화 장치(200)의 각각은 결정된 기정의된 상대적인 위치에 기반하여 콜 블록을 도출할 수 있다. 여기서, 콜 픽쳐는 참조 픽쳐 리스트에 포함된 적어도 하나의 참조 픽쳐 중에서 하나의 픽쳐일 수 있다.

참조 픽쳐 내의 블록은 복원된 참조 픽쳐 내에서 현재 블록의 위치에 공간적으로 대응되는 위치에 존재할 수 있다. 말하자면, 현재 픽쳐 내에서의 현재 블록의 위치 및 참조 픽쳐 내에서의 블록의 위치는 서로 대응할 수 있다. 이하, 참조 픽쳐에 포함된 블록의 움직임 정보는 시간적 움직임 정보로 불릴 수 있다.

움직임 정보의 도출 방식은 현재 블록의 예측 모드에 따라 변할 수 있다. 예를 들면, 인터 예측을 위해 적용되는 예측 모드로서, 향상된 움직임 벡터 예측자(Advanced Motion Vector Predictor; AMVP) 및 머지(merge) 등이 있을 수 있다.

예를 들면, 예측 모드로서, AMVP가 적용되는 경우, 부호화 장치(100) 및 복호화 장치(200)의 각각은 복원된 주변 블록의 움직임 벡터 및/또는 콜 블록의 움직임 벡터를 이용하여 예측 움직임 벡터 후보 리스트를 생성할 수 있다. 복원된 주변 블록의 움직임 벡터 및/또는 콜 블록의 움직임 벡터는 예측 움직임 벡터 후보로 사용될 수 있다.

부호화 장치(100)에 의해 생성된 비트스트림은 예측 움직임 벡터 인덱스를 포함할 수 있다. 예측 움직임 벡터 인덱스는 예측 움직임 벡터 후보 리스트에 포함된 예측 움직임 벡터 후보 중에서 선택된 최적의 예측 움직임 벡터를 지시할 수 있다. 비트스트림을 통해 예측 움직임 벡터 인덱스는 부호화 장치(100)로부터 복호화 장치(200)로 전송될 수 있다.

복호화 장치(200)는 예측 움직임 벡터 인덱스를 이용하여 예측 움직임 벡터 후보 리스트에 포함된 예측 움직임 벡터 후보 중에서 현재 블록의 예측 움직임 벡터를 선택할 수 있다.

부호화 장치(100)는 현재 블록의 움직임 벡터 및 예측 움직임 벡터 간의 움직임 벡터 차분(MVD: Motion Vector Difference)을 계산할 수 있고, MVD를 부호화할 수 있다. 비트스트림은 부호화된 MVD를 포함할 수 있다. MVD는 비트스트림을 통해 부호화 장치(100)로부터 복호화 장치(200)로 전송될 수 있다. 이 때, 복호화 장치(200)는 수신된 MVD를 복호화할 수 있다. 복호화 장치(200)는 복호화된 MVD 및 예측 움직임 벡터의 합을 통해 현재 블록의 움직임 벡터를 도출할 수 있다.

비트스트림은 참조 픽쳐를 지시하는 참조 픽쳐 인덱스 등을 포함할 수 있다. 참조 픽쳐 인덱스는 비트스트림을 통해 부호화 장치(100)로부터 복호화 장치(200)로 전송될 수 있다. 복호화 장치(200)는 주변 블록의 움직임 정보들을 이용하여 현재 블록의 움직임 벡터를 예측할 수 있고, 예측된 움직임 벡터 및 움직임 벡터 차분을 이용하여 현재 블록의 움직임 벡터를 유도할 수 있다. 복호화 장치(200)는 유도된 움직임 벡터와 참조 픽쳐 인덱스 정보에 기반하여 현재 블록에 대한 예측 블록을 생성할 수 있다.

부호화 대상 유닛 및 복호화 대상 유닛에 대해서 복원된 주변 유닛의 움직임 정보가 사용될 수 있기 때문에, 특정한 인터 예측 모드에서는, 부호화 장치(100)가 대상 유닛에 대한 움직임 정보를 별도로 부호화하지 않을 수도 있다. 대상 유닛의 움직임 정보가 부호화되지 않으면, 복호화 장치(200)로 전송되는 비트량이 감소될 수 있고, 부호화 효율이 향상될 수 있다. 예를 들면, 이러한 대상 유닛의 움직임 정보가 부호화되지 않는 인터 예측 모드로서, 스킵 모드(skip mode) 및/또는 머지 모드(merge mode) 등이 있을 수 있다. 이때, 부호화 장치(100) 및 복호화 장치(200)는 복원된 주변 유닛 중 어떤 유닛의 움직임 정보를 대상 유닛의 움직임 정보로서 사용되는지를 지시하는 식별자 및/또는 인덱스를 사용할 수 있다.

움직임 정보의 도출 방식의 다른 예로, 머지(merge)가 있다. 머지란 복수의 블록들에 대한 움직임의 병합을 의미할 수 있다. 머지는 하나의 블록의 움직임 정보를 다른 블록에도 함께 적용시키는 것을 의미할 수 있다. 머지가 적용되는 경우, 부호화 장치(100) 및 복호화 장치(200)의 각각은 복원된 주변 블록의 움직임 정보 및/또는 콜 블록의 움직임 정보를 이용하여 머지 후보 목록(merge candidate list)를 생성할 수 있다. 움직임 정보는 1) 움직임 벡터, 2) 참조 영상에 대한 인덱스, 및 3) 예측 방향 중 적어도 하나를 포함할 수 있다. 예측 방향은 단방향 또는 양방향일 수 있다.

이때, 머지는 CU 단위 또는 PU 단위로 적용될 수 있다. CU 단위 또는 PU 단위로 머지가 수행되는 경우, 부호화 장치(100)는 비트스트림을 통해 기정의된 정보를 복호화 장치(200)로 전송할 수 있다. 비트스트림은 기정의된 정보를 포함할 수 있다. 기정의된 정보는, 1) 블록 파티션(partition)별로 머지를 수행할지 여부를 나타내는 정보, 2) 현재 블록에 인접한 주변 블록들 중 어떤 블록과 머지를 할 것인가에 대한 정보를 포함할 수 있다. 예를 들면, 현재 블록의 주변 블록들은 현재 블록의 좌측 인접 블록, 현재 블록의 상단 인접 블록 및 현재 블록의 시간적(temporal) 인접 블록 등을 포함할 수 있다.

머지 후보 목록은 움직임 정보들이 저장된 목록을 나타낼 수 있다. 또한, 머지 후보 목록은 머지가 수행되기 전에 생성될 수 있다. 머지 후보 목록에 저장되는 움직임 정보는, 1) 현재 블록에 인접한 주변 블록의 움직임 정보 또는 2) 참조 영상 에서 현재 블록에 대응하는 콜 블록(collocated block) 움직임 정보일 수 있다. 또한, 머지 후보 목록에 저장된 움직임 정보는 이미 머지 후보 목록에 존재하는 움직임 정보들의 조합에 의해 생성된 새로운 움직임 정보일 수 있다.

스킵 모드는 주변 블록의 정보를 그대로 현재 블록에 적용하는 모드일 수 있다. 스킵 모드는 인터 예측에 이용되는 모드 중 하나일 수 있다. 스킵 모드가 사용되는 경우, 부호화 장치(100)는 어떤 블록의 움직임 정보를 현재 블록의 움직임 정보로서 이용할 것인지에 대한 정보만을 비트스트림을 통해 복호화 장치(200)에 전송할 수 있다. 부호화 장치(100)는 다른 정보는 복호화 장치(200)에 전송하지 않을 수 있다. 예를 들면, 다른 정보는 신택스(syntax) 정보일 수 있다. 신택스 정보는 움직임 벡터 차분 정보를 포함할 수 있다.

도 8은 일 실시예에 따른 인터 예측 방법의 흐름도이다.

아래에서는, 예시적으로 영상의 부호화 과정에 있어서 대상 유닛에 대한 인터 예측을 수행하는 방법이 설명된다. 예를 들면, 대상 유닛은 CU일 수 있다.

단계(810)에서, 인터 예측부(110)는 대상 유닛의 영상 복잡도에 기반하여 대상 유닛의 타입을 결정할 수 있다.

여기에서, 대상 유닛의 타입은 정적 영역 및 동적 영역을 포함할 수 있고, 대상 유닛은 정적 영역 및 동적 영역 중 하나로 분류될 수 있다.

영상 복잡도는 대상 유닛 및 대응 유닛 간의 비교에 기반하여 결정될 수 있다. 말하자면, 대상 유닛을 나타내는 값 및 대응 유닛을 나타내는 값에 대한 기정의된 연산의 결과가 영상 복잡도로서 사용될 수 있다. 여기에서, 대상 유닛을 나타내는 값은 대상 유닛의 LCU일 수 있으며, 대응 유닛을 나타내는 값은 대응 유닛의 LCU일 수 있다.

영상 복잡도는 대상 유닛의 LCU 및 대응 유닛의 LCU의 절대 차분 값(Sum of Absolute difference; SAD)에 기반하여 결정될 수 있다. 예를 들면, 영상 복잡도는 대상 유닛의 LCU 및 대응 유닛 LCU의 SAD일 수 있으며, 대상 유닛의 LCU 및 대응 유닛 LCU의 SAD에 기반하여 생성되는 값일 수 있다.

또는, 영상 복잡도는 대상 유닛의 LCU 및 대응 유닛의 LCU의 제곱 에러 합(Sum of Squared Error; SSE)에 기반하여 결정될 수 있다. 예를 들면, 영상 복잡도는 대상 유닛의 LCU 및 대응 유닛 LCU의 SSE일 수 있으며, 대상 유닛의 LCU 및 대응 유닛 LCU의 SSE에 기반하여 생성되는 값일 수 있다.

대응 유닛은 대상 유닛에 대응하는 유닛일 수 있다. 예를 들면, 대응 유닛은 참조 픽쳐 내의 대상 유닛에 대응하는 콜 유닛일 수 있다. 현재 픽쳐 내에서의 대상 유닛의 위치 및 참조 픽쳐 내에서의 대응 유닛의 위치는 서로 대응할 수 있다.

인터 예측부(110)는 대상 유닛의 영상 복잡도 및 기정의된 임계 값(Th) 간의 비교에 기반하여 대상 유닛의 타입을 결정할 수 있다. 기정의된 임계 값(Th)는 대상 유닛의 타입의 판단을 위해 최적으로 결정된 값일 수 있다. 예를 들면, 인터 예측부(110)는 대상 유닛의 영상 복잡도 또는 SAD가 기정의된 임계 값(Th)의 이상일 경우, 대상 유닛의 타입을 동적 유닛으로 결정할 수 있다. 인터 예측부(110)는 대상 유닛의 영상 복잡도 또는 SAD가 기정의된 임계 값(Th)보다 작을 경우, 대상 유닛의 타입을 정적 유닛으로 결정할 수 있다.

인터 예측부(110)는 대상 유닛의 영상 복잡도 및 기정의된 임계 값(Th) 간의 비교의 결과에 따라 플래그 "type flag"의 값을 설정할 수 있다.

인터 예측부(110)는 대상 유닛의 영상 복잡도 또는 SAD가 기정의된 임계 값(Th)의 이상이면 "type flag"을 "참(true)", "논리 1" 또는 기정의된 제1 값으로 설정할 수 있다. 인터 예측부(110)는 인터 예측부(110)는 대상 유닛의 영상 복잡도 또는 SAD가 기정의된 임계 값(Th)보다 작으면 "type flag"을 "거짓(false)", "논리 0" 또는 기정의된 제2 값으로 설정할 수 있다. 예를 들면, 플래그 "type flag"는 대상 유닛의 타입을 나타낼 수 있다. "type flag"의 값이 기정의된 제1 값이면, 대상 유닛은 동적 유닛일 수 있다. "type flag"의 값이 기정의된 제2 값이면, 대상 유닛은 정적 유닛일 수 있다.

대상 유닛의 슬라이스의 슬라이스 타입이 비슬라이스(Bslice)인 경우, 인터 예측부(110)는 대상 유닛의 타입을 결정함에 있어서 2개의 참조 픽쳐들을 사용할 수 있다. 대상 유닛의 슬라이스의 슬라이스 타입이 비슬라이스인 경우, 인터 예측부(110)는 대상 유닛의 LCU 및 참조 픽쳐 0의 제1 대응 유닛의 LCU의 제1 SAD를 계산할 수 있고, 대상 유닛의 LCU 및 참조 픽쳐 1의 제2 대응 유닛의 LCU의 제2 SAD를 계산할 수 있다. 인터 예측부(110)는 제1 SAD 및 제2 SAD의 평균을 대상 유닛에 대한 SAD로 사용할 수 있다.

대상 유닛의 타입은 초기 타입 및 최종 타입으로 분류될 수 있다. 초기 타입은 "type flag"가 나타내는 대상 유닛의 타입일 수 있다. 최종 타입은 대상 유닛의 "type flag" 및 인접 유닛의 "type flag"의 가중치가 부여된 합(weighted sum)에 기반하여 결정되는 타입일 수 있다. 인접 유닛은 대상 유닛에 대한 처리 이전에 이미 부호화 또는 복호화된, 대상 유닛에 인접한 유닛일 수 있다. 인접 유닛은 복수일 수 있다. 예를 들면, 복수의 인접한 유닛들은 대상 유닛에 좌측 상단으로 인접한 유닛, 대상 유닛에 상단으로 인접한 유닛, 대상 유닛에 우측 상단으로 인접한 유닛 및 대상 유닛에 좌측으로 인접한 유닛 중 적어도 하나를 포함할 수 있다.

인터 예측부(110)는 대상 유닛 및 인접 유닛의 영상 복잡도들에 기반하여 대상 유닛의 최종의 타입을 결정할 수 있다. 예를 들면, 인터 예측부(110)는 대상 유닛의 "type flag" 및 인접 유닛의 "type flag"의 가중치가 부여된 합이 기정의된 제3 값의 이상이면 대상 유닛의 최종의 타입을 동적 유닛으로 결정할 수 있다. 예를 들면, 인터 예측부(110)는 대상 유닛의 "type flag" 및 인접 유닛의 "type flag"의 가중치가 부여된 합이 기정의된 제4 값보다 작으면 대상 유닛의 최종의 타입을 정적 유닛으로 결정할 수 있다.

단계(820)에서, 인터 예측부(110)는 결정된 타입에 따라서 대상 유닛에 대한 인터 예측을 수행할 수 있다.

인터 예측부(110)는 대상 유닛의 타입이 동적 유닛인 경우, 종래의 인터 예측을 사용하여 대상 유닛에 대한 예측을 수행할 수 있다. 여기에서, 종래의 인터 예측은 도 1 내지 도 7을 참조하여 전술된 인터 예측일 수 있다.

인터 예측부(110)는 대상 유닛의 타입이 정적 유닛인 경우, 간소화된 인터 예측을 사용하여 대상 유닛에 대한 예측을 수행할 수 있다.

인터 예측부(110)는 복수의 타입들에 대하여 서로 상이한 인터 예측들을 사용하여 대상 유닛에 대한 예측을 수행할 수 있다.

서로 상이한 인터 예측들은, 예를 들면, 1) 대상 유닛에 대한 쿼드트리 분할의 횟수에 있어서 서로 상이하거나, 2) 참조 픽쳐의 개수에 있어서 서로 상이하거나, 3) 화면 간 예측 방향의 종류에 있어서 상이할 수 있다.

예를 들면, 간소화된 인터 예측은 대상 유닛에 대한 쿼드트리 분할 횟수를 제한하는 인터 예측일 수 있다. 간소화된 인터 예측은 대상 유닛에 대한 쿼드트리 분할 횟수를 제한함으로써 더 큰 크기의 예측 유닛으로 부호화 및/또는 복호화를 수행하는 예측일 수 있다. 인터 예측부(110)는 정적 유닛에 대해서는 동적 유닛에 비해 더 작은 최대 깊이를 적용하여 대상 유닛에 대한 분할을 수행할 수 있다.

또는, 간소화된 인터 예측은 인터 예측의 참조 픽쳐의 개수가 제한된 예측일 수 있다. 간소화된 인터 예측은 대상 유닛에 대한 참조 픽쳐의 개수를 제안하는 예측일 수 있다. 인터 예측부(110)는 정적 유닛에 대해서는 동적 유닛에 대해 더 적은 참조 픽쳐를 사용하여 대상 유닛에 대한 예측을 수행할 수 있다.

또는, 간소화된 인터 예측은 인터 예측의 인터 예측 방향이 제한된 예측일 수 있다. 간소화된 인터 예측은 대상 유닛에 대한 인터 예측 방향이 제한된 예측일 수 있다. 인터 예측부(110)는 정적 유닛에 대해서는 동적 유닛에 비해 더 제한된 인터 예측 방향으로 대상 유닛에 대한 예측을 수행할 수 있다.

인터 예측부(110)는 복수의 타입들에 대하여 서로 상이한 탐색 영역(search range)들을 사용하여 대상 유닛에 대한 예측을 수행할 수 있다.

예를 들면, 간소화된 인터 예측은 축소된 탐색 영역에서 탐색이 이루어지는 예측일 수 있다. 인터 예측부(110)는 정적 유닛에 대해서는 동적 유닛에 비해 더 작은 탐색 영역에서 대상 유닛에 대한 예측을 수행할 수 있다.

전술된 단계들(810 및 820)은 도 1을 참조하여 전술된 부호화 장치(110)의 다른 구성요소(component)에 의해 수행되는 동작들과 결합되어 수행될 수 있다.

전술된 인터 예측부(110)에 의한 인터 예측부는 복호화 장치(200)의 인터 예측부(250)에 의해서도 수행될 수 있다. 전술된 단계들(810 및 820)은 인터 예측부(250)에 의해서도 수행될 수 있다. 또한, 전술된 단계들(810 및 820)은 도 2을 참조하여 전술된 복호화 장치(200)의 다른 구성요소에 의해 수행되는 동작들과 결합되어 수행될 수 있다.

도 9는 일 예에 따른 현재 픽쳐 및 참조 픽쳐의 차분 영상을 나타낸다.

도 9에서는, 현재 픽쳐 및 2개의 참조 픽쳐들이 도시되었다. 현재 픽쳐는 현재 부호화 또는 복호화의 대상인 대상 픽쳐일 수 있다. 현재 픽쳐는 현재 블록을 포함하는 픽쳐일 수 있다.

도 9에서, LCU_CUR은 대상 유닛을 나타낼 수 있다. LCU_AL, LCU_A, LCU_AR 및, LCU_L은 대상 유닛의 복원된 이웃 유닛들을 나타낼 수 있다.

현재 픽쳐에 대해 2개의 참조 픽쳐 리스트들인 L0 및 L1가 존재할 수 있다. 2개의 참조 픽쳐들 중 첫 번째 참조 픽쳐는 L0에서 선택된 픽쳐일 수 있고, 두 번째 참조 픽쳐는 L1에서 선택된 픽쳐일 수 있다.

도 9에서, LCU^L0 _CUR은 첫 번째 참조 픽쳐의 대응 유닛을 나타낼 수 있다. LCU^L0 _AL, LCU^L0 _A, LCU^L0 _AR 및, LCU^L0 _L은 첫 번째 참조 픽쳐의 대응 유닛의 복원된 이웃 유닛들을 나타낼 수 있다. LCU^L1 _CUR은 두 번째 참조 픽쳐의 대응 유닛을 나타낼 수 있다. LCU^L1 _AL, LCU^L1 _A, LCU^L1 _AR 및, LCU^L1 _L은 두 번째 참조 픽쳐의 대응 유닛의 복원된 이웃 유닛들을 나타낼 수 있다.

도 9에서는 2개의 차분 영상들이 도시되었다. 좌측의 차분 영상은 L0의 참조 픽쳐 및 현재 픽쳐 간의 차분 영상일 수 있다. 좌측의 차분 영상은 L0의 참조 픽쳐 및 현재 픽쳐의 SAD를 나타낼 수 있다. 우측의 차분 영상은 L1의 참조 픽쳐 및 현재 픽쳐 간의 차분 영상일 수 있다. 우측의 차분 영상은 L1의 참조 픽쳐 및 현재 픽쳐의 SAD를 나타낼 수 있다.

도시된 것과 같이 현재 픽쳐는 복수 개의 CU들로 구성될 수 있으며, 부호화 또는 복호화는 래스터 스캔(raster scan)의 순서에 따라서 CU 별로 이루어질 수 있다.

일반적으로, 영상의 특성에 따라 차분 영상의 CU는 아래와 같은 특성을 가질 수 있다.

1) CU 내에 움직이는 물체(moving object)가 존재하는 경우, 시간 차에 따른 물체의 위상의 변화 및 물체 내의 세부적인 움직임의 변화에 기인하여 주로 물체의 물체 경계(object boundary) 및 에지(edge)의 영역들에서 (상대적으로 더 큰) 차분 값이 존재할 수 있다. 도 9에서, "A"로 표시된 부분은 움직이는 물체의 물체 경계 및 에지의 영역들에서 발생한 차분 값을 나타낼 수 있다.

2) CU가 정적 영역(static region) 내에 존재하는 경우, 시간 차에 따른 영상의 특성(예를 들면, 복잡도)의 변화가 없기 때문에, 대부분의 픽셀 값(또는, 차분 값)이 0에 가까운 값을 가질 수 있다. 도 9에서 "B"로 표시된 부분은, "A"로 표시된 부분 외의 영역을 나타낼 수 있고, 정적 영역을 나타낼 수 있다.

전술된 영상의 일반 현상에 기초하여, 대상 유닛 내의 영상의 특성에 따라 대상 유닛이 정적 유닛 및 동적 유닛 중 하나로 분류될 수 있다.

대상 유닛의 분류를 위해, 인터 예측부(110)는 현재 픽쳐의 대상 유닛 및 참조 픽쳐의 대응 유닛 간의 픽셀 단위의 에러 값을 계산할 수 있다. 대응 유닛은 참조 픽쳐 내의 콜 블록일 수 있다.

도 8을 참조하여 전술된 SAD는 픽셀 단위의 에러 값의 일 예일 수 있다. 예를 들면, 에러 값은 SAD 외에도, 제곱 에러 합(Sum of Squared Error; SSE) 등의 다른 에러 값일 수 있다. 도 8을 전술된 실시예에서, SAD는 예러 값 또는 SSE로 대체될 수 있다.

인터 예측부(110)는 아래의 수학식 2에 기반하여 대상 블록의 SAD를 계산할 수 있다.

여기에서, k는 L0의 참조 픽쳐 또는 L1의 참조 픽쳐를 나타낼 수 있다. i는 픽셀의 x 좌표를 나타낼 수 있다. j는 픽셀의 y 좌표를 나타낼 수 있다. N은 대상 유닛의 크기를 나타낼 수 있다.

현재 픽쳐의 각 CU는 1비트의 "type_flag"를 가질 수 있다. CU에 대해 계산된 SAD의 값이 기정의된 SAD 임계 값(Th_SAD)의 이상인 경우, CU는 동적 유닛으로 결정될 수 있다. 이 경우, type flag"의 값은 "참(true)", "논리 1" 또는 기정의된 제1 값으로 설정될 수 있다. CU에 대해 계산된 SAD의 값이 기정의된 SAD 임계 값(Th_SAD)보다 작은 경우, CU는 정적 유닛으로 결정될 수 있다. 이 경우, type flag"의 값은 거짓(false)", "논리 0" 또는 기정의된 제2 값으로 설정될 수 있다.

도 10은 일 예에 따른 대상 유닛 및 복원된 이웃 유닛들의 타입 플래그들을 나타낸다.

도 10에서, TF_CUR은 대상 유닛의 "type flag"를 나타낼 수 있다. TF_AL는 대상 유닛에 좌측 상단으로 인접한 인접 유닛의 "type flag"를 나타낼 수 있다. TF_A는 대상 유닛에 상단으로 인접한 인접 유닛의 "type flag"를 나타낼 수 있다. TF_AR는 대상 유닛에 우측 상단으로 인접한 유닛의 "type flag"를 나타낼 수 있다. TF_L는 대상 유닛에 좌측으로 인접한 유닛의 "type flag"를 나타낼 수 있다.

전술된 상대적으로 단순한 대상 유닛의 타입의 결정 방식 외에도, 인터 예측부(110)는 인접 유닛들 및 대상 유닛 간의 상관도를 고려하여 보다 신뢰성 있는 대상 유닛의 타입의 결정 방식을 제공할 수 있다.

예를 들면, 일반적인 자연 영상에 있어서, 카메라의 움직임이 없음이 가정되었을 때, 배경에 존재하는 정적 영역은 넓은 범위에 걸쳐 나타나는 경향이 있다. 따라서, 대상 유닛의 타입의 결정에 있어서, 대상 유닛의 타입은 기 결정된 인접 유닛들의 타입들과 큰 상관도를 가질 수 있다.

이러한 상관도를 고려하기 위해, 인터 예측부(110)는 대상 유닛의 "type_flag" 및 인접 유닛들의 "type_flag"의 가중치가 부여된 합 "flag_sum"을 계산할 수 있다.

인터 예측부(110)는 아래의 수학식 3에 기반하여 대상 유닛의 가중치가 부여된 합 "flag_sum"을 계산할 수 있다.

TF_i는 유닛 i의 "type_flag"를 나타낼 수 있다. i는 대상 유닛을 나타내는 CUR, 상단 좌측 인접(Above Left) 유닛을 나타내는 AL, 상단(Above) 인접 유닛을 나타내는 A, 상단 우측(Above Right) 인접 유닛을 나타내는 AR 및 좌측(Left) 인접 유닛을 나타내는 L 중 하나일 수 있다. K는 가용한 인접 유닛의 개수일 수 있다. w_i는 유닛 i의 가중치일 수 있다.

대상 유닛 및 인접 유닛의 가중치들은 서로 상이한 기정의된 값들일 수 있다. 예를 들면, 대상 유닛 및 좌측 인접 유닛 간의 상관도가 가장 높다는 가정하에, TF_i의 가중치는 w_cur=0.5, w_L=0.2 및 w_AL=w_A= w_AR=0.1 로 결정될 수 있다. 예를 들면, 이웃 유닛 중 대상 유닛과의 상관도가 더 높은 유닛이 더 높은 가중치를 가질 수 있다.

인터 예측부(110)는 가중치가 부여된 합 "flag_sum"을 사용하여 대상 유닛의 최종의 타입을 결정할 수 있다.

인터 예측부(110)는 아래의 수학식 4에 기반하여 대상 유닛의 최종의 타입을 결정할 수 있다.

"type_flag"는 대상 유닛의 최종의 타입을 나타낼 수 있다. Th는 기정의된 임계 값일 수 있다.

대상 유닛의 슬라이스의 슬라이스 타입이 비슬라이스(Bslice)인 경우, 인터 예측부(110)는 대상 유닛의 타입을 결정함에 있어서 좌측의 참조 픽쳐 및 우측의 참조 픽쳐를 사용할 수 있다. 인터 예측부(110)는 대상 유닛의 LCU 및 좌측 참조 픽쳐의 대응 유닛의 LCU 간의 SAD1를 계산할 수 있고, 대상 유닛의 LCU 및 우측 참조 픽쳐의 대응 유닛의 LCU의 SAD2를 계산할 수 있다. 인터 예측부(110)는 SAD1 및 SAD1의 평균을 대상 유닛에 대한 SAD로 사용할 수 있다. 인터 예측부(110)는 아래의 수학식 5와 같이 1비트의 우측 산술 쉬프트 연산을 사용하여 SAD를 계산할 수 있다.

SAD가 계산되면, 인터 예측부(110)는 아래의 수학식 6에 기반하여 대상 유닛의 "type flae"인 TF를 결정할 수 있다.

도 3을 참조하여 전술된 것과 같이, 종래의 인터 예측 기술이 적용될 경우, 각 CU는 기정의된 깊이까지 재귀적으로 분할될 수 있다. 이때, 깊이 정보는 CU의 크기를 나타낼 수 있으며, CU 별로 저장될 수 있다. 예컨대, LCU의 깊이는 0일 수 있고, SCU의 깊이는 기정의된 최대 깊이일 수 있다. CU가 정적 유닛인 경우, CU가 나타내는 영상은 주로 평활한(homogeneous) 영역이거나 점진적으로 변화하는 (gradually changing) 특성을 가질 수 있다. 따라서, 정적 유닛인 CU들은 주로 큰 예측 유닛으로 부호화 되는 경향이 나타낼 수 있다. 종래의 인터 예측 기술이 사용될 경우, CU가 필요 이상으로 세분화된 다수의 예측 블록으로 부호화 될 가능성이 있다.

CU가 필요 이상으로 분할될 경우, 각각의 하위 예측 유닛에 대하여 움직임 정보가 전송되어야 하기 때문에 부호화 효율이 감소할 수 있다. 또한, 정의된 최대 깊이까지 CU에 대한 재귀적 분할 및 예측이 수행되어야 하기 때문에 부호화 장치(100)의 복잡도가 증가할 수 있다.

인터 예측부(110)는 대상 유닛의 타입에 따라서, 복수의 타입들에 대해 서로 상이한 최대 깊이를 적용하여 대상 유닛을 분할할 수 있다. 여기에서, 인터 예측부(110)는 복수의 타입들 중 정적 유닛의 최대 깊이를 동적 유닛의 최대 깊이보다 더 작게 설정할 수 있다.

말하자면, 인터 예측부(110)는 정적 유닛에 대해서는 분할을 위해 기정의된 최대 깊이의 정보를 감소시킴으로써 정적 유닛이 큰 크기의 예측 유닛으로만 부호화되도록 할 수 있다. 인터 예측부(110)는 정적 유닛을 큰 크기의 예측 유닛으로만 부호화되도록 함으로써 부호화 효율을 향상시킬 수 있고, 부호화 장치(100)의 복잡도를 감소시킬 수 있다.

예를 들면, 재귀적 분할을 위한 최대 깊이가 N일 때, 정적 유닛에 대한 최대 깊이는 NL일 수 있다. 여기에서, N은 1 이상의 정수일 수 있다. L은 0 이상, N1 이하의 정수일 수 있다. 또는, L은 1 및 N 사이의 값을 가질 수 있다.

인터 예측부(110)는 적응적으로 L의 값을 결정할 수 있다. 예를 들면, 인터 예측부(110)는 수학식 3의 flag_sum의 값에 기반하여 L의 값을 결정할 수 있다. 모든 가중치 w_i의 값이 1이라는 가정 하에서, L의 값은 N(Mflag_sum)와 같이 계산될 수 있다. 말하자면, flag_sum의 값이 5인 경우 L=N이 성립하고, flag_sum의 값이 4인 경우 L=N1이 성립하고, flag_sum의 값이 3인 경우 L=N2 등으로 결정될 수 있다. 여기에서, M은, flag_sum을 계산하기 위해 사용되는 유닛들의 개수, 또는 TF_i의 개수일 수 있다. 예를 들면, 인접한 유닛들이 상단 좌측 인접 유닛, 상단 인접 유닛, 우측 인접 유닛, 좌측 유닛일 경우, M의 값은 5일 수 있다.

종래의 인터 예측 기술이 적용될 경우, 움직임 벡터의 값의 범위는 미리 정의된 탐색 영역(Search Range; SR)에 의해 결정될 수 있다. 또한, 부호화 장치(100)로부터 복호화 장치(200)로 전송되는 실제의 정보는 결정된 MV 및 인접한 블록의 MV 간의 움직임 벡터 차분 값(Motion Vector Difference; MVD)일 수 있다.

정적 유닛의 경우, 인접 블록과의 상관도(correlation)이 높기 때문에 상대적으로 작은 값을 갖는 MV가 결정되는 경향이 있다. 따라서, 정적 부호화 유닛에 대해서는 정의된 SR 보다 줄어든 SR을 사용함으로써, 움직임 예측을 위한 부호화 장치(100)의 복잡도를 줄임과 동시에 움직임 정보의 전송량을 줄여 부호화 효율을 높일 수 있다.

예를 들면, 일반적인 유닛 또는 동적 유닛에 대해 기정의된 SR의 크기가 N일 때, 정적 유닛에 대한 SR의 크기는 NL일 수 있다. 여기에서, N은 2 이상의 정수일 수 있다. N은 1 이상 N 보다 작은 정수일 수 있다.

인터 예측부(110)는 적응적으로 L의 값을 결정할 수 있다. 예를 들면, 인터 예측부(110)는 수학식 3의 flag_sum의 값에 기반하여 L의 값을 결정할 수 있다. 예를 들면, 인터 예측부(110)는 flag_sum의 값이 더 클수록 L의 값이 더 크도록 설정할 수 있다. 모든 가중치 w_i의 값이 1이라는 가정 하에서, L의 값은 N(Mflag_sum)와 같이 계산될 수 있다. 말하자면, flag_sum의 값이 5인 경우 L=의 값은 3*N/4일 수 있다. flag_sum의 값이 4인 경우 L의 값은 N/2일 수 있다. flag_sum의 값이 3의 이하인 경우 L의 값은 N/4일 수 있다.

도 11은 일 실시예에 따른 부호화 장치 및/또는 복호화 장치를 구현하는 전자 장치의 구조도이다.

일 실시예에 따르면, 부호화 장치(100)의 인터 예측부(110), 인트라 예측부(120), 스위치(115), 감산기(125), 변환부(130), 양자화부(140), 엔트로피 부호화부(150), 역양자화부(160), 역변환부(170), 가산기(175), 필터부(180) 및 참조 픽쳐 버퍼(190)의 적어도 일부는 프로그램 모듈들일 수 있으며, 외부의 장치 또는 시스템과 통신할 수 있다. 프로그램 모듈들은 운영 체제, 응용 프로그램 모듈 및 기타 프로그램 모듈의 형태로 부호화 장치(100)에 포함될 수 있다.

또한 일 실시예에 따르면, 복호화 장치(200)의 엔트로피 복호화부(210), 역양자화부(220), 역변환부(230), 인트라 예측부(240), 인터 예측부(250), 가산기(255), 필터부(260) 및 참조 픽쳐 버퍼(270) 의 적어도 일부는 프로그램 모듈들일 수 있으며, 외부의 장치 또는 시스템과 통신할 수 있다. 프로그램 모듈들은 운영 체제, 응용 프로그램 모듈 및 기타 프로그램 모듈의 형태로 복호화 장치(200)에 포함될 수 있다.

프로그램 모듈들은 물리적으로는 여러 가지 공지의 기억 장치 상에 저장될 수 있다. 또한, 이러한 프로그램 모듈 중 적어도 일부는 부호화 장치(100)와 통신 가능한 원격 기억 장치 또는 복호화 장치(200)와 통신 가능한 원격 기억 장치 에 저장될 수도 있다.

프로그램 모듈들은 일 실시예에 따른 기능 또는 동작을 수행하거나, 일 실시예에 따른 추상 데이터 유형을 구현하는 루틴(routine), 서브루틴(subroutine), 프로그램, 오브젝트(object), 컴포넌트(component) 및 데이터 구조(data structure) 등을 포괄할 수 있지만, 이에 제한되지는 않는다.

프로그램 모듈들은 부호화 장치(100)의 적어도 하나의 프로세서(processor) 또는 복호화 장치(200)의 적어도 하나의 프로세서에 의해 수행되는 명령어(instruction) 또는 코드(code)로 구성될 수 있다.

부호화 장치(100) 및/또는 복호화 장치(200)는 도 10에서 도시된 전자 장치(1100)로서 구현될 수 있다. 전자 장치(1100)는 부호화 장치(100) 및/또는 복호화 장치(200)로서 동작하는 범용의 컴퓨터 시스템일 수 있다.

도 10에서 도시된 바와 같이, 전자 장치(1100)는 버스(1190)를 통하여 서로 통신하는 적어도 하나의 처리부(processing unit)(1110), 메모리(1130), 사용자 인터페이스(User Interface; UI) 입력 디바이스(1150), UI 출력 디바이스(1160) 및 저장소(1140)를 포함할 수 있다. 또한, 전자 장치(1100)는 네트워크(1199)에 연결되는 통신부(1120)를 더 포함할 수 있다. 처리부(1110)는 중앙 처리 장치(Central Processing Unit; CPU), 메모리(1130) 또는 저장소(1140)에 저장된 프로세싱(processing) 명령어(instruction)들을 실행하는 반도체 장치일 수 있다. 메모리(1130) 및 저장소(1140)는 다양한 형태의 휘발성 또는 비휘발성 저장 매체일 수 있다. 예를 들어, 메모리는 롬(ROM)(1131) 및 램(RAM)(1132) 중 적어도 하나를 포함할 수 있다.

부호화 장치(100) 및/또는 복호화 장치(200)는 컴퓨터에 의해 독출(read)될 수 있는 기록 매체를 포함하는 컴퓨터 시스템에서 구현될 수 있다.

기록 매체는 전자 장치(1100)가 부호화 장치(100) 및/또는 복호화 장치(200)로서 동작하기 위해 요구되는 적어도 하나의 모듈을 저장할 수 있다. 메모리(1130)는 적어도 하나의 모듈을 저장할 수 있고, 적어도 하나의 처리부(1110)에 의하여 실행되도록 구성될 수 있다.

부호화 장치(100) 및/또는 복호화 장치(200)의 데이터 또는 정보의 통신과 관련된 기능은 통신부(1120)를 통해 수행될 수 있다.

상술한 실시예들에서, 방법들은 일련의 단계 또는 유닛으로서 순서도를 기초로 설명되고 있으나, 본 발명은 단계들의 순서에 한정되는 것은 아니며, 어떤 단계는 상술한 바와 다른 단계와 다른 순서로 또는 동시에 발생할 수 있다. 또한, 당해 기술 분야에서 통상의 지식을 가진 자라면 순서도에 나타난 단계들이 배타적이지 않고, 다른 단계가 포함되거나, 순서도의 하나 또는 그 이상의 단계가 본 발명의 범위에 영향을 미치지 않고 삭제될 수 있음을 이해할 수 있을 것이다.

이상 설명된 본 발명에 따른 실시예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CDROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기광 매체(magnetooptical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명이 상기 실시예들에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다.

따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.

Claims

인터 예측에 있어서 대상 유닛에 대한 타입을 결정하는 단계; 및
상기 타입에 따라 상기 대상 유닛의 움직임 정보에 기반하여 상기 대상 유닛에 대한 인터 예측을 수행하는 단계
를 포함하는 복호화 방법.
제1항에 있어서,
상기 인터 예측은 상기 대상 유닛에 대응하는 대응 유닛에 기반하는 절대 차분의 합 연산에 기반하여 수행되는 복호화 방법.
제2항에 있어서,
상기 타입은 상기 절대 차분의 합 연산의 결과가 임계 값의 이상인지 여부에 대응하여 지정되는 복호화 방법.
제1항에 있어서,
상기 타입은 상기 대상 유닛에 대한 탐색 영역을 결정하는 복호화 방법.
제1항에 있어서,
상기 타입은 상기 대상 유닛에 대한 분할에 영향을 미치는 복호화 방법.
제1항에 있어서,
상기 인터 예측은 제1 참조 픽쳐 내의 제1 대응 유닛 및 제2 참조 픽쳐 내의 제2 대응 유닛에 기반하는 절대 차분의 합 연산에 기반하여 수행되는 복호화 방법.
인터 예측에 있어서 대상 유닛에 대한 타입을 결정하는 단계; 및
상기 타입에 따라 상기 대상 유닛의 움직임 정보에 기반하는 상기 대상 유닛에 대한 인터 예측을 수행하는 단계
를 포함하는 부호화 방법.
제7항에 있어서,
상기 인터 예측은 상기 대상 유닛에 대응하는 대응 유닛에 기반하는 절대 차분의 합 연산에 기반하여 수행되는 부호화 방법.
제8항에 있어서,
상기 타입은 상기 절대 차분의 합 연산의 결과가 임계 값의 이상인지 여부에 대응하여 지정되는 부호화 방법.
제7항에 있어서,
상기 타입은 상기 대상 유닛에 대한 탐색 영역을 결정하는 부호화 방법.
제7항에 있어서,
상기 타입은 상기 대상 유닛에 대한 분할에 영향을 미치는 부호화 방법.
제7항에 있어서,
상기 인터 예측은 제1 참조 픽쳐 내의 제1 대응 유닛 및 제2 참조 픽쳐 내의 제2 대응 유닛에 기반하는 절대 차분의 합 연산에 기반하여 수행되는 부호화 방법.
제7항에 기재된 부호화 방법에 의하여 생성된 비트스트림을 기록하는 기록 매체.
비트스트림을 저장하는 컴퓨터 판독 가능한 기록 매체에 있어서,
상기 비트스트림은,
대상 유닛에 대한 부호화된 정보
를 포함하고,
상기 부호화된 정보를 사용하여 상기 대상 유닛에 대한 복호화가 수행되고,
상기 복호화에서, 인터 예측에 있어서 상기 대상 유닛에 대한 타입이 결정되고,
상기 타입에 따라 상기 대상 유닛의 움직임 정보에 기반하는 상기 대상 유닛에 대한 인터 예측이 수행되는 컴퓨터 판독 가능한 기록 매체.
제14항에 있어서,
상기 인터 예측은 상기 대상 유닛에 대응하는 대응 유닛에 기반하는 절대 차분의 합 연산에 기반하여 수행되는 컴퓨터 판독 가능한 기록 매체.
제15항에 있어서,
상기 타입은 상기 절대 차분의 합 연산의 결과가 임계 값의 이상인지 여부에 대응하여 지정되는 컴퓨터 판독 가능한 기록 매체.
제14항에 있어서,
상기 타입은 상기 대상 유닛에 대한 탐색 영역을 결정하는 컴퓨터 판독 가능한 기록 매체.
제14항에 있어서,
상기 타입은 상기 대상 유닛에 대한 분할에 영향을 미치는 컴퓨터 판독 가능한 기록 매체.
제14항에 있어서,
상기 인터 예측은 제1 참조 픽쳐 내의 제1 대응 유닛 및 제2 참조 픽쳐 내의 제2 대응 유닛에 기반하는 절대 차분의 합 연산에 기반하여 수행되는 컴퓨터 판독 가능한 기록 매체.
컴퓨터 실행 가능한 코드를 포함하는 비트스트림을 저장하는 컴퓨터 판독 가능한 기록 매체에 있어서, 상기 컴퓨터 실행 가능한 코드는 실행되었을 때 비디오 복호화 장치가
상기 컴퓨터 실행 가능한 코드로부터 신택스 엘리먼트를 획득하는 단계;
상기 신택스 엘리먼트에 기반하여 인터 예측에 있어서 대상 유닛에 대한 타입을 결정하는 단계; 및
상기 타입에 따라 상기 대상 유닛의 움직임 정보에 기반하여 상기 대상 유닛에 대한 인터 예측을 수행하는 단계
를 수행하게 하는 컴퓨터 판독 가능한 기록 매체.