KR101701342B1

KR101701342B1 - 적응적인 루프 필터링을 이용한 비디오의 부호화 방법 및 장치, 비디오 복호화 방법 및 장치

Info

Publication number: KR101701342B1
Application number: KR1020090075336A
Authority: KR
Inventors: 이태미; 한우진; 김일구
Original assignee: 삼성전자주식회사
Priority date: 2009-08-14
Filing date: 2009-08-14
Publication date: 2017-02-01
Also published as: EP2466890A2; US10218982B2; EP2466890A4; US20160234508A1; US20180160121A1; JP2013502133A; WO2011019213A2; US20170223360A1; US9351000B2; WO2011019213A3; CN102474615B; CN102474615A; KR20110017720A; US20170034537A1; JP5731506B2; US9491474B2; US20120140831A1; US9912954B2; US9668000B2

Abstract

본 발명은, 부호화된 비디오에 대한 비트스트림을 수신하여 파싱(parsing)하고, 비트스트림으로부터 최대 크기의 부호화 단위인 최대 부호화 단위에 할당되는 현재 픽처의 영상 데이터, 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보 및 현재 픽처의 루프 필터링을 위한 필터 계수 정보를 추출하여, 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보에 기초하여, 최대 부호화 단위별 부호화된 영상 데이터를 복호화하고, 현재 픽처의 복호화된 영상 데이터에 대해 디블로킹을 수행하여, 디블로킹된 데이터에 대해 연속적인 1차원 필터링에 의한 루프 필터링을 수행함으로써 현재 픽처를 복원하는 비디오 복호화 방법를 개시한다.

루프 필터링, 러닝 필터, 필터 계수

Description

적응적인 루프 필터링을 이용한 비디오의 부호화 방법 및 장치, 비디오 복호화 방법 및 장치{Method and apparatus for video encoding considering adaptive loop filtering, and method and apparatus for video decoding considering adaptive loop filtering}

본 발명은 비디오의 부호화 및 복호화에 관한 것이다.

고해상도 또는 고화질 비디오 컨텐트를 재생, 저장할 수 있는 하드웨어의 개발 및 보급에 따라, 고해상도 또는 고화질 비디오 컨텐트를 효과적으로 부호화하거나 복호화하는 비디오 코덱의 필요성이 증대하고 있다. 기존의 비디오 코덱에 따르면, 비디오는 소정 크기의 매크로블록에 기반하여 제한된 부호화 방식에 따라 부호화되고 있다. 또한, 기존의 비디오 코덱은 복원된 영상 데이터의 화질 개선을 위해 루프 필터링을 이용하기도 한다.

본 발명은, 연속적인 1차원 필터링에 의한 적응적인 루프 필터링을 이용하는 비디오의 부호화 및 복호화에 관한 것이다.

본 발명의 일 실시예에 따라 연속적인 1차원 필터링에 의한 루프 필터링을 이용하는 비디오 복호화 방법은, 부호화된 비디오에 대한 비트스트림을 수신하여 파싱(parsing)하는 단계; 상기 비트스트림으로부터 최대 크기의 부호화 단위인 최대 부호화 단위에 할당되는 현재 픽처의 영상 데이터, 상기 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보 및 상기 현재 픽처의 루프 필터링을 위한 필터 계수 정보를 추출하는 단계; 상기 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보에 기초하여, 상기 최대 부호화 단위별 부호화된 영상 데이터를 복호화하는 단계; 및 상기 현재 픽처의 복호화된 영상 데이터에 대해 디블로킹을 수행하고, 디블로킹된 데이터에 대해 연속적인 1차원 필터링에 의한 루프 필터링을 수행하는 단계를 포함한다.

일 실시예에 따른 부호화 단위는 최대 크기 및 심도로 특징지어질 수 있다.

심도란 부호화 단위가 계층적으로 분할되는 단계를 나타내며, 심도가 깊어질수록 심도별 부호화 단위는 최대 부호화 단위로부터 최소 부호화 단위까지 분할될 수 있다. 본 명세서에서는, 높은 심도 또는 상위 심도로부터 낮은 심도 또는 하위 심도의 방향으로 '심도가 깊어진다'고 정의한다. 심도가 깊어짐에 따라 최대 부호화 단위의 분할 횟수가 증가하고, 최대 부호화 단위의 분할 가능한 총 횟수가 '최대 심도'로 대응된다. 부호화 단위의 최대 크기 및 최대 심도가 미리 설정되어 있 을 수 있다.

일 실시예에 따른 상기 필터 계수 정보 추출 단계는, 복수의 1차원 필터들 중 각각의 1차원 필터에 대해, 연속적인 필터 계수들 간의 차이값에 대한 잔차 정보를 추출하는 단계를 포함한다.

일 실시예에 따른 상기 루프 필터링 수행 단계는, 수평 방향의 1차원 필터링 및 수직 방향의 1차원 필터링을 연속적으로 수행하여 상기 현재 픽처를 복원할 수 있다.

일 실시예에 따른 상기 루프 필터링 수행 단계는, 상기 추출된 필터 계수의 잔차 정보를 이용하여, 상기 각각의 1차원 필터의 필터 계수를 유도하는 단계; 및 상기 유도된 각각의 1차원 필터의 필터 계수를 이용하여, 상기 연속적인 1차원 필터링을 수행하는 단계를 포함할 수 있다.

일 실시예에 따른 상기 필터 계수 유도 단계는, 상기 각각의 1차원 필터마다, 현재 필터 계수 및 이전 필터 계수 간의 차이값을 상기 이전 필터 계수에 더함으로써 현재 필터 계수가 계산됨으로써, 상기 연속적인 필터 계수들을 유도할 수 있다.

일 실시예에 따른 상기 루프 필터링 수행 단계는, 상기 디블로킹된 영상 데이터 중 수평 방향의 9개의 연속적인 데이터에 대해 5개의 수평 방향의 1차원 필터 계수로 필터링하는 단계; 및 상기 디블로킹된 영상 데이터 중 수직 방향의 9개의 연속적인 데이터에 대해 5개의 수직 방향의 1차원 필터 계수로 필터링하는 단계를 포함할 수 있다.

본 발명의 일 실시예에 따라 연속적인 1차원 필터링에 의한 루프 필터링을 이용하는 비디오 부호화 방법은, 현재 픽처를 최대 크기의 부호화 단위인 적어도 하나의 최대 부호화 단위로 분할하는 단계; 상기 최대 부호화 단위의 영역을 분할하는 횟수가 증가함에 따라 깊어지는 심도에 기초하여, 상기 심도마다 상기 최대 부호화 단위의 영역이 분할된 적어도 하나의 분할 영역을 부호화하여, 상기 적어도 하나의 분할 영역 별로 최종 부호화 결과가 출력될 심도를 결정하는 단계; 상기 최대 부호화 단위마다 상기 적어도 하나의 분할 영역 별 최종 부호화 결과인 영상 데이터, 심도 및 예측 모드에 관한 부호화 정보, 및 상기 현재 픽처의 부호화 중 디블로킹 이후 연속적인 1차원 필터링에 의해 수행되는 루프 필터링의 필터 계수 정보를 부호화하여 출력하는 단계를 포함한다.

일 실시예에 따른 상기 루프 필터링의 필터 계수 정보 출력 단계는, 상기 각각의 1차원 필터마다, 상기 잔차 정보로서 현재 필터 계수 및 이전 필터 계수 간의 차이값을 부호화하는 단계를 포함한다.

일 실시예에 따라, 상기 최대 부호화 단위는 적어도 하나의 심도에 따른 계층적으로 분화된 상기 심도별 부호화 단위를 포함하며, 각각의 하위 심도의 부호화 단위는 복수의 상위 심도의 부호화 단위들을 포함하고, 상기 부호화 심도는 상기 최대 부호화 단위로부터 계층적으로 분화된 적어도 하나의 심도별 부호화 단위 중, 부호화 오차가 가장 작은 심도를 나타낸다.

본 발명의 일 실시예에 따라 연속적인 1차원 필터링에 의한 루프 필터링을 이용하는 비디오 복호화 장치는, 부호화된 비디오에 대한 비트스트림을 수신하여 파싱(parsing)하는 수신부; 상기 비트스트림으로부터 최대 크기의 부호화 단위인 최대 부호화 단위에 할당되는 현재 픽처의 영상 데이터, 상기 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보, 및 상기 현재 픽처의 루프 필터링을 위한 필터 계수 정보를 추출하는 추출부; 상기 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보에 기초하여, 상기 최대 부호화 단위별 부호화된 영상 데이터를 복호화하는 영상 데이터 복호화부; 및 상기 현재 픽처의 복호화된 영상 데이터에 대해 디블로킹을 수행하고, 디블로킹된 데이터에 대해 연속적인 1차원 필터링에 의한 루프 필터링을 수행하는 루프 필터링 수행부를 포함한다.

본 발명의 일 실시예에 따라 연속적인 1차원 필터링에 의한 루프 필터링을 이용하는 비디오 부호화 장치는, 현재 픽처를 최대 크기의 부호화 단위인 적어도 하나의 최대 부호화 단위로 분할하는 최대 부호화 단위 분할부; 상기 최대 부호화 단위의 영역을 분할하는 횟수가 증가함에 따라 깊어지는 심도에 기초하여, 상기 심도마다 상기 최대 부호화 단위의 영역이 분할된 적어도 하나의 분할 영역을 부호화하여, 상기 적어도 하나의 분할 영역 별로 최종 부호화 결과가 출력될 심도를 결정하는 부호화 심도 결정부; 상기 최대 부호화 단위마다 상기 적어도 하나의 분할 영역 별 최종 부호화 결과인 영상 데이터와, 심도 및 예측 모드에 관한 부호화 정보, 및 상기 현재 픽처의 부호화 중 디블로킹 이후 연속적인 1차원 필터링에 의해 수행되는 루프 필터링의 필터 계수 정보를 부호화하여 출력하는 출력부를 포함한다.

본 발명은, 일 실시예에 따른 비디오 복호화 방법을 구현하기 위한 프로그램이 기록된 컴퓨터로 판독 가능한 기록 매체를 포함한다. 또한 본 발명은, 일 실시 예에 따른 비디오 부호화 방법을 구현하기 위한 프로그램이 기록된 컴퓨터로 판독 가능한 기록 매체를 포함한다.

이하 도 1 내지 도 26을 참조하여 본 발명의 일 실시예에 따른 비디오 부호화 장치 및 비디오 복호화 장치, 비디오 부호화 방법 및 비디오 복호화 방법이 상술된다. 도 1 내지 도 14을 참조하여 본 발명의 일 실시예에 따라 공간적으로 계층적인 데이터 단위에 기반한 비디오의 부호화 및 비디오의 복호화가 후술되고, 도 14 내지 도 26을 참조하여 본 발명의 일 실시예에 따른 적응적 루프 필터링을 이용하는 비디오의 부호화 및 비디오의 복호화가 후술된다.

이하 도 1 내지 도 13을 참조하여 본 발명의 일 실시예에 따른 비디오 부호화 장치 및 비디오 복호화 장치, 비디오 부호화 방법 및 비디오 복호화 방법이 상술된다.

도 1 은 본 발명의 일 실시예에 따른 비디오 부호화 장치의 블록도를 도시한다.

일 실시예에 따른 비디오 부호화 장치(100)는 최대 부호화 단위 분할부(110), 부호화 심도 결정부(120) 및 출력부(130)를 포함한다.

최대 부호화 단위 분할부(110)는 영상의 현재 픽처를 위한 최대 크기의 부호화 단위인 최대 부호화 단위에 기반하여 현재 픽처를 구획할 수 있다. 현재 픽처가 최대 부호화 단위보다 크다면, 현재 픽처의 영상 데이터는 적어도 하나의 최대 부호화 단위로 분할될 수 있다. 영상 데이터는 적어도 하나의 최대 부호화 단위별로 부호화 심도 결정부(120)로 출력될 수 있다.

일 실시예에 따른 부호화 단위는 최대 크기 및 심도로 특징지어질 수 있다. 심도란 부호화 단위가 계층적으로 분할되는 단계를 나타내며, 심도가 깊어질수록 심도별 부호화 단위는 최대 부호화 단위로부터 최소 부호화 단위까지 분할될 수 있다. 최대 부호화 단위의 심도가 최상위 심도이며 최소 부호화 단위가 최하위 부호화 단위로 정의될 수 있다. 최대 부호화 단위는 심도가 깊어짐에 따라 심도별 부호화 단위의 크기는 감소하므로, 상위 심도의 부호화 단위는 복수 개의 하위 심도의 부호화 단위를 포함할 수 있다.

전술한 바와 같이 부호화 단위의 최대 크기에 따라, 현재 픽처의 영상 데이터를 최대 부호화 단위로 분할하며, 각각의 최대 부호화 단위는 심도별로 분할되는 부호화 단위들을 포함할 수 있다. 일 실시예에 따른 최대 부호화 단위는 심도별로 분할되므로, 최대 부호화 단위에 포함된 공간 영역(spatial domain)의 영상 데이터가 심도에 따라 계층적으로 분류될 수 있다.

최대 부호화 단위의 높이 및 너비를 계층적으로 분할할 수 있는 총 횟수를 제한하는 최대 심도 및 부호화 단위의 최대 크기가 미리 설정되어 있을 수 있다.

부호화 심도 결정부(120)는, 심도마다 최대 부호화 단위의 영역이 분할된 적어도 하나의 분할 영역을 부호화하여, 적어도 하나의 분할 영역 별로 최종 부호화 결과가 출력될 심도를 결정한다. 즉 부호화 심도 결정부(120)는, 현재 픽처의 최대 부호화 단위마다 심도별 부호화 단위로 영상 데이터를 부호화하여 가장 작은 부호화 오차가 발생하는 심도를 선택하여 부호화 심도로 결정한다. 결정된 부호화 심도 및 최대 부호화 단위별 영상 데이터는 출력부(130)로 출력된다.

최대 부호화 단위 내의 영상 데이터는 최대 심도 이하의 적어도 하나의 심도에 따라 심도별 부호화 단위에 기반하여 부호화되고, 각각의 심도별 부호화 단위에 기반한 부호화 결과가 비교된다. 심도별 부호화 단위의 부호화 오차의 비교 결과 부호화 오차가 가장 작은 심도가 선택될 수 있다. 각각의 최대화 부호화 단위마다 적어도 하나의 부호화 심도가 결정될 수 있다.

최대 부호화 단위의 크기는 심도가 깊어짐에 따라 부호화 단위가 계층적으로 분할되어 분할되며 부호화 단위의 개수는 증가한다. 또한, 하나의 최대 부호화 단위에 포함되는 동일한 심도의 부호화 단위들이라 하더라도, 각각의 데이터에 대한 부호화 오차를 측정하고 하위 심도로의 분할 여부가 결정된다. 따라서, 하나의 최대 부호화 단위에 포함되는 데이터라 하더라도 위치에 따라 심도별 부호화 오차가 다르므로 위치에 따라 부호화 심도가 달리 결정될 수 있다. 따라서, 하나의 최대 부호화 단위에 대해 부호화 심도가 하나 이상 설정될 수 있으며, 최대 부호화 단위의 데이터는 하나 이상의 부호화 심도의 부호화 단위에 따라 구획될 수 있다.

최대 부호화 단위의 예측 부호화 및 주파수 변환이 수행될 수 있다. 예측 부호화 및 주파수 변환도 마찬가지로, 최대 부호화 단위마다, 최대 심도 이하의 심도마다 심도별 부호화 단위를 기반으로 수행된다.

최대 부호화 단위가 심도별로 분할될 때마다 심도별 부호화 단위의 개수가 증가하므로, 심도가 깊어짐에 따라 생성되는 모든 심도별 부호화 단위에 대해 예측 부호화 및 주파수 변환을 포함한 부호화가 수행되어야 한다. 이하 설명의 편의를 위해 적어도 하나의 최대 부호화 단위 중 현재 심도의 부호화 단위을 기반으로 예측 부호화 및 주파수 변환을 설명하겠다.

일 실시예에 따른 비디오 부호화 장치(100)는, 영상 데이터의 부호화를 위한 데이터 단위의 크기 또는 형태를 다양하게 선택할 수 있다. 영상 데이터의 부호화를 위해서는 예측 부호화, 주파수 변환, 엔트로피 부호화 등의 단계를 거치는데, 모든 단계에 걸쳐서 동일한 데이터 단위가 사용될 수도 있으며, 단계별로 데이터 단위가 변경될 수도 있다.

예를 들어 비디오 부호화 장치(100)는, 영상 데이터의 부호화를 위한 부호화 단위 뿐만 아니라, 부호화 단위의 영상 데이터의 예측 부호화를 수행하기 위해, 부호화 단위와 다른 데이터 단위를 선택할 수 있다.

최대 부호화 단위의 예측 부호화를 위해서는, 최대 부호화 단위의 심도별 부호화 단위의 부분적 데이터 단위를 기반으로 예측 부호화가 수행될 수 있다. 부호화 단위의 부분적 데이터 단위는, 부호화 단위 및 심도별 부호화 단위의 높이 및 너비 중 적어도 하나가 분할된 데이터 단위를 포함할 수 있다.

예를 들어, 부호화 단위의 크기가 2Nx2N(단, N은 양의 정수)인 경우, 부분적 데이터 단위의 크기는 2Nx2N, 2NxN, Nx2N, NxN 등일 수 있다. 부호화 단위의 높이 또는 너비 중 적어도 하나를 반분하는 형태의 데이터 단위 이외에도 다양하게 분할한 형태의 데이터 단위를 기반으로 예측 부호화가 수행될 수도 있다. 이하, 예측 부호화의 기반이 되는 데이터 단위는 '예측 단위'라고 지칭될 수 있다.

부호화 단위의 예측 모드는, 인트라 모드, 인터 모드 및 스킵 모드 중 적어 도 하나일 수 있다. 예를 들어 인트라 모드 및 인터 모드는, 2Nx2N, 2NxN, Nx2N, NxN 크기의 예측 단위에 대해서 수행될 수 있다. 또한, 스킵 모드는 2Nx2N 크기의 예측 단위에 대해서만 수행될 수 있다. 부호화 단위 이내의 하나의 예측 단위마다 독립적으로 부호화가 수행되어 부호화 오차가 가장 작은 예측 모드가 선택될 수 있다.

또한, 일 실시예에 따른 비디오 부호화 장치(100)는, 영상 데이터의 부호화를 위한 부호화 단위 뿐만 아니라, 부호화 단위와 다른 데이터 단위를 기반으로 부호화 단위의 영상 데이터의 주파수 변환을 수행할 수 있다.

부호화 단위의 주파수 변환을 위해서는, 부호화 단위보다 작거나 같은 크기의 데이터 단위를 기반으로 주파수 변환이 수행될 수 있다. 예를 들어, 주파수 변환을 위한 데이터 단위는, 인트라 모드를 위한 데이터 단위 및 인터 모드를 위한 데이터 단위를 포함할 수 있다. 이하, 주파수 변환의 기반이 되는 데이터 단위는 '변환 단위'라고 지칭될 수 있다.

부호화 심도별 부호화 정보는, 부호화 심도 뿐만 아니라 예측 관련 정보 및 주파수 변환 관련 정보가 필요하다. 따라서, 부호화 심도 결정부(120)는 최소 부호화 오차를 발생시킨 부호화 심도 뿐만 아니라, 부호화 심도의 부호화 단위를 예측 단위로 분할한 파티션 타입, 예측 단위별 예측 모드, 주파수 변환을 위한 변환 단위의 크기 등을 결정할 수 있다.

부호화 심도 결정부(120)는 심도별 부호화 단위의 부호화 오차를 라그랑지 곱(Lagrangian Multiplier) 기반의 율-왜곡 최적화 기법(Rate-Distortion Optimization)을 이용하여 측정할 수 있다.

출력부(130)는, 부호화 심도 결정부(120)에서 결정된 적어도 하나의 부호화 심도에 기초하여 부호화된 최대 부호화 단위의 영상 데이터및 심도별 부호화 모드에 관한 정보를 비트스트림 형태로 출력한다.

부호화된 영상 데이터는 영상의 레지듀얼 데이터의 부호화 결과일 수 있다.

심도별 부호화 모드에 관한 정보는, 부호화 심도 정보, 부호화 심도의 부호화 단위의 예측 단위의 파티션 타입 정보, 예측 단위별 예측 모드 정보, 변환 단위의 크기 정보 등을 포함할 수 있다.

부호화 심도 정보는, 현재 심도로 부호화하지 않고 하위 심도의 부호화 단위로 부호화할지 여부를 나타내는 심도별 분할 정보를 이용하여 정의될 수 있다. 현재 부호화 단위의 현재 심도가 부호화 심도라면, 현재 부호화 단위는 현재 심도의 부호화 단위로 부호화되므로 현재 심도의 분할 정보는 더 이상 하위 심도로 분할되지 않도록 정의될 수 있다. 반대로, 현재 부호화 단위의 현재 심도가 부호화 심도가 아니라면 하위 심도의 부호화 단위를 이용한 부호화를 시도해보아야 하므로, 현재 심도의 분할 정보는 하위 심도의 부호화 단위로 분할되도록 정의될 수 있다.

현재 심도가 부호화 심도가 아니라면, 하위 심도의 부호화 단위로 분할된 부호화 단위에 대해 부호화가 수행된다. 현재 심도의 부호화 단위 내에 하위 심도의 부호화 단위가 하나 이상 존재하므로, 각각의 하위 심도의 부호화 단위마다 반복적으로 부호화가 수행되어, 동일한 심도의 부호화 단위마다 재귀적(recursive) 부호화가 수행될 수 있다.

하나의 최대 부호화 단위 안에 적어도 하나의 부호화 심도가 결정되며 부호화 심도마다 적어도 하나의 부호화 모드에 관한 정보가 결정되어야 하므로, 하나의 최대 부호화 단위에 대해서는 적어도 하나의 부호화 모드에 관한 정보가 결정될 수 있다. 또한, 최대 부호화 단위의 데이터는 심도에 따라 계층적으로 구획되어 위치 별로 부호화 심도가 다를 수 있으므로, 데이터에 대해 부호화 심도 및 부호화 모드에 관한 정보가 설정될 수 있다.

따라서, 일 실시예에 따른 출력부(130)는, 최대 부호화 단위에 포함되어 있는 최소 부호화 단위마다 해당 부호화 정보를 설정할 수 있다. 즉, 부호화 심도의 부호화 단위는 동일한 부호화 정보를 보유하고 있는 최소 부호화 단위를 하나 이상 포함하고 있다. 이를 이용하여, 인근 최소 부호화 단위들이 동일한 심도별 부호화 정보를 갖고 있다면, 동일한 최대 부호화 단위에 포함되는 최소 부호화 단위일 수 있다.

예를 들어 출력부(130)를 통해 출력되는 부호화 정보는, 심도별 부호화 단위별 부호화 정보와 예측 단위별 부호화 정보로 분류될 수 있다. 심도별 부호화 단위별 부호하 정보는, 예측 모드 정보, 파티션 크기 정보를 포함할 수 있다. 예측 단위별로 전송되는 부호화 정보는 인터 모드의 추정 방향에 관한 정보, 인터 모드의 참조 영상 인덱스에 관한 정보, 움직임 벡터에 관한 정보, 인트라 모드의 크로마 성분에 관한 정보, 인트라 모드의 보간 방식에 관한 정보 등을 포함할 수 있다. 또한, 픽처, 슬라이스 또는 GOP별로 정의되는 부호화 단위의 최대 크기에 관한 정보 및 최대 심도에 관한 정보는 비트스트림의 헤더에 삽입될 수 있다.

비디오 부호화 장치(100)의 가장 간단한 형태의 실시예에 따르면, 심도별 부호화 단위는 한 계층 상위 심도의 부호화 단위의 높이 및 너비를 반분한 크기의 부호화 단위이다. 즉, 현재 심도의 부호화 단위의 크기가 2Nx2N이라면, 하위 심도의 부호화 단위의 크기는 NxN 이다. 또한, 2Nx2N 크기의 현재 부호화 단위는 NxN 크기의 하위 심도 부호화 단위를 최대 4개 포함할 수 있다.

따라서, 일 실시예에 따른 비디오 복호화 장치(100)는 현재 픽처의 특성을 고려하여 결정된 최대 부호화 단위의 크기 및 최대 심도를 기반으로, 각각의 최대 부호화 단위마다 최적의 형태 및 크기의 부호화 단위를 결정할 수 있다. 또한, 각각의 최대 부호화 단위마다 다양한 예측 모드, 주파수 변환 방식 등으로 부호화할 수 있으므로, 다양한 영상 크기의 부호화 단위의 영상 특성을 고려하여 최적의 부호화 모드가 결정될 수 있다.

따라서, 영상의 해상도가 매우 높거나 데이터량이 매우 큰 영상을 기존 매크로블록 단위로 부호화한다면, 픽처당 매크로블록의 수가 과도하게 많아진다. 이에 따라, 매크로블록마다 생성되는 압축 정보도 많아지므로 압축 정보의 전송 부담이 커지고 데이터 압축 효율이 감소하는 경향이 있다. 따라서, 일 실시예에 따른 비디오 부호화 장치는, 영상의 크기를 고려하여 부호화 단위의 최대 크기를 증가시키면서, 영상 특성을 고려하여 부호화 단위를 조절할 수 있으므로, 영상 압축 효율이 증대될 수 있다.

도 2 는 본 발명의 일 실시예에 따른 비디오 복호화 장치의 블록도를 도시한다.

일 실시예에 따른 비디오 복호화 장치(200)는 수신부(210), 영상 데이터 및 부호화 정보 추출부(220) 및 영상 데이터 복호화부(230)를 포함한다. 일 실시예에 따른 비디오 복호화 장치(200)의 각종 프로세싱을 위한 부호화 단위, 심도, 예측 단위, 변환 단위, 각종 부호화 모드에 관한 정보 등 각종 용어의 정의는, 도 1 및 비디오 부호화 장치(100)을 참조하여 전술한 바와 동일하다.

수신부(205)는 부호화된 비디오에 대한 비트스트림을 수신하여 파싱(parsing)한다. 영상 데이터 및 부호화 정보 추출부(220)는 파싱된 비트스트림으로부터 최대 부호화 단위별로 영상 데이터를 추출하여 영상 데이터 복호화부(230)로 출력한다. 영상 데이터 및 부호화 정보 추출부(220)는 현재 픽처에 대한 헤더로부터 현재 픽처의 부호화 단위의 최대 크기에 관한 정보를 추출할 수 있다.

또한, 영상 데이터 및 부호화 정보 추출부(220)는 파싱된 비트스트림으로부터 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보를 추출한다. 추출된 부호화 심도 및 부호화 모드에 관한 정보는 영상 데이터 복호화부(230)로 출력된다. 즉, 비트열의 영상 데이터를 최대 부호화 단위로 분할하여, 영상 데이터 복호화부(230)가 최대 부호화 단위마다 영상 데이터를 복호화하도록 할 수 있다.

최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보는, 하나 이상의 부호화 심도 정보에 대해 설정될 수 있으며, 부호화 심도별 부호화 모드에 관한 정보는, 부호화 단위별 예측 단위의 파티션 타입 정보, 예측 모드 정보 및 변환 단위의 크기 정보 등을 포함할 수 있다. 또한, 부호화 심도 정보로서, 심도별 분할 정보가 추출될 수도 있다.

영상 데이터 및 부호화 정보 추출부(220)가 추출한 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보는, 일 실시예에 따른 비디오 부호화 장치(100)와 같이 부호화단에서, 최대 부호화 단위별 심도별 부호화 단위마다 반복적으로 부호화를 수행하여 최소 부호화 오차를 발생시키는 것으로 결정된 부호화 심도 및 부호화 모드에 관한 정보이다. 따라서, 비디오 복호화 장치(200)는 최소 부호화 오차를 발생시키는 부호화 방식에 따라 데이터를 복호화하여 영상을 복원할 수 있다.

영상 데이터 및 부호화 정보 추출부(220)는 최소 부호화 단위별로 부호화 심도 및 부호화 모드에 관한 정보를 추출할 수 있다. 최소 부호화 단위별로, 해당 최대 부호화 단위의 부호화 심도 및 부호화 모드에 관한 정보가 기록되어 있다면, 동일한 부호화 심도 및 부호화 모드에 관한 정보를 갖고 있는 최소 부호화 단위들은 동일한 최대 부호화 단위에 포함되는 데이터 단위로 유추될 수 있다. 즉, 동일한 정보의 최소 부호화 단위를 모아 복호화하면, 부호화 오차가 가장 작은 부호화 심도의 부호화 단위를 기반으로 한 복호화가 가능하다.

영상 데이터 복호화부(230)는 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보에 기초하여 각각의 최대 부호화 단위의 영상 데이터를 복호화하여 현재 픽처를 복원한다. 최대 부호화 단위별 부호화 심도 정보에 기초하여, 영상 데이터 복호화부(230)는 적어도 하나의 부호화 심도의 부호화 단위마다 영상 데이터를 복호화할 수 있다. 복호화 과정은 인트라 예측 및 움직임 보상을 포함하는 예측 과정, 및 주파수 역변환 과정을 포함할 수 있다.

영상 데이터 복호화부(230)는, 부호화 단위별 예측 부호화를 위해, 부호화 심도별 부호화 단위의 예측 단위의 파티션 타입 정보 및 예측 모드 정보에 기초하여, 부호화 단위마다 각각의 예측 단위 및 예측 모드로 인트라 예측 또는 움직임 보상을 수행할 수 있다.

또한, 영상 데이터 복호화부(230)는, 최대 부호화 단위별 주파수 역변환을 위해, 부호화 심도별 부호화 단위의 변환 단위의 크기 정보에 기초하여, 부호화 단위마다 각각의 변환 단위로 주파수 역변환을 수행할 수 있다.

영상 데이터 복호화부(230)는 심도별 분할 정보를 이용하는 현재 최대 부호화 단위의 부호화 심도를 결정할 수 있다. 만약, 분할 정보가 현재 심도로 복호화할 것을 나타내고 있다면 현재 심도가 부호화 심도이다. 따라서, 영상 데이터 복호화부(230)는 현재 최대 부호화 단위의 영상 데이터에 대해 현재 심도의 부호화 단위를 예측 단위의 파티션 타입, 예측 모드 및 변환 단위 크기 정보를 이용하여 복호화할 수 있다.

즉, 최소 부호화 단위에 대해 설정되어 있는 부호화 정보를 관찰하여, 동일한 분할 정보를 포함한 부호화 정보를 보유하고 있는 최소 부호화 단위를 모아, 하나의 데이터 단위로 복호화할 수 있다.

일 실시예에 따른 비디오 복호화 장치(200)는, 부호화 과정에서 최대 부호화 단위마다 재귀적으로 부호화를 수행하여 최소 부호화 오차를 발생시킨 부호화 단위에 대한 정보를 획득하여, 현재 픽처에 대한 복호화에 이용할 수 있다. 즉, 최대 부호화 단위마다 최적 부호화 단위로 영상 데이터의 복호화가 가능해진다.

따라서, 높은 해상도의 영상 또는 데이터량이 과도하게 많은 영상이라도 부호화단으로부터 전송된 최적 부호화 모드에 관한 정보를 이용하여, 영상의 특성에 적응적으로 결정된 부호화 단위의 크기 및 부호화 모드에 따라 효율적으로 영상 데이터를 복호화하여 복원할 수 있다.

도 3 은 계층적 부호화 단위의 개념을 도시한다.

부호화 단위의 예는, 너비x높이가 64x64인 부호화 단위부터, 32x32, 16x16, 8x8, 및 4x4를 포함할 수 있다. 정사각형 형태의 부호화 단위 이외에도, 너비x높이가 64x32, 32x64, 32x16, 16x32, 16x8, 8x16, 8x4, 4x8인 부호화 단위들이 존재할 수 있다.

비디오 데이터(310)에 대해서는, 해상도는 1920x1080, 부호화 단위의 최대 크기는 64, 최대 심도가 2로 설정되어 있다. 비디오 데이터(320)에 대해서는, 해상도는 1920x1080, 부호화 단위의 최대 크기는 64, 최대 심도가 4로 설정되어 있다. 비디오 데이터(330)에 대해서는, 해상도는 352x288, 부호화 단위의 최대 크기는 16, 최대 심도가 2로 설정되어 있다.

해상도가 높거나 데이터량이 많은 경우 부호화 효율의 향상 뿐만 아니라 영상 특성을 정확히 반형하기 위해 부호화 사이즈의 최대 크기가 상대적으로 큰 것이 바람직하다. 따라서, 비디오 데이터(330)에 비해, 해상도가 높은 비디오 데이터(310, 320)는 부호화 사이즈의 최대 크기가 64로 선택될 수 있다.

최대 심도는 계층적 부호화 단위에서 총 계층수를 나타낸다. 따라서, 비디오 데이터(310)의 최대 심도는 2이므로, 비디오 데이터(310)의 부호화 단위(315)는 장 축 크기가 64인 최대 부호화 단위로부터, 심도가 두 계층 깊어져서 장축 크기가 32, 16인 부호화 단위들까지 포함할 수 있다. 반면, 비디오 데이터(330)의 최대 심도는 2이므로, 비디오 데이터(330)의 부호화 단위(335)는 장축 크기가 16인 부호화 단위들로부터, 심도가 두 계층 깊어져서 장축 크기가 8, 4인 부호화 단위들까지 포함할 수 있다.

비디오 데이터(320)의 최대 심도는 4이므로, 비디오 데이터(320)의 부호화 단위(325)는 장축 크기가 64인 최대 부호화 단위로부터, 심도가 네 계층 깊어져서 장축 크기가 32, 16, 8, 4인 부호화 단위들까지 포함할 수 있다. 심도가 깊어질수록 세부 정보의 표현능력이 향상될 수 있다.

도 4 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 부호화부의 블록도를 도시한다.

일 실시예에 따른 영상 부호화부(400)는, 비디오 부호화 장치(100)의 부호화 심도 결정부(120)에서 영상 데이터를 부호화하는데 거치는 작업들을 포함한다. 즉, 인트라 예측부(410)는 현재 프레임(405) 중 인트라 모드의 부호화 단위에 대해 인트라 예측을 수행하고, 움직임 추정부(420) 및 움직임 보상부(425)는 인터 모드의 현재 프레임(405) 및 참조 프레임(495)를 이용하여 인터 추정 및 움직임 보상을 수행한다.

인트라 예측부(410), 움직임 추정부(420) 및 움직임 보상부(425)로부터 출력된 데이터는 주파수 변환부(430) 및 양자화부(440)를 거쳐 양자화된 변환 계수로 출력된다. 양자화된 변환 계수는 역양자화부(460), 주파수 역변환부(470)을 통해 공간 영역의 데이터로 복원되고, 복원된 공간 영역의 데이터는 디블로킹부(480) 및 루프 필터링부(490)를 거쳐 후처리되어 참조 프레임(495)으로 출력된다. 양자화된 변환 계수는 엔트로피 부호화부(450)를 거쳐 비트스트림(455)으로 출력될 수 있다.

일 실시예에 따른 비디오 부호화 장치(100)에 적용되기 위해서는, 영상 부호화부(400)의 구성 요소들인 인트라 예측부(410), 움직임 추정부(420), 움직임 보상부(425), 주파수 변환부(430), 양자화부(440), 엔트로피 부호화부(450), 역양자화부(460), 주파수 역변환부(470), 디블로킹부(480) 및 루프 필터링부(490)가 모두, 최대 부호화 단위마다 최대 심도를 고려한 심도별 부호화 단위에 기반하여 작업을 수행하여야 한다.

특히, 인트라 예측부(410), 움직임 추정부(420) 및 움직임 보상부(425)는 부호화 단위의 최대 크기 및 심도를 고려하여 부호화 단위 내의 예측 단위 및 예측 모드를 결정하며, 주파수 변환부(430)는 부호화 단위의 최대 크기 및 심도를 고려하여 변환 단위의 크기를 고려하여야 한다.

도 5 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 복호화부의 블록도를 도시한다.

비트스트림(505)이 파싱부(510)를 거쳐 복호화 대상인 부호화된 영상 데이터 및 복호화를 위해 필요한 부호화에 관한 정보가 파싱된다. 부호화된 영상 데이터는 엔트로피 복호화부(520) 및 역양자화부(530)를 거쳐 역양자화된 데이터로 출력되고, 주파수 역변환부(540)를 거쳐 공간 영역의 영상 데이터가 복원된다.

공간 영역의 영상 데이터에 대해서, 인트라 예측부(550)는 인트라 모드의 부 호화 단위에 대해 인트라 예측을 수행하고, 움직임 보상부(560)는 참조 프레임(585)를 함께 이용하여 인터 모드의 부호화 단위에 대해 움직임 보상을 수행한다.

인트라 예측부(550) 및 움직임 보상부(560)를 거친 공간 영역의 데이터는 디블로킹부(570) 및 루프 필터링부(580)를 거쳐 후처리되어 복원 프레임(595)으로 출력될 수 있다. 또한, 디블로킹부(570) 및 루프 필터링부(580)를 거쳐 후처리된 데이터는 참조 프레임(585)으로서 출력될 수 있다.

비디오 복호화 장치(200)의 영상 데이터 복호화부(230)에서 영상 데이터를 복호화하기 위해, 일 실시예에 따른 영상 복호화부(500)의 파싱부(510) 이후의 단계별 작업들이 수행될 수 있다.

일 실시예에 따른 비디오 복호화 장치(200)에 적용되기 위해서는, 영상 복호화부(400)의 구성 요소들인 파싱부(510), 엔트로피 복호화부(520), 역양자화부(530), 주파수 역변환부(540), 인트라 예측부(550), 움직임 보상부(560), 디블로킹부(570) 및 루프 필터링부(580)가 모두, 최대 부호화 단위마다 부호화 심도의 부호화 단위에 기반하여 작업을 수행하여야 한다.

특히, 인트라 예측부(550), 움직임 보상부(560)는 부호화 단위의 최대 크기 및 심도를 고려하여 부호화 단위 및 예측 모드를 결정하며, 주파수 역변환부(540)는 부호화 단위의 최대 크기 및 심도를 고려하여 변환 단위의 크기를 고려하여야 한다.

도 6 는 본 발명의 일 실시예에 따른 심도별 부호화 단위 및 예측 단위를 도 시한다.

일 실시예에 따른 비디오 부호화 장치(100) 및 일 실시예에 따른 비디오 복호화 장치(200)는 영상 특성을 고려하기 위해 계층적인 부호화 단위를 사용한다. 부호화 단위의 최대 높이 및 너비, 최대 심도는 영상의 특성에 따라 적응적으로 결정될 수도 있으며, 사용자의 요구에 따라 다양하게 설정될 수도 있다. 미리 설정된 부호화 단위의 최대 크기에 따라, 심도별 부호화 단위의 크기가 결정될 수 있다.

일 실시예에 따른 부호화 단위의 계층 구조(600)는 부호화 단위의 최대 높이 및 너비가 64이며, 최대 심도가 4인 경우를 도시하고 있다. 일 실시예에 따른 부호화 단위의 계층 구조(600)의 세로축을 따라서 심도가 깊어지므로 심도별 부호화 단위의 높이 및 너비가 각각 분할한다. 또한, 부호화 단위의 계층 구조(600)의 가로축을 따라, 각각의 심도별 부호화 단위의 예측 부호화의 기반이 되는 부분적 데이터 단위인 예측 단위가 도시되어 있다.

즉, 부호화 단위(610)는 부호화 단위의 계층 구조(600) 중 최대 부호화 단위로서 심도가 0이며, 부호화 단위의 크기, 즉 높이 및 너비가 64x64이다. 세로축을 따라 심도가 깊어지며, 크기 32x32인 심도 1의 부호화 단위(620), 크기 16x16인 심도 2의 부호화 단위(630), 크기 8x8인 심도 3의 부호화 단위(640), 크기 4x4인 심도 4의 부호화 단위(650)가 존재한다. 크기 4x4인 심도 4의 부호화 단위(650)는 최소 부호화 단위이다.

각각의 심도별로 가로축을 따라, 부호화 단위의 예측 단위로서, 부분적 데이터 단위들이 배열된다. 즉, 심도 0의 크기 64x64의 부호화 단위(610)의 예측 단위 는, 크기 64x64의 부호화 단위(610)에 포함되는 크기 64x64의 부분적 데이터 단위(610), 크기 64x32의 부분적 데이터 단위들(612), 크기 32x64의 부분적 데이터 단위들(614), 크기 32x32의 부분적 데이터 단위들(616)일 수 있다. 반대로 보면, 부호화 단위는 변환 단위들(610, 612, 614, 616)을 포함하는 최소 크기의 정사각형의 데이터 단위일 수 있다.

마찬가지로, 심도 1의 크기 32x32의 부호화 단위(620)의 예측 단위는, 크기 32x32의 부호화 단위(620)에 포함되는 크기 32x32의 부분적 데이터 단위(620), 크기 32x16의 부분적 데이터 단위들(622), 크기 16x32의 부분적 데이터 단위들(624), 크기 16x16의 부분적 데이터 단위들(626)일 수 있다.

마찬가지로, 심도 2의 크기 16x16의 부호화 단위(630)의 예측 단위는, 크기 16x16의 부호화 단위(630)에 포함되는 크기 16x16의 부분적 데이터 단위(630), 크기 16x8의 부분적 데이터 단위들(632), 크기 8x16의 부분적 데이터 단위들(634), 크기 8x8의 부분적 데이터 단위들(636)일 수 있다.

마찬가지로, 심도 3의 크기 8x8의 부호화 단위(640)의 예측 단위는, 크기 8x8의 부호화 단위(640)에 포함되는 크기 8x8의 부분적 데이터 단위(640), 크기 8x4의 부분적 데이터 단위들(642), 크기 4x8의 부분적 데이터 단위들(644), 크기 4x4의 부분적 데이터 단위들(646)일 수 있다.

마지막으로, 심도 4의 크기 4x4의 부호화 단위(650)는 최소 부호화 단위이며 최하위 심도의 부호화 단위이고, 해당 예측 단위도 크기 4x4의 데이터 단위(650)이다.

일 실시예에 따른 비디오 부호화 장치(100)의 부호화 심도 결정부(120)는, 최대 부호화 단위(610)의 부호화 심도를 결정하기 위해, 최대 부호화 단위(610)에 포함되는 각각의 심도의 부호화 단위마다 부호화를 수행하여야 한다.

동일한 범위 및 크기의 데이터를 포함하기 위한 심도별 부호화 단위의 개수는, 심도가 깊어질수록 심도별 부호화 단위의 개수도 증가한다. 예를 들어, 심도 1의 부호화 단위 한 개가 포함하는 데이터에 대해서, 심도 2의 부호화 단위는 네 개가 필요하다. 따라서, 동일한 데이터의 부호화 결과를 심도별로 비교하기 위해서, 한 개의 심도 1의 부호화 단위 및 네 개의 심도 2의 부호화 단위를 이용하여 각각 부호화되어야 한다.

각각의 심도별 부호화를 위해서는, 부호화 단위의 계층 구조(600)의 가로축을 따라, 심도별 부호화 단위의 예측 단위들마다 부호화를 수행하여, 해당 심도에서 가장 작은 부호화 오차인 대표 부호화 오차가 선택될 수다. 또한, 부호화 단위의 계층 구조(600)의 세로축을 따라 심도가 깊어지며, 각각의 심도마다 부호화를 수행하여, 심도별 대표 부호화 오차를 비교하여 최소 부호화 오차가 검색될 수 있다. 최대 부호화 단위(610) 중 최소 부호화 오차가 발생하는 심도가 최대 부호화 단위(610)의 부호화 심도 및 파티션 타입으로 선택될 수 있다.

도 7 은 본 발명의 일 실시예에 따른, 부호화 단위 및 변환 단위의 관계를 도시한다.

일 실시예에 따른 비디오 부호화 장치(100) 또는 일 실시예에 따른 비디오 복호화 장치(200)는, 최대 부호화 단위마다 최대 부호화 단위보다 작거나 같은 크 기의 부호화 단위로 영상을 부호화하거나 복호화한다. 부호화 과정 중 주파수 변환을 위한 변환 단위의 크기는 각각의 부호화 단위보다 크지 않은 데이터 단위를 기반으로 선택될 수 있다.

예를 들어, 일 실시예에 따른 비디오 부호화 장치(100) 또는 일 실시예에 따른 비디오 복호화 장치(200)에서, 현재 부호화 단위(710)가 64x64 크기일 때, 32x32 크기의 변환 단위(720)를 이용하여 주파수 변환이 수행될 수 있다.

또한, 64x64 크기의 부호화 단위(710)의 데이터를 64x64 크기 이하의 32x32, 16x16, 8x8, 4x4 크기의 변환 단위들로 각각 주파수 변환을 수행하여 부호화한 후, 원본과의 오차가 가장 적은 변환 단위가 선택될 수 있다.

도 8 은 본 발명의 일 실시예에 따라, 심도별 부호화 정보들을 도시한다.

일 실시예에 따른 비디오 부호화 장치(100)의 부호화 정보 부호화부는 부호화 모드에 관한 정보로서, 각각의 부호화 심도의 부호화 단위마다 파티션 타입에 관한 정보(800), 예측 모드에 관한 정보(810), 변환 단위 크기에 대한 정보(820)를 부호화하여 전송할 수 있다.

파티션 타입에 대한 정보(800)는, 현재 부호화 단위의 예측 부호화를 위해 예측 단위로서, 현재 부호화 단위가 분할된 타입에 대한 정보를 나타낸다. 예를 들어, 심도 0 및 크기 2Nx2N의 현재 부호화 단위 CU_0는, 크기 2Nx2N의 예측 단위(802), 크기 2NxN의 예측 단위(804), 크기 Nx2N의 예측 단위(806), 크기 NxN의 예측 단위(808) 중 어느 하나의 타입으로 분할되어 예측 단위로 이용될 수 있다. 이 경우 현재 부호화 단위의 파티션 타입에 관한 정보(800)는 크기 2Nx2N의 예측 단위(802), 크기 2NxN의 예측 단위(804), 크기 Nx2N의 예측 단위(806) 및 크기 NxN의 예측 단위(808) 중 하나를 나타내도록 설정된다.

예측 모드에 관한 정보(810)는, 각각의 예측 단위의 예측 모드를 나타낸다. 예를 들어 예측 모드에 관한 정보(810)를 통해, 파티션 타입에 관한 정보(800)가 가리키는 예측 단위가 인트라 모드(812), 인터 모드(814) 및 스킵 모드(816) 중 하나로 예측 부호화가 수행되는지 여부가 설정될 수 있다.

또한, 변환 단위 크기에 관한 정보(820)는 현재 부호화 단위를 어떠한 변환 단위를 기반으로 주파수 변환을 수행할지 여부를 나타낸다. 예를 들어, 변환 단위는 제 1 인트라 변환 단위 크기(822), 제 2 인트라 변환 단위 크기(824), 제 1 인터 변환 단위 크기(826), 제 2 인트라 변환 단위 크기(828) 중 하나일 수 있다.

일 실시예에 따른 비디오 복호화 장치(200)의 부호화 정보 추출부는, 각각의 심도별 부호화 단위마다 파티션 타입에 관한 정보(800), 예측 모드에 관한 정보(810), 변환 단위 크기에 대한 정보(820)를 추출하여 복호화에 이용할 수 있다.

도 9 는 본 발명의 일 실시예에 따른 심도별 부호화 단위를 도시한다.

심도의 변화를 나타내기 위해 분할 정보가 이용될 수 있다. 분할 정보는 현재 심도의 부호화 단위가 하위 심도의 부호화 단위로 분할될지 여부를 나타낸다.

심도 0 및 2N_0x2N_0 크기의 부호화 단위의 예측 부호화를 위한 예측 단위(910)는 2N_0x2N_0 크기의 파티션 타입(912), 2N_0xN_0 크기의 파티션 타입(914), N_0x2N_0 크기의 파티션 타입(916), N_0xN_0 크기의 파티션 타입(918)을 포함할 수 있다.

파티션 타입마다, 한 개의 2N_0x2N_0 크기의 예측 단위, 두 개의 2N_0xN_0 크기의 예측 단위, 두 개의 N_0x2N_0 크기의 예측 단위, 네 개의 N_0xN_0 크기의 예측 단위마다 반복적으로 예측 부호화가 수행되어야 한다. 크기 2N_0x2N_0, 크기 N_0x2N_0 및 크기 2N_0xN_0 및 크기 N_0xN_0의 예측 단위에 대해서는, 인트라 모드 및 인터 모드로 예측 부호화가 수행될 수 있다. 스킵 모드는 크기 2N_0x2N_0의 예측 단위에 예측 부호화가 대해서만 수행될 수 있다.

크기 N_0xN_0의 파티션 타입(918)에 의한 부호화 오차가 가장 작다면, 심도 0를 1로 변경하고(920), 심도 2 및 크기 N_0xN_0의 파티션 타입의 부호화 단위들(922, 924, 926, 928)에 대해 반복적으로 최소 부호화 오차를 검색해 나갈 수 있다.

동일한 심도의 부호화 단위들(922, 924, 926, 928)에 대해 부호화가 반복적으로 수행되므로, 이중 하나만 예를 들어 심도 1의 부호화 단위의 부호화를 설명한다. 심도 1 및 크기 2N_1x2N_1 (=N_0xN_0)의 부호화 단위의 예측 부호화를 위한 예측 단위(930)는, 크기 2N_1x2N_1의 파티션 타입(932), 크기 2N_1xN_1의 파티션 타입(934), 크기 N_1x2N_1의 파티션 타입(936), 크기 N_1xN_1의 파티션 타입(938)을 포함할 수 있다. 파티션 타입마다, 한 개의 크기 2N_1x2N_1의 예측 단위, 두 개의 크기 2N_1xN_1의 예측 단위, 두 개의 크기 N_1x2N_1의 예측 단위, 네 개의 크기 N_1xN_1의 예측 단위마다 반복적으로 예측 부호화가 수행되어야 한다.

또한, 크기 N_1xN_1 크기의 파티션 타입(938)에 의한 부호화 오차가 가장 작다면, 심도 1을 심도 2로 변경하면서(940), 심도 2 및 크기 N_2xN_2의 부호화 단위 들(942, 944, 946, 948)에 대해 반복적으로 최소 부호화 오차를 검색해 나갈 수 있다.

최대 심도가 d인 경우, 심도별 분할 정보는 심도 d-1일 때까지 설정될 수 있다. 즉, 심도 d-1 및 크기 2N_(d-1)x2N_(d-1)의 부호화 단위의 예측 부호화를 위한 예측 단위(950)는, 크기 2N_(d-1)x2N_(d-1)의 파티션 타입(952), 크기 2N_(d-1)xN_(d-1)의 파티션 타입(954), 크기 N_(d-1)x2N_(d-1)의 파티션 타입(956), 크기 N_(d-1)xN_(d-1)의 파티션 타입(958)을 포함할 수 있다.

파티션 타입마다, 한 개의 크기 2N_(d-1)x2N_(d-1)의 예측 단위, 두 개의 크기 2N_(d-1)xN_(d-1)의 예측 단위, 두 개의 크기 N_(d-1)x2N_(d-1)의 예측 단위, 네 개의 크기 N_(d-1)xN_(d-1)의 예측 단위마다 반복적으로 예측 부호화를 통한 부호화가 수행되어야 한다. 최대 심도가 d이므로, 심도 d-1의 부호화 단위(952)는 더 이상 분할 과정을 거치지 않는다.

일 실시예에 따른 비디오 부호화 장치(100)는 부호화 단위(912)를 위한 부호화 심도를 결정하기 위해, 심도별 부호화 오차를 비교하여 가장 작은 부호화 오차가 발생하는 심도를 선택한다.

예를 들어, 심도 0의 부호화 단위에 대한 부호화 오차는 파티션 타입(912, 914, 916, 918)마다 예측 부호화를 수행한 후 가장 작은 부호화 오차가 발생하는 예측 단위가 결정된다. 마찬가지로 심도 0, 1, ..., d-1 마다 부호화 오차가 가장 작은 예측 단위가 검색될 수 있다. 심도 d에서는, 크기 2N_dx2N_d의 부호화 단위이면서 예측 단위(960)를 기반으로 한 예측 부호화를 통해 부호화 오차가 결정될 수 있다.

이런 식으로 심도 0, 1, ..., d-1, d의 모든 심도별 최소 부호화 오차를 비교하여 오차가 가장 작은 심도가 선택되어 부호화 심도로 결정될 수 있다. 부호화 심도 및 해당 심도의 예측 단위는 부호화 모드에 관한 정보로써 부호화되어 전송될 수 있다. 또한, 심도 0으로부터 부호화 심도에 이르기까지 부호화 단위가 분할되어야 하므로, 부호화 심도의 분할 정보만이 '0'으로 설정되고, 부호화 심도를 제외한 심도별 분할 정보는 '1'로 설정되어야 한다.

일 실시예에 따른 비디오 복호화 장치(200)의 부호화 정보 추출부(220)는 부호화 단위(912)에 대한 부호화 심도 및 예측 단위에 관한 정보를 추출하여 부호화 단위(912)를 복호화하는데 이용할 수 있다. 일 실시예에 따른 비디오 복호화 장치(200)는 심도별 분할 정보를 이용하여 분할 정보가 '0'인 심도를 부호화 심도로 파악하고, 해당 심도에 대한 부호화 모드에 관한 정보를 이용하여 복호화에 이용할 수 있다.

도 10a, 10b 및 10c는 본 발명의 일 실시예에 따른, 부호화 단위, 예측 단위 및 주파수 변환 단위의 관계를 도시한다.

부호화 단위(1010)는, 최대 부호화 단위에 대해 일 실시예에 따른 비디오 부호화 장치(100)가 결정한 부호화 심도별 부호화 단위들이다. 예측 단위(1060)는 부호화 단위(1010) 중 각각의 부호화 심도별 부호화 단위의 예측 단위들이며, 변환 단위(1070)는 각각의 부호화 심도별 부호화 단위의 변환 단위들이다.

심도별 부호화 단위들(1010)은 최대 부호화 단위의 심도가 0이라고 하면, 부 호화 단위들(1012, 1054)은 심도가 1, 부호화 단위들(1014, 1016, 1018, 1028, 1050, 1052)은 심도가 2, 부호화 단위들(1020, 1022, 1024, 1026, 1030, 1032, 1048)은 심도가 3, 부호화 단위들(1040, 1042, 1044, 1046)은 심도가 4이다.

예측 단위들(1060) 중 일부(1014, 1016, 1022, 1032, 1048, 1050, 1052, 1054)는 부호화 단위가 분할된 타입이다. 즉, 예측 단위(1014, 1022, 1050, 1054)는 2NxN의 파티션 타입이며, 예측 단위(1016, 1048, 1052)는 Nx2N의 파티션 타입, 예측 단위(1032)는 NxN의 파티션 타입이다. 즉, 심도별 부호화 단위들(1010)의 예측 단위는 각각의 부호화 단위보다 작거나 같다.

변환 단위들(1070) 중 일부(1052)의 영상 데이터에 대해서는 부호화 단위에 비해 작은 크기의 데이터 단위로 주파수 변환 또는 주파수 역변환이 수행된다. 또한, 변환 단위(1014, 1016, 1022, 1032, 1048, 1050, 1052, 1054)는 예측 단위들(1060) 중 해당 예측 단위와 비교해보면, 서로 다른 크기 또는 형태의 데이터 단위이다. 즉, 일 실시예에 따른 비디오 부호화 장치(100) 및 일 실시예에 다른 비디오 복호화 장치(200)는 동일한 부호화 단위에 대한 인트라 예측/움직임 추정/움직임 보상 작업, 및 주파수 변환/역변환 작업이라 할지라도, 각각 별개의 데이터 단위를 기반으로 수행할 수 있다.

도 11 은 본 발명의 일 실시예에 따른 부호화 단위별 부호화 정보를 도시한다.

일 실시예에 따른 비디오 부호화 장치(100)의 출력부(130)는 부호화 단위별 부호화 정보를 출력하고, 일 실시예에 따른 비디오 복호화 장치(200)의 부호화 정 보 추출부(220)는 부호화 단위별 부호화 정보를 추출할 수 있다.

부호화 정보는 부호화 단위에 대한 분할 정보, 파티션 타입 정보, 예측 모드 정보, 변환 단위 크기 정보를 포함할 수 있다. 도 11에 도시되어 있는 부호화 정보들은 일 실시예에 따른 비디오 부호화 장치(100) 및 일 실시예에 따른 비디오 복호화 장치(200)에서 설정할 수 있는 일례이다.

분할 정보는 해당 부호화 단위의 부호화 심도를 나타낼 수 있다. 즉, 분할 정보에 따라 더 이상 분할되지 않는 심도가 부호화 심도이므로, 부호화 심도에 대해서 파티션 타입 정보, 예측 모드, 변환 단위 크기 정보가 정의될 수 있다. 분할 정보에 따라 한 단계 더 분할되어야 하는 경우에는, 분할된 4개의 하위 심도의 부호화 단위마다 독립적으로 부호화가 수행되어야 한다.

파티션 타입 정보는, 부호화 심도의 부호화 단위의 변환 단위의 파티션 타입을 2Nx2N, 2NxN, Nx2N 및 NxN 중 하나로 나타낼 수 있다. 예측 모드는, 인트라 모드, 인터 모드 및 스킵 모드 중 하나로 나타낼 수 있다. 인트라 모드 및 인터 모드는 파티션 타입 2Nx2N, 2NxN, Nx2N 및 NxN에서 정의될 수 있으며, 스킵 모드는 파티션 타입 2Nx2N에서만 정의될 수 있다. 변환 단위 크기는 인트라 모드에서 두 종류의 크기, 인터 모드에서 두 종류의 크기로 설정될 수 있다.

부호화 단위 내의 최소 부호화 단위마다, 소속되어 있는 부호화 심도의 부호화 단위별 부호화 정보를 수록하고 있을 수 있다. 따라서, 인접한 최소 부호화 단위들끼리 각각 보유하고 있는 부호화 정보들을 확인하면, 동일한 부호화 심도의 부호화 단위에 포함되는지 여부가 확인될 수 있다. 또한, 최소 부호화 단위가 보유하 고 있는 부호화 정보를 이용하면 해당 부호화 심도의 부호화 단위를 확인할 수 있으므로, 최대 부호화 단위 내의 부호화 심도들의 분포가 유추될 수 있다.

따라서 이 경우 현재 부호화 단위가 주변 데이터 단위를 참조하여 예측하기 경우, 현재 부호화 단위에 인접하는 심도별 부호화 단위 내의 최소 부호화 단위의 부호화 정보가 직접 이용됨으로써 최소 부호화 단위의 데이터가 참조될 수 있다.

또 다른 실시예로, 심도별 부호화 단위의 부호화 정보가 심도별 부호화 단위 내 중 대표되는 최소 부호화 단위에 대해서만 저장되어 있을 수 있다. 이 경우 현재 부호화 단위가 주변 부호화 단위를 참조하여 예측되는 경우, 인접하는 심도별 부호화 단위의 부호화 정보를 이용하여, 심도별 부호화 단위 내에서 현재 부호화 단위에 인접하는 데이터가 검색됨으로써 참조될 수도 있다.

도 12 는 본 발명의 일 실시예에 따른 비디오 부호화 방법의 흐름도를 도시한다.

단계 1210에서, 현재 픽처는 적어도 하나의 최대 부호화 단위로 분할된다. 또한, 가능한 총 분할 횟수를 나타내는 최대 심도가 미리 설정될 수도 있다.

단계 1220에서, 심도마다 최대 부호화 단위의 영역이 분할된 적어도 하나의 분할 영역시 부호화되어, 적어도 하나의 분할 영역 별로 최종 부호화 결과가 출력될 심도가 결정된다. 최대 부호화 단위가 단계별로 분할되며 심도가 깊어질 때마다, 하위 심도별 부호화 단위들마다 반복적으로 부호화가 수행되어야 한다.

또한, 심도별 부호화 단위마다, 부호화 오차가 가장 작은 파티션 타입별 변환 단위가 결정되어야 한다. 부호화 단위의 최소 부호화 오차를 발생시키는 부호화 심도가 결정되기 위해서는, 모든 심도별 부호화 단위마다 부호화 오차가 측정되어 비교되어야 한다.

단계 1230에서, 최대 부호화 단위마다 적어도 하나의 분할 영역 별 최종 부호화 결과인 영상 데이터와, 부호화 심도 및 부호화 모드에 관한 정보가 출력된다. 부호화 모드에 관한 정보는 부호화 심도에 관한 정보 또는 분할 정보, 부호화 심도의 파티션 타입 정보, 예측 모드 정보 및 변환 단위 크기 정보 등을 포함할 수 있다. 부호화된 부호화 모드에 관한 정보는, 부호화된 영상 데이터와 함께 복호화단으로 전송될 수 있다.

도 13 은 본 발명의 일 실시예에 따른 비디오 복호화 방법의 흐름도를 도시한다.

단계 1310에서, 부호화된 비디오에 대한 비트스트림가 수신되어 파싱된다.

단계 1320에서, 파싱된 비트스트림으로부터 최대 크기의 최대 부호화 단위에 할당되는 현재 픽처의 영상 데이터 및 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보가 추출된다. 최대 부호화 단위별 부호화 심도는, 현재 픽처의 부호화 과정에서 최대 부호화 단위별로 부호화 오차가 가장 적은 심도로 선택된 심도이다. 최대 부호화 단위별 부호화는, 최대 부호화 단위를 심도별로 계층적으로 분할한 적어도 하나의 데이터 단위에 기반하여 영상 데이터가 부호화된 것이다. 따라서, 부호화 단위별 부호화 심도를 파악한 후 각각의 영상 데이터를 복호화함으로써 영상의 부복호화의 효율성이 향상될 수 있다.

단계 1330에서, 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정 보에 기초하여 각각의 최대 부호화 단위의 영상 데이터가 복호화된다. 복호화된 영상 데이터는 재생 장치에 의해 재생되거나, 저장 매체에 저장되거나, 네트워크를 통해 전송될 수 있다.

이하, 도 14 내지 도 26을 참조하여 본 발명의 일 실시예에 따르는 적응적인 루프 필터링을 이용하는 비디오 부호화 및 비디오 복호화가 상술된다.

도 14 는 본 발명의 일 실시예에 따라 연속적인 1차원 필터링에 의한 루프 필터링을 이용하는 비디오 부호화 장치를 도시한다.

일 실시예에 따른 비디오 부호화 장치(1400)는 최대 부호화 단위 분할부(1410), 부호화 심도 결정부(1420), 및 출력부(1460)를 포함한다. 출력부(1460)는 부호화된 영상 데이터 출력부(1430), 부호화 정보 출력부(1440) 및 루프 필터 계수 정보 출력부(1450)를 포함한다.

최대 부호화 단위 분할부(1410) 및 부호화 심도 결정부(1420)는 도 1을 참조하여 전술된 비디오 부호화 장치(100)의 최대 부호화 단위 분할부(110) 및 부호화 심도 결정부(120)와 동일한 기능의 구성요소이다. 또한, 부호화된 영상 데이터 출력부(1430) 및 부호화 정보 출력부(1440)는 도 1을 참조하여 전술된 비디오 부호화 장치(100)의 출력부(130)의 일부 기능을 수행한다.

다만, 비디오 부호화 장치(1400)의 비디오 부호화는, 일 실시예에 따라 연속적인 1차원 필터링에 의해 수행되는 루프 필터링을 포함한다. 일 실시예에 따른 비디오 부호화 장치(1400)의 루프 필터링에 의한 특징들이 이하 상술된다.

일 실시예에 따라 최대 부호화 단위 분할부(1410)는 영상의 현재 픽처를 위한 최대 크기의 부호화 단위인 최대 부호화 단위에 기반하여 현재 픽처를 구획하고, 부호화 심도 결정부(1420)는 최대 부호화 단위마다 심도별 부호화 단위로 영상 데이터를 부호화하여 적어도 하나의 분할 영역 별로 최종 부호화 결과가 출력될 심도를 결정한다..

일 실시예에 따라 부호화된 영상 데이터 출력부(1430)는, 부호화 심도에 기초하여 부호화된 최대 부호화 단위의 영상 데이터의 비트스트림을 출력한다. 부호화 정보 출력부(1440)는, 최대 부호화 단위마다 심도별 부호화 모드에 관한 정보를 부호화하여 출력한다.

일 실시예에 따른 루프 필터 계수 정보 출력부(1450)는, 현재 픽처의 부호화 중 디블로킹 이후 연속적인 1차원 필터링에 의해 수행되는 루프 필터링의 필터 계수 정보를 부호화하여 출력한다. 일 실시예에 따른 루프 필터링은 복수의 1차원 필터의 연속적인 필터링에 의한다. 루프 필터링은 루마 성분 및 크로마 성분에 대해 별개로 수행될 수 있다.

일 실시예에 따른 비디오 부호화 장치(1400)가 영상 부호화부(400)에 대응되는 경우, 양자화된 변환 계수가 역양자화부(460), 주파수 역변환부(470)을 통해 시간 영역의 데이터로 복원되고, 복원된 시간 영역의 데이터는 디블로킹부(480) 및 루프 필터링부(490)를 거쳐 참조 프레임(495)이 생성된다. 일 실시예에 따른 루프 필터 계수 정보 출력부(1450)는 루프 필터링부(490)에서 이용되는 필터 계수를 부호화하여 출력할 수 있다.

부호화되는 필터 계수 정보는, 각각의 1차원 필터에 대한 필터 계수에 대한 정보를 포함하며, 각 1차원 필터의 필터 계수의 정보는, 연속적인 필터 계수들 간의 차이값에 관한 정보를 포함할 수 있다. 즉, 각각의 1차원 필터의 필터 계수의 잔차 성분이 부호화될 수 있다. 구체적으로, 루프 필터 계수 정보 출력부(1450)는 각각의 1차원 필터마다, 잔차 정보로서 현재 필터 계수 및 이전 필터 계수 간의 차이값을 부호화할 수 있다.

연속적인 1차원 필터링은, 수평 방향의 1차원 필터 및 수직 방향의 1차원 필터의 연속적인 필터링일 수 있다. 상세하게는, 수평 방향의 9개의 연속적인 디블로킹된 데이터에 대해 수평 방향의 1차원 필터링을 수행하고, 연속적으로 수직 방향의 9개의 연속적인 디블로킹된 데이터에 대해 수직 방향의 1차원 필터링을 수행할 수 있다. 이 경우, 수평 방향의 1차원 필터 및 수직 방향의 1차원 필터는 대칭형 필터이며, 필터 계수의 개수는 각각 5개씩일 수 있다.

1차원 필터의 필터 계수는 비너 필터 방식(Wiener filter approach)에 의해 결정될 수 있다.

일 실시예에 따른 비디오 부호화 장치(1400)는 각각의 1차원 필터의 종류, 개수, 크기, 양자화 비트, 계수, 필터링 방향, 필터링 수행 여부 및 러닝 필터링 수행 여부 등이 설정하여, 필터 계수 정보 이외에 루프 필터링의 1차원 필터 세트에 대한 정보를 부호화하여 전송할 수도 있다.

1차원 필터 세트에 관한 정보는 픽처, 슬라이스, 시퀀스 등의 데이터 단위로 설정되어 있을 수 있다.

예를 들어, 각각의 1차원 필터의 종류는 비너 필터(Wiener filter)인지, 대칭 또는 비대칭 필터 등을 포함하는 소정 필터로 결정될 수 있다. 1차원 필터가 비너 필터인 경우, 필터 계수가 필터들간의 상호 상관 매트릭스에 의해 결정될 수 있으므로, 필터 계수 정보는 개별적인 계수 대신에 상호 상관 매트릭스에 관한 정보를 포함할 수 있다.

각각의 1차원 필터의 필터링 방향은, 소정 각도의 일직선 상에 위치한 픽셀들에 대한 필터링 방향으로 결정될 수 있다. 예를 들어, 수직(±90°), 수평(0°, 180°), 대각선(±45°, ±135°) 등 ±0~180°의 소정 각도의 필터링 방향에 따른 1차원 필터링이 수행될 수 있다.

또는, 각각의 1차원 필터의 필터링 방향이 영상 데이터 중 로컬 영상 특성에 적응적으로 결정될 수 있다. 예를 들어, 영상 데이터 중 로컬 영상의 에지를 검출하여, 검출된 에지의 방향에 따른 필터링 방향을 따라 1차원 필터링이 수행되도록 필터가 결정될 수 있다.

복수의 1차원 필터 세트를 하나 이상의 연속적인 1차원 필터를 포함하는 서브 필터 세트로 분류하여, 각각의 서브 필터 세트 별로 1차원 필터링을 수행할지 여부가 결정될 수 있다. 즉, 동일한 서브 필터 세트의 필터들은 모두 필터링이 수행되는지, 모두 수행되지 않는지 여부가 결정될 수도 있다.

이전 픽셀의 1차원 필터링의 결과가 현재 픽셀의 1차원 필터링에 영향을 주는 러닝 필터링(running filtering) 방식인지 여부가 결정될 수 있다. 러닝 필터링 방식에 따르는 1차원 필터링에 의하면, 이전 픽셀의 필터링 결과가 갱신됨에 따라 연속적으로 이전 픽셀의 필터링된 데이터를 입력받아 현재 픽셀의 필터링이 수행될 수 있다.

도 15 는 본 발명의 일 실시예에 따라 연속적인 1차원 필터링에 의한 루프 필터링을 이용하는 비디오 복호화 장치를 도시한다.

일 실시예에 따르는 비디오 복호화 장치(1500)는 수신부(1501), 추출부(1505), 및 영상 데이터 복호화부(1540)를 포함한다. 추출부(1505)는 영상 데이터 획득부(1510), 부호화 정보 추출부(1520) 및 루프 필터 계수 정보 추출부(1530)를 포함한다. 영상 데이터 복호화부(1540)는 도 2를 참조하여 전술된 비디오 복호화 장치(200)의 영상 데이터 복호화부(230)에 각각 대응되고, 영상 데이터 획득부(1510), 부호화 정보 추출부(1520)는 비디오 복호화 장치(200)의 추출부(220)의 일부 기능을 수행한다.

다만, 영상 데이터 복호화부(1540)는 연속적인 1차원 필터링에 의한 루프 필터링을 수행하는 루프 필터링 수행부(1550)를 포함한다. 일 실시예에 따른 비디오 복호화 장치(1500)의 연속적인 1차원 필터링에 의해 적응적인 루프 필터링을 수행하며 복호화하는 특징이 이하 상술된다.

수신부(1501)는 부호화된 비디오에 대한 비트스트림을 수신하여 파싱(parsing)하고, 추출부(1505)는 파싱된 수신한 비트스트림으로부터 각종 부호화된 정보를 추출한다. 영상 데이터 획득부(1510)는 파싱된 수신한 비트스트림으로부터, 최대 부호화 단위별로 부호화된 영상 데이터를 획득할 수 있다. 부호화 정보 추출부(1520)는 수신한 비트스트림을 파싱하여, 현재 픽처에 대한 헤더로부터 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보를 추출한다.

루프 필터 계수 정보 추출부(1530)는 현재 픽처의 루프 필터링을 위한 필터 계수 정보를 추출한다. 루프 필터 계수 정보 추출부(1530)는, 루프 필터링이 연속적인 1차원 필터링에 의하는 경우, 복수의 1차원 필터들의 필터 계수를 추출할 수 있다.

루프 필터 계수 정보 추출부(1530)는, 연속적인 1차원 필터링의 복수의 1차원 필터들 중 각각의 1차원 필터에 대해, 연속적인 필터 계수들 간의 차이값에 대한 잔차 정보를 추출할 수 있다.

영상 데이터 복호화부(1540)는 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보에 기초하여 각각의 최대 부호화 단위의 부호화된 영상 데이터를 복호화하여 현재 픽처를 복원한다. 영상 데이터 복호화부(1540)는 시간 영역의 영상 데이터로 복호화된 현재 픽처의 데이터에 대해 디블로킹을 수행하고, 디블로킹된 데이터에 대해, 루프 필터 계수 정보 추출부(1530)에서 추출된 필터 계수를 이용하여 루프 필터링을 수행한다. 루프 필터링은 루마 성분 및 크로마 성분에 대해 별개로 수행될 수 있다.

일 실시예에 따른 영상 데이터 복호화부(1540)가 영상 복호화부(500)에 대응되는 경우, 영상 데이터 복호화부(1540)의 루프 필터링부(1550)는, 루프 필터링부(580)에 대응되며, 디블로킹부(570)에 의해 디블로킹된 데이터에 대해 연속적인 1차원 필터링을 수행할 수 있다. 디블로킹되고 루프 필터링이 수행된 데이터는 버퍼에 저장되며, 다음 픽처의 움직임 보상을 위한 참조 영상으로써 이용될 수 있다.

루프 필터링 수행부(1550)는 수평 방향의 1차원 필터링 및 수직 방향의 1차원 필터링을 연속적으로 수행하고 현재 픽처를 복원한다. 루프 필터링 수행부(1550)는, 루프 필터 계수 정보 추출부(1530)로부터 추출된 필터 계수의 잔차 정보를 이용하여, 각각의 1차원 필터의 필터 계수를 유도할 수 있다.

예를 들어, 각각의 1차원 필터마다, 현재 필터 계수 및 이전 필터 계수 간의 차이값을 이전 필터 계수에 더함으로써 현재 필터 계수가 유도될 수 있다. 유도된 각각의 1차원 필터의 필터 계수를 이용하여, 디블로킹된 데이터에 대해 연속적인 1차원 필터링이 수행될 수 있다. 디블로킹은 복호화된 데이터의 블록 효과를 감소시키고, 루프 필터링은 복원된 영상 및 원본 영상 간의 오차를 최소화시킨다.

발명의 구체적인 이해를 위해, 수평 방향 및 수직 방향의 연속적인 1차원 필터링에 의한 루프 필터링을 이하 수학식을 참조하여 상술한다.

현재 필터 계수는 수학식 1에 따라 유도될 수 있다.

c[i][j] = adaptive_loop_filter_prev[i][j] + adaptive_loop_filter[i][j]

여기서 i는 1차원 필터의 인덱스를 나타내며, j는 각 1차원 필터의 필터 계수의 인덱스를 나타낸다. c[i][j] 는 현재 필터 계수, adaptive_loop_filter_prev[i][j]는 이전 필터 계수, adaptive_loop_filter[i][j]는 필터 계수 정보로서 전송된 필터 계수의 잔차 성분을 나타낸다.

즉, 현재 필터 계수는 이전 필터 계수 및 잔차 성분의 합으로 유도될 수 있다. 현재 필터 계수를 유도한 후 다음 필터 계수를 유도하기 위해, 현재 필터 계수 c[i][j]가 adaptive_loop_filter_prev[i][j]으로 갱신된다.

연속적인 1차원 필터링에 의한 루프 필터링은 수학식 2 및 3에 따라 수행될 수 있다. 수학식 2 및 3에서 i는 현재 픽처의 너비 방향의 인덱스, j는 현재 픽처의 높이 방향의 인덱스를 나타낸다.

q_i,j = (p_i,j-4*c[0][4] + p_i,j-3*c[0][3] + p_i,j-2*c[0][2] + p_i,j-1*c[0][1] + p_i,j*c[0][0] + p_i,j+1*c[0][1] + p_i,j+2*c[0][2] + p_i,j+3*c[0][3] + p_i,j+4*c[0][4])

p_i,j는 현재 픽처의 디블로킹된 데이터를 나타내며, q_i,j는 디블로킹된 데이터에 대해 수평 방향의 1차원 필터링된 데이터를 나타낸다. 대칭형 필터의 필터 계수 c를 이용하여, 9개의 디블로킹된 데이터에 대해 5개의 필터 계수를 이용하여 대칭적으로 필터링된다.

f_i _,j = (q_i _,j-4*c[1][4] + q_i _,j-3*c[1][3] + q_i _,j-2*c[1][2] + q_i _,j-1*c[1][1] + q_i,j*c[1][0] + q_i _,j+1*c[1][1] + q_i _,j+2*c[1][2] + q_i _,j+3*c[1][3] + q_i _,j+4*c[1][4])

f_i,j 는 q_i,j에 대해 수직 방향의 1차원 필터링한 데이터를 나타낸다. 필터 계수 c는 러닝 필터링 방식을 따르므로, 수평 방향의 1차원 필터링된 데이터에 대해 연속적으로 수직 방향의 1차원 필터링이 수행된다.

대칭형 필터의 경우, 2차원 필터에 비해 1차원 필터가 소량의 계수만으로도 모든 필터의 계수가 설정될 수 있다는 장점이 있다. 따라서, 2차원 필터에 비해 복수의 1차원 필터 세트가 전송 비트스트림에 삽입되어야 할 필터 특성과 관련된 비트가 상대적으로 적게 필요하다.

또한, 필터링 동안 임시 데이터를 저장하기 위한 메모리의 용량도 2차원 필터에 비해 1차원 필터가 적다. 2차원 필터에 의한 필터링의 연산량은 1차원 필터링에 비해 현저히 크다. 러닝 필터링의 경우 2차원에서는 불가능한 다수 필터링에 의한 병행 처리가 불가능하지만, 1차원 필터에 의해서는 병행 처리가 가능하다.

하지만, 일 실시예에 따른 루프 필터링은 수평 방향 및 수직 방향의 연속적인 1차원 필터링에 한정되는 것은 아니다. 일 실시예에 따른 루프 필터링은, 임의의 개수의 1차원 필터의 연속적인 필터링으로 구현될 수 있으며, 각각의 1차원 필터링은 임의의 방향으로 수행될 수 있다.

일 실시예에 따른 비디오 복호화 장치(1500)는 필터 계수 정보 이외에 루프 필터링의 1차원 필터 세트에 대한 정보를 수신받아, 각각의 1차원 필터의 종류, 개수, 크기, 양자화 비트, 계수, 필터링 방향, 필터링 수행 여부 및 러닝 필터링 수행 여부 등을 확인할 수 있다. 이에 따라, 루프 필터링 수행부(1550)는 다양한 1차원 필터의 조합에 의한 루프 필터링을 수행할 수 있다.

루프 필터링에 의한 후처리는 복잡한 손실 압축에 의해 발생하는 원본 영상 및 복원 영상 간의 왜곡을 감소시킬 수 있다. 또한, 루프 필터링된 영상을 참조 영상으로 이용함으로써, 예측 또는 움직임 보상의 결과 영상의 화질이 향상될 수 있다.

다양한 특징의 1차원 필터의 조합을 통해 영상의 특징, 시스템 환경 또는 사용자 요구 등을 고려한 적응적 루프 필터링이 가능하다. 또한, 2차원 필터 대신 연속적인 1차원 필터가 이용되므로 2차원 필터에 비해 메모리, 연산량, 전송 비트 등의 다양한 방면에서 유리하다. 더욱이 필터 계수의 잔차 성분이 부호화되어 전송되므로 필터 계수을 전송하는데 발생하는 부담이 감소될 수 있다.

도 16 은 본 발명의 일 실시예에 따른 연속적인 1차원 필터링의 흐름도를 도시한다.

복수의 1차원 필터들이 연속적으로 필터링됨으로써 루프 필터링이 수행될 수 있다. 단계 1610에서, 디블로킹된 복원 영상이 입력되고, 단계 1620에서 제 1 필터, 제 2 필터 내지 제 N 필터의 모든 필터의 사용 여부가 결정되고, 모두 사용하지 않기로 결정되면 저장 또는 재생(단계 1660)로 곧바로 진행한다. 단계 1620에서 모든 필터에 의한 필터링을 수행하기로 결정하기로 결정되면, 필터링 순서에 따라, 단계 1630에서 제 1 필터를 이용한 제 1 필터링 방향의 1차원 필터링, 단계 1640에서 제 2 필터를 이용한 제 2 필터링 방향의 1차원 필터링, 단계 1650에서 제 N 필터를 이용한 제 N 필터링 방향의 1차원 필터링까지 순서대로 수행될 수 있다.

단계 1660에서는, 디블로킹된 복원 영상 데이터 또는 연속적으로 1차원 필터링된 데이터가 버퍼에 저장되거나 재생 장치에서 재생된다.

도 17 은 본 발명의 다른 실시예에 따른 루프 필터링의 흐름도를 도시한다.

일 실시예의 1차원 필터의 필터링 방향은 영상 특성의 분석을 통해 로컬 영상의 특성에 적응적으로 결정될 수 있다. 예를 들어, 영상의 에지를 보존하기 위해 로컬 영상의 에지 방향에 적응적으로 필터링 방향이 결정될 수 있다.

단계 1710 에서 복원된 영상 데이터가 입력되면, 단계 1720에서는 복원된 영상 데이터의 각각의 픽셀마다 에지가 검출된다. 단계 1730에서는 검출된 에지 방향에 따라 1차원 필터링이 수행되고, 단계 1740에서 필터링된 데이터는 저장되거나 재생 장치에서 재생된다.

비디오 부호화 과정에서 에지 방향에 따라 결정된 필터링 방향를 포함한 1차 필터 세트에 관한 정보는 부호화되어 복호화단에 제공된다. 비디오 복호화 과정에서는 수신된 데이터로부터 루프 필터에 관한 정보를 판독하여, 소정 1차원 필터의 에지 방향 등의 필터링 방향에 따른 1차원 필터링이 수행될 수 있다.

도 18 는 본 발명의 일 실시예에 따라 연속적인 1차원 필터링에 의한 루프 필터링을 이용하는 비디오 부호화 방법을 도시한다.

단계 1810에서 현재 픽처는 최대 크기의 부호화 단위인 적어도 하나의 최대 부호화 단위로 분할되고, 단계 1820에서 심도마다 최대 부호화 단위의 영역이 분할된 적어도 하나의 분할 영역시 부호화되어, 적어도 하나의 분할 영역 별로 최종 부호화 결과가 출력될 심도가 결정된다.

단계 1830에서는 각각의 최대 부호화 단위마다 하나의 부호화 심도로 부호화된 영상 데이터, 부호화 심도 및 부호화 모드에 관한 정보가 부호화되어 출력된다. 또한, 현재 픽처의 부호화 중 디블로킹 이후 연속적인 1차원 필터링에 의해 수행되는 루프 필터링의 필터 계수 정보가 부호화되어 출력될 수 있다. 필터 계수 정보는 연속적인 필터 계수 간의 잔차 성분에 대한 정보를 포함할 수 있다. 수평 방향의 1 차원 필터 및 수직 방향의 1차원 필터의 연속적인 필터링에 의해 루프 필터링이 수행될 수 있다. 1차원 필터는 대칭형 필터일 수 있으며, 1차원 필터의 필터 계수는 비너 필터 방식에 따를 수 있다.

도 19 는 본 발명의 일 실시예에 따라 연속적인 1차원 필터링에 의한 루프 필터링을 이용하는 비디오 복호화 방법을 도시한다.

단계 1910에서, 부호화된 비디오에 대한 비트스트림가 수신되어 파싱된다.

단계 1920에서 파싱된 비트스트림으로부터 최대 크기의 최대 부호화 단위에 할당되는 현재 픽처의 영상 데이터 및 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보가 추출된다. 또한, 현재 픽처의 루프 필터링을 위한 필터 계수 정보가 추출된다. 필터 계수 정보는 각각의 1차원 필터의 필터 계수 간의 잔차 성분에 대한 정보를 포함할 수 있다. 추출된 필터 계수 정보는 수평 방향의 1차원 필터 및 수직 방향의 1차원 필터의 계수일 수 있다.

단계 1930에서, 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보 및 부호화 단위 패턴 정보에 기초하여, 최대 부호화 단위의 부호화된 영상 데이터가 복호화될 수 있다.

단계 1940에서, 현재 픽처의 복호화된 영상 데이터에 대해 디블로킹이 수행되고, 디블로킹된 데이터에 대해 연속적인 1차원 필터링에 의한 루프 필터링이 수행된다. 필터 계수 정보로서 필터 계수의 잔차 성분이 추출된 경우, 필터 계수의 잔차 성분 및 이전 필터 계수를 합함으로써 현재 필터 계수가 유도될 수 있다. 각각의 1차원 필터마다 유도된 필터 계수를 이용하여, 연속적인 1차원 필터링이 수행 될 수 있다. 루프 필터링은 루마 성분 및 크로마 성분에 대해 별개로 수행될 수 있다.

대용량의 영상 또는 고해상도의 영상의 큰 데이터량 때문에, 상대적으로 작은 크기의 매크로블록으로 영상을 부복호화하는 경우 연산량이 매우 부담될 수 있다. 본 발명은 영상 크기에 적합하게 선택된 크기의 부호화 단위를 이용하며, 최대 크기의 부호화 단위 내에서도 영상의 세부 정보에 따라 부호화 단위의 크기를 계층적으로 분화한다. 계층적 구조의 부호화 단위에 기반하여, 최대 부호화 단위마다 최소한의 부호화 오차를 갖는 부호화 단위들이 결정된다. 즉, 계층적 구조의 부호화 단위에 기반하여 효율적인 부복호화가 도모될 수 있다.

또한, 대용량의 영상 또는 고해상도의 영상에 대해 포스트 프로세싱의 연산량 부담을 줄이기 위해, 디블로킹한 후 수행하는 루프 필터링으로서 2차원 필터링 대신 연속적인 1차원 필터링을 도입한다. 이로써, 연상량 뿐만 아니라 필터 계수의 전송 비트도 감소할 수 있다. 또한, 필터 계수 대신에 필터 계수의 잔차 성분을 전송함으로써 전송 효율이 더욱 증가될 수 있다.

한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등) 및 캐리어 웨이브(예를 들면, 인터넷을 통한 전송)와 같은 저장매체를 포함한다.

이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

도 3 은 본 발명의 일 실시예에 따른 부호화 단위의 개념을 도시한다.

도 5 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 비디오 복호화부의 블록도를 도시한다.

도 6 는 본 발명의 일 실시예에 따른 심도별 부호화 단위 및 예측 단위를 도시한다.

Claims

비트스트림으로부터 최대 크기의 부호화 단위인 최대 부호화 단위의 크기 정보 및 픽셀 값을 보상하기 위한 루프 필터링의 수행 여부에 대한 정보를 획득하는 단계;

상기 최대 부호화 단위의 크기 정보에 기초하여 픽처를 분할하여 상기 최대 부호화 단위를 결정하는 단계;

상기 최대 부호화 단위의 부호화된 영상 데이터를 복원하는 단계;

상기 최대 부호화 단위의 복호화된 영상 데이터에 대해 에지(edge)의 방향을 결정하는 단계; 및

상기 루프 필터링의 수행 여부에 대한 정보에 기초하여, 상기 최대 부호화 단위의 복원된 영상 데이터의 디블로킹 필터링된 데이터에 대해 상기 루프 필터링을 수행하는 단계를 포함하되,

상기 루프 필터링은 상기 결정된 에지의 방향에 따라 수행되고,

상기 최대 부호화 단위 내의 적어도 하나의 부호화 단위 중 하나는 상기 부호화 단위에 대해 예측을 수행하기 위한 적어도 하나의 예측 단위를 포함하고,

상기 부호화 단위는 상기 적어도 하나의 예측 단위와는 독립적으로 적어도 하나의 변환 단위로 분할되는 것을 특징으로 하는 비디오 복호화 방법.
비트스트림으로부터 최대 크기의 부호화 단위인 최대 부호화 단위의 크기 정보 및 픽셀 값을 보상하기 위한 루프 필터링의 수행 여부에 대한 정보를 획득하는 추출부; 및

상기 최대 부호화 단위의 크기 정보에 기초하여 픽처를 분할하여 상기 최대 부호화 단위를 결정하고, 상기 최대 부호화 단위의 부호화된 영상 데이터를 복원하고, 상기 최대 부호화 단위의 복원된 영상 데이터에 대해 에지(edge)의 방향을 결정하며, 상기 루프 필터링의 수행 여부에 대한 정보에 기초하여, 상기 최대 부호화 단위의 복원된 영상 데이터의 디블로킹 필터링된 데이터에 대해 상기 루프 필터링을 수행하는 복호화부를 포함하되,

상기 루프 필터링은 상기 결정된 에지의 방향에 따라 수행되고,

상기 최대 부호화 단위 내의 적어도 하나의 부호화 단위 중 하나는 상기 부호화 단위에 대해 예측을 수행하기 위한 적어도 하나의 예측 단위를 포함하고,

상기 부호화 단위는 상기 적어도 하나의 예측 단위와는 독립적으로 적어도 하나의 변환 단위로 분할되는 것을 특징으로 하는 비디오 복호화 장치.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제