KR20110019140A

KR20110019140A - 유연한 직교 변환에 기초한 영상 부호화, 복호화 방법 및 장치

Info

Publication number: KR20110019140A
Application number: KR1020090076734A
Authority: KR
Inventors: 이교혁; 최종범; 천민수; 지엔러 천
Original assignee: 삼성전자주식회사
Priority date: 2009-08-19
Filing date: 2009-08-19
Publication date: 2011-02-25
Also published as: KR101712097B1; US20110044551A1; US8611687B2

Abstract

복수의 예측 방법 및 복수의 직교 변환 방법을 각각 그룹화하고, 대응시킴으로써 예측 방법과 직교 변환 방법을 자유롭게 조합하여 영상을 부호화하는 방법 및 장치가 개시된다.

예측, 직교 변환, 대응

Description

유연한 직교 변환에 기초한 영상 부호화, 복호화 방법 및 장치{Method and apparatus for encoding and decoding image based on flexible orthogonal transform}

본 발명은 영상 부호화, 복호화 방법 및 장치에 관한 것으로 보다 상세히는 직교 변환을 이용한 영상 부호화, 복호화 방법 및 장치에 관한 것이다.

MPEG-4 H.264/MPEG-4 AVC(Advanced Video Coding)와 같은 코덱에서는 인트라 예측 또는 인터 예측을 이용해 영상을 예측 부호화한다. 인터 예측을 위해 영상 부호화 장치는 현재 블록과 동일 또는 유사한 블록을 참조 픽처에서 검색하고, 검색 결과에 현재 블록을 움직임 보상하여 예측 블록을 생성한다. 또한, 인트라 예측을 위해 영상 부호화 장치는 현재 블록에 인접한 이전에 부호화된 영역에 포함된 픽셀 값을 이용해 예측 블록을 생성한다.

예측 블록이 생성되면, 현재 블록에서 예측 블록을 감산하여 레지듀얼 블록을 생성하고 생성된 레지듀얼 블록을 직교 변환한다. 직교 변환은 이산 코사인 변환(DCT: Discrete Cosine Transform)일 수 있다.

본 발명이 해결하고자 하는 기술적 과제는 직교 변환을 이용한 영상 부호화 복호화 방법 및 장치를 제공하는데 있고, 상기 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는데 있다.

상기 기술적 과제를 해결하기 위한 본 발명의 일 실시예에 따른 영상 부호화 방법은 복수의 예측 방법을 그룹화하여 예측에 대한 적어도 하나의 그룹을 생성하는 단계; 복수의 직교 변환 방법을 그룹화하여 직교 변환에 대한 적어도 하나의 그룹을 생성하는 단계; 상기 예측에 대한 적어도 하나의 그룹 각각을 상기 직교 변환에 대한 적어도 하나의 그룹에 대응시키는 단계; 및 상기 대응에 기초해 예측에 대한 소정의 그룹의 예측 방법에 의해 예측된 블록을 상기 예측에 대한 소정의 그룹에 대응되는 직교 변환에 대한 그룹의 직교 변환 방법을 이용해 변환함으로써 입력 영상을 부호화하는 단계를 한다.

본 발명의 또 다른 실시예에 따르면, 상기 예측에 대한 적어도 하나의 그룹을 생성하는 단계는 상기 복수의 예측 방법을 예측 블록의 크기 및 예측 방법의 유형 중 적어도 하나에 기초해 그룹화하여 상기 예측에 대한 적어도 하나의 그룹을 생성하는 단계를 포함한다.

본 발명의 또 다른 실시예에 따르면, 상기 예측 방법의 유형은 인트라 예측 및 인터 예측을 포함한다.

본 발명의 또 다른 실시예에 따르면, 상기 직교 변환에 대한 적어도 하나의 그룹을 생성하는 단계는 상기 복수의 직교 변환 방법을 변환 블록의 크기 및 변환 알고리즘 중 적어도 하나에 기초해 그룹화하여 상기 직교 변환에 대한 적어도 하나의 그룹을 생성하는 단계를 포함한다.

본 발명의 또 다른 실시예에 따르면, 상기 변환 알고리즘은 이산 코사인 변환 및 하다마드 변환을 포함한다.

본 발명의 또 다른 실시예에 따르면, 상기 대응시키는 단계는 상기 예측 블록의 크기 및 상기 변환 블록의 크기에 기초해 상기 예측에 대한 적어도 하나의 그룹 각각을 상기 직교 변환에 대한 적어도 하나의 그룹에 대응시키는 단계를 포함한다.

본 발명의 또 다른 실시예에 따르면, 상기 대응시키는 단계는 영상 시퀀스 또는 픽처 또는 슬라이스 또는 IDR(Instantaneous Decoding Refresh) 픽처 단위로 수행되는 것을 특징으로 한다.

본 발명의 또 다른 실시예에 따르면, 상기 부호화하는 단계는 상기 예측에 대한 적어도 하나의 그룹과 상기 직교 변환에 대한 적어도 하나의 그룹 사이의 대응에 대한 정보를 부호화하는 단계를 포함한다.

상기 기술적 과제를 해결하기 위한 본 발명의 일 실시예에 따른 영상 복호화 방법은 소정의 출력 영상에 대한 비트스트림을 수신하는 단계; 예측에 대한 적어도 하나의 그룹과 직교 변환에 대한 적어도 하나의 그룹 사이의 대응에 대한 정보를 복호화하는 단계; 및 상기 대응에 기초해 직교 변환에 대한 소정의 그룹의 변환 방법에 의해 역직교 변환된 블록을 상기 대응되는 예측에 대한 그룹의 예측 방법을 이용해 예측함으로써 상기 출력 영상을 복호화하는 단계를 포함한다.

상기 기술적 과제를 해결하기 위한 본 발명의 일 실시예에 따른 영상 부호화 장치는 입력 영상을 부호화하는 영상 부호화부; 및 예측에 대한 적어도 하나의 그룹 각각을 직교 변환에 대한 적어도 하나의 그룹에 대응시키고, 상기 영상 부호화부가 상기 대응에 기초해 예측에 대한 소정의 그룹의 예측 방법에 의해 예측된 블록을 상기 예측에 대한 소정의 그룹에 대응되는 직교 변환에 대한 그룹의 직교 변환 방법을 이용해 변환함으로써 입력 영상을 부호화하도록 제어하는 매칭부를 포함한다.

상기 기술적 과제를 해결하기 위한 본 발명의 일 실시예에 따른 영상 복호화 장치는 출력 영상에 대한 비트스트림을 복호화하는 영상 복호화부; 및 상기 비트스트림에 포함된 예측에 대한 적어도 하나의 그룹과 직교 변환에 대한 적어도 하나의 그룹 사이의 대응에 대한 정보에 기초해 상기 영상 부호화부가 직교 변환에 대한 소정의 그룹의 변환 방법에 의해 역직교 변환된 블록을 상기 대응되는 예측에 대한 그룹의 예측 방법을 이용해 예측함으로써 상기 출력 영상을 복원하도록 제어하는 매칭부를 포함한다.

상기 기술적 과제를 해결하기 위해 본 발명의 일 실시예는 상기된 영상 부호화, 복호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.

이하에서는 도면을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다.

도 1은 본 발명의 일 실시예에 따른 영상 부호화 장치를 도시한다.

도 1을 참조하면, 본 발명의 일 실시예에 따른 영상 부호화 장치(100)는 영상부호화부(110) 및 매칭부(120)를 포함한다.

영상 부호화부(110)는 입력 영상을 수신하여 부호화한다. 영상 부호화부(110)는 매칭부(120)에서 생성된 예측에 대한 그룹과 직교 변환에 대한 그룹 사이의 대응에 대한 정보에 기초해 입력 영상을 부호화한다. 도 2a 내지 2c 및 도 3을 참조하여 후술한다.

매칭부(120)는 복수의 예측 방법을 그룹화하여 예측에 대한 적어도 하나의 그룹을 생성하고, 복수의 직교 변환 방법도 그룹화하여 직교 변환에 대한 적어도 하나의 그룹을 생성한다. 이하에서는 예측에 대한 그룹을 예측 그룹이라 하고, 직교 변환에 대한 그룹을 직교 변환 그룹이라 하여 본 발명의 실시예들을 설명한다.

도 2a는 본 발명의 일 실시예에 따른 복수의 예측 방법의 그룹화를 도시한다.

영상의 예측 부호화를 위해 소정의 블록에 대한 예측 블록을 생성함에 있어 예측의 기본 단위인 예측 블록의 크기 및 예측 방법의 유형에 따라 상이한 복수의 예측 방법이 이용될 수 있다. 예를 들어, 16x16 크기의 현재 블록을 예측함에 있어, 16x16 크기로 예측을 수행할 수 있고, 8x8 크기의 네 개의 서브 블록을 나누어 예측을 수행할 수 있다.

또한, 예측 방법의 유형 즉, 인트라 예측 모드 또는 인터 예측 모드 중 어떤 모드의 예측 모드를 이용하는지 여부에 따라 상이한 복수의 예측 방법이 있을 수 있다. 예측 방법의 유형이 인터 예측 모드인 경우에도 시간적으로 앞뒤 픽처를 모두 참조하는 쌍방향 예측인지, 시간적으로 앞선 픽처만을 참조하는 단방향 예측인지에 따라 상이한 복수의 예측 방법이 있을 수 있다.

매칭부(120)는 예측 블록의 크기 및 예측 방법의 유형 중 적어도 하나가 상이한 복수의 예측 방법 #1~#n을 그룹화하여 적어도 하나의 예측 그룹 #1~#m을 생성한다.

예를 들어, 예측 블록의 크기에 기초해 16x16 크기로 예측을 수행하는 예측 방법들을 예측 그룹 #1로 그룹화하고, 8x8 크기로 예측을 수행하는 예측 방법들을 예측 그룹 #2로 그룹화할 수 있다.

또는, 예측 방법의 유형에 기초해 예측 방법의 인트라 예측을 이용하는 예측 방법들을 예측 그룹 #1로 그룹화하고, 인터 예측을 이용하는 예측 방법들을 예측 그룹 #2로 그룹화할 수도 있다.

예측 블록의 크기 및 예측 방법의 유형을 조합하여 그룹화할 수도 있다. 예를 들어, 8x8 크기 이상의 인터 예측을 예측 그룹 #1로 그룹화하고, 4x4 크기 이하의 인터 예측을 예측 그룹 #2로 그룹화하며, 8x8 크기 이상의 인트라 예측을 예측 그룹 #3로 그룹화하고, 4x4 크기 이하의 인트라 예측을 예측 그룹 #4로 그룹화할 수도 있다.

전술한 예측 블록의 크기 및 예측 방법의 유형은 복수의 예측 방법을 그룹화하는 기준의 예시일 뿐이며, 본원 발명은 이에 한정되지 아니한다. 예를 들어, 예측 블록이 정사각형인지 직사각형인지 여부에 따라 복수의 예측 방법을 그룹화할 수도 있다.

도 2b는 본 발명의 일 실시예에 따른 복수의 직교 변환 방법의 그룹화를 도시한다.

픽셀 도메인의 픽셀 값들을 주파수 도메인의 계수들로 변환하는 직교 변환도 변환 블록의 크기 및 직교 변환 알고리즘에 따라 상이한 복수의 직교 변환 방법을 이용해 수행될 수 있다. 16x16 크기의 현재 블록을 직교 변환함에 있어, 16x16 크기로 직교 변환을 수행할 수 있고, 8x8 크기의 네 개의 서브 블록을 나누어 직교 변환을 수행할 수 있다. 또한, 직교 변환 알고리즘 즉, 이산 코사인 변환(DCT : discrete cosine transform) 및 하다마드 변환(hadamard transform) 중 어떤 알고리즘을 이용하는지에 따라 상이한 복수의 직교 변환 방법이 있을 수 있다. 변환 알고리즘은 직교 변환을 위해 픽셀 도메인의 블록에 곱해지는 베이시스 함수(basis function)에 따라 상이할 수 있다.

매칭부(120)는 변환 블록의 크기 및 변환 알고리즘의 유형 중 적어도 하나가 상이한 복수의 직교 변환 방법 #1~#p을 그룹화하여 적어도 하나의 직교 변환 그룹 #1~#q을 생성한다.

예를 들어, 변환 블록의 크기에 기초해 16x16 크기로 직교 변환을 수행하는 직교 변환 방법들을 직교 변환 그룹 #1로 그룹화하고, 8x8 크기로 직교 변환을 수행하는 직교 변환 방법들을 직교 변환 그룹 #2로 그룹화할 수 있다.

또는, 직교 변환 알고리즘에 기초해 이산 코사인 변환을 이용하는 직교 변환 방법들을 예측 그룹 #1로 그룹화하고, 하다마드 변환을 이용한 직교 변환 방법들을 측 그룹 #2로 그룹화할 수도 있다.

직교 변환 블록의 크기 및 직교 변환 알고리즘을 조합하여 그룹화할 수도 있다. 예를 들어, 8x8 크기 이상의 이상 코사인 변환을 직교 변환 그룹 #1로 그룹화하고, 4x4 크기 이하의 이산 코사인 변환을 직교 변환 그룹 #2로 그룹화하며, 8x8 크기 이상의 하다마드 변환을 직교 변환 그룹 #3로 그룹화하고, 4x4 크기 이하의 직교 변환을 직교 변환 그룹 #4로 그룹화할 수도 있다.

도 2a의 예측 그룹과 달리 도 2b의 직교 변환 그룹은 동일한 직교 변환 방법을 포함할 수 있다. 다시 말해, 소정의 직교 변환 방법 #1이 직교 변환 그룹 #1에 포함되고, 직교 변환 그룹 #2에도 포함되도록 직교 변환 방법들을 그룹화할 수 있다. 예를 들어, 16x16 및 8x8 크기의 변환 블록을 이용하는 직교 변환 방법들이 직교 변환 그룹 #1에 포함되고, 8x8 및 4x4 크기의 변환 블록을 이용하는 직교 변환 방법들이 직교 변환 그룹 #2에 포함되도록 직교 변환 방법들을 그룹화하는 경우, 8x8 크기의 변환 블록을 이용하는 직교 변환 방법들은 직교 변환 그룹 #1 및 직교 변환 그룹 #2에 모두 포함된다.

도 2c는 본 발명의 일 실시예에 따른 예측에 대한 적어도 하나의 그룹과 직교 변환에 대한 적어도 하나의 그룹 사이의 대응을 도시한다.

도 2a 및 2b에 도시된 바와 같이 적어도 하나의 예측 그룹 및 적어도 하나의 직교 변환 그룹이 생성되면, 매칭부(120)는 적어도 예측 그룹을 적어도 하나의 직교 변환 그룹에 대응시킨다.

도 2c를 참조하면, 매칭부(120)는 예측 그룹 #1을 직교 변환 그룹 #1에 대응 시키고, 예측 그룹 #2를 직교 변환 그룹 #2에 대응시킨다. 예측 그룹들을 각각 소정의 직교 변환 그룹에 대응시킨다. 상이한 예측 그룹들을 하나의 직교 변환 그룹에 대응시킬 수도 있다. 도 2c에 도시된 예에서는 예측 그룹 #1 및 #4가 하나의 직교 변환 그룹 #1에 대응된다.

서로 다른 예측 방법들에 의해 예측 블록이 생성된 경우에도 동일한 직교 변환 방법을 이용해 직교 변환하는 것이 효율적일 수 있으므로, 상이한 예측 그룹들이 하나의 직교 변환 그룹에 대응될 수 있다.

대응은 다양한 기준에 따라 수행될 수 있으나, 본 발명의 일 실시예에 따르면, 예측 블록의 크기 및 변환 블록의 크기에 기초해 예측 그룹을 직교 변환 그룹에 대응시킬 수 있다. 다시 말해, 크기에 기초해 예측 그룹 및 직교 변환 그룹을 생성한 경우, 예측 블록의 크기와 직교 변환 블록의 크기가 유사한 그룹들끼리 대응시킨다.

예를 들어, 16x16 및 8x8 크기의 예측 블록을 이용하는 예측 방법들이 포함된 예측 그룹은 16x16 및 8x8 크기의 직교 변환 블록을 이용하는 직교 변환 그룹에 대응시킨다. 큰 크기의 블록을 이용해 예측된 영상은 큰 크기의 블록을 이용해 직교 변환하고, 반대로 작은 크기의 블록을 이용해 예측된 영상은 작은 크기의 블록을 이용해 직교 변환할 수 있다.

도 3a 내지 3c는 본 발명의 일 실시예에 따른 예측에 대한 적어도 하나의 그룹과 직교 변환에 대한 적어도 하나의 그룹 사이의 대응을 위한 신택스(syntax)를 도시한다.

매칭부(120)는 도 3a에 도시된 신택스에 따라 도 2a에 도시된 바와 같이 복수의 예측 방법을 그룹화하여 적어도 하나의 예측 그룹을 생성한다. "NUM_PRED_GROUP"은 예측 그룹의 개수를 의미하며, "NUM_PREDUNIT_IN_GROUP[n]"은 n번째 예측 그룹에 포함되는 예측 방법의 개수를 의미한다. "USED_PRED_UNIT[n][i]"는 n번째 예측 그룹의 i번째 예측 방법을 의미한다.

매칭부(120)는 도 3b에 도시된 신택스에 따라 도 2b에 도시된 바와 같이 복수의 직교 변환 방법을 그룹화하여 적어도 하나의 직교 변환 그룹을 생성한다. "NUM_TRANS_SET"은 직교 변환 그룹의 개수를 의미하며, "NUM_TRANS_IN_SET[n]"은 n 번째 직교 변환 그룹에 포함되는 직교 변환 방법의 개수를 의미한다. "USED_TRANS_UNIT[n][i]"는 n번째 직교 변환 그룹의 i번째 직교 변환 방법을 의미한다.

매칭부(120)는 도 3c의 신택스에 따라 도 2c에 도시된 바와 같이 적어도 하나의 예측 그룹과 적어도 하나의 직교 변환 그룹을 대응시킨다. "TRANSFORM_SET_MATCHING[n]"은 n번째 예측 그룹에 대응되는 직교 변환 그룹을 의미한다.

본 발명의 일 실시예에 따르면, 매칭부(120)는 영상 시퀀스 또는 픽처 또는 슬라이스 또는 IDR(Instantaneous Decoding Refresh) 픽처 단위로 적어도 하나의 예측 그룹 및 적어도 하나의 직교 변환 그룹을 생성하고, 대응시킬 수 있다. 도 3a-3c에 도시된 신택스에 따라 적어도 하나의 예측 그룹 및 적어도 하나의 직교 변환 그룹을 생성하고 대응시키면, 예측 그룹에 대한 정보, 직교 변환 그룹에 대한 정보 및 대응에 대한 정보를 부호화하기 위해 새로운 오버헤드(overhead)가 발생할 수 있다. 따라서, 오버헤드를 최소화하기 위해 매칭부(120)는 영상 시퀀스 또는 픽처 또는 슬라이스 또는 IDR 픽처 단위로 적어도 하나의 예측 그룹 및 적어도 하나의 직교 변환 그룹을 생성하고, 대응시킨다.

본 발명의 또 다른 실시예에 따르면, 블록 단위로 예측 그룹 및 직교 변환 그룹을 생성하고, 대응시킬 수 있다. 그러나, 전술한 바와 같이 블록 단위로 예측 그룹에 대한 정보, 직교 변환 그룹에 대한 정보 및 대응에 대한 정보를 부호화하면, 큰 오버헤드가 발생하여 영상 부호화의 압축률이 저하될 수 있다. 이를 해결하기 위해, 현재 부호화되는 블록에 인접한 이전에 부호화된 영역의 정보들을 이용해 블록 단위로 예측 그룹 및 직교 변환 그룹을 생성하고, 대응시킨다.

다시 말해, 매칭부(120)는 현재 블록에 인접한 이전에 부호화된 영역에 포함되어 있는 적어도 하나의 블록의 움직임 벡터(Motion vector), 움직임 벡터 차이(Motion vector difference), 참조 인덱스, 예측 방법, 직교 변환 방법, 직교 변환 계수, QP(Quantization Parameter), 델타 QP, 레지듀얼 값 및 참조 픽처의 부호화 정보 중 적어도 하나를 이용해 예측 그룹 및 직교 변환 그룹을 생성하고, 대응시킬 수 있다.

예를 들어, 현재 블록에 인접한 이전에 부호화된 영역에 포함된 블록의 움직임 벡터의 크기가 소정 값 이하인 경우 현재 블록도 인접한 블록과 마찬가지로 움직임이 없는 평탄한(plane) 영역인 것으로 판단할 수 있다. 이 경우 현재 블록의 예측 결과 생성된 레지듀얼 값들을 '0'일 확률이 높으므로, 변환 블록의 크기를 크 게하여 변환을 수행하는 것이 영상 부호화의 압축률을 향상시킬 수 있다. 따라서, 큰 크기의 변환 블록을 이용하는 직교 변환 방법들이 포함된 직교 변환 그룹을 예측 그룹들에 대응시킴으로써 블록 단위로 대응을 변경시킬 수 있다.

도 4는 본 발명의 또 다른 실시예에 따른 예측에 대한 적어도 하나의 그룹과 직교 변환에 대한 적어도 하나의 그룹 사이의 대응을 도시한다.

도 4를 참조하면, 매칭부(120)가 적어도 하나의 예측 그룹과 적어도 하나의 직교 변환 그룹을 대응시킴에 있어서, 이미 설정된 조합을 이용할 수 있다.

매칭부(120)는 이미 설정되어 있는 "Pre-fix 조합1", "Pre-fix 조합2", ... , "Pre-fix 조합c" 중 하나에 따라 예측 그룹 및 직교 변환 그룹을 생성하고, 대응시킨다. 도 4에 도시된 바와 같이 이미 설정된 조합에 따라 예측 그룹 및 직교 변환 그룹을 생성하고, 대응시킴으로써 그룹에 대한 정보 및 대응에 대한 정보를 부호화하기 위해 발생하는 오버헤드를 최소화시킬 수 있다. 매칭부(120)가 "Pre-fix 조합1", "Pre-fix 조합2", ... , "Pre-fix 조합c" 중 어떤 조합에 따라 예측 그룹 및 직교 변환 그룹을 대응시켰는지를 나타내는 인덱스(index)만 부호화하면 복호화하는 측에서 도 3의 기 설정된 조합 중 하나를 이용해 영상을 복호화할 수 있으므로, 그룹에 대한 정보 및 대응 정보를 부호화할 필요가 없기 때문이다.

다시 도 1을 참조하면, 매칭부(120)가 도 2a-2c, 3a-3c 및 4에 도시된 바와 같이 예측에 대한 적어도 하나의 그룹과 직교 변환에 대한 적어도 하나의 그룹을 대응시키면, 영상 부호화부(110)는 매칭부(120)의 제어를 받아 입력 영상을 부호화한다. 매칭부(120)로부터 대응에 대한 정보를 수신하고, 수신된 대응에 대한 정보 에 기초해 입력 영상을 부호화한다.

소정의 예측 그룹의 예측 방법에 의해 예측된 블록을 대응되는 직교 변환에 대한 그룹의 직교 변환 방법을 이용해 변환한다. 입력 영상의 소정 블록 k가 예측 그룹 #x의 예측 방법들 중 하나에 따라 예측되었으면, 예측 그룹 #x에 대응되는 직교 변환 그룹 #y의 직교 변환 방법들 중 하나에 따라 블록 k를 직교 변환한다.

도 2c와 같이 예측 그룹과 직교 변환 그룹이 대응된 경우를 예로 들어 설명하면, 입력 영상의 소정의 블록이 예측 그룹 #4에 포함된 예측 방법 중 하나를 이용해 예측된 경우, 이 블록을 직교 변환할 때에는 직교 변환 그룹 #1에 포함된 직교 변환 방법 중 하나를 이용해 직교 변환한다.

또한, 영상부호화부(110)는 매칭부(120)로부터 수신한 예측 그룹에 대한 정보, 직교 변환 그룹에 대한 정보 및 예측 그룹과 직교 변환 그룹 사이의 대응에 대한 정보를 부호화한다. 도 3a-3c에서 전술한 신택스들을 엔트로피 부호화할 수 있다. 도 4에 도시된 바와 같이 이미 설정된 조합을 이용해 예측 그룹과 직교 변환 그룹을 대응시킨 경우에는 이미 설정된 조합에 대한 인덱스만 엔트로피 부호화할 수 있다.

도 5는 본 발명의 또 다른 실시예에 따른 영상 부호화 장치를 도시한다.

도 5를 참조하면, 본 발명의 또 다른 실시예에 따른 영상 부호화 장치(500)는 인트라예측부(510), 움직임추정부(520), 인터예측부(530), 직교변환 및 양자화부(540), 엔트로피 부호화부(550), 역양자화 및 역직교변환부(560), 디블록킹필터(570), 프레임 메모리(580) 및 매칭부(590)를 포함한다. 매칭부(590)는 도 1의 매칭부(120)와 동일한 기능을 수행하며, 나머지 모듈들(510 내지 580)은 도 1의 영상부호화부(110)의 기능을 수행한다. 영상 부호화 장치(500)는 블록 단위로 영상을 처리하는 바, 이하에서는 영상 부호화 장치(500)가 현재 블록을 부호화하는 경우를 예로 들어 설명한다.

인트라예측부(510)는 현재 블록을 인트라 예측한다. 현재 블록에 인접한 이전에 부호화된 영역에 포함된 픽셀 값들을 이용해 인트라 예측을 수행한다. 현재 블록에 인접한 이전에 부호화된 영역에 포함된 픽셀 값을 소정의 방향으로 복사함으로써 예측 블록을 생성한다.

움직임추정부(520)는 현재 블록을 움직임 추정한다. 현재 블록과 동일 또는 유사한 블록을 프레임 메모리(580)에 저장된 적어도 하나의 참조 픽처에서 검색하고, 검색하고 검색 결과를 인터예측부(530)에 전송한다. 현재 블록과 SAD(Sum of Absolute Difference)가 가장 작은 블록을 적어도 하나의 참조 픽처에서 검색한다. 검색 결과 움직임 벡터가 생성된다.

인터예측부(530)는 움직임추정부(520)의 움직임 추정 결과에 기초해 현재 블록을 인터 예측한다. 현재 블록에 대한 움직임 벡터를 움직임 추정부(520)로부터 수신하고, 수신된 움직임 벡터에 따라 현재 블록을 움직임 보상한다.

인트라예측부(510) 또는 인터예측부(530)에서 생성된 예측 블록을 현재 블록에서 감산하여 레지듀얼 블록이 생성되면, 직교변환 및 양자화부(540)는 레지듀얼 블록을 직교 변환하고, 양자화한다. 레지듀얼 블록을 이산 코사인 변환 또는 하다마드 변환을 이용해 직교 변환하고, 직교 변환 결과 생성된 계수들을 소정의 양자 화 파라미터에 따라 양자화한다.

양자화된 계수들은 엔트로피부호화부(550)에서 엔트로피 부호화된다. CAVLC(Context-based Adaptive Variable Length Code) 또는 CABAC(Context-Bassed Adaptive Binary Arithmetic Code)에 따라 엔트로피 부호화된다.

또한, 역양자화 및 역직교변환부(560)은 양자화된 계수들을 역양자화, 역직교 변환하여 레지듀얼 블록을 복원한다. 직교변환 및 양자화부(540)의 처리 과정을 역으로 수행하여 레지듀얼 블록이 복원된다.

복원된 레지듀얼 블록은 예측 블록과 가산되어 현재 블록으로 복원된다. 복원된 현재 블록은 디블록킹필터(570)에 의해 디블록킹 필터링되고, 다음 픽처 또는 다음 블록의 예측에 이용하기 위해 프레임 메모리(580)에 저장된다.

매칭부(590)는 예측 그룹 및 직교 변환 그룹을 생성한다. 그런 다음, 예측에 대한 적어도 하나의 그룹 각각을 직교 변환에 대한 적어도 하나의 그룹에 대응시킨다. 예측 그룹 및 직교 변환 그룹은 영상 시퀀스 또는 픽처 또는 슬라이스 또는 IDR 픽처 단위로 생성되고, 대응될 수 있음은 전술하였다.

또한, 매칭부(590)는 대응에 기초해 다른 모듈들(510, 530, 540 및 560)의 영상 부호화를 제어한다. 현재 블록이 예측 그룹 #x의 예측 방법들 중 하나를 이용해 예측되었으면, 예측 그룹 #x에 대응되는 직교 변환 그룹 #y의 직교 변환 방법들 중 하나를 이용해 현재 블록을 직교 변환하도록 인트라예측부(510), 인터예측부(530), 직교변환 및 양자화부(540) 및 역양자화 및 역직교변환부(560)을 제어한다.

보다 상세히는, 매칭부(590)는 인트라예측부(510) 및 인터예측부(530)의 예측 결과에 기초해 현재 블록이 예측 그룹 중 어떤 그룹의 예측 방법을 이용해 예측 방법을 이용해 부호화되었는지 판단한다. 그럼 다음, 직교 변환 및 양자화부(540)를 제어하여, 현재 블록의 예측에 이용된 예측 그룹에 대응되는 직교 변환 그룹의 직교 변환 방법을 이용해 현재 블록을 직교 변환한다. 또한, 역양자화 및 역직교변환부(560)도 제어하여 직교변환 및 양자화부(540)에서 이용된 직교 변환 방법을 역으로 수행하여 역직교 변환을 수행하도록 한다.

매칭부(590)에서 생성된 예측 그룹에 대한 정보, 직교 변환 그룹에 대한 정보 및 예측 그룹과 직교 변환 그룹 사이의 대응에 대한 정보는 엔트로피 부호화부(550)에서 엔트로피 부호화되어 비스트림에 삽입된다.

도 6은 본 발명의 일 실시예에 따른 영상 부호화 방법을 설명하기 위한 흐름도이다.

도 6을 참조하면, 단계 610에서 본 발명의 일 실시예에 따른 영상 부호화 장치(100 또는 500)는 복수의 예측 방법을 그룹화하여 적어도 하나의 예측 그룹을 생성한다. 예측 그룹을 생성하는 방법 및 신택스는 도 2a 및 도 3a를 참조하여 전술하였다.

단계 620에서 영상 부호화 장치(100 또는 500)는 복수의 직교 변환 방법을 그룹화하여 적어도 하나의 직교 변환 그룹을 생성한다. 하나의 직교 변환 방법이 상이한 직교 변환 그룹에 포함될 수 있다. 직교 변환 그룹을 생성하는 방법 및 신 택스는 도 2b 및 도 3b를 참조하여 전술하였다.

단계 630에서 영상 부호화 장치(100 또는 500)는 단계 610에서 생성된 적어도 하나의 예측 그룹 각각을 단계 620에서 생성된 적어도 하나의 직교 변환 그룹에 대응시킨다. 하나의 직교 변환 그룹이 상이한 예측 그룹에 대응될 수 있다. 예측 그룹과 직교 변환 그룹 사이의 대응 방법 및 신택스는 도 2c 및 3c와 관련하여 전술하였다.

단계 640에서 영상 부호화 장치(100 또는 500)는 단계 630의 예측 그룹과 직교 변환 그룹 사이의 대응에 기초해 입력 영상을 부호화한다. 예측 그룹 x의 예측 방법을 이용해 부호화된 소정의 블록을 예측 그룹 x에 대응되는 직교 변환 그룹 y의 직교 변환 방법을 이용해 직교 변환함으로써 블록 단위로 입력 영상을 부호화한다.

단계 610 내지 630의 예측 그룹 및 직교 변환 그룹을 생성하고, 대응시키는 단계들은 영상 시퀀스 또는 픽처 또는 슬라이스 또는 IDR 픽처 단위로 수행될 수 있다. 또한, 소정 블록에 인접한 이전에 부호화된 영역의 부가 정보들을 이용함으로써 블록 단위로 수행될 수도 있다.

도 7은 본 발명의 일 실시예에 따른 영상 복호화 장치를 도시한다.

도 7을 참조하면, 본 발명의 일 실시예에 따른 영상 복호화 장치(700)는 영상 복호화부(710) 및 매칭부(720)를 포함한다.

영상복호화부(710)는 비트스트림을 수신하고, 수신된 비트스트림을 복호화하여 출력 영상을 복원한다. 매칭부(720)의 제어를 받아, 비트스트림에 포함된 적어 도 하나의 예측 그룹과 적어도 하나의 직교 변환 그룹 사이의 대응에 기초해 출력 영상을 복원한다. 도 1과 관련하여 전술한 영상 부호화부(110)의 영상 부호화 과정을 역으로 수행한다. 직교 변환 그룹 y의 직교 변환 방법에 의해 역직교 변환된 블록을 직교 변환 y에 대응되는 예측 그룹 x의 예측 방법을 이용해 예측하여, 블록 단위로 출력 영상을 복원한다.

매칭부(720)는 비트스트림에 포함되어 있는 예측 그룹에 대한 정보, 직교 변환 그룹에 대한 정보 및 예측 그룹과 직교 변환 그룹 사이의 대응에 대한 정보에 기초해 영상 복호화부(710)를 제어한다.

적어도 하나의 예측 그룹은 복수의 예측 방법을 예측 블록의 크기 및 예측 방법의 유형 중 적어도 하나에 기초해 그룹화하여 생성된 그룹일 수 있으며, 적어도 하나의 직교 변환 그룹은 복수의 직교 변환 방법을 변환 블록의 크기 및 변환 알고리즘 중 적어도 하나에 기초해 그룹화하여 생성된 그룹일 수 있다.

또한, 대응에 대한 정보는 도 2a-2c 및 도 3a-3c와 관련하여 전술한 방법에 따라 생성된 정보로서, 예측 블록의 크기 및 변환 블록의 크기에 기초해 적어도 하나의 예측 그룹 각각을 적어도 하나의 직교 변환 그룹에 대응시켜 생성된 정보일 수 있다.

대응에 대한 정보는 영상 시퀀스 또는 픽처 또는 슬라이스 또는 IDR 픽처 단위로 생성된 정보일 수 있으며, 현재 블록에 인접한 이전에 부호화된 영역 이전의 부가 정보들을 이용해 블록 단위로 생성된 정보일 수도 있다.

도 8은 본 발명의 또 다른 실시예에 따른 영상 복호화 장치를 도시한다.

도 8을 참조하면, 본 발명의 또 다른 실시예에 따른 영상 부호화 장치(800)는 엔트로피 복호화부(810), 역양자화 및 역직교변환부(820), 인트라예측부(830), 인터예측부(984), 프레임메모리(850), 디블록킹필터(860) 및 매칭부(870)를 포함한다. 매칭부(870)는 도 7의 매칭부(720)와 동일한 기능을 수행하며, 나머지 모듈들(810 내지 860)은 도 7의 영상 복호화부(710)의 기능을 수행한다. 도 5의 영상 부호화 장치(500)와 마찬가지로 영상 복호화 장치(800)도 블록 단위로 영상을 처리하는 바, 이하에서는 영상 복호화 장치(800)가 현재 블록을 부호화하는 경우를 예로 들어 설명한다.

엔트로피복호화부(810)는 비트스트림을 수신하고, 수신된 비트스트림을 엔트로피 복호화한다. 현재 블록의 직교 변환 계수들을 엔트로피 복호화한다. 또한, 예측 그룹에 대한 정보, 직교 변환 그룹에 대한 정보 및 예측 그룹과 직교 변환 그룹 사이의 대응에 대한 정보도 엔트로피 복호화될 수 있다. 예측 그룹과 직교 변환 그룹 사이의 대응에 대한 정보는 영상 시퀀스 또는 픽처 또는 슬라이스 또는 IDR 픽처 단위로 엔트로피 복호화될 수 있다.

역양자화부 및 역직교변환부(820)는 엔트로피 복호화부(810)에서 엔트로피 복호화된 직교 변환 계수들을 역양자화하고, 역직교 변환한다. 직교 변환 계수들을 소정의 양자화 파라미터에 따라 역양자화하고, 역양자화된 직교 변환 계수들에 대해 이산 코사인 변환 또는 하다마드 변환을 역으로 수행하여 현재 블록의 레지듀얼 값들을 복원한다.

인트라예측부(830)는 현재 블록에 인접한 이전에 복호화된 영역에 포함되어 있는 픽셀 값들을 이용해 현재 블록을 인트라 예측한다. 현재 블록에 인접한 이전에 복호화된 영역에 포함된 픽셀 값을 소정의 방향으로 복사함으로써 예측 블록을 생성한다. 인터예측부(840)는 현재 블록의 움직임 벡터에 기초해 프레임메모리(850)에 저장되어 있는 참조 픽처를 검색하여 현재 블록을 인터 예측한다. 인트라예측부(830) 또는 인터예측부(840)에서 생성된 현재 블록의 예측 블록은 역양자화 및 역직교변환부(820)에서 생성된 레지듀얼 블록에 가산된다.

디블록킹필터(860)는 예측 블록과 레지듀얼 블록 가산하여 생성된 블록을 디블록킹 필터링한다. 소정의 필터를 이용해 블록 사이의 경계를 필터링하여 블록킹 아티팩츠(Blocking artifacts)를 제거한다. 디블록킹 필터링된 현재 블록을 다음 픽처 또는 다음 블록의 예측에 이용하기 위해 프레임메모리(850)에 저장된다.

매칭부(870)는 엔트로피 복호화부(810)에서 엔트로피 복호화된 예측 그룹에 대한 정보, 직교 변환 그룹에 대한 정보 및 예측 그룹과 직교 변환 그룹 사이의 대응에 대한 정보를 수신하고, 수신된 대응에 대한 정보에 기초해 다른 모듈들(820 내지 840)의 복호화를 제어한다. 현재 블록이 직교 변환 그룹 #y의 직교 변환 방법들 중 하나를 이용해 역직교 변환되었으면, 직교 변환 그룹 #y에 대응되는 예측 그룹 #x의 예측 방법을 이용해 현재 블록을 예측하도록, 역양자화 및 역직교변환부(820), 인트라예측부(830) 및 인터 예측부(840)를 제어한다.

도 9는 본 발명의 일 실시예에 따른 영상 복호화 방법를 도시한다.

도 9를 참조하면, 단계 910에서 본 발명의 일 실시예에 따른 영상 복호화 장치는 소정의 출력 영상에 대한 비트스트림을 수신한다.

단계 920에서 영상 복호화 장치는 단계 910에서 수신된 출력 영상에 대한 비트스트림에 포함된 예측 그룹과 직교 변환 그룹 사이의 대응에 대한 정보를 복호화한다.

단계 930에서 영상 복호화 장치는 단계 920에서 복호화된 대응에 대한 정보에 기초해 출력 영상을 복호화한다. 직교 변환 그룹 y의 직교 변환 방법을 이용해 역직교 변환된 블록을 직교 변환 그룹 y에 대응되는 예측 그룹 x의 예측 방법을 이용해 예측함으로써 출력 영상을 복호화한다.

본 발명의 일 실시예에 따르면, 예측 방법과 직교 변환 방법을 다양하게 조합하여 영상을 부호화하면서, 예측 방법과 직교 변환 방법 사이의 대응에 대한 정보를 적은 비트를 이용해 부호화할 수 있어 영상 부호화의 압축률을 향상시킬 수 있다.

이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명이 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이와 균등하거나 또는 등가적인 변형 모두는 본 발명 사상의 범주에 속한다 할 것이다. 또한, 본 발명에 따른 시스템은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다.

예를 들어, 본 발명의 예시적인 실시예에 따른 영상 부호화 장치 및 영상 복호화 장치는 도 1, 5, 7 및 8에 도시된 바와 같은 장치의 각각의 유닛들에 커플링 된 버스, 상기 버스에 결합된 적어도 하나의 프로세서를 포함할 수 있다. 또한, 명령, 수신된 메시지 또는 생성된 메시지를 저장하기 위해 상기 버스에 결합되어, 전술한 바와 같은 명령들을 수행하기 위한 적어도 하나의 프로세서에 커플링된 메모리를 포함할 수 있다.

또한, 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.

Claims

영상 부호화 방법에 있어서,

복수의 예측 방법을 그룹화하여 예측에 대한 적어도 하나의 그룹을 생성하는 단계;

복수의 직교 변환 방법을 그룹화하여 직교 변환에 대한 적어도 하나의 그룹을 생성하는 단계;

상기 예측에 대한 적어도 하나의 그룹 각각을 상기 직교 변환에 대한 적어도 하나의 그룹에 대응시키는 단계; 및

상기 대응에 기초해 예측에 대한 소정의 그룹의 예측 방법에 의해 예측된 블록을 상기 예측에 대한 소정의 그룹에 대응되는 직교 변환에 대한 그룹의 직교 변환 방법을 이용해 변환함으로써 입력 영상을 부호화하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법.
제 1 항에 있어서, 상기 예측에 대한 적어도 하나의 그룹을 생성하는 단계는

상기 복수의 예측 방법을 예측 블록의 크기 및 예측 방법의 유형 중 적어도 하나에 기초해 그룹화하여 상기 예측에 대한 적어도 하나의 그룹을 생성하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법.
제 2 항에 있어서, 상기 예측 방법의 유형은

인트라 예측 및 인터 예측을 포함하는 것을 특징으로 하는 영상 부호화 방법.
제 2 항에 있어서, 상기 직교 변환에 대한 적어도 하나의 그룹을 생성하는 단계는

상기 복수의 직교 변환 방법을 변환 블록의 크기 및 변환 알고리즘 중 적어도 하나에 기초해 그룹화하여 상기 직교 변환에 대한 적어도 하나의 그룹을 생성하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법.
제 4 항에 있어서, 상기 변환 알고리즘은

이산 코사인 변환 및 하다마드 변환을 포함하는 것을 특징으로 하는 영상 부호화 방법.
제 4 항에 있어서, 상기 대응시키는 단계는

상기 예측 블록의 크기 및 상기 변환 블록의 크기에 기초해 상기 예측에 대한 적어도 하나의 그룹 각각을 상기 직교 변환에 대한 적어도 하나의 그룹에 대응시키는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법.
제 1 항에 있어서, 상기 대응시키는 단계는

영상 시퀀스 또는 픽처 또는 슬라이스 또는 IDR(Instantaneous Decoding Refresh) 픽처 단위로 수행되는 것을 특징으로 하는 영상 부호화 방법.
제 1 항에 있어서, 상기 부호화하는 단계는

상기 예측에 대한 적어도 하나의 그룹과 상기 직교 변환에 대한 적어도 하나의 그룹 사이의 대응에 대한 정보를 부호화하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법.
영상 복호화 방법에 있어서,

소정의 출력 영상에 대한 비트스트림을 수신하는 단계;

예측에 대한 적어도 하나의 그룹과 직교 변환에 대한 적어도 하나의 그룹 사이의 대응에 대한 정보를 복호화하는 단계; 및

상기 대응에 기초해 직교 변환에 대한 소정의 그룹의 변환 방법에 의해 역직교 변환된 블록을 상기 대응되는 예측에 대한 그룹의 예측 방법을 이용해 예측함으로써 상기 출력 영상을 복호화하는 단계를 포함하는 것을 특징으로 하는 영상 복호화 방법.
제 9 항에 있어서, 상기 예측에 대한 적어도 하나의 그룹은

상기 복수의 예측 방법을 예측 블록의 크기 및 예측 방법의 유형 중 적어도 하나에 기초해 그룹화하여 생성된 적어도 하나의 그룹인 것을 특징으로 하는 영상 복호화 방법.
제 10 항에 있어서, 상기 예측 방법의 유형은

인트라 예측 및 인터 예측을 포함하는 것을 특징으로 하는 영상 복호화 방법.
제 10 항에 있어서, 상기 직교 변환에 대한 적어도 하나의 그룹은

상기 복수의 직교 변환 방법을 변환 블록의 크기 및 변환 알고리즘 중 적어도 하나에 기초해 그룹화하여 생성된 적어도 하나의 그룹인 것을 특징으로 하는 영상 복호화 방법.
제 12 항에 있어서, 상기 변환 알고리즘은

이산 코사인 변환 및 하다마드 변환을 포함하는 것을 특징으로 하는 영상 복호화 방법.
제 12 항에 있어서, 상기 대응에 대한 정보는

상기 예측 블록의 크기 및 상기 변환 블록의 크기에 기초해 상기 예측에 대한 적어도 하나의 그룹 각각을 상기 직교 변환에 대한 적어도 하나의 그룹에 대응시켜 생성된 정보인 것을 특징으로 하는 영상 복호화 방법.
제 9 항에 있어서, 상기 대응에 대한 정보는

영상 시퀀스 또는 픽처 또는 슬라이스 또는 IDR(Instantaneous Decoding Refresh) 픽처 단위로 생성된 정보인 것을 특징으로 하는 영상 복호화 방법.
영상 부호화 장치에 있어서,

입력 영상을 부호화하는 영상 부호화부; 및

예측에 대한 적어도 하나의 그룹 각각을 직교 변환에 대한 적어도 하나의 그룹에 대응시키고, 상기 영상 부호화부가 상기 대응에 기초해 예측에 대한 소정의 그룹의 예측 방법에 의해 예측된 블록을 상기 예측에 대한 소정의 그룹에 대응되는 직교 변환에 대한 그룹의 직교 변환 방법을 이용해 변환함으로써 입력 영상을 부호화하도록 제어하는 매칭부를 포함하는 것을 특징으로 하는 영상 부호화 장치.
제 16 항에 있어서, 상기 매칭부는

영상 시퀀스 또는 픽처 또는 슬라이스 또는 IDR(Instantaneous Decoding Refresh) 픽처 단위로 상기 대응을 수행하는 것을 특징으로 하는 영상 부호화 장치.
영상 복호화 장치에 있어서,

출력 영상에 대한 비트스트림을 복호화하는 영상 복호화부; 및

상기 비트스트림에 포함된 예측에 대한 적어도 하나의 그룹과 직교 변환에 대한 적어도 하나의 그룹 사이의 대응에 대한 정보에 기초해 상기 영상 부호화부가 직교 변환에 대한 소정의 그룹의 변환 방법에 의해 역직교 변환된 블록을 대응되는 예측에 대한 그룹의 예측 방법을 이용해 예측함으로써 상기 출력 영상을 복원하도록 제어하는 매칭부를 포함하는 것을 특징으로 하는 영상 복호화 장치.
제 18 항에 있어서, 상기 대응에 대한 정보는

영상 시퀀스 또는 픽처 또는 슬라이스 또는 IDR(Instantaneous Decoding Refresh) 픽처 단위로 생성된 정보인 것을 특징으로 하는 영상 복호화 장치.
제 1 항 내지 제 15 항 중 어느 한 항의 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.