KR20070052057A

KR20070052057A - 인간의 시각 특성을 이용한 영상의 부호화, 복호화 방법 및장치

Info

Publication number: KR20070052057A
Application number: KR1020050109632A
Authority: KR
Inventors: 한우진
Original assignee: 삼성전자주식회사
Priority date: 2005-11-16
Filing date: 2005-11-16
Publication date: 2007-05-21
Also published as: US7680346B2; KR100750138B1; US20070110327A1; EP1788820A2; CN1968419A

Abstract

본 발명은 인간의 심리시각적(psychovisual) 특성을 이용하여 영상의 압축 효율을 향상시키는 영상의 부호화 방법 및 장치에 관한 것으로, 본 발명에 따른 영상 부호화 방법 및 장치는 인간의 시각 시스템이 갖는 마스킹 효과를 이용하여 영상 특성에 따라 인간이 시각적으로 인지할 수 있는 영상의 최소인지한계인 JND(Just Noticeable Distortion) 이하에 존재하는 영상 신호 성분은 부호화하지 않음으로써 영상의 주관적인 화질의 큰 열화없이 압축율을 향상시키는데 특징이 있다.

Description

인간의 시각 특성을 이용한 영상의 부호화, 복호화 방법 및 장치{Method and apparatus for image encoding and decoding considering the characteristic of human visual system}

도 1은 종래 기술에 따른 예측 기반 영상 부호화 방법의 일 예를 나타낸 도면이다.

도 2a 및 2b는 본 발명에 이용되는 인간의 시각 시스템이 갖는 마스킹 효과를 설명하기 위한 도면이다.

도 3은 본 발명에 따른 인간의 시각적 특성을 이용한 영상 부호화 방법의 개념을 설명하기 위한 도면이다.

도 4는 본 발명의 일 실시예에 따른 영상 부호화 장치를 나타낸 블록도이다.

도 5는 본 발명의 일 실시예에 따른 영상 부호화 방법을 나타낸 플로우 차트이다.

도 6은 본 발명의 일 실시예에 따른 영상 부호화 방법에서 각 단계별 생성되는 블록을 나타낸 도면이다.

도 7은 본 발명의 다른 실시예에 따른 영상 부호화 장치를 나타낸 블록도이다.

도 8은 본 발명의 다른 실시예에 따른 영상 부호화 방법을 나타낸 플로우 차 트이다.

도 9는 본 발명의 다른 실시예에 따른 영상 부호화 방법에서 각 단계별 생성되는 블록을 나타낸 도면이다.

도 10은 본 발명의 또 다른 실시예에 따른 영상 부호화 장치를 나타낸 블록도이다.

도 11은 본 발명의 또 다른 실시예에 따른 영상 부호화 방법을 나타낸 플로우 차트이다.

도 12는 본 발명의 또 다른 실시예에 따른 영상 부호화 방법에서 각 단계별 생성되는 블록을 나타낸 도면이다.

도 13은 본 발명의 바람직한 실시예에 따른 영상 복호화 장치의 구성을 나타낸 블록도이다.

도 14는 본 발명의 바람직한 실시예에 따른 영상 복호화 방법을 나타낸 플로우 차트이다.

본 발명은 영상의 부호화에 관한 것으로, 보다 구체적으로는 인간의 심리시각적(psychovisual) 특성을 이용하여 영상의 압축 효율을 향상시키는 영상의 부호화 방법 및 장치에 관한 것이다.

도 1은 종래 기술에 따른 예측 기반 영상 부호화 방법의 일 예를 나타낸 도 면이다.

도 1을 참조하면, MPEG-1, MPEG-2, MPEG-4 Visual, H.261, H.263 및 H.264 등의 주요 비디오 압축 표준안에서는 하나의 프레임을 복수 개의 매크로블록들로 분할한 다음, 매크로블록 단위로 예측(prediction process)을 수행하여 현재 블록(current block)에 대응되는 예측 블록(predicted block)을 구하고, 현재 블록(O)과 예측 블록(P)의 차이인 레지듀얼 블록(residual block)를 변환(transform) 및 양자화(quantization)하여 변환 계수의 값의 범위를 줄인 다음 엔트로피 코딩을 수행한다.

종래 기술에 따른 예측 기반 영상 부호화 방법은 영상이 갖는 시공간적 상관관계(spatio-temporal correlation)를 최대한 활용하여 현재 블록과 가장 유사한 예측 블록을 예측하는데 기반을 두고 있다. 즉, 종래 기술에 따른 예측 기반 영상 부호화 방법은 현재 블록과 예측 블록 사이의 차분값인 레지듀얼 신호를 코딩함으로써 압축 효율을 높인다. 결국 종래 기술에 따른 영상 부호화 방법에서는 현재 블록과 예측 블록이 얼마나 유사한지에 따라서 압축 효율이 결정된다.

그러나, 종래 기술에 따르면 영상 부호화를 위해 인간의 시각 시스템이 갖는 특징을 잘 활용하고 있지 못하고 있다. 즉, 종래 기술에 따르면 인간이 시각적으로 잘 인지하지 못하는 부분을 포함하여 레지듀얼 블록 또는 변환 블록 전체를 그대로 부호화하고 있다. 제한된 전송 대역폭의 한계를 극복하고, 고화질의 영상을 사용자에게 제공하기 위해서 더욱 향상된 압축 효율을 갖는 영상의 부호화 방법이 요구되고 있다.

따라서, 본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 인간의 시각 시스템이 갖는 마스킹 효과(masking effect)를 반영한 심리시각적 모델을 예측 기반 부호화 방법에 적용하여 영상의 압축 효율을 향상시키는 영상의 부호화 방법 및 장치를 제공하는 데에 목적이 있다.

상기와 같은 기술적 과제를 해결하기 위하여 본 발명의 일 실시예에 따른 영상 부호화 방법은 부호화할 소정 크기의 현재 블록에 대응되는 예측 블록을 생성하는 단계; 상기 현재 블록과 상기 예측 블록의 차이를 계산하여 레지듀얼 블록을 생성하는 단계; 상기 레지듀얼 블록 및 예측 블록을 각각 변환하여 변환 레지듀얼 블록 및 변환 예측 블록을 생성하는 단계; 상기 변환 예측 블록을 구성하는 각 계수들이 시각적으로 인지될 수 있는 최소 임계 변환 계수값을 구하고, 상기 최소 임계 변환 계수값들로 구성된 최소 임계 블록을 생성하는 단계; 및 상기 변환 레지듀얼 블록의 각 계수별로, 양자화 스텝에 따른 최대 양자화 에러가 상기 최소 임계 변환 계수값 미만이 되도록 하는 최적 양자화 스텝을 결정하고, 상기 결정된 최적 양자화 스텝에 따라 상기 변환 레지듀얼 블록의 각 계수를 양자화하는 단계를 포함하는 것을 특징으로 한다.

본 발명의 다른 실시예에 따른 영상 부호화 방법은, 부호화할 소정 크기의 현재 블록에 대응되는 예측 블록을 생성하는 단계; 상기 현재 블록과 상기 예측 블록의 차이를 계산하여 레지듀얼 블록을 생성하는 단계; 상기 레지듀얼 블록 및 상 기 예측 블록을 각각 변환하여 변환 레지듀얼 블록 및 변환 예측 블록을 생성하는 단계; 상기 변환 예측 블록의 각 변환 계수들이 시각적으로 인지될 수 있는 최소 임계 변환 계수값을 구하고, 상기 최소 임계 변환 계수값들로 구성된 최소 임계 블록을 형성하는 단계; 및 상기 변환 레지듀얼 블록의 계수와 대응되는 상기 최소 임계 변환 계수값을 비교하여 상기 변환 레지듀얼 블록의 계수들 중에서 부호화할 변환 레지듀얼 블록 계수를 선택하는 단계를 포함하는 것을 특징으로 한다.

본 발명의 또 다른 실시예에 따른 영상 부호화 방법은, 부호화할 소정 크기의 현재 블록에 대응되는 예측 블록을 생성하는 단계; 상기 현재 블록과 상기 예측 블록의 차이를 계산하여 레지듀얼 블록을 생성하는 단계; 상기 예측 블록을 구성하는 각 화소들의 시각적으로 인지될 수 있는 최소 임계값을 구하고, 상기 최소 임계값들로 구성된 최소 임계 블록을 생성하는 단계; 및 상기 레지듀얼 블록과 상기 최소 임계 블록의 각 화소별 차이값을 계산하여 차분 레지듀얼 블록을 생성하는 단계를 포함하는 것을 특징으로 한다.

본 발명의 일 실시예에 따른 영상 부호화 장치는, 부호화할 소정 크기의 현재 블록에 대응되는 예측 블록을 생성하는 예측부; 상기 현재 블록과 상기 예측 블록의 차이를 계산하여 레지듀얼 블록을 생성하는 감산부; 상기 레지듀얼 블록을 변환하여 변환 레지듀얼 블록을 생성하는 제 1 변환부; 상기 예측 블록을 변환하여 변환 예측 블록을 생성하는 제 2 변환부; 상기 변환 예측 블록을 구성하는 각 계수들이 시각적으로 인지될 수 있는 최소 임계 변환 계수값을 구하고, 상기 최소 임계 변환 계수값들로 구성된 최소 임계 블록을 생성하는 최소 임계 블록 생성부; 및 상 기 변환 레지듀얼 블록의 각 계수별로, 양자화 스텝에 따른 최대 양자화 에러가 상기 최소 임계 변환 계수값 미만이 되도록 하는 최적 양자화 스텝을 결정하고, 상기 결정된 최적 양자화 스텝에 따라 상기 변환 레지듀얼 블록의 각 계수를 양자화하는 양자화부를 포함하는 것을 특징으로 한다.

본 발명의 다른 실시예에 따른 영상 부호화 장치는, 부호화할 소정 크기의 현재 블록에 대응되는 예측 블록을 생성하는 예측부; 상기 현재 블록과 상기 예측 블록의 차이를 계산하여 레지듀얼 블록을 생성하는 감산부; 상기 레지듀얼 블록을 변환하여 변환 레지듀얼 블록을 생성하는 제 1 변환부; 상기 예측 블록을 변환하여 변환 예측 블록을 생성하는 제 2 변환부; 상기 변환 예측 블록의 각 변환 계수들이 시각적으로 인지될 수 있는 최소 임계 변환 계수값을 구하고, 상기 최소 임계 변환 계수값들로 구성된 최소 임계 블록을 형성하는 최소 임계 블록 생성부; 및 상기 변환 레지듀얼 블록의 계수와 대응되는 상기 최소 임계 변환 계수값을 비교하여 상기 변환 레지듀얼 블록의 계수들 중에서 부호화할 변환 레지듀얼 블록 계수를 선택하는 선택부를 포함하는 것을 특징으로 한다.

본 발명의 또 다른 실시예에 따른 영상 부호화 장치는, 부호화할 소정 크기의 현재 블록에 대응되는 예측 블록을 생성하는 예측부; 상기 현재 블록과 상기 예측 블록의 차이를 계산하여 레지듀얼 블록을 생성하는 제 1 감산부; 상기 예측 블록을 구성하는 각 화소들의 시각적으로 인지될 수 있는 최소 임계값을 구하고, 상기 최소 임계값들로 구성된 최소 임계 블록을 생성하는 최소 임계 블록 생성부; 및 상기 레지듀얼 블록과 상기 최소 임계 블록의 각 화소별 차이값을 계산하여 차분 레지듀얼 블록을 생성하는 제 2 감산부를 포함하는 것을 특징으로 한다.

본 발명에 따른 영상 복호화 방법은, 수신된 비트스트림으로부터, 변환 레지듀얼 블록의 각 계수별로 양자화 스텝에 따른 최대 양자화 에러가 상기 최소 임계 변환 계수값 미만이 되도록 결정된 최적 양자화 스텝 정보 및 상기 변환 레지듀얼 블록 계수 정보를 추출하는 단계; 상기 추출된 최적 양자화 스텝에 따라 양자화된 변환 레지듀얼 블록 계수를 역양자화하는 단계; 및 복호화할 현재 블록에 대한 예측 블록과 역변환된 상기 변환 레지듀얼 블록을 가산하여 영상을 복원하는 단계를 포함하는 것을 특징으로 한다.

본 발명에 따른 영상 복호화 장치는, 수신된 비트스트림으로부터, 변환 레지듀얼 블록의 각 계수별로 양자화 스텝에 따른 최대 양자화 에러가 상기 최소 임계 변환 계수값 미만이 되도록 결정된 최적 양자화 스텝 정보 및 상기 변환 레지듀얼 블록 계수 정보를 추출하는 엔트로피 복호화부; 상기 추출된 최적 양자화 스텝에 따라 양자화된 변환 레지듀얼 블록 계수를 역양자화하는 역양자화부; 및 상기 역양자화된 변환 레지듀얼 블록 계수를 역변환하여 레지듀얼 블록을 출력하는 역변환부; 복호화할 현재 블록에 대한 예측 블록을 생성하는 예측부; 및 상기 역변환된 상기 레지듀얼 블록과 상기 예측 블록을 가산하여 영상을 복원하는 가산부를 포함하는 것을 특징으로 한다.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들에 대하여 상세히 설명한다.

먼저 인간의 시각 시스템이 갖는 특성에 대하여 살펴본다. 인간의 시각 시 스템(Human Visual System:HVS)은 인간의 청각 시스템과 마찬가지로 마스킹 효과(masking effect)를 갖는다. 영상에 있어서 마스킹 효과란 영상 신호의 특정 주파수에 소정 크기 이상의 큰 성분이 존재하는 경우, 상기 특정 주파수 주변의 주파수 대역에 존재하는 소정 크기 이하의 작은 성분의 신호를 인간이 인지하지 못하거나 영상 특성에 따라 소정 크기 이하의 영상 신호를 인지하지 못하는 것을 말한다.

도 2a 및 2b는 본 발명에 이용되는 인간의 시각 시스템이 갖는 마스킹 효과를 설명하기 위한 도면이다. 도 2a에서 위쪽에 위치한 영상(21,22)은 8비트로 양자화된 영상이고, 아래쪽에 위치한 영상(23,24)은 4비트로 양자화된 영상이다.

도 2에서 거친 표면을 나타내고 있는 두 영상(22,24)을 비교해보면, 8비트로 양자화되거나 4비트로 양자화된 영상의 차이를 시각적으로 인지하기 힘들다. 한편 부드러운 표면을 나타낸 두 영상(21, 23)을 비교해보면, 8비트로 양자화된 영상(21)에 비하여 4비트로 양자화된 영상에서 밴딩(banding) 효과가 더 뚜렷해지는 것을 알 수 있다. 이와 같이, 영상 특성에 따라서 양자화 계수를 조절함으로써 인간이 시각적으로 느끼지 못하는 부분을 부호화하지 않음으로써 부호화된 영상의 압축율을 향상시킬 수 있다.

한편, 도 2b의 첫 번째 영상(25)은, 연속적인 톤(tone)의 링컨 영상을 픽처당 10싸이클(cycle/picture)로 저대역 필터(low-pass filtered) 처리한 후 샘플링한 영상이다. 또한, 도 2b의 두 번째 영상(26)은 상기 첫 번째 영상(25)을 다시 저대역 필터 처리한 영상이고, 세 번째 영상(27)은 상기 첫 번째 영상(25)에서 40 싸이클 이상의 고주파수 대역 성분을 제거한 영상이며, 네 번째 영상(28)은 상기 첫 번째 영상의 12~40 싸이클 대역의 주파수 성분을 제거한 영상을 나타낸 것이다.

도 2b의 첫 번째 영상(25) 및 두 번째 영상(26)을 비교해보면, 고주파수 대역 성분을 갖는 블록 에지 부분의 불연속성을 저대역 필터 처리를 통해 제거하는 경우 시각적 인지도가 증가한다. 그러나, 인간의 시각적 인지에 있어서 반드시 영상의 고주파수 성분만이 영향을 미치는 것은 아니다. 도 2b의 세 번째 영상(27) 및 네 번째 영상(28)을 참조하면, 40싸이클 이상의 고주파수 대역 성분을 제거한 세 번째 영상(27)에 비하여 12~40 싸이클 대역의 특정 주파수 대역 성분만을 제거한 네 번째 영상(28)의 시각적 인지도가 증가되는 것을 알 수 있다. 이와 같이, 마스킹 효과는 제한된 주파수 대역 성분의 상호 작용에 의해 발생하며, 영상 특성에 따른 특정 주파수 대역 성분만을 제거함으로써 시각적 인지도의 큰 차이 없이 영상을 압축할 수 있다.

본 발명은 이와 같은 인간의 시각 시스템이 갖는 마스킹 효과를 이용하여 영상 특성에 따라 인간이 시각적으로 인지할 수 있는 영상의 최소인지한계인 JND(Just Noticeable Distortion) 이하에 존재하는 영상 신호 성분은 부호화하지 않음으로써 영상의 주관적인 화질의 큰 열화없이 압축율을 향상시키는데 특징이 있다.

원영상 신호를 인트라 예측 또는 인터 예측을 통해 예측한 예측 신호를 P(31), 상기 예측 신호 P의 최소인지한계(JND)를 J(33), 원영상 신호와 예측 신호 의 차이인 레지듀얼 신호를 R(32)이라고 한다. 도 3을 참조하면, 본 발명에 따른 영상 부호화 방법은 예측 신호(P)로부터 인간이 상기 예측 신호를 인지할 수 있는 최소 인지한계인 JND(J)를 산출하고, 상기 JND 이하의 레지듀얼 신호(R)는 부호화하지 않음으로써 효율적인 압축을 가능하게 한다. 즉, JND보다 큰 값을 갖는 레지듀얼 신호 부분(30)과 상기 최소 인지한계인 JND와의 차이(MAX(0,R-J))만을 부호화함으로써 영상의 압축 효율을 향상시킨다.

이를 위해, 본 발명에 따른 영상 부호화 방법 및 장치는 양자화 단계, 변환 단계, 레지듀얼 신호를 처리하는 단계 각각에서 상기 JND 특성을 고려하여 부호화할 데이터를 결정한다. 이하에서는 상기 각 단계별에 따라 본 발명의 바람직한 실시예들에 따른 영상 부호화 방법 및 장치에 대하여 설명한다.

도 4는 본 발명의 일 실시예에 따른 영상 부호화 장치를 나타낸 블록도이고, 도 5는 본 발명의 일 실시예에 따른 영상 부호화 방법을 나타낸 플로우 차트이며, 도 6은 본 발명의 일 실시예에 따른 영상 부호화 방법에서 각 단계별 생성되는 블록을 나타낸 도면이다. 도 4 내지 도 6을 참조하여 본 발명의 일 실시예에 따른 영상 부호화 방법 및 장치의 동작에 대하여 설명하면 다음과 같다.

본 발명의 일 실시예에 따른 영상 부호화 방법 및 장치는 양자화 단계에서 발생하는 양자화 에러값이 시각적으로 인지될 수 있는 소정의 임계 계수값, 즉 JND 이하가 되도록 양자화 스텝을 조절하는 것이다.

도 4를 참조하면, 본 발명의 일 실시예에 따른 영상 부호화 장치(400)는 예측부(410), 감산부(420), 제 1변환부(430), 제 2변환부(440), 최소임계블록 생성부 (450), 양자화부(460) 및 엔트로피 부호화부(470)를 포함한다.

단계 510에서, 상기 예측부(410)는 소정 크기의 블록 단위로 입력되는 부호화할 현재 블록(C1)에 대하여 인트라 예측 또는 인터 예측을 수행하여 현재 블록(C1)에 대응되는 예측 블록(P1)을 생성한다.

단계 520에서, 상기 감산부(420)는 현재 블록(C₁)으로부터 예측 블록(P₁)을 감산하여 레지듀얼 블록(R₁)을 생성한다. 도 6을 참조하면, 레지듀얼 블록(R₁)의 (x,y)에 위치한 화소 R_xy는 현재 블록 내부의 화소(C_xy)와 대응되는 예측 블록의 화소(P_xy)를 감산한 값을 갖는다. 즉, R_xy=C_xy-P_xy이다.

단계 530에서, 상기 제 1변환부(430) 및 제 2변환부(440)는 DCT 변환 또는 웨이블릿 변환 등의 주파수 변환을 수행하여 상기 레지듀얼 블록(R₁)과 예측 블록(P₁)으로부터 각각 변환 레지듀얼 블록(R_c1), 변환 예측 블록(P_c1)을 생성한다.

단계 540에서, 상기 최소 임계 블록 생성부(450)는 상기 변환 예측 블록(P_c1)을 구성하는 각 계수들이 시각적으로 인지될 수 있는 최소 임계 변환 계수값을 구하고, 상기 최소 임계 변환 계수값들로 구성된 최소 임계 블록(J_c1)을 생성한다.

단계 550에서, 상기 양자화부(460)는 상기 변환 레지듀얼 블록(R_c1)의 각 레지듀얼 변환 계수(R')를 양자화하는데 이용되는 최적 양자화 스텝을 결정한다. 상기 최적 양자화 스텝은 다음의 수학식 1에 의해 계산될 수 있다.

수학식 1에서, R_i는 i번째 변환 레지듀얼 블록의 계수, J_i는 i번째 최소 임계 블록의 최소 임계 변환 계수값, Q_step ⁱ 는 상기 변환 레지듀얼 블록(R_c1)의 i번째 변환 레지듀얼 계수를 양자화하는데 이용되는 최적 양자화 스텝을 나타낸다. 또한,

는 상기 변환 레지듀얼 블록(R_c1)과 상기 최소 임계 블록(J_c1)의 차분값을 최적 양자화 스텝(Q_step ⁱ)에 따라 양자화한 값을 나타낸다.

수학식 1을 참조하면, 상기 양자화부(460)는 양자화 오차값

의 절대값이 상기 예측 블록(P₁)으로부터 생성된 최소 임계 변환 계수값(J_i) 이하가 되도록 하는 양자화 스텝값 중 최대값을 최적 양자화 스텝으로 결정할 수 있다. 그러나, 상기 수학식 1에 의하여 양자화 스텝을 결정하는 경우 복호화단에서 상기 변환 레지듀얼 블록의 계수값(R_i)를 바로 이용할 수 없으므로, 다음의 수학식 2와 같이 최적 양자화 스텝을 결정하는 것이 바람직하다.

수학식 2에서 MaxE(Q_step ⁱ)은 양자화 스텝 Q_step ⁱ에 따른 최대 양자화 에러값을 나타낸다. 예를 들어, 양자화 스텝 Q_step ⁱ값을 a라고 하면, 반올림 또는 반내림에 의하여 발생되는 최대 양자화 에러값은 a/2가 된다. 상기 양자화부(460)는 상기 최대 양자화 에러 MaxE(Q_step ⁱ)가 상기 최소 임계 변환 계수값(J_i) 이하가 되도록 하는 양자화 스텝값 중 최대값을 최적 양자화 스텝으로 결정한 다음, 결정된 최적 양자화 스텝에 따라 상기 변환 레지듀얼 블록(Rc₁)을 양자화하여 양자화된 변환 레지듀얼 블록(QR_C1)을 생성한다. 상기 최적 양자화 스텝(Q_step ⁱ) 정보를 부호화된 비트스트림에 포함시켜 전송하면 복호화단에서는 전송된 최적 양자화 스텝 정보를 이용하여 양자화된 변환 레지듀얼 블록의 계수들에 대한 역양자화를 수행할 수 있다.

한편, 대역 전송폭의 한계로 인해 매우 높은 압축률이 요구되는 경우, 즉 할당할 수 있는 비트가 제한된 경우에 있어서 상기 수학식 2를 통해 결정된 양자화 스텝으로 부호화를 수행한 경우 원하는 비트율에 도달할 수 없는 경우가 있다. 이러한 경우, 적응적으로 상기 방법을 적용하기 위하여 상기 수학식 2를 통해 결정되는 최적 양자화 스텝이 상기 변환 레지듀얼 블록 계수에 대하여 미리 정해진 소정의 양자화 스텝보다 큰 경우에만 적용되도록 할 수 있다. 또한, 상기 수학식 2에서 결정된 각 변환 레지듀얼 블록 계수별 양자화 스텝의 상대적 비율을 유지하면서 상기 최적 양자화 스텝의 평균값을 변화시킴으로써 대역폭의 변화에 따라 적응적으 로 비트를 재할당할 수 있다.

이와 같이, 본 발명의 일 실시예에 따른 영상 부호화 방법 및 장치는 양자화 잡음이 인간의 시각 시스템이 인지할 수 있는 최소 임계값(JND) 이하가 되도록 양자화 스텝을 조절함으로써 영상의 압축 효율을 증가시킨다.

도 7은 본 발명의 다른 실시예에 따른 영상 부호화 장치를 나타낸 블록도이고, 도 8은 본 발명의 다른 실시예에 따른 영상 부호화 방법을 나타낸 플로우 차트이며, 도 9는 본 발명의 다른 실시예에 따른 영상 부호화 방법에서 각 단계별 생성되는 블록을 나타낸 도면이다. 이하, 도 7 내지 도 9를 참조하여 본 발명의 다른 실시예에 따른 영상 부호화 방법 및 장치의 동작에 대하여 설명한다.

본 발명의 다른 실시예에 따른 영상 부호화 방법은 양자화 단계 이전의 변환 단계에서 변환 계수들이 시각적으로 인지될 수 있는 최소 임계 변환 계수값을 구하고, 상기 최소 임계 변환 계수값보다 큰 값을 갖는 변환 레지듀얼 블록 부분의 계수만을 부호화하는 것이다.

도 7을 참조하면, 본 발명의 다른 실시예에 따른 영상 부호화 장치(700)는 예측부(710), 감산부(720), 제 1 변환부(730), 제 2변환부(740), 최소 임계 블록 형성부(750), 선택부(760), 양자화부(770) 및 엔트로피 부호화부(780)를 포함한다.

단계 810에서, 상기 예측부(710)는 소정 크기의 블록 단위로 입력되는 부호화할 현재 블록(C₂)에 대하여 인트라 예측 또는 인터 예측을 수행하여 현재 블록(C₂)에 대응되는 예측 블록(P₂)을 생성한다.

단계 820에서, 상기 감산부(720)는 현재 블록(C₂)과 예측 블록(P₂)을 감산하여 레지듀얼 블록(R₂)을 생성한다.

단계 830에서, 상기 제 1변환부(730) 및 제 2변환부(740)는 각각 상기 레지듀얼 블록(R₂)과 예측 블록(P₂)에 대한 변환을 수행하여 변환 레지듀얼 블록(R_c2), 변환 예측 블록(P_c2)을 생성한다.

단계 840에서, 상기 최소 임계 블록 생성부(750)는 상기 변환 예측 블록(P_c2)을 구성하는 각 계수들이 시각적으로 인지될 수 있는 최소 임계 변환 계수값(J)을 구하고, 상기 최소 임계 변환 계수값(J)들로 구성된 최소 임계 블록(J_c2)을 생성한다.

단계 850에서, 상기 선택부(760)는 상기 변환 레지듀얼 블록(Rc2)의 각 변환 레지듀얼 계수(R')와 상기 최소 임계 변환 계수값(J)을 비교하여 상기 변환 레지듀얼 블록(R_c2)의 계수들 중에서 부호화할 계수를 결정한다.

구체적으로 도 9를 참조하면, 상기 선택부(760)는 상기 변환 레지듀얼 블록(R_c2)의 변환 레지듀얼 계수의 절대값 ABS(R_c2)와 최소 임계 블록(J_c2)의 계수의 절대값 ABS(J_c2)의 차이를 계산하고 그 차이가 0보다 큰 값을 갖는 부분만을 부호화한다. DCT 등의 변환을 수행한 경우 변환 계수값이 음수일 수 있기 때문에 상기 변환 레지듀얼 계수값과 최소 임계 변환 계수값의 크기를 비교하기 위하여 절대값을 이용한다. 상기 변환 레지듀얼 블록(R_c2)의 (x,y)에 위치한 변환 레지듀얼 계수값을 R_xy' , 대응되는 최소 임계 블록의 계수값을 J_xy라고 하면, 상기 선택부(760)는

을 만족하는 경우 변환 레지듀얼 계수값을 부호화하고,

인 경우에는 해당되는 변환 레지듀얼 계수값을 0으로 설정한다. 즉, 상기 선택부(760)는 최소 임계 변환 계수값(J_xy)보다 큰 값을 갖는 변환 레지듀얼 계수들(R_xy')만을 선택하여 상기 최소 임계 변환 계수값과의 차이를 부호화한다. 또한, 상기 차분 변환 레지듀얼 계수가 음수인 경우, 즉 최소 임계 변환 계수값이 차분 변환 레지듀얼 계수값보다 큰 경우에는 상기 차분 변환 레지듀얼 계수를 0으로 설정하여 부호화할 정보량을 감소시킨다.

단계 860에서, 상기 선택부(780)에서 선택된 변환 레지듀얼 블록 계수와 최소 임계 변환 계수값과의 차이인 차분 변환 레지듀얼 계수값은 다시 양자화부(770) 및 엔트로피 부호화부(780)를 거쳐 양자화 및 엔트로피 부호화되어 비트스트림으로 출력된다.

도 10은 본 발명의 또 다른 실시예에 따른 영상 부호화 장치를 나타낸 블록도이고, 도 11은 본 발명의 또 다른 실시예에 따른 영상 부호화 방법을 나타낸 플로우 차트이며, 도 12는 본 발명의 또 다른 실시예에 따른 영상 부호화 방법에서 각 단계별 생성되는 블록을 나타낸 도면이다. 이하, 도 10 내지 도 12를 참조하여 본 발명의 또 다른 실시예에 따른 영상 부호화 방법 및 장치의 동작에 대하여 설명 한다.

본 발명의 또 다른 실시예에 따른 영상 부호화 방법은 변환 단계 이전에, 예측 블록을 구성하는 각 화소들의 시각적으로 인지될 수 있는 최소 임계값(JND)을 구하고, 레지듀얼 값과 상기 최소 임계값과의 차이를 부호화하는 것이다.

도 10을 참조하면, 본 발명의 또 다른 실시예에 따른 영상 부호화 장치(1000)는 예측부(1010), 제 1감산부(1020), 최소 임계 블록 형성부(1030), 제 2 감산부(1040), 변환부(1050), 양자화부(1060) 및 엔트로피 부호화부(1070)를 포함한다.

단계 1110에서, 상기 예측부(1010)는 소정 크기의 블록 단위로 입력되는 부호화할 현재 블록(C₃)에 대하여 인트라 예측 또는 인터 예측을 수행하여 현재 블록(C₃)에 대응되는 예측 블록(P₃)을 생성한다.

단계 1120에서, 상기 제 1감산부(1020)는 현재 블록(C₃)으로부터 예측 블록(P₃)을 감산하여 레지듀얼 블록(R₃)을 생성한다.

단계 1130에서, 상기 최소 임계 블록 형성부(1030)는 상기 예측 블록(P₃)을 구성하는 각 화소들이 시각적으로 인지될 수 있는 최소 임계값을 구하고, 상기 최소 임계값들로 구성된 최소 임계 블록(J3)을 생성한다.

단계 1140에서, 상기 제 2감산부(1040)는 상기 레지듀얼 블록(R₃)과 상기 최소 임계 블록(J₃ ₎과 차이를 계산하여 차분 레지듀얼 블록(DR₃)을 생성한다. 만약 상기 레지듀얼 블록(R₃)과 상기 최소 임계 블록(J₃)과의 차이가 음수인 경우에는 차분 레지듀얼 블록(DR3)의 화소값은 0으로 설정된다. 즉, 상기 차분 레지듀얼 블록(DR₃)의 각 화소는 max(0, R-J) 값을 갖는다.

단계 1150에서, 상기 차분 레지듀얼 블록을 구성하는 상기 레지듀얼 블록(R₃)과 상기 최소 임계 블록(J₃)과의 차이는 변환, 양자화 및 엔트로피 부호화 과정을 거쳐서 부호화된다.

도 13은 본 발명의 바람직한 실시예에 따른 영상 복호화 장치의 구성을 나타낸 블록도이고, 도 14는 본 발명의 바람직한 실시예에 따른 영상 복호화 방법을 나타낸 플로우 차트이다.

도 13을 참조하면, 본 발명에 따른 영상 복호화 장치는 엔트로피 디코더(1310), 역양자화부(1320), 역변환부(1330), 예측부(1340) 및 가산부(1350)를 포함한다.

단계 1410에서, 상기 엔트로피 디코더(1310)는 수신된 비트스트림을 엔트로피 복호화하여 상기 비트스트림에 포함된 최적 양자화 스텝 및 양자화된 변환 계수 등의 부호화 정보를 추출한다.

단계 1420에서, 상기 역양자화부(1320)는 상기 추출된 최적 양자화 스텝을 이용하여 추출된 변환 계수를 역양자화하여 변환 계수를 출력한다.

단계 1430에서, 상기 예측부(1340)는 수신된 비트스트림에 포함된 부호화 모드 정보로부터 현재 복호화할 블록에 대한 인터 예측 또는 인트라 예측을 수행하여 예측 블록을 생성한다. 상기 가산부(1350)는 상기 예측 블록과 상기 역변환부(1330)로부터 출력되는 레지듀얼 값을 더하여 복원된 영상을 출력한다.

한편, 전술한 영상 부호화 방법은 컴퓨터 프로그램으로 작성 가능하다. 상기 프로그램을 구성하는 코드들 및 코드 세그먼트들은 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 상기 프로그램은 컴퓨터가 읽을 수 있는 정보저장매체(computer readable media)에 저장되고, 컴퓨터에 의하여 읽혀지고 실행됨으로써 동영상 부호화 및 복호화 방법을 구현한다. 상기 정보저장매체는 자기 기록매체, 광 기록매체, 및 캐리어 웨이브 매체를 포함한다.

이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

전술한 바와 같은 본 발명에 따르면, 인간의 시각 시스템이 갖는 마스킹 효과를 이용하여 시각적으로 인지될 수 있는 부분만을 압축하여 부호화함으로써 주관적인 화질에 큰 열화없이 영상의 압축 효율을 증가시킬 수 있다.

Claims

영상 부호화 방법에 있어서,

부호화할 소정 크기의 현재 블록에 대응되는 예측 블록을 생성하는 단계;

상기 현재 블록과 상기 예측 블록의 차이를 계산하여 레지듀얼 블록을 생성하는 단계;

상기 레지듀얼 블록 및 예측 블록을 각각 변환하여 변환 레지듀얼 블록 및 변환 예측 블록을 생성하는 단계;

상기 변환 예측 블록을 구성하는 각 계수들이 시각적으로 인지될 수 있는 최소 임계 변환 계수값을 구하고, 상기 최소 임계 변환 계수값들로 구성된 최소 임계 블록을 생성하는 단계; 및

상기 변환 레지듀얼 블록의 각 계수별로, 양자화 스텝에 따른 최대 양자화 에러가 상기 최소 임계 변환 계수값 미만이 되도록 하는 최적 양자화 스텝을 결정하고, 상기 결정된 최적 양자화 스텝에 따라 상기 변환 레지듀얼 블록의 각 계수를 양자화하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법.
제 1항에 있어서,

상기 최소 임계 변환 계수값은 상기 변환 예측 블록으로부터 계산된 JND(Just Noticeable Distortion)인 것을 특징으로 하는 영상 부호화 방법.
제 1항에 있어서,

i번째 변환 레지듀얼 블록 계수의 양자화 스텝을
, 상기 양자화 스텝에 따른 최대 양자화 에러를
, 상기 i번째 변환 레지듀얼 블록 계수에 대응되는 상기 최소 임계 변환 계수값을
라고 할 때, 상기 i번째 변환 레지듀얼 블록 계수의 최적 양자화 스텝은
을 만족하는
중 최대값을 갖는 양자화 스텝으로 결정되는 것을 특징으로 하는 영상 부호화 방법.
제 1항에 있어서,

상기 최적 양자화 스텝은 상기 변환 레지듀얼 블록 계수에 대하여 미리 정해진 소정의 양자화 스텝보다 큰 경우에만 상기 변환 레지듀얼 블록 계수의 양자화 스텝으로 결정되는 것을 특징으로 하는 영상 부호화 방법.
제 1항에 있어서,

상기 결정된 변환 레지듀얼 블록 계수별 양자화 스텝의 상대적 비율을 유지하면서 상기 양자화 스텝의 평균값을 변화시키는 단계를 더 포함하는 것을 특징으로 하는 영상 부호화 방법.
영상 부호화 방법에 있어서,

부호화할 소정 크기의 현재 블록에 대응되는 예측 블록을 생성하는 단계;

상기 현재 블록과 상기 예측 블록의 차이를 계산하여 레지듀얼 블록을 생성하는 단계;

상기 레지듀얼 블록 및 상기 예측 블록을 각각 변환하여 변환 레지듀얼 블록 및 변환 예측 블록을 생성하는 단계;

상기 변환 예측 블록의 각 변환 계수들이 시각적으로 인지될 수 있는 최소 임계 변환 계수값을 구하고, 상기 최소 임계 변환 계수값들로 구성된 최소 임계 블록을 형성하는 단계; 및

상기 변환 레지듀얼 블록의 계수와 대응되는 상기 최소 임계 변환 계수값을 비교하여 상기 변환 레지듀얼 블록의 계수들 중에서 부호화할 변환 레지듀얼 블록 계수를 선택하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법.
제 6항에 있어서,

상기 선택된 변환 레지듀얼 블록 계수와 상기 최소 임계 변환 계수값과의 차이를 양자화 및 엔트로피 부호화하는 단계를 더 포함하는 것을 특징으로 하는 영상 부호화 방법.
제 6항에 있어서,

상기 최소 임계 변환 계수값은 상기 변환 예측 블록으로부터 계산된 JND(Just Noticeable Distortion)인 것을 특징으로 하는 영상 부호화 방법.
제 6항에 있어서,

상기 선택된 변환 레지듀얼 블록 계수의 절대값은 대응되는 상기 최소 임계 변환 계수값의 절대값보다 큰 것을 특징으로 하는 영상 부호화 방법.
영상 부호화 방법에 있어서,

부호화할 소정 크기의 현재 블록에 대응되는 예측 블록을 생성하는 단계;

상기 현재 블록과 상기 예측 블록의 차이를 계산하여 레지듀얼 블록을 생성하는 단계;

상기 예측 블록을 구성하는 각 화소들의 시각적으로 인지될 수 있는 최소 임계값을 구하고, 상기 최소 임계값들로 구성된 최소 임계 블록을 생성하는 단계; 및

상기 레지듀얼 블록과 상기 최소 임계 블록의 각 화소별 차이값을 계산하여 차분 레지듀얼 블록을 생성하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법.
제 10항에 있어서,

상기 최소 임계값은 상기 예측 블록으로부터 계산된 JND(Just Noticeable Distortion)인 것을 특징으로 하는 영상 부호화 방법.
제 10항에 있어서,

상기 차분 레지듀얼 블록의 화소들 중 음수인 화소값을 갖는 화소는 0으로 설정하는 단계를 더 포함하는 것을 특징으로 하는 영상 부호화 방법.
영상 부호화 장치에 있어서,

부호화할 소정 크기의 현재 블록에 대응되는 예측 블록을 생성하는 예측부;

상기 현재 블록과 상기 예측 블록의 차이를 계산하여 레지듀얼 블록을 생성하는 감산부;

상기 레지듀얼 블록을 변환하여 변환 레지듀얼 블록을 생성하는 제 1 변환부;

상기 예측 블록을 변환하여 변환 예측 블록을 생성하는 제 2 변환부;

상기 변환 예측 블록을 구성하는 각 계수들이 시각적으로 인지될 수 있는 최소 임계 변환 계수값을 구하고, 상기 최소 임계 변환 계수값들로 구성된 최소 임계 블록을 생성하는 최소 임계 블록 생성부; 및

상기 변환 레지듀얼 블록의 각 계수별로, 양자화 스텝에 따른 최대 양자화 에러가 상기 최소 임계 변환 계수값 미만이 되도록 하는 최적 양자화 스텝을 결정하고, 상기 결정된 최적 양자화 스텝에 따라 상기 변환 레지듀얼 블록의 각 계수를 양자화하는 양자화부를 포함하는 것을 특징으로 하는 영상 부호화 장치.
제 13항에 있어서,

상기 최소 임계 변환 계수값은 상기 변환 예측 블록으로부터 계산된 JND(Just Noticeable Distortion)인 것을 특징으로 하는 영상 부호화 장치.
제 13항에 있어서,

i번째 변환 레지듀얼 블록 계수의 양자화 스텝을
, 상기 양자화 스텝에 따른 최대 양자화 에러를
, 상기 i번째 변환 레지듀얼 블록 계수에 대응되는 상기 최소 임계 변환 계수값을
라고 할 때, 상기 양자화부는 상기 i번째 변환 레지듀얼 블록 계수의 최적 양자화 스텝을
을 만족하는
중 최대값으로 결정하는 것을 특징으로 하는 영상 부호화 장치.
제 13항에 있어서,

상기 양자화부는, 상기 최적 양자화 스텝이 상기 변환 레지듀얼 블록 계수에 대하여 미리 정해진 소정의 양자화 스텝보다 큰 경우에만 상기 변환 레지듀얼 블록 계수의 양자화 스텝으로 결정하는 것을 특징으로 하는 영상 부호화 장치.
제 13항에 있어서,

상기 양자화부는, 상기 결정된 변환 레지듀얼 블록 계수별 양자화 스텝의 상대적 비율을 유지하면서 상기 양자화 스텝의 평균값을 변화시키는 것을 특징으로 하는 영상 부호화 장치.
영상 부호화 장치에 있어서,

부호화할 소정 크기의 현재 블록에 대응되는 예측 블록을 생성하는 예측부;

상기 현재 블록과 상기 예측 블록의 차이를 계산하여 레지듀얼 블록을 생성하는 감산부;

상기 레지듀얼 블록을 변환하여 변환 레지듀얼 블록을 생성하는 제 1 변환부;

상기 예측 블록을 변환하여 변환 예측 블록을 생성하는 제 2 변환부;

상기 변환 예측 블록의 각 변환 계수들이 시각적으로 인지될 수 있는 최소 임계 변환 계수값을 구하고, 상기 최소 임계 변환 계수값들로 구성된 최소 임계 블록을 형성하는 최소 임계 블록 생성부; 및

상기 변환 레지듀얼 블록의 계수와 대응되는 상기 최소 임계 변환 계수값을 비교하여 상기 변환 레지듀얼 블록의 계수들 중에서 부호화할 변환 레지듀얼 블록 계수를 선택하는 선택부를 포함하는 것을 특징으로 하는 영상 부호화 장치.
제 18항에 있어서,

상기 최소 임계 변환 계수값은 상기 변환 예측 블록으로부터 계산된 JND(Just Noticeable Distortion)인 것을 특징으로 하는 영상 부호화 장치.
제 18항에 있어서,

상기 선택부는, 상기 변환 레지듀얼 블록 계수 중 그 절대값이 대응되는 상기 최소 임계 변환 계수값의 절대값보다 큰 것을 부호화할 변환 레지듀얼 블록 계수로 선택하는 것을 특징으로 하는 영상 부호화 장치.
영상 부호화 장치에 있어서,

부호화할 소정 크기의 현재 블록에 대응되는 예측 블록을 생성하는 예측부;

상기 현재 블록과 상기 예측 블록의 차이를 계산하여 레지듀얼 블록을 생성하는 제 1 감산부;

상기 예측 블록을 구성하는 각 화소들의 시각적으로 인지될 수 있는 최소 임계값을 구하고, 상기 최소 임계값들로 구성된 최소 임계 블록을 생성하는 최소 임계 블록 생성부; 및

상기 레지듀얼 블록과 상기 최소 임계 블록의 각 화소별 차이값을 계산하여 차분 레지듀얼 블록을 생성하는 제 2 감산부를 포함하는 것을 특징으로 하는 영상 부호화 장치.
제 21항에 있어서,

상기 최소 임계값은 상기 예측 블록으로부터 계산된 JND(Just Noticeable Distortion)인 것을 특징으로 하는 영상 부호화 장치.
제 21항에 있어서,

상기 차분 레지듀얼 블록의 화소들 중 음수인 화소값을 갖는 화소는 0으로 설정하여 양자화를 수행하는 양자화부를 더 포함하는 것을 특징으로 하는 영상 부호화 장치.
영상 복호화 방법에 있어서,

수신된 비트스트림으로부터, 변환 레지듀얼 블록의 각 계수별로 양자화 스텝에 따른 최대 양자화 에러가 상기 최소 임계 변환 계수값 미만이 되도록 결정된 최적 양자화 스텝 정보 및 상기 변환 레지듀얼 블록 계수 정보를 추출하는 단계;

상기 추출된 최적 양자화 스텝에 따라 양자화된 변환 레지듀얼 블록 계수를 역양자화하는 단계; 및

복호화할 현재 블록에 대한 예측 블록과 역변환된 상기 변환 레지듀얼 블록을 가산하여 영상을 복원하는 단계를 포함하는 것을 특징으로 하는 영상 복호화 방법.
제 24항에 있어서,

상기 최소 임계 변환 계수값은 상기 변환 예측 블록으로부터 계산된 JND(Just Noticeable Distortion)인 것을 특징으로 하는 영상 복호화 방법.
영상 복호화 장치에 있어서,

수신된 비트스트림으로부터, 변환 레지듀얼 블록의 각 계수별로 양자화 스텝에 따른 최대 양자화 에러가 상기 최소 임계 변환 계수값 미만이 되도록 결정된 최적 양자화 스텝 정보 및 상기 변환 레지듀얼 블록 계수 정보를 추출하는 엔트로피 복호화부;

상기 추출된 최적 양자화 스텝에 따라 양자화된 변환 레지듀얼 블록 계수를 역양자화하는 역양자화부; 및

상기 역양자화된 변환 레지듀얼 블록 계수를 역변환하여 레지듀얼 블록을 출력하는 역변환부;

복호화할 현재 블록에 대한 예측 블록을 생성하는 예측부; 및

상기 역변환된 상기 레지듀얼 블록과 상기 예측 블록을 가산하여 영상을 복원하는 가산부를 포함하는 것을 특징으로 하는 영상 복호화 장치.
제 26항에 있어서,

상기 최소 임계 변환 계수값은 상기 변환 예측 블록으로부터 계산된 JND(Just Noticeable Distortion)인 것을 특징으로 하는 영상 복호화 장치.