KR101574391B1

KR101574391B1 - 영상 부호화 방법 및 그 장치

Info

Publication number: KR101574391B1
Application number: KR1020130129280A
Authority: KR
Inventors: 이상훈; 김학섭
Original assignee: 연세대학교 산학협력단
Priority date: 2013-10-29
Filing date: 2013-10-29
Publication date: 2015-12-08
Also published as: KR20150050635A

Abstract

영상 부호화 방법 및 그 장치가 개시된다. 영상 부호화 장치는 영상의 구조적 유사도가 최대가 되도록 양자화 스텝 사이즈를 결정하는 양자화 스텝 사이즈 결정부; 매크로블록내 기준값을 기준으로 상기 결정된 양자화 스텝 사이즈를 반영하여 상기 매크로블록내의 픽셀에 대한 양자화 레벨을 결정하는 양자화 레벨 결정부; 및 상기 결정된 양자화 레벨에 따라 상기 매크로블록내의 픽셀을 양자화하여 부호화하는 부호화부를 포함한다.

Description

영상 부호화 방법 및 그 장치{Method and apparatus for image coding}

본 발명은 영상처리에 관한 것으로, 보다 상세하게 주어진 트래픽 상황에서 일정 비트레이트를 만족시키면서 QoS가 보장될 수 있는 고성능 저지연 영상 부호화 방법 및 그 장치에 관한 것이다.

종래에는 블록 절단 부호화(BTC: block truncation coding, 이하 BTC라 칭함)은 영상 부호화시 계산량을 획기적으로 줄일 수 있어 많은 곳에서 활용되었다. 이러한 BTC 방식은 영상을 블록으로 나누고 각 블록을 2개의 값으로 매핑하여 데이터량을 줄일 수 있다. 즉, 블록내의 픽셀값들을 양자화 기준점(T)를 기준으로 기준점을 초과하는 값과 기준점 이하의 값으로 구분하여 부호화하는 방식이다.

이를 수식으로 나타내면 수 1과 같다.

여기서, Z_i는 i번째 픽셀에 대응하는 코드값을 나타낸다. BTC 방식의 경우 일반적으로 양자화 기준점은 블록내의 모든 픽셀값들의 평균값으로 설정되고, 양자화 레벨은 수 2와 같이 계산된다.

여기서, M은 양자화 기준점보다 작은 픽셀값들의 개수를 나타내고, N은 전체 픽셀 개수를 나타낸다.

이러한 BTC 방식은 블록의 사이즈와 콘텐츠의 복잡도에 따라 성능이 크게 달라지며, 매우 복잡한 영상을 부호화하는 경우 블록 사이즈가 고정되어 많은 화질 열화를 유발하는 문제점이 있다.

본 발명은 이산 웨이블릿 트랜스폼을 기반으로 영상의 주파수적 특성을 고려하여 영상 부호화에 따른 부호화 효율을 높일 수 있는 영상 부호화 방법 및 그 장치를 제공하기 위한 것이다.

또한, 본 발명은 트래픽 상황에 대해 일정한 비트레이트를 만족시키면서 QoS를 보정할 수 있는 고성능 저지연 영상 부호화 방법 및 그 장치를 제공하기 위한 것이다.

또한, 본 발명은 영상의 구조적 유사도(SSIM: Structural similarity)를 고려하여 시각적 화질을 개선할 수 있는 영상 부호화 방법 및 그 장치를 제공하기 위한 것이다.

본 발명의 일 측면에 따르면, 영상의 구조적 유사도(SSIM: Structural similarity)를 고려하여 시각적 화질을 개선할 수 있는 영상 부호화 장치가 제공된다.

본 발명의 일 실시예에 따르면, 영상의 구조적 유사도가 최대가 되도록 양자화 스텝 사이즈를 결정하는 양자화 스텝 사이즈 결정부; 매크로블록내 기준값을 기준으로 상기 결정된 양자화 스텝 사이즈를 반영하여 상기 매크로블록내의 픽셀에 대한 양자화 레벨을 결정하는 양자화 레벨 결정부; 및 상기 결정된 양자화 레벨에 따라 상기 매크로블록내의 픽셀을 양자화하여 부호화하는 부호화부를 포함하는 영상 부호화 장치가 제공될 수 있다.

상기 기준값은 상기 매크로블록내에 포함된 픽셀값들의 중간값일 수 있다.

상기 구조적 유사도는 SSIM(Structural similarity)를 이용하여 도출될 수 있다.

상기 양자화 스텝 사이즈를 하기 수식을 이용하여 결정되되,

여기서,

이되,

상기 xi는 i번째 픽셀의 픽셀값을 나타내고, ki는 i번째 픽셀에 할당되는 바이너리의 인덱스를 나타내며,

는 매크로블록내 픽셀들의 평균값을 나타내며,

는 매크로블록내 픽셀들의 분산을 나타낸다.

상기 레벨 결정부는 하기 수식을 이용하여 양자화 레벨을 결정하되,

여기서,

는 상기 기준값을 나타내고, 상기

는 픽셀값들의 분포를 균등하게 분할했을 때 가장 빈도수가 많은 바이너리의 인덱스를 나타내고,

는 양자화 스텝 사이즈를 나타낸다.

상기 영상을 프레임 단위로 이산 웨이블릿 트랜스폼 변환을 수행하는 변환부를 더 포함하되, 상기 양자화 스텝 사이즈 및 상기 양자화 레벨은 상기 변환된 영상을 이용하여 결정될 수 있다.

본 발명의 다른 실시예에 따르면, 입력 영상을 이산 웨이블릿 트랜스폼 변환하는 변환부; 및 상기 변환된 영상을 매크로블록 단위로 상이한 복수의 부호화 방식으로 각각 부호화하여 구조적 유사도(SSIM)가 최적인 부호화 방식으로 부호화하는 부호화부를 포함하는 영상 부호화 장치가 제공될 수 있다.

상기 복수의 부호화 방식은 스킵 모드, 평균값 매핑 모드 및 구조적 유사도 기반 양자화 모드를 포함할 수 있다.

상기 스킵 모드는 상기 매크로블록 내의 픽셀값을 모두 "0"으로 매핑하여 부호화는 것이며, 상기 평균값 매핑 모드는 상기 매크로블록내의 픽셀값들을 평균값으로 매핑하여 부호화하는 것이며, 상기 구조적 유사도 기반 양자화 모드는 영상의 구조적 유사도가 최대가 되도록 양자화 스텝 사이즈를 결정한 후 매크로블록내 기준값을 기준으로 상기 결정된 양자화 스텝 사이즈를 반영하여 상기 매크로블록내의 픽셀에 대한 양자화 레벨을 결정하여 양자화하는 방식이다.

상기 복수의 부호화 방식은 병렬적으로 수행될 수 있다.

본 발명의 다른 측면에 따르면, 영상의 구조적 유사도(SSIM: Structural similarity)를 고려하여 시각적 화질을 개선할 수 있는 영상 부호화 방법이 제공된다.

본 발명의 일 실시예에 따르면, 영상의 구조적 유사도가 최대가 되도록 양자화 스텝 사이즈를 결정하는 단계; 매크로블록내 기준값을 기준으로 상기 결정된 양자화 스텝 사이즈를 반영하여 상기 매크로블록내의 픽셀에 대한 양자화 레벨을 결정하는 단계; 및 상기 결정된 양자화 레벨에 따라 상기 매크로블록내의 픽셀을 양자화하여 부호화하는 단계를 포함하는 영상 처리 방법이 제공될 수 있다.

본 발명의 다른 실시예에 따르면, 입력 영상을 이산 웨이블릿 트랜스폼 변환하는 단계; 및 상기 변환된 영상을 매크로블록 단위로 복수의 부호화 방식으로 각각 부호화하여 구조적 유사도(SSIM)가 최적인 부호화 방식으로 부호화하는 단계를 포함하는 영상 부호화 방법이 제공될 수 있다.

본 발명의 일 실시예에 따른 영상 부호화 방법 및 그 장치를 제공함으로써, 이산 웨이블릿 트랜스폼을 기반으로 영상의 주파수적 특성을 고려하여 영상 부호화에 따른 부호화 효율을 높일 수 있는 이점이 있다.

또한, 본 발명은 트래픽 상황에 대해 일정한 비트레이트를 만족시키면서 QoS를 보정할 수 있는 고성능 저지연 영상 전송이 가능케 할 수 있는 이점도 있다.

또한, 본 발명은 영상의 구조적 유사도(SSIM: Structural similarity)를 고려하여 시각적 화질을 개선할 수 있는 이점도 있다.

도 1은 본 발명의 일 실시예에 따른 영상 부호화 방법을 나타낸 순서도.
도 2는 DWT 변환 특성을 설명하기 위해 도시한 도면.
도 3은 종래와 본 발명의 일 실시예에 따른 양자화 레벨을 비교하기 위해 도시한 그래프.
도 4는 본 발명의 일 실시예에 따른 영상 부호화 장치의 내부 구성을 개략적으로 도시한 블록도.
도 5는 본 발명의 일 실시예에 따른 부호화부의 내부 구성을 나타낸 블록도.
도 6은 본 발명의 일 실시예에 따른 SAQC의 부호화 유닛의 구성을 개략적으로 도시한 블록도.

본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.

본 발명은 이산 웨이블릿 트랜스폼에 기반한 영상의 주파수적 특성을 고려하고, 영상의 구조적 유사도가 최대가 될 수 있도록 양자화 스텝 사이즈 및 양자화 레벨을 결정하여 영상을 부호화할 수 있는 영상 부호화에 관한 것이다. 이를 통해, 본 발명은 시각적 화질을 개선할 수 있다.

이하, 본 발명의 실시예를 첨부한 도면을 참조하여 상세히 설명하기로 한다.

도 1은 본 발명의 일 실시예에 따른 영상 부호화 방법을 나타낸 순서도이고, 도 2는 DWT 변환 특성을 설명하기 위해 도시한 도면이고, 도 3은 종래와 본 발명의 일 실시예에 따른 양자화 레벨을 비교하기 위해 도시한 그래프이다.

단계 110에서 영상 부호화 장치(100)는 영상을 프레임 단위로 이산 웨이블릿 트랜스폼(DWT: discrete wavelet transform- 이하 DWT라 칭하기로 함) 변환을 수행한다. 도 2에는 DWT 변환된 프레임의 각 영역을 개략적으로 도시한 것이다. 도 2는 DWT를 1회 수행한 프레임의 각 영역을 나타낸 것이다. 1차 DWT 변환된 프레임의 각 영역은 도 2에 도시된 바와 같이, LL, LH, HL, HH 4개의 영역으로 나뉘게 된다. 이때, LL 영역은 영상내의 저주파 성분들이 모이게 되고, LH 및 HL 영역은 각각 가로축과 세로축 방향의 고주파 성분들이 모이게 된다. 그리고, HH 영역에는 대각선 방향의 고주파 성분들이 모이게 된다.

도 2에서 보여지는 바와 같이, DWT 변환된 영상은 LL 영역에 높은 평균값 및 표준편차를 갖게 된다. 이를 통해, DWT 변환된 영상의 LL 영역에 가장 많은 정보가 있음을 알 수 있다. 그리고, LH, HL 및 HH 영역에는 영상에 대한 정보가 크게 줄어들어 대부분 0에 가까운 값을 갖는 것을 알 수 있다.

단계 115에서 영상 부호화 장치(100)는 DWT 변환된 영상의 구조적 유사도가 최대가 되도록 양자화 스텝 사이즈를 결정한다.

본 발명의 일 실시예에 따르면, 영상의 구조적 유사도는 SSIM(Structural similarity)에 의해 계산될 수 있다. 이해와 설명의 편의를 도모하기 위해 SSIM에 대해 간략하게 설명하기로 한다.

SSIM은 원 영상(original image)과 왜곡 영상간의 구조적 유사도를 계산하여 화질을 평가하는 것으로, 수 3에 의해 계산될 수 있다.

여기서,

은 원 영상(original image의 매크로블록내 픽셀들의 평균값을 나타내고,

는 부호화된 영상의 매크로블록내 픽셀들의 평균을 나타낸다. 또한,

는 원 영상의 매크로블록내 픽셀들의 분산을 나타내고,

는 부호화된 영상의 매크로블록내 픽셀들의 분산을 나타내고,

는 원 영상과 부호화된 영상간의 상관계를 나타낸다. 또한,

및

는 두 영상간의 구조적 유사도 계산시 "0"으로 나눠지는 것을 예방하기 위한 상수이다.

본 발명의 일 실시예에 따른 영상 부호화 장치(100)는 매크로블록내의 기준값(즉, 픽셀값들의 중간값)을 기준으로 양자화 레벨을 결정하므로, 상술한 수 3의 첫번째 텀(first term)은 1이 된다.

이로 인해, 본 발명의 일 실시예에 따른 영상 부호화에 따른 SSIM은 수 4에 의해 계산될 수 있다.

본 발명의 일 실시예에 따른 양자화 레벨은 하기에서 보다 상세히 설명하겠지만, 매크로블록내의 픽셀의 평균값을 기준값으로 하여 양자화 레벨이 결정된다.

이에, 수 4에 양자화 레벨 수식을 대입하면 수 5와 같이 표현될 수 있다.

여기서, k_i는 i번째 픽셀에 할당되는 바이너리의 인덱스(이산값)을 나타내고, x_i는 i번째 픽셀의 픽셀값을 나타내며,

는 매크로블록내의 픽셀들의 평균값을 나타내고,

는 매크로블록내의 픽셀들의 분산을 나타내고, N은 매크로블록내의 픽셀 개수를 나타낸다.

따라서, 영상 부호화 장치(100)는 영상의 구조적 유사도가 최대가 될 수 있도록 하기 수 6을 이용하여 양자화 스텝 사이즈를 결정할 수 있다.

단계 120에서 영상 부호화 장치(100)는 DWT 변환된 프레임의 매크로블록내의 기준값을 기반으로 결정된 양자화 스텝 사이즈를 반영하여 양자화 레벨을 결정한다. 여기서, 기준값은 매크로블록내의 픽셀값들의 중간값을 나타낸다.

예를 들어, 영상 부호화 장치(100)는 수 7을 이용하여 양자화 레벨을 결정할 수 있다.

여기서,

는 매크로블록내 픽셀값들의 중간값을 나타내고,

는 픽셀값들의 분포를 균등하게 분할했을 때 가장 빈도수가 많은 바이너리의 인덱스를 나타내며,

는 양자화 스텝 사이즈를 나타낸다.

도 3에는 종래의 적응적 양자화 방법과 본 발명의 일 실시예에 따른 양자화 레벨을 비교한 그래프이다.

종래의 적응적 양자화 방법(AQC)의 경우 최소값과 최대값을 균등하게 분할하여 양자화 스텝 사이즈를 결정하고, 최소값으로부터 양자화 레벨을 결정하여 도 3에 도시된 바와 같이, 픽셀값들이 한곳에 몰려있고 상이한 픽셀이 먼 곳에 있을 때 매우 비효율적인 단점이 있다.

본 발명의 일 실시예에 따른 양자화 레벨은 픽셀의 최소값이 아닌 중간값을 기준값으로 하여 양자화 레벨을 결정하므로, 픽셀 분포를 고려하여 효율적으로 양자화 레벨이 결정되는 것을 알 수 있다.

양자화 레벨이 결정되면, i번째 픽셀값의 양자화된 코드는 하기 수 8을 이용하여 계산될 수 있다. 하기 수 8은 3비트를 이용하여 양자화 레벨이 8인 경우를 가정한 경우의 양자화 바이너리(코드)를 나타낸 것이다.

단계 125에서 영상 부호화 장치(100)는 결정된 양자화 레벨에 따라 매크로블록내의 픽셀값을 양자화하여 부호화한다.

도 4는 본 발명의 일 실시예에 따른 영상 부호화 장치의 내부 구성을 개략적으로 도시한 블록도이고, 도 5는 본 발명의 일 실시예에 따른 부호화부의 내부 구성을 나타낸 블록도이다.

도 4를 참조하면, 본 발명의 일 실시예에 따른 영상 부호화 장치(100)는 변환부(410) 및 부호화부(420)를 포함하여 구성된다.

변환부(410)는 영상을 입력받고, 입력된 영상을 이산 웨이블릿 트랜스폼(DWT: discrete wavelet transform, 이하 DWT라 칭하기로 함)을 수행하기 위한 수단이다. 변환부(410)는 입력받은 영상에 대해 프레임 단위로 DWT를 수행할 수 있다. 이미 전술한 바와 같이, DWT 변환된 프레임의 LL 영역에 가장 많은 정보가 있음을 알 수 있다. 그리고, LH, HL 및 HH 영역에는 영상에 대한 정보가 크게 줄어들어 대부분 0에 가까운 값을 갖는 것을 알 수 있다.

이에 따라, 부호화부(420)는 변환부(410)에 의해 DWT 변환된 각 프레임의 각 영역의 특성을 이용하여 적응적으로 부호화할 수 있다.

도 5에는 부호화부(420)의 세부 구성이 개략적으로 도시되어 있다. 도 5를 참조하면, 부호화부(420)는 부호화 유닛(510), 계산부(515) 및 모드 선택부(520)를 포함한다.

부호화 유닛(510)은 미리 정해진 부호화 방식에 따라 DWT 변환된 프레임을 부호화기 위한 수단이다. 도 5에 도시된 바와 같이, 부호화 유닛(510)은 각각 상이한 복수의 부호화 유닛을 각각 포함한다.

복수의 부호화 유닛 중 어느 하나는 스킵 부호화 유닛이고, 다른 하나는 평균값 매핑 부호화 유닛이며, 또 다른 하나는 구조적 유사도 기반 적응적 양자화 부호화 유닛(SAQC: SSIM based adaptive quantization coding, 이하 SAQC라 칭하기로 함)이다.

스킵 부호화 유닛은 매크로블록내 모든 픽셀의 값을 "0"으로 매핑하여 부호화하는 것으로 압축율이 매우 높으나, 화질 열화가 가장 심한 단점이 잇다.

평균값 매핑 부호화 유닛(mean mapping)은 매크로블록내의 모든 픽셀을 평균값으로 매핑하는 것으로, 평균값 매핑 모드 또한 압축율이 높은 이점이 있다.

스킵 부호화 및 평균값 매핑은 DWT 변환된 프레임의 각 영역에서 LH, HL 및 HH 영역과 같이 고주파 성분이 많은 영역에서 시각적 화질 열화를 최소화하며 높은 압축율을 보일 수 있다.

SAQC는 구조적 유사도에 기반하여 매크로블록을 픽셀 분포를 고려한 양자화 스텝 사이즈 및 양자화 레벨에 따라 매크로블록을 부호화하기 위한 수단이다.

SAQC는 DWT 변환된 프레임의 각 영역에서 가장 많은 영상 정보를 가지고 있는 LL 영역의 경우 시각적 화질 열화를 최소화하여 효과적인 압축 효율을 얻을 수 있는 이점이 있다.

상이한 복수의 부호화 유닛(510)은 병렬로 동작될 수 있다.

계산부(515)는 각 부호화 유닛(510)에 따른 부호화에 결과에 따라 구조적 유사도(SSIM)을 각각 계산하기 위한 수단이다.

구조적 유사도(SSIM)에 대해서는 이미 전술한 바와 동일하므로 중복되는 설명은 생략하기로 한다.

모드 선택부(520)는 계산부(515)에 의해 계산된 구조적 유사도가 최적인 부호화를 해당 매크로블록의 부호화 방식으로 선택하기 위한 수단이다.

예를 들어, 모드 선택부(520)는 DWT 변환된 프레임의 각 영역의 첫번째 프레임을 대상으로 구조적 유사도가 최적인 부호화 방식을 선택한 후 해당 영역 전체에 대해 동일한 부호화 유닛에 의해 부호화 되도록 제어할 수도 있다.

도 6은 본 발명의 일 실시예에 따른 SAQC의 부호화 유닛의 구성을 개략적으로 도시한 블록도이다.

도 6을 참조하면, 본 발명의 일 실시예에 따른 SAQC의 부호화 유닛은 양자화 스텝 사이즈 결정부(610), 양자화 레벨 결정부(615) 및 양자화부(620)를 포함하여 구성된다.

양자화 스텝 사이즈 결정부(610)는 영상의 구조적 유사도(SSIM)가 최대가 되도록 양자화 스텝 사이즈를 결정하기 위한 수단이다. 이는 이미 도 1에서 설명한 바와 동일하므로 중복되는 설명은 생략하기로 한다.

양자화 레벨 결정부(615)는 매크로블록내의 픽셀값들의 중간값을 기준값으로 결정된 양자화 스텝 사이즈를 반영하여 양자화 레벨을 결정하기 위한 수단이다. 양자화 레벨 결정부(615)는 매크로블록내의 픽셀값들의 중간값을 기준값으로 양자화 스텝 사이즈를 반영하여 결정되므로, 픽셀 분포를 고려하여 양자화 레벨을 결정할 수 있는 이점이 있다.

양자화부(620)는 결정된 양자화 레벨에 따라 상기 매크로블록내의 픽셀을 양자화하여 부호화하기 위한 수단이다.

한편, 본 발명의 실시예에 따른 영상 부호화 방법은 다양한 전자적으로 정보를 처리하는 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 저장 매체에 기록될 수 있다. 저장 매체는 프로그램 명령, 데이터 파일, 데이터 구조등을 단독으로 또는 조합하여 포함할 수 있다.

저장 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 소프트웨어 분야 당업자에게 공지되어 사용 가능한 것일 수도 있다. 저장 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media) 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 전자적으로 정보를 처리하는 장치, 예를 들어, 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

410: DWT(discrete wavelet transform)
420: 부호화부

Claims

원영상과 변환된 영상의 구조적 유사도가 최대가 되도록 양자화 스텝 사이즈를 결정하는 양자화 스텝 사이즈 결정부-상기 구조적 유사도는 SSIM(Structural similarity)를 이용하여 도출됨;
상기 변환된 영상의 매크로블록내 기준값을 기준으로 상기 결정된 양자화 스텝 사이즈를 반영하여 상기 매크로블록내의 픽셀에 대한 양자화 레벨을 결정하는 양자화 레벨 결정부; 및
상기 결정된 양자화 레벨에 따라 상기 매크로블록내의 픽셀을 양자화하여 부호화하는 부호화부를 포함하는 영상 부호화 장치.
제1 항에 있어서,
상기 기준값은 상기 매크로블록내에 포함된 픽셀값들의 중간값인 것을 특징으로 하는 영상 부호화 장치.
삭제
삭제
제1 항에 있어서,
상기 레벨 결정부는 하기 수식을 이용하여 양자화 레벨을 결정하는 것을 특징으로 하는 영상 부호화 장치.

여기서,
는 상기 기준값을 나타내고, 상기
는 픽셀값들의 분포를 균등하게 분할했을 때 가장 빈도수가 많은 바이너리의 인덱스를 나타내고,
는 양자화 스텝 사이즈를 나타냄.
제1 항에 있어서,
상기 영상을 프레임 단위로 이산 웨이블릿 트랜스폼 변환을 수행하는 변환부를 더 포함하되,
상기 양자화 스텝 사이즈 및 상기 양자화 레벨은 상기 변환된 영상을 이용하여 결정되는 것을 특징으로 하는 영상 부호화 장치.
원 영상과 변환된 영상의 구조적 유사도가 최대가 되도록 양자화 스텝 사이즈를 결정하는 단계-상기 구조적 유사도는 SSIM(Structural similarity)를 이용하여 도출됨;
상기 변환된 영상의 매크로블록내 기준값을 기준으로 상기 결정된 양자화 스텝 사이즈를 반영하여 상기 매크로블록내의 픽셀에 대한 양자화 레벨을 결정하는 단계; 및
상기 결정된 양자화 레벨에 따라 상기 매크로블록내의 픽셀을 양자화하여 부호화하는 단계를 포함하는 영상 처리 방법.
입력 영상을 이산 웨이블릿 트랜스폼 변환하는 변환부; 및
상기 변환된 영상을 매크로블록 단위로 상이한 복수의 부호화 방식으로 각각 부호화하여 상기 입력 영상과 상기 변환된 영상의 구조적 유사도가 최대가 되는 부호화 방식으로 부호화하는 부호화부를 포함하되,
상기 구조적 유사도는 SSIM(Structural similarity)를 이용하여 도출되는 것을 특징으로 하는 영상 부호화 장치.
제8 항에 있어서,
상기 복수의 부호화 방식은 스킵 모드, 평균값 매핑 모드 및 구조적 유사도 기반 양자화 모드를 포함하는 것을 특징으로 하는 영상 부호화 장치.
제9 항에 있어서,
상기 구조적 유사도 기반 양자화 모드는 상기 입력 영상과 상기 변환된 영상의 구조적 유사도가 최대가 되도록 양자화 스텝 사이즈를 결정한 후 상기 변환된 영상의 매크로블록내 기준값을 기준으로 상기 결정된 양자화 스텝 사이즈를 반영하여 상기 매크로블록내의 픽셀에 대한 양자화 레벨을 결정하여 양자화하는 방식인 것을 특징으로 하는 영상 부호화 장치.
제10 항에 있어서,
상기 기준값은 상기 매크로블록내의 중간값인 것을 특징으로 하는 영상 부호화 장치.
제8 항에 있어서,
상기 복수의 부호화 방식은 병렬적으로 수행되는 것을 특징으로 하는 영상 부호화 장치.
삭제
제7 항의 방법을 수행하기 위한 프로그램을 기록한 기록매체.