KR20030023816A

KR20030023816A - 형상 적응형 이산여현변환/역이산여현변환 알고리즘을위한 장치

Info

Publication number: KR20030023816A
Application number: KR1020010056923A
Authority: KR
Inventors: 정재성; 이승우; 조중휘
Original assignee: (주)로고스텍
Priority date: 2001-09-14
Filing date: 2001-09-14
Publication date: 2003-03-20

Abstract

본 발명은 영상 압축 기술에 관한 것으로, 특히 형상 적응형 이산여현변환/역이산여현변환(DCT/IDCT) 알고리즘을 위한 장치에 관한 것이며, 피드-포워드(Feed-forward) 방식으로 SA-DCT를 구현하는 경우 입력되는 데이터에 대한 전처리부의 레지스터를 줄이고 F 행렬의 크기를 줄일 수 있는 형태 적응형 DCT/IDCT를 위한 장치를 제공하는데 그 목적이 있다. 본 발명은 N=8의 DCT 및 IDCT에 사용되는 직접 연산 구조를 N=1~8로 가변적인 MPEG-4의 SA-DCT 및 SA-IDCT를 위하여 사용할 수 있도록 수정한 구조로서, MPEG-4의 버전1과 버전2에서 요구되는 DCT방식을 모두 수용할 수 있도록 하여 하나의 블록으로 두 가지 처리가 가능하도록 구현하였다.

Description

형상 적응형 이산여현변환/역이산여현변환 알고리즘을 위한 장치{Device for shape adaptive DCT/IDCT algorithm}

본 발명은 영상 압축 기술에 관한 것으로, 특히 형상 적응형 이산여현변환/역이산여현변환(DCT/IDCT) 알고리즘을 위한 장치에 관한 것이다.

이산여현변환(Discrete Cosine Transform, DCT) 알고리즘은 영상 압축을 위한 효과적인 코딩 기술로서, 이를 이용하여 원 데이터의 블록들을 트랜스폼-영역으로 변환하며, 역이산여현변환(IDCT) 알고리즘는 처리된 트랜스폼-영역의 데이터 블록들을 원 데이터로 변환하는 것이다. DCT는 특히 영상의 압축에 탁월한 성능을 갖는 것으로 오늘날 멀티미디어 관련 국제표준인 H.261, JPEG, MPEG의 핵심요소로 자리잡고 있다.

문자, 도형, 일반 데이터 등을 무손실 압축하면 완전 복구가 가능하지만 압축률은 평균적으로 2대1 정도이다. 반면 영상 음성 음향 등의 데이터를 인간의 눈과 귀가 거의 느끼지 못할 정도로 작은 손실을 허용하면서 압축하면 10대1 이상의 압축률을 쉽게 얻을 수 있다. 동영상의 경우, 화면간 중복성과 화면내 화소간 중복성이 많아 시각 특성을 잘 활용하면 MPEG 영상 압축에서 볼 수 있듯이 30대1 이상의 압축을 쉽게 얻을 수 있다. 정지영상은 화면내 화소의 중복성 만이 있고, 한 화면이므로 화면간 중복성은 없어 JPEG에서 보듯이 MPEG보다는 다소 압축률이 낮다. 영상은 중복성이 높은 3차원(동영상) 혹은 2차원(정지영상) 데이터이기 때문에 압축율도 크게 나타나는데 비해 음성과 음향은 중복성이 상대적으로 떨어지는 1차원 데이터여서 압축률도 영상에 비해 크게 떨어진다. 영상데이터를 효과적으로 압축하기 위한 목적으로 가장 널리 쓰이는 손실부호화 기법은 변환부호화이다. 이 방식의 기본구조는 공간적으로 높은 상관도를 가지면서 배열되어있는 데이터를 직교변환에 의하여 저주파 성분으로부터 고주파 성분에 이르기까지 여러 주파수 성분으로 나누어 성분별로 달리 양자화하는 것이다. 이때 각 주파수 성분간에는 상관도가 거의 없어지고 신호의 에너지가 저주파 쪽에 집중된다. 단순 PCM에 비해 같은 비트율에서 얻는 변환부호화의 이득은 각 주파수 성분의 분산치의 산술평균과 기하평균의비와 같다. 즉 저주파쪽 으로 에너지의 집중이 심화될수록 압축효율이 높다. 공간상의 데이터에 대한 단순 PCM은 모든 표본을 같은 길이(예: m 비트/표본)의 비트로 표현하며 신호대 양자화 잡음비는 약 6m가 된다. 반면 직교변환에 의해 주파수 영역으로 바뀐 데이터는 에너지가 많이 모이는(즉 분산치가큰) 주파수 성분이 보다 많은 비트를 할당받아 그 주파수 성분을 보다 충실히 표현하도록 하고 있다. 분산치가 4배(즉 진폭이 2배) 될 때마다 1비트씩 더 할당받는데 이렇게 되면 모든 주파수 성분에서 동일한 양자화 에러 특성을 갖게 된다. 여러 가지의 직교변환 가운데 이론적으로 영상신호의 에너지 집중특성이 가장 뛰어나 압축에 가장 효과적인 것은 카루넨-뢰브 변환(KLT)이다. 그러나 이것은 영상에 따라 변환함수가 새로 정의되어야 하므로 현실적으로 사용할수 없다. 이 KLT에 충분히 가까운 성능을 가지면서 구현 가능한 변환이 바로 앞에서 언급한 DCT이다.

현재 여러 국제표준에 핵심기술로 자리잡고 있는 DCT는 8×8크기의 화소를 하나의 블록으로 묶어 변환의 단위로 삼고 있다. 블록의 크기를 키울수록 압축효율은 높아지나 변환의 구현이 훨씬 어려워진다. 실험적으로 8×8이 성능과 구현의 용이성간 타협점으로 선택되었다. DCT 변환계수의 양자화는 스칼라 양자화(SQ)와 벡터 양자화(VQ)가 가능하다. VQ는 보통 계수간 상관도가 높을 때 효과적이고 대신 SQ보다는 복잡도가 높다. DCT계수들끼리는 이미 상관도가 거의 없어 현재 국제표준 에서는 SQ를 채택하고 있다. 또 SQ도 다시 구현이 용이한 선형과 특성이 좋은 비선형 기법으로 나뉘는데 양자화된 계수가 다시 엔트로피 부호화(무손실)를 거치면 두 기법간 성능의 차가 작아진다. 현재 국제표준에서는 엔트로피 부호화가 뒤따르고있어 H.261, JPEG, MPEG-1에서는 선형 기법만을 사용하였다. 그러나 MPEG-2에서는 약간의 성능개선을 위해 비선형 기법도 함께 채택했다. 또한 양자화된 DCT계수들의 통계적 특성을 이용한 무손실 압축을 위해 현재 국제표준에서는 런길이 부호화와 허프만 부호화를 결합하여 사용하고 있다. 영상의 압축은 이렇게 DCT, 양자화, 런길이 부호화, 허프만 부호화, 움직임 보상 DPCM(동영상의 경우만 해당) 등 많은 기술이 결합되어 이루어지고 있다.

도 1은 피드-포워드 방식으로 구현된 종래의 1차원 SA-DCT의 회로도이다.

도 1을 참조하면, 피드-포워드 알고리즘을 이용하여 제안된 종래의 아키텍쳐는 알고리즘 전개에 따른 F 행렬의 중복으로 인한 문제점이 있어 많은 ROM 데이터를 필요로 하며, 입력되는 데이터에 대한 전처리부에 많은 수의 레지스터를 사용하여 칩면적이 크고 수행 속도가 떨어지는 문제점이 있다.

본 발명은 상기와 같은 종래기술의 문제점을 해결하기 위하여 제안된 것으로, 피드-포워드(Feed-forward) 방식으로 SA-DCT를 구현하는 경우 입력되는 데이터에 대한 전처리부의 레지스터를 줄이고 F 행렬의 크기를 줄일 수 있는 형태 적응형 DCT/IDCT를 위한 장치를 제공하는데 그 목적이 있다.

도 1은 피드-포워드 방식으로 구현된 종래의 1차원 SA-DCT의 회로도.

도 2는 2차원 SA-DCT의 블록 다이어그램.

도 3은 1차원 N-DCT의 블록 다이어그램.

도 4는 본 발명의 일 실시예에 따른 1차원 SA-DCT의 회로도.

도 5는 1차원 N-IDCT의 블록 다이어그램.

도 6는 본 발명의 일 실시예에 따른 1차원 SA-IDCT의 회로도.

상기의 기술적 과제를 달성하기 위한 본 발명의 일 측면에 따르면, 블록 스타트 신호에 응답하여 입력 데이터 및 형상 정보를 입력 받아 병렬 데이터로 출력하기 위한 프론트 블록; 상기 프론트 블록의 출력을 입력 받아 직접 연산 구조를 사용하여 이산여현변환을 수행하는 이산여현변환 코어 블록; 및 상기 이산여현변환/역이산여현변환 블록의 출력에를 곱하여 출력하기 위한 백 블록을 구비하는 형태 적응형 이산여현변환을 위한 장치가 제공된다.

본 발명은 N=8의 DCT/IDCT에 사용되는 직접 연산 구조를 N=1∼8로 가변적인 MPEG-4의 SA-DCT/SA-IDCT를 위하여 사용할 수 있도록 수정한 구조로서, MPEG-4의 버전1과 버전2에서 요구되는 DCT 방식을 모두 수용할 수 있도록 하여 하나의 블록으로 두 가지 처리가 가능하도록 구현하였다.

이하, 본 발명이 속한 기술분야에서 통상의 지식을 가진 자가 본 발명을 보다 용이하게 실시할 수 있도록 하기 위하여 본 발명의 바람직한 실시예를 소개하기로 한다.

도 2는 2차원 SA-DCT의 블록 다이어그램이다.

도 2를 참조하면, 입력 데이터(data in)와 형상 정보(shape information)를 이용하여 1차원 N-DCT를 취한다. BS는 블록 스타트(Block Start) 신호이다. 이 결과 데이터와 수직 상향 정렬로 바뀐 형상 정보는 트랜스포지션 RAM(transposition RAM)을 거쳐 다시 1차원 N-DCT를 수행하고 그 결과치(data out)를 출력한다.

도 3은 1차원 N-DCT의 블록 다이어그램이다.

도 3을 참조하면, 1차원 N-DCT은 프론트 블록(front block), 1차원 SA-DCT 코어 블록(1D SA-DCT core block), 백 블록(back block) 등 3 개의 하위 블록으로 구성된다. 프론트 블록에 입력되는 데이터(data in)와 형상 정보(shape information)는 외부 블록으로부터 BS(Block Start) 신호와 함께 입력되기 시작하며, 1차원 N-DCT는 BS 신호에 의해 동작을 시작한다. 입력된 데이터는 프론트 블록에서 직접 연산 구조를 이용하여 1차원 SA-DCT 코어 블록의 입력이 되며, 이때 레지스터는 형상 정보에 의해 유효한 데이터를 갖는 픽셀의 값만을 유지하게 되는데, 8개의 입력을 받은 후 병렬로 데이터를 넘겨주면 픽셀의 배치 순서가 입력의 역순이 된다. 피드-포워드 구조에서는 이 직렬-병렬-직렬 순의 입력과 출력 구조가 픽셀의 순서를 역순으로 배치하는 문제를 해결하기 위해 레지스터를 사용하여 많은 양의 레지스터를 필요로 하는 단점이 있었다.

따라서, 본 발명에서는 이 직렬-병렬-직렬 구조를 변형하여 직렬-병렬(serial-to-parallel) 구조 사이에 MUX를 이용하여 데이터의 배치 순서를 조절하고 다음 단의 덧셈 연산까지 포함하여 직접 연산 구조를 사용함으로써 레지스터의 크기를 축소하였다. 또한, N=8인 일반적인 DCT에서는 LSB 방향으로 쉬프팅(shifting)하여 해결한과의 곱셈을 백 블록에서 행하여 출력으로 보냄으로써 구조를 크게 변경하지 않고 일반적인 DCT와 SA-DCT를 모두 수행할 수 있도록 하였다.

도 4는 본 발명의 일 실시예에 따른 1차원 SA-DCT의 회로도이다. 기존의 피드-포워드 방식(도 1 참조)에 의한 구조와 비교하여 직렬 입력을 프론트 블록으로부터 병렬로 출력되게 하고 MUX를 이용하여 데이터를 배치함으로써 레지스터의 사용을 줄였으며, 각 ROM에는 F 행렬에 따라 7개의 데이터를 저장하여 연산의 수행이 가능하도록 설계하였다.

도 5는 1차원 N-IDCT의 블록 다이어그램이다.

도 5를 참조하면, 1차원 N-IDCT은 프론트 블록(front block), 1차원 SA-IDCT 코어 블록(1D SA-IDCT core block), 백 블록(back block) 등 3 개의 하위 블록으로 구성된다. 프론트 블록에 입력되는 데이터(data in)와 형상 정보(shape information)는 외부 블록으로부터 BS 신호와 함께 입력되기 시작하며, 1차원 N-IDCT는 BS 신호에 의해 동작을 시작한다.

도 6은 본 발명의 일 실시예에 따른 1차원 SA-IDCT의 회로도이다.

도 6을 참조하면, IDCT 수식의 특징인 행렬의 상하대칭을 이용하여 SA-DCT에서 사용한 ROM 데이터를 사용하고, 백 블록에서에 대한 곱셈 연산을 수행한 후 외부에서 받은 형상정보에 의해 데이터를 출력으로 보낸다. 따라서 구조를 크게 변경하지 않고 일반적인 IDCT와 SA-IDCT를 모두 수행할 수 있도록 설계하였다.

이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.

이상에서 살펴본 바와 같이 본 발명은 기존의 N=8인 일반적인 DCT에 개선된 피드-포워드 방식을 이용하여 기존의 블록을 그대로 이용하여 MPEG-4에서 사용되는 DCT를 수행할 수 있게 하였으며, 피드-포워드 방식을 개선하여 면적 감소와 수행 시간 단축 및 전력 감소 효과를 기대할 수 있다.

Claims

블록 스타트 신호에 응답하여 입력 데이터 및 형상 정보를 입력 받아 병렬 데이터로 출력하기 위한 프론트 블록;

상기 프론트 블록의 출력을 입력 받아 직접 연산 구조를 사용하여 이산여현변환을 수행하는 이산여현변환 코어 블록; 및

상기 이산여현변환/역이산여현변환 블록의 출력에를 곱하여 출력하기 위한 백 블록

을 구비하는 형태 적응형 이산여현변환을 위한 장치.