KR20050028499A

KR20050028499A - 스캔 테이블을 이용한 영상 주사방법과 그를 적용한 이산코사인 변환 장치

Info

Publication number: KR20050028499A
Application number: KR1020030064779A
Authority: KR
Inventors: 이승철
Original assignee: 삼성전자주식회사
Priority date: 2003-09-18
Filing date: 2003-09-18
Publication date: 2005-03-23
Also published as: KR100566290B1; US20050063462A1

Abstract

1. 청구범위에 기재된 발명이 속하는 기술분야

본 발명은 영상 정보의 송수신을 위한 것으로 특히, 이산 코사인 변환에 관한 것임.

2. 발명이 해결하려고 하는 기술적 과제

본 발명은 DCT에 있어서 특수한 상황에서도 블럭별로 정확한 주사방식을 결정하는 것이 가능한 스캔 테이블을 이용한 영상 주사방법과 그를 적용한 이산 코사인 변환 장치를 제공하는데 그 목적이 있음.

3. 발명의 해결 방법의 요지

본 발명은, 입력 영상을 이산 코사인 변환(DCT)하고 이를 양자화(Q)하여 주사방식에 따라 주사하여 가변길이 부호화를 통한 압축 비디오 스트림으로 출력하는 이산 코사인 변환 장치에 있어서, 입력된 영상에 대해 소정의 영상 블럭군 단위로 상기 영상 블럭군 내의 각각의 단위 영상 블럭의 동일 위치의 픽셀에 대한 상기 DCT 연산에 따른 계수의 절대값을 누적합한 뒤, 그 누적합의 값에 따른 스캔 테이블을 생성하는 스캔 테이블 생성부; 상기 스캔 테이블 생성부에서 생성된 상기 스캔 테이블에 따라 정렬된 값들을 가변길이 부호화 테이블(VLC table)상의 비트 길이만 누적합하여 비트량을 계산하는 비트율 계산부; 및 상기 이산 코사인 변환된 입력 영상을 입력받아 상기 스캔 테이블 생성부로 입력하여 상기 소정의 블럭군 단위로 스캔 테이블을 생성하도록 제어하고 이에 따른 상기 비트율 계산부의 비트율 값을 입력받아, 상기 스캔 테이블의 용량 증가와 상기 비트율을 이용해 상기 주사방식에 따른 주사를 위한 스캔 테이블을 제공하도록 제어하는 스캔 제어부를 포함함.

4. 발명의 중요한 용도

본 발명은 DCT 등에 이용됨.

Description

스캔 테이블을 이용한 영상 주사방법과 그를 적용한 이산 코사인 변환 장치{Image Scanning Method By Using Scan Table and Discrete Cosine Transform Apparatus adapted it}

본 발명은 영상 정보의 송수신을 위한 것으로 특히, 이산 코사인 변환에 관한 것이다.

일반적인 영상 전송에 있어서 영상 송신 장치는 영상 데이터를 압축하여 전송하는데, 이와 같이 영상을 압축하기 위하여 공간영역에서 주파수영역으로 변환을 시도한다. 이 과정에서 가장 널리 쓰이는 변환 방법이 이산코사인변환(DCT : Discrete Cosine Transform) 방법이다. 이 변환 방법은 영상 에너지 컴팩션(energy compaction), 빠른 처리속도 등의 장점 때문에 현재 표준 정지영상/동영상 압축에 사용되고 있다.

이렇게 주파수 영역으로 변환된 영상(정사각형 모양)은 주된 에너지가 좌측 상단에 몰리게 되고, 고주파 성분이 우측 하단으로 몰리게 되는데, 이를 도 1에서 도시하고 있다.

도 1 은 2차원 8x8 DCT의 신호 분포 예시도이다.

도 1에 도시된 바에 따르면, DCT에 의해서 영상 신호의 주파수 변환은 가로방향 및 세로방향으로 각각 1차원씩 순차적으로 처리하여 2차원의 주파수 신호로 구현된다. 일반적으로 왼쪽 상단 블럭의 계수인 DC(Direct Current)값은 8x8 크기 영상 전체의 평균 에너지를 나타내는 직류성분으로 값이 가장 크다.

그리고, 나머지 63개 블럭의 계수는 AC(Alternative Current)이며, 직류에서 멀어질 수록 고주파 성분을 표현하는 계수이며, 고주파 영역으로 갈 수록 값이 작아진다.

도 1 에 도시된 예시도의 경우, 64개의 DCT 계수가 각각 어떤 역할을 하는 지 보여주고 있다.

이와 같이 주파수 성분의 계수값으로 표현된 상태에서 양자화를 통하여, 값이 상대적으로 작은 고주파 성분들의 값을 0 또는 0에 가까운 작은 값으로 수렴시키며, 그 값의 검색을 위해 좌측상단부터 우측하단으로 지그재그 모양으로 스캐닝을 한다.

이 지그재그 스캐닝을 하게 되면, 이산코사인변환의 특성을 가장 잘 살릴 수 있는 것으로 알려져 있고, 고주파 성분인 0 또는 0에 가까운 작은 값과 저주파 성분인 큰 값을 효율적으로 분리하여 가변길이부호화(VLC, Variable Length Coding)를 하게 된다.

이러한 과정은 MPEG(Moving Picture Experts Group)1, 2, 4, H.261, 263, 264, JPEG(Joint Photographic Experts Group) 등의 공통적으로 채택하고 있다.

DCT와 양자화를 실행한 상태에서 데이터는 윗쪽 상단 왼쪽에서 오른쪽으로 저장되어 있고, 아래로 내려가는 방향으로 위치하게 된다. 이는 주파수 변환하는 단위를 8 x 8 크기의 정사각형으로 지정하였기 때문이다. 그러나, DCT 변환 후 계수는 블럭 내에서 왼쪽 상단에서부터 우측 하단으로 방사형으로 진행하면서 값이 현저하게 작아지게 된다. 특히 양자화 과정을 거치게 되면, 고주파 성분의 대부분은 0로 수렴하게 된다. 이를 저장된 형태인 윗쪽 상단 왼쪽에서 오른쪽으로, 또한 아래로 내려가는 방향으로 가변길이부호화를 시도하게 될 경우, DCT를 통해 얻어진 압축하기 쉬운 형태가 주는 이점을 제대로 살리지 못하게 된다. 따라서, 고주파 성분과 저주파 성분을 따로 분리할 수 있도록 주사하는 기술이 필요하게 된다.

도 2(a)~도 2(c) 는 종래의 2차원 8 x 8 DCT 신호의 주사 방식에 대한 예시도이다.

주사 방식의 목표는 계수의 값이 큰 값부터 작은 값으로 차례로 정렬이 되도록 주사하는 것이다. 그 이유는 계수의 값이 차례로 정렬이 될 때, 가변길이부호화를 통해 압축의 효과가 커지기 때문이다.

도 2(a)는 일반적인 영상의 경우에 사용하는 방법으로 지그재그(zigzag) 스캔 방법이다. 도 2(b)는 수직성분이 강한 경우에 사용하는 방법으로 수직 스캔 방법이다. 도 2(c)는 수평성분이 강한 경우에 사용하는 방법으로 수평 스캔 방법이다.

이상의 도 2(a)~도 2(c)는 현재 MPEG4 표준에서 채택된 주사방식이다. 이 주사방식으로 인하여 DCT 변환의 특성이 극대화 되면서, 가변길이부호화(VLC : Variable Length Cording)가 진행된다.

도 3 은 일반적인 H.263/MPEG 비디오 인코더의 일실시예 구성도이다.

도 3 에 도시된 바와 같이, 일반적인 H.263/MPEG 비디오 인코더는 프레임 단위의 영상 정보를 입력받아 이를 저장하는 원본 저장부(301), 입력된 원본 영상 정보를 엠시디 저장부(311)에 저장된 움직임 보상된 정보와 연산하여 DCT부(303)로 전달하는 제 1 연산부(302), 이산 코사인 변환을 수행하는 DCT부(303), DCT부(303)의 출력을 양자화하는 양자화부(Q)(304), 양자화된 데이터를 역양자화하는 역양자화부(IQ)(305), 역양자화부(305)의 출력을 역 이산 코사인 변환하는 IDCT부(306), 엠시디 저장부(311)에 저장된 이전 프레임(n-1)의 움직임 보상된 정보와 IDCT부(306)를 통한 디코딩된 당 프레임(n)의 디코딩 정보를 결합하는 결합기(307), 다음 프레임(n)을 위한 디코딩 정보를 저장하는 리콘 저장부(Recon Memory)(308), 리콘 저장부(308)에 저장된 이전 프레임(n-1)의 디코딩 정보와 당 프레임(n)의 원본 영상을 입력받아 움직임 예측을 위한 움직임 벡터와 디퍼렌셜 이미지를 출력하는 움직임 예측부(310), 리콘 저장부(308)에 저장된 이전 프레임(n-1)의 디코딩 정보에 움직임 예측부(310)의 출력을 받아 움직임을 보상하는 움직임 보상부(309), 움직임 보상된 이전 프레임(n-1)을 저장하는 엠시디 저장부(Mced Memory)(311), 양자화된 신호에 대해 주사방식에 따라 주사하여 그 순서를 저장하는 스캔(SCAN)부(312) 및 자주 나오는 값을 작은 비트로 할당하고 가끔 나오는 값일수록 큰 비트로 할당하도록 하는 엔트로피 코딩을 위한 VLC부(109)를 포함한다.

도 3 에 도시된 스캔부(312)에 의해 그 주사방식을 결정하고 처리하게 되는데, 도 2 와 같은 주사방식에 의하는 경우 영상블럭마다 그 DCT에 의한 계수값의 분포가 틀려지게 되어 도 2와 같은 일률적인 주사 방식을 취할 경우 최적의 주사 조건을 만족시킬 수 없게 된다.

따라서, 각각의 영상 블럭마다 그 주사방식을 결정하는 방안에 대한 연구가 이루어져 왔다.

그 대표적인 예로 미국 특허 제 5,500,678호의 "Optimized Scanning of Transform Coefficients in Video Coding"(US Pat. 5,500,678), 미국 특허 제 6,263,026 호의 "Signal Compressing System"(US Pat. 6,263,026), 대한민국 특허 출원 제 2002-00709호의 "정지영상 및 동영상 부호화에서 변환 계수의 예측 주사 방법"이 있다.

그 내용을 살펴보면, 미국 특허 제 5,500,678호의 "Optimized Scanning of Transform Coefficients in Video Coding"(US Pat. 5,500,678)는 두 개의 주사방식을 미리 정의해 놓고, 이를 선택적으로 적용하도록 하는 방법으로, 현재 MPEG-4 인트라 코딩 방식의 주사방식으로 채택되어 있으나, 그 목적 영상에 따라 지그재그 주사방식 만을 사용한 것에 비하여 오히려 비트량이 많이 발생할 때도 있다.

그리고, 미국 특허 제 6,263,026 호의 "Signal Compressing System"(US Pat. 6,263,026)는 미국 특허 제 5,500,678호가 두 개의 주사 방식을 선택적으로 적용하는 것에 비하여, 보다 많은 다수의 주사 방식을 미리 설정하여 여기에서 가장 알맞은 주사 방식을 선택하고 이를 DCT 계수들에 적용하는 방식이다. 미국 특허 제 5,500,678호의 특허내용의 단점을 보완하기 위하여 보다 많은 주사 방식을 준비해 놓도록 하는 기술이다. 이 방법에서는 주사방식을 준비하고 있기 위해서 별도의 저장공간이 필요하게 되는 단점이 있으며, 미리 준비된 주사방식이 목적영상에 맞지 않으면, 그 부분이 압축률 저하의 요인이 된다.

그리고, 대한민국 특허 출원 제 2002-00709호의 "정지영상 및 동영상 부호화에서 변환 계수의 예측 주사 방법"은 미국 특허 제 5,500,678호에 기초하여 동적으로 해당 영상에 대한 주사방식이 미국 특허 제 5,500,678호에서 벗어나는 부분만 변경해 나가도록 하는 기술이다. 또한, 블럭 내에 각 계수들이 "non-zero"가 아닐 확률을 구하여 이 확률 순서대로 주사순서를 정하도록 하는 것이다. 이는 앞서 두 가지 특허기술이 가지는 단점을 보완하지만, DCT 계수의 "zero" 여부만을 체크하여 주사순서를 정하는 방법은 영상이 밝지도, 어둡지도, 색차신호가 짙거나 옅지 않은 이상적인(ideal) 상황에서만 좋은 효율을 보여주게 되는 문제점이 있다.

즉, 이상의 기존 주사방식은 가장 확률적으로 압축효율이 좋을 것같은 방식을 표준으로 정해 놓고, 이를 아무런 연산없이 적용하는 것이다. 이는 영상의 특성이 저주파성분과 고주파 성분이 고르게 나오고, 8 x 8 블럭 내에서 영상 신호가 어느 한쪽으로 치우치거나 특이한 형태(예를 들면 영상의 경계면)를 띠지 않고 평이한 상태를 가정한 것이라 볼 수 있다. 실제 통계적으로 영상을 분석해 보면, 이 표준 지그재그 주사방식을 따르지 않는 DCT 블럭들이 많이 존재함이 확인된다.

따라서, 영상압축의 효과를 높이기 위해 좀더 정확한 주사방식에 대한 연구가 요구된다.

본 발명은, 상기와 같은 문제점을 해결하기 위하여 제안된 것으로, DCT에 있어서 특수한 상황에서도 블럭별로 정확한 주사방식을 결정하는 것이 가능한 스캔 테이블을 이용한 영상 주사방법과 그를 적용한 이산 코사인 변환 장치를 제공하는데 그 목적이 있다.

또한, 본 발명은 기존의 지그재그 주사방식 및 그에 유사한 기술을 쓰지 않고도 기존의 방식에 비해 연산량의 추가가 크지 않으면서 기존의 지그재그 주사방식 및 그에 유사한 기술의 단점을 극복하고, 특수한 상황에서 더 나은 압축률을 얻을 수 있는 영상 주사방법을 제공하는데 그 목적이 있다.

상기의 목적을 달성하기 위한 본 발명은, 입력 영상을 이산 코사인 변환(DCT)하고 이를 양자화(Q)하여 주사방식에 따라 주사하여 가변길이 부호화를 통한 압축 비디오 스트림으로 출력하는 이산 코사인 변환 장치에 있어서, 입력된 영상에 대해 소정의 영상 블럭군 단위로 상기 영상 블럭군 내의 각각의 단위 영상 블럭의 동일 위치의 픽셀에 대한 상기 DCT 연산에 따른 계수의 절대값을 누적합한 뒤, 그 누적합의 값에 따른 스캔 테이블을 생성하는 스캔 테이블 생성부; 상기 스캔 테이블 생성부에서 생성된 상기 스캔 테이블에 따라 정렬된 값들을 가변길이 부호화 테이블(VLC table)상의 비트 길이만 누적합하여 비트량을 계산하는 비트율 계산부; 및 상기 이산 코사인 변환된 입력 영상을 입력받아 상기 스캔 테이블 생성부로 입력하여 상기 소정의 블럭군 단위로 스캔 테이블을 생성하도록 제어하고 이에 따른 상기 비트율 계산부의 비트율 값을 입력받아, 상기 스캔 테이블의 용량 증가와 상기 비트율을 이용해 상기 주사방식에 따른 주사를 위한 스캔 테이블을 제공하도록 제어하는 스캔 제어부를 포함한다.

또한, 본 발명은, 압축 영상 전송을 위한 영상 주사 방법에 있어서, 상기 압축 영상 전송을 위한 이산 코사인 변환된 영상을 입력받는 제 1 단계; 상기 입력된 이산 코사인 변환된 영상에 대해 소정의 단위의 블럭군을 설정하는 제 2 단계; 상기 설정된 소정의 블럭군 내의 각각의 단위 블럭에서 동일한 위치의 픽셀에 대한 DCT 처리에 따른 계수의 절대값을 누적합하여 저장하는 제 3 단계; 상기 저장된 단위 블럭 내의 픽셀 위치에 따른 절대값의 누적합의 순서대로 픽셀을 재정렬하고 그에 따른 스캔 테이블을 생성하는 제 4 단계; 및 상기 스캔 테이블에 따라 영상 주사하는 제 5 단계를 포함한다.

이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다. 도면에서 동일한 구성요소들에 대해서는 비록 다른 도면에 표시되더라도 가능한 한 동일한 참조번호 및 부호로 나타내고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어서, 관련된 공지기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명은 생략한다.

도 4 는 본 발명에 따른 주사방식을 결정하여 영상을 압축 전송하는 H.263/MPEG 비디오 인코더의 일실시예 구성도이다.

도 4 에 도시된 바와 같이, 본 발명에 따른 H.263/MPEG 비디오 인코더는 도 3 의 일반적인 H.263/MPEG 비디오 인코더와 유사한 구성을 가진다. 그 내용을 상세히 살펴보면, 프레임 단위의 영상 정보를 입력받아 이를 저장하는 원본 저장부(301), 입력된 원본 영상 정보를 엠시디 저장부(311)에 저장된 움직임 보상된 정보와 연산하여 DCT부(303)로 전달하는 제 1 연산부(302), 이산 코사인 변환을 수행하는 DCT부(303), DCT부(303)의 출력을 양자화하는 양자화부(Q)(304), 양자화된 데이터를 역양자화하는 역양자화부(IQ)(305), 역양자화부(305)의 출력을 역 이산 코사인 변환하는 IDCT부(306), 엠시디 저장부(311)에 저장된 이전 프레임(n-1)의 움직임 보상된 정보와 IDCT부(306)를 통한 디코딩된 당 프레임(n)의 디코딩 정보를 결합하는 결합기(307), 다음 프레임(n)을 위한 디코딩 정보를 저장하는 리콘 저장부(Recon Memory)(308), 리콘 저장부(308)에 저장된 이전 프레임(n-1)의 디코딩 정보와 당 프레임(n)의 원본 영상을 입력받아 움직임 예측을 위한 움직임 벡터와 디퍼렌셜 이미지를 출력하는 움직임 예측부(310), 리콘 저장부(308)에 저장된 이전 프레임(n-1)의 디코딩 정보에 움직임 예측부(310)의 출력을 받아 움직임을 보상하는 움직임 보상부(309), 움직임 보상된 이전 프레임(n-1)을 저장하는 엠시디 저장부(Mced Memory)(311), 양자화된 신호에 대해 주사방식에 따라 주사하여 그 순서를 저장하는 스캔(SCAN)부(312) 및 자주 나오는 값을 작은 비트로 할당하고 가끔 나오는 값일수록 큰 비트로 할당하도록 하는 엔트로피 코딩을 위한 VLC부(109)를 포함하는 일반적인 H.263/MPEG 비디오 인코더의 구성에 본 발명을 적용하기 위한 스캔(Scan) 제어부(401), 스캔 테이블 생성부(402) 및 비트량 계산부(403)을 포함한다.

본 발명에 따른 H.263/MPEG 비디오 인코더에서 스캔(Scan) 제어부(401), 스캔 테이블 생성부(402) 및 비트량 계산부(403)의 구성 및 그 동작을 좀 더 상세히 살펴보면 다음과 같다.

각각의 기능을 먼저 살펴보면, 스캔 테이블 생성부(402)는 입력된 영상 블럭군 내의 각각의 단위 영상 블럭의 동일 위치의 픽셀에 대한 상기 DCT 연산에 따른 계수의 절대값을 누적합 한 뒤, 그 누적합의 값이 큰 순서에 따라 주사 순서를 저장하는 스캔 테이블을 생성한다.

그리고, 비트량 계산부(403)는 지정된 블럭에 할당된 스캔 테이블 생성부(402)에서 생성된 스캔 테이블을 적용하여 정렬된 값들을 가변길이부호화테이블(VLC table) 상의 비트 길이만 누적합하여 비트량을 계산한다.

그리고, 스캔 제어부(401)는 스캔 테이블에 따른 비트량 계산부(403)의 비트율을 이용하여, 스캔 테이블의 용량 증가와 영상분할에 따른 압축률을 비교하여 최적의 스캔 테이블을 제공하도록 제어한다.

DCT(303)부를 통해 이산 코사인 변환된 영상 정보는 양자화(Q)부(304)로 전달됨과 동시에 스캔 제어부(401)로 전달된다. 스캔 제어부(401)는 전달된 이산 코사인 변환된 영상 정보를 스캔 테이블 생성부(402)로 전달하여 스캔 테이블을 생성하도록 제어하고, 해당 스캔 테이블에 따른 비트량을 계산하는 비트량 계산부(403)의 계산 결과에 따라 해당 스캔 테이블을 스캔부(312)의 주사방식으로 사용할 것인지를 결정한다.

여기서, 스캔 제어부(401) 및 스캔 테이블 생성부(402)는 영상 정보의 블럭을 소정의 단위로 나누어 그 주사방식을 결정하게 되는데, 비트량 계산부(403)의 계산 결과에 따라 최적화된 영상 정보의 블럭 단위를 결정할 수 있게 된다.

즉, 스캔 제어부(401) 및 스캔 테이블 생성부(402)는 8x8 영상 프레임의 1개 블럭 단위로 계산을 하고(DCT와 같은 영상변환장치의 크기에 맞게 임의의 크기로 적용하는 것이 가능하다.), 소정의 블럭군에 대하여 8x8 영상 블럭 단위로 블럭내 각각의 좌표에 해당하는 화소들에 대하여 계산을 하여 그 각각의 비트량 계산 결과에 따라 최적의 스캔 테이블을 스캔부(312)로 전달하여 그 스캔 테이블에 따라 주사하도록 한다. 즉, 본 발명에서는 전송부와 수신부가 정해진 주사 방식을 약속에 의해 선택하는 표준에서와는 달리, 스캔 테이블을 인코딩시에 포함하여 인코딩하고 이를 같이 전송하여 디코딩시에 이를 이용하여 디코딩이 되도록 하는데, 스캔 테이블의 용량이 커지면 압축율이 좋아진다고 하더라도 그 효과가 충분히 반영되지 못한다. 따라서, 스캔 테이블의 용량과 비트율을 이용한 압축율을 트레이드 오프(trade off)하여 최적화된 스캔 테이블을 제공하여야 한다. 이러한 제어 동작을 스캔 제어부(401)를 통해 수행한다. 특히, 각각 블럭군이 생성될 때마다 그 스캔 테이블의 크기는 일정하기때문에 그 크기 값은 스캔 제어부(401)에 저장을 하고 비트율 계산부(403)에서 비트율을 입력받아 그 값을 제어한다.

예를 들면, 10키로비트(Kbits)의 프레임에 대해 A블럭군의 압축율이 50%이고 그 스캔 테이블의 용량이 1키로비트(Kbits)이면 그 전송 데이터의 용량은 6키로비트가 된다. 반면, 10키로비트(Kbits)의 프레임에 대해 B블럭군의 압축율이 55%이고 그 스캔 테이블의 용량이 0.3키로비트(Kbits)이면 그 전송 데이터의 용량은 5.8키로비트가 된다. 따라서, 비트율로만 따지면 A블럭군의 스캔 테이블이 낫지만, 결과적으로는 B블럭군의 스캔 테이블의 최적의 값이 된다.

도 5 는 본 발명에 따른 스캔 테이블의 생성 방법의 일실시예 동작 흐름도이다.

우선, 본 발명에 따른 스캔 테이블의 생성 방법은 우선 주사순서를 정하는 스캔 테이블을 결정하기 위한 블럭군을 설정한다(401). 즉, 어떤 블럭 단위로 스캔 테이블을 결정할 것인지를 정한다.

그리고, 설정된 블럭군 내의 각각의 단위 블럭에서 동일한 위치의 픽셀에 대한 DCT 처리에 따른 계수의 절대값을 합하여 저장한다(402). 즉, 설정된 블럭군 내에서 동일한 위치의 절대값의 크기에 따른 배열이 가능하게 된다.

그리고, 저장된 단위 블럭 내의 픽셀 위치에 따른 절대값의 합의 순서대로 픽셀을 재정렬하여 이에 따른 스캔 테이블을 생성한다(403). 즉, 402 과정에서 저장된 절대값의 합을 크기의 순서대로 배열한다.

그리고, 생성된 스캔 테이블, 즉 재정렬된 픽셀의 순서에 따라 스캔한다(404).

이와 같은 도 5의 스캔 테이블의 생성 방법을 8x8 영상에 적용하여 처리하는 상세 동작 흐름도를 도 6 에서 도시하고 있다.

도 6에 도시된 바에 따르면, 8x8 영상에 적용한 스캔 테이블의 생성 방법은 픽셀의 계수값의 합을 위한 함수 Sum[], 스캔의 순서를 정하기 위한 함수 Scan[], 스캔 테이블 생성을 위한 처리가 수행되었는지를 확인하기 위한 함수 flag[], 영상 블럭을 표시하는 y, 영상 블럭(y)내의 픽셀의 위치를 표시하는 x, 스캔의 순서를 표시하기 위한 인덱스 a, 영상 블럭내의 픽셀의 계수의 합에 따른 순서를 표시하기 위한 인덱스값인 b를 초기화한다(601).

그리고, DCT블럭의 인덱스 시작(M)과 종료(N)를 결정한다(602). 즉, 스캔 테이블을 결정하기 위한 블럭군을 설정(401)하는 과정이다.

Sum[]을 모두 '0'으로 하고, 영상 블럭을 표시하는 y를 M으로 한다(603). 즉, 영상 블럭 M으로부터 동작을 수행한다.

그리고, 영상블럭(y)이 종료값인 N에 이를 때까지 각각의 픽셀의 DCT에 따른 계수의 절대값을 더한다(604, 605, 606, 607, 608, 609). 여기서, 607 과정의 "Sum[x] = Sum[x] + ABS(DCT[y][x])"라는 계산식의 의미는 다음과 같다.

설정된 영상 블럭(M~N)군 내의 각각의 단위 영상 블럭은 같은 수의 픽셀들로 구성되며, 그 위치는 모두 동일하다. 따라서, 각각의 단위 영상 블록의 같은 위치에 해당하는 픽셀(x)을 DCT[y][x]라고 표시한다. 즉, DCT[y][x]는 단위 영상 블럭 y의 x번째 픽셀을 의미한다. 따라서, x번째 픽셀의 계수값의 절대값의 합(Sum[x])은 "이전 블럭까지의 x번째 픽셀의 계수값의 절대값의 합(Sum[x]) + 현 블럭의 x번째 픽셀의 계수의 절대값(ABS(DCT[y][x])"로 표시된다.

이와 같이, 각각의 단위 블럭내의 픽셀의 절대값의 합을 계산하면, flag[]를 초기화한다(610). 그리고, 스캔의 순서를 표시하기 위한 인덱스 a를 "0"으로 초기화한다(611).

그리고, a의 값이 64가 될 때까지(즉, 단위 영상 블럭의 전체 픽셀 : 8x8 영상이므로 픽셀의 수는 64이다.)(612) 최초 인덱스(index)와 최초의 최대값(max)를 "-1"로 설정하고 영상 블럭내의 픽셀의 계수의 합에 따른 순서를 표시하기 위한 인덱스값인 b를 "0"으로 설정한다(613).

그리고, b가 64가 될 때까지(614) flag[b]가 "1"이면서 Sum[b]가 최대값(max)보다 큰 지를 확인한다(615).

그리고, 확인결과, flag[b]가 "1"이면서 Sum[b]가 최대값(max)보다 크면 최대값을 Sum[b]로 바꾸고 인덱스를 b로 한다(616).

이상의 615, 616의 과정을 b가 64가 될 때까지(614) 반복한다(614, 617).

이에 따라 최대값을 가지는 픽셀의 위치(b)가 결정된다. 따라서, 최초의 Scan[a]를 인덱스-즉, 절대값 합의 최대값을 갖는 픽셀의 위치-로 결정하고, 해당 픽셀의 위치의 flag[인덱스]값을 "0"으로 함으로써, 해당 픽셀에 대해서는 이미 처리가 되었음을 표시한다(618).

그리고, 그 순서가 64에 이를때 까지 612 내지 619의 과정을 반복한다.

이상의 동작에 따라 블럭군내의 단위 블럭의 픽셀의 위치를 절대값 합의 최대값을 갖는 순서에 따라 차례로 배열한다.

도 7(a)~(f) 는 본 발명에 따른 영상 주사 방법과 종래의 지그재그 방법에 따른 영상 주사 방법의 압축률 비교를 위한 예시도이다.

도 7(a)~(f)에 도시된 바와 같은 각각의 영상에 대한 본 발명에 따른 영상 주사 방법과 종래의 지그재그 방법에 따른 영상 주사 방법의 압축률 비교를 하면 <표 1> 내지 <표 3>과 같다.

<표 1>은 각각의 도면에 대한 종래의 지그재그 방법에 따른 영상 주사 방법의 압축률을 표시한 것이다. 각각의 값은 원본(Raw) 데이터 대비 비트량의 비율을 %로 표시한 것이다.

양자화수	a	b	c	d	e	f
1	24.498	21.283	24.013	16.892	58.087	55.392
5	5.224	4.328	4.771	3.257	16.006	14.01
10	2.516	2.224	2.146	1.713	7.417	5.973

<표 2>는 각각의 도면에 대한 본 발명에 따른 영상 주사 방법의 압축률을 표시한 것이다. 각각의 값은 원본(Raw) 데이터 대비 비트량의 비율을 %로 표시한 것이다. <표 2>는 프레임당 1개의 스캔 테이블을 이용하는 경우의 예이다.

양자화수	a	b	c	d	e	f
1	24.987	21.589	24.269	16.972	58.151	55.433
5	5.261	4.36	4.746	3.216	15.933	13.953
10	2.416	2.221	2.109	1.703	7.294	5.883

<표 3>는 각각의 도면에 대한 본 발명에 따른 영상 주사 방법의 압축률을 표시한 것이다. 각각의 값은 원본(Raw) 데이터 대비 비트량의 비율을 %로 표시한 것이다. <표 3>는 프레임당 1024개의 스캔 테이블을 이용하는 경우의 예이다.

양자화수	a	b	c	d	e	f
1	21.248	18.558	21.159	14.362	54.787	52.229
5	3.727	3.435	3.656	2.687	12.655	11.072
10	1.905	1.901	1.828	1.568	5.597	4.519

상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(씨디롬, 램, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다.

이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.

상기와 같은 본 발명은, DCT에 있어서 특수한 상황에서도 블럭별로 정확한 주사방식을 결정하는 것이 가능하도록 하는 효과가 있다.

또한, 본 발명은 기존의 지그재그 주사방식 및 그에 유사한 기술을 쓰지 않고도 기존의 방식에 비해 연산량의 추가가 크지 않으면서 더 나은 압축률을 얻을 수 있는 효과가 있다.

도 1 은 2차원 8x8 DCT의 신호 분포 예시도.

도 2(a)~도 2(c) 는 종래의 2차원 8 x 8 DCT 신호의 주사 방식에 대한 예시도.

도 3 은 일반적인 H.263/MPEG 비디오 인코더의 일실시예 구성도.

도 4 는 본 발명에 따른 주사방식을 결정하여 영상을 압축 전송하는 H.263/MPEG 비디오 인코더의 일실시예 구성도.

도 5 는 본 발명에 따른 스캔 테이블의 생성 방법의 일실시예 동작 흐름도.

도 6 은 도 5의 스캔 테이블의 생성 방법을 8x8 영상에 적용하여 처리하는 상세 동작 흐름도.

도 7(a)~(f) 는 본 발명에 따른 영상 주사 방법과 종래의 지그재그 방법에 따른 영상 주사 방법의 압축률 비교를 위한 예시도.

Claims

입력 영상을 이산 코사인 변환(DCT)하고 이를 양자화(Q)하여 주사방식에 따라 주사하여 가변길이 부호화를 통한 압축 비디오 스트림으로 출력하는 이산 코사인 변환 장치에 있어서,

입력된 영상에 대해 소정의 영상 블럭군 단위로 상기 영상 블럭군 내의 각각의 단위 영상 블럭의 동일 위치의 픽셀에 대한 상기 DCT 연산에 따른 계수의 절대값을 누적합한 뒤, 그 누적합의 값에 따른 스캔 테이블을 생성하는 스캔 테이블 생성부;

상기 스캔 테이블 생성부에서 생성된 상기 스캔 테이블에 따라 정렬된 값들을 가변길이 부호화 테이블(VLC table)상의 비트 길이만 누적합하여 비트량을 계산하는 비트율 계산부; 및

상기 이산 코사인 변환된 입력 영상을 입력받아 상기 스캔 테이블 생성부로 입력하여 상기 소정의 블럭군 단위로 스캔 테이블을 생성하도록 제어하고 이에 따른 상기 비트율 계산부의 비트율 값을 입력받아, 상기 스캔 테이블의 용량 증가와 상기 비트율을 이용해 상기 주사방식에 따른 주사를 위한 스캔 테이블을 제공하도록 제어하는 스캔 제어부를 포함하는 스캔 테이블을 이용한 이산 코사인 변환 장치.
제 1 항에 있어서,

상기 스캔 제어부는,

상기 소정의 블럭군을 최소의 단위 영상 블럭군으로부터 최대의 영상 블럭군까지 변화시켜 상기 스캔 테이블 테이블 생성부로 입력하고, 그에 따른 상기 비트율 계산부의 비트율 값을 입력받도록 하는 것을 특징으로 하는 스캔 테이블을 이용한 이산 코사인 변환 장치.
제 2 항에 있어서,

상기 스캔 제어부는, 변화되는 상기 소정의 블럭군에 대해 각각 상기 스캔 테이블 생성부에서 생성되는 상기 스캔 테이블의 데이터 용량값을 저장하는 것을 특징으로 하는 스캔 테이블을 이용한 이산 코사인 변환 장치.
제 3 항에 있어서,

상기 스캔 제어부는, 변화되는 상기 소정의 블럭군에 따라, 상기 저장된 스캔 테이블의 데이터 용량값과 해당 스캔 테이블에 따른 상기 비트율 계산부의 비트율값을 합하여 그 합이 최소가 되는 스캔 테이블을 상기 주사방식으로 제공하도록 제어하는 것을 특징으로 하는 스캔 테이블을 이용한 이산 코사인 변환 장치.
압축 영상 전송을 위한 영상 주사 방법에 있어서,

상기 압축 영상 전송을 위한 이산 코사인 변환된 영상을 입력받는 제 1 단계;

상기 입력된 이산 코사인 변환된 영상에 대해 소정의 단위의 블럭군을 설정하는 제 2 단계;

상기 설정된 소정의 블럭군 내의 각각의 단위 블럭에서 동일한 위치의 픽셀에 대한 DCT 처리에 따른 계수의 절대값을 누적합하여 저장하는 제 3 단계;

상기 저장된 단위 블럭 내의 픽셀 위치에 따른 절대값의 누적합의 순서대로 픽셀을 재정렬하고 그에 따른 스캔 테이블을 생성하는 제 4 단계; 및

상기 스캔 테이블에 따라 영상 주사하는 제 5 단계를 포함하는 스캔 테이블을 이용한 영상 주사 방법.
제 5 항에 있어서,

상기 제 5 단계는,

상기 제 2 단계의 소정의 블럭군을 변화시켜 상기 제 3 단계와 상기 제 4 단계의 과정을 반복함으로써, 최적의 스캔 테이블을 생성하는 제 6 단계; 및

상기 최적의 스캔 테이블에 따라 영상 주사하는 제 7 단계로 이루어진 것을 특징으로 하는 스캔 테이블을 이용한 영상 주사 방법.