KR100501815B1 - 비트 플레인을 이용한 계층적 이산여현 변환방법 - Google Patents

비트 플레인을 이용한 계층적 이산여현 변환방법 Download PDF

Info

Publication number
KR100501815B1
KR100501815B1 KR10-2003-0015375A KR20030015375A KR100501815B1 KR 100501815 B1 KR100501815 B1 KR 100501815B1 KR 20030015375 A KR20030015375 A KR 20030015375A KR 100501815 B1 KR100501815 B1 KR 100501815B1
Authority
KR
South Korea
Prior art keywords
dct
image
bit
coefficients
bit plane
Prior art date
Application number
KR10-2003-0015375A
Other languages
English (en)
Other versions
KR20040080540A (ko
Inventor
유철
Original Assignee
유철
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 유철 filed Critical 유철
Priority to KR10-2003-0015375A priority Critical patent/KR100501815B1/ko
Publication of KR20040080540A publication Critical patent/KR20040080540A/ko
Application granted granted Critical
Publication of KR100501815B1 publication Critical patent/KR100501815B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/99Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals involving fractal coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

본 발명은 영상 압축 부호화에 사용되는 이산여현변환(DCT) 방법에 관한 것으로, 더욱 상세하게는 비트 플레인을 이용한 계층적 이산여현 부호화 방법에 관한 것이다.
이러한 본 발명의 방법은 영상 데이터를 입력하는 제1 단계; 소정 크기의 DCT블록을 형성하는 제2 단계; 상기 DCT블럭에 대해 DCT 변환하는 제3 단계; 상기 DCT변환된 계수를 소정 스케일로 양자화하는 제4 단계; 상기 양자화된 AC DCT계수를 지그재그 스캔하는 제5 단계; 상기 지그재그 스캔된 AC DCT 계수를 소정 비트의 비트 플레인으로 순차적으로 배열하는 제6 단계; 및 상기 배열된 비트 플레인을 지그재그 스캔하는 제7 단계를 포함한다.
따라서 본 발명은 영상의 평균적이고 전체적인 정보를 가진 MSB 정보를 더 우선적으로 잘 전송할 수 있도록 하고, 저주파에서 고주파성분으로의 DCT 계수의 중요도에 따라 계층을 나누어 전송함으로써 계층을 나누지 않고 단일 계층으로 전송한 영상보다 영상의 화질이 개선된 효과를 제공할 수 있다.

Description

비트 플레인을 이용한 계층적 이산여현 변환방법 { Layered DCT coding method using bit plain }
본 발명은 영상 압축 부호화에 사용되는 이산여현변환(DCT) 방법에 관한 것으로, 더욱 상세하게는 비트 플레인을 이용한 이산여현 부호화 방법에 관한 것이다.
일반적으로, 문자, 음성, 음향, 정지영상, 동영상 등 다양한 형식의 데이터를 갖는 멀티미디어는 여러 분야에서 구성 및 제안되고 있으며, 고성능 PC에 의한 멀티미디어, 초고속통신망을 통한 화상 회의 및 종합 정보 제공 등 많은 분야에서 그 응용 범위가 확대되고 있는 실정이다. 이러한 멀티미디어 시스템에서 많은 정보를 전송하기 위해서는 저장 비용 및 전송 시간이 증가하게 되며 특히, 동영상은 다른 정보에 비해 많은 정보량을 가지고 실시간을 요구하는 응용에서는 압축이 필요하게 된다.
압축은 데이터에 내재된 중복성을 없애고 필요한 성분만을 뽑아내는 과정으로, 내재하는 중복성으로는 프레임과 프레임 사이에 존재하는 시간적 중복성과 한 프레임 내에서도 이웃하는 픽셀과 픽셀 사이에 존재하는 공간적 중복성이 있다. 이 시간적 중복성과 공간적 중복성을 없애기 위해 사용되는 부호화로 움직임 보상과 DCT(Discrete Cosine Transform)와 양자화(Quantization)가 있다.
이 중 공간적 중복성을 제거하기 위한 기본 알고리즘의 경우, 각각의 영상을 블록 단위로 분할을 한 후에 블록별로 독립적으로 DCT를 적용한다. DCT를 이용하여 공간적 중복성을 제거하며, 이를 통해 얻어진 DCT 계수를 양자화와 지그재그 스캔(Zig-zag scanning)을 통하여 연속적인 값이 많이 나오도록 하며, 그 데이터를 가변장 부호화(RLC: Run-Length Coding)와 허프만 부호화(Huffman Coding)를 통해서 최종적인 압축을 수행한다. 그러나 무선 채널이나 인터넷과 같이 오류가 발생하기 쉬운 네트워크에서 전송 시 압축된 데이터는 오류에 대해 민감하며, 오류 발생시 심각한 화질 저하를 초래할 수 있다. 이는 영상 압축 시 사용되는 가변장 부호화 및 예측 부호화의 사용으로 인해 영상 스트림 내의 부분적인 오류가 시공간 상으로 번지게 되어 화질의 저하를 가져오게 된다. 이러한 이유로 채널 오류에 강인하게 코딩을 하거나 채널 오류로 인한 영상 정보 손실을 복원하기 위한 많은 기법들이 연구되고 있다.
이 중 계층적 부호화(Layered Coding)란 영상 정보를 여러 계층으로 나누어 중요도가 적은 정보의 경우 낮은 계층에 포함시키고, 중요도가 높은 정보는 높은 계층으로 나누어 전송하는 것이다. 단일 계층의 부호화 시에 현재 프레임에 오류가 발생하면 주위 블록이나 이전 프레임 데이터를 사용해 영상 복원에 이용할 수 있으나 한계가 있다. 계층적 부호화의 경우 고급 계층에 오류가 발생하더라도 기본 계층의 데이터를 이용하면 오류 은닉, 정정 효과를 높일 수 있다.
본 발명은 DCT기반의 블록 코딩을 사용하는 영상압축 방법에서 비트 플레인을 이용한 DCT 계수의 계층적 부호화 방법을 제공하는데 그 목적이 있다.
상기와 같은 목적을 달성하기 위하여 본 발명의 방법은, 영상 데이터를 입력하는 제1 단계; 소정 크기의 DCT블록을 형성하는 제2 단계; 상기 DCT블럭에 대해 DCT 변환하는 제3 단계; 상기 DCT변환된 계수를 소정 스케일로 양자화하는 제4 단계; 상기 양자화된 AC DCT계수를 지그재그 스캔하는 제5 단계; 상기 지그재그 스캔된 AC DCT 계수를 소정 비트의 비트 플레인으로 순차적으로 배열하는 제6 단계; 및 상기 배열된 비트 플레인을 지그재그 스캔하는 제7 단계를 포함하는 것을 특징으로 한다.
상기 제7 단계는 상기 배열된 비트 플레인을 소정 수의 계수 집합으로 구분한 후 각 계수 집합별로 지그재그 스캔하여 계층 부호화하고, 상기 계층 부호화는 지정된 집합까지 지그재그 스캔을 한 후에 나머지 스캔되지 못한 LSB의 경우 제로(0)로 패딩한다.
그리고 상기 DCT블록은 8x8 블록의 크기이고, AC 계수만 8비트 비트 플레인상에 순차적으로 배열하고, 이러한 본 발명의 방법은 H261, H263 등 다양한 방식에 적용할 수 있다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 자세히 설명하기로 한다.
도 1은 본 발명에 따른 방법을 도시한 순서도로서, 본 발명에 따른 방법은 영상입력단계(S1)와, 소정 크기의 DCT블록을 형성하는 단계(S2), DCT변환하는 단계(S3), 양자화하는 단계(S4), 양자화된 DCT계수를 1차 지그재그 스캔하는 단계(S5), DCT계수를 비트 플레인으로 배열하는 단계(S6), 2차 지그재그 스캔하는 단계(S7), 및 계층화 코딩하는 단계(S8)로 이루어진다. 이를 각 단계별로 구분하여 보다 자세히 설명하면 다음과 같다.
1. DCT 및 양자화 과정(단계 S1 내지 S5)
DCT(Discrete Cosine Transform)는 변환 전에는 화면에 불규칙하게 퍼져 있던 화소 값이 변환 후에는 저주파 성분에서 고주파 성분에 이르기까지 여러 주파수 성분을 나누어지며, 저주파 쪽으로 집중되는 결과를 가져온다. 현재 H.261, JPEG, MPEG 등의 여러 국제표준에 핵심기술로 자리잡고 있는 DCT는 8×8 크기의 화소를 하나의 블록으로 묶어 변환의 단위로 삼고 있다. 블록의 크기를 키울수록 압축효율은 높아지나 변환의 구현이 훨씬 어려워지므로 실험적으로 8×8이 성능과 구현의 용이성간 타협점으로 선택되었다.
DCT 기반 부호화 알고리즘은 도 2에 도시된 바와 같이, 각각의 영상을 블록 단위로 분할을 한 후에 블록별로 DCT를 적용하고, 양자화를 한 후 지그재그 스캔, 가변장 부호화 등의 엔트로피 코딩 순으로 실행된다.
도 2를 참조하면, DCT기반 엔코더(210)는 DCT(211)와 양자화기(212), 엔트로피 엔코더(213)로 이루어져 8x8 DCT블럭을 입력받아 압축된 데이터를 출력하고, DCT기반 디코더(220)는 엔트로피 디코더(221), 역양자화기(222), 역이산여현 변환기(223)로 이루어져 압축된 데이터를 입력받아 8x8 DCT 블록을 재생한다. 즉, DCT 방식의 기본 구조는 공간적으로 높은 상관도를 가지면서 배열되어 있는 데이터를 직교 변환에 의하여 저주파 성분으로부터 고주파 성분에 이르기까지 여러 주파수 성분으로 나누어 성분별로 달리 양자화하는 것이다.
이러한 DCT 연산을 식으로 나타내면 다음 수학식1 및 수학식2와 같다. 수학식1은 8×8 DCT 연산을 나타낸 것이며, 수학식2는 8×8 IDCT(Inverse DCT)의 연산을 나타낸 것이다.
도 3은 Lena 이미지로 DCT 연산을 수행하는 절차를 도시한 도면으로서, (가)는 Lena 영상으로부터 8x8 DCT블록을 형성하는 개념을 나타내고, (나)는 8x8 DCT블록의 픽셀값을 나타낸 예이며, (다)는 (나)를 DCT 변환한 값을 나타낸 예이며, (라)는 (다)를 양자화한 예를 나타낸 도면이다.
도 3을 참조하면, DCT의 계수 F(u,v)는 영상 블록의 주파수 성분을 나타내며, (0,0)은 영상의 DC 성분을 나타내며, 그 외의 나머지는 AC 성분을 나타낸다. DC 성분에서 멀어질수록 높은 주파수 성분을 가지게 되며, 대부분의 영상 블록에서는 작은 범위로 인해 픽셀의 값이 크게 변하지 않는다. 주파수 성분 즉, DCT 계수로 보면 고주파 성분이 작다는 것을 의미한다. 다시 말하면 DCT 계수가 DC 성분 근처에 몰리게 됨으로써 DCT는 대부분의 에너지가 저주파수 영역의 DC 값에 집중되어 압축 효과를 높일 수 있도록 해준다.
또한 영상의 인지성에 의해 고주파 계수는 영상의 세밀한 부분을 나타내므로, 이 부분의 약간의 손상은 전체 화질에 많은 영향을 끼치지 않으므로, DCT 계수를 주파수 별로 다른 값으로 양자화하는데 저주파 성분은 작은 값으로 양자화하여 세밀한 값으로 부호화하며, 상대적으로 고주파 성분으로 갈수록 큰 값으로 양자화하여 약간의 손실로 압축을 극대화한다. 이러한 양자화를 통한 DCT 계수는 더욱더 고주파 성분에서 작은 값을 가지게 되며, 가장 높은 계수 근처의 계수 값들은 대부분의 많은 값들이 0의 값을 가지게 된다. 이러한 계수를 순서대로 전송하는 것보다 주파수 값의 순서대로 읽게 되면, 한 블록에서 뒤쪽의 값들은 연속적인 0의 값이 나올 확률이 높아지게 될 것이다. 따라서 도 4에 도시된 바와 같은 순서로 읽게 되면, 0이 연속해서 나올 확률이 높아지게 된다. 이 방법을 지그재그 스캔이라고 하며, 이러한 0의 연속적인 값을 가변장 부호화하여 압축률을 높일 수 있다.
2. 비트플레인 부호화(단계 S6, S7)
비트 플레인의 기본 개념은 멀티 레벨의 영상을 2진 영상의 집합으로 분해하는 것으로, 분해된 각 2진 영상에 압축 기술을 적용하는 것이다.
m 비트 그레이 스케일(gray-scale) 영상의 그레이 레벨(gray-level)은 베이스(base)가 2인 다항식의 형태로 다음 수학식 3과 같이 나타낼 수 있다.
이러한 특성에 기초하여 영상을 2진 영상 집합으로 분할하는 간단한 방법은 다항식의 m개의 계수를 m개의 1비트인 비트 플레인으로 구분하는 것이다. 0차 비트 플레인은 각 픽셀의 a0 비트로 이루어지고, (m-1)차 비트 플레인은 am-1 비트 또는 계수를 포함한다. 일반적으로 각 비트 플레인은 0에서부터 m-1까지 숫자가 매겨지고 픽셀을 원 영상의 각 픽셀로부터 적절한 비트의 값이나 다항식 계수와 같이 놓음으로써 구성된다.
이 2진 영상 분할은 그레이 스케일 영상으로부터의 비트 플레인으로 MSB(the most significant bit plane)에서 LSB(the least significant bit plane)까지 움직이므로 상당히 랜덤하게 된다. 그렇기에 이 방법의 단점은 그레이 레벨(gray-level)에서의 약간의 변화가 비트 플레인에서는 중요한 영향을 미칠 수 있다는 점이다. 예를 들어, 세기(intensity)가 127(01111111)인 픽셀이 세기가 128(10000000)인 픽셀과 인접해 있을 때, 우연히 모든 비트 플레인이 대응하는 각 비트가 0에서 1로 혹은 1에서 0으로의 변화가 일어난다면 두 2진 부호 127과 128은 최상위 비트가 서로 달라 비트 플레인 127은 이웃 픽셀 값이 1인 0의 값의 픽셀을 포함하고, 이점에서 0에서 1(또는 1에서 0)로의 변이를 만들게 된다.
이러한 비트 플레인의 문제점을 완화시키는 다른 재구성 방법으로는 m 비트 그레이 부호에 의해 영상을 표현하는 것이다. m 비트 그레이 부호 gm-1gm-2...g2 g1g0 는 수학식 3의 다항식에 대응하고, 이는 다음 수학식 4 및 5로 계산될 수 있다.
여기에서 는 Exclusive OR를 나타낸다. 따라서 그레이 레벨의 작은 변화는 모든 m 비트 플레인에 영향을 적게 미친다. 예를 들어, 그레이 레벨 7과 8이 인접할 때 다음 표 1을 참고하여 보면, 7과 8에 대응하는 그레이 코드가 차례로 0100과 1100이므로, 단지 한 비트 플레인만이 0에서 1로 바뀌었음을 알 수 있다. 이처럼, 비트 플레인을 그레이 코드로 변환하여 사용함으로써 비트 전이의 에러로 인해 영상의 변화가 크게 나는 것을 막을 수 있다. 또한 영상의 화소 값의 주변은 비슷한 평균값을 가지게 되는데, 이는 그레이 코드로 변환 시 각 비트 플레인이 비슷한 정보를 가지게 되어 경계나 윤곽을 추출해 내는데 용이하게 된다.
gray-level bit-plane gray code
0 0000 0000
1 0001 0001
2 0010 0011
3 0011 0010
4 0100 0110
5 0101 0111
6 0110 0101
7 0111 0100
8 1000 1100
한편, 본 발명에 따른 계층적 DCT 부호화는 일반적인 DCT 기반의 부호화와 같이 8×8의 블록 DCT 변환을 수행한다. 주어진 8×8 DCT 블록에서 63개의 AC 계수를 지그재그 스캔 순서에 맞게 C1, C2,..,C63 이라고 한다. 이때 각 AC 계수를 8비트로 표현하면 도 5에 도시된 바와 같다.
도 5를 참조하면, DCT AC계수를 지그재그 스캔한 C1에서 C63이 8비트로 표현되어 배열되어 있는데, B1은 MSB가 되고, B8은 LSB가 된다. 일반적인 부호화 방식은 DCT를 한 후, 지그재그 스캔한 AC 계수인 C1,C2,C3,...C63 순으로 가변장 부호화를 하나, 본 발명에서는 지그재그 스캔한 AC 계수를 8 비트 플레인으로 바꾼 뒤, 그 비트 값들을 다시 지그재그 스캔하여 전송한다.
도 6은 도 5의 비트 플레인을 지그재그 스캔한 것을 나타낸 도면으로서, B1에서 B8로 갈수록 하위 LSB인 세부적인 정보를 포함하는 고주파 성분이 강해지는 것이며, C1에서 C63로 갈수록 AC 계수 성분이 고주파 성분이 된다. 이렇게 가로와 세로 방향으로 고주파 성분이 강해지는 것을 고려할 때, 그 중요도가 대칭적으로 같다고 본다면 일반적인 지그재그 스캔 방법이 각각 가로와 세로의 성분을 골고루 스캔할 수 있게 된다.
본 발명에 따른 비트 플레인 변환 결과를 살펴보면, 상위 비트 플레인인 MSB에서 하위 비트 플레인인 LSB로 내려갈수록 랜덤성이 강해지고, LSB의 경우 변화되는 값이 큰 값이 아니므로 그 중요도는 떨어지게 된다. 다음 표 2는 영상시험에 널리 사용되는 Lena 이미지를 비트 플레인으로 바꾸어 하위 비트 플레인인 LSB를 제거하고 전송하였을 때 얻어지는 결과 이미지의 MSE(Mean Squared Error)와 PSNR(Peak Signal to Noise Ratio) 값을 정리해 놓은 것이다.
Bit plane MSE PSNR
하위 1 bit 제거 0.25 54.19
하위 1,2 bit 제거 3.51 42.68
하위 1,2,3 bit 제거 17.49 35.70
하위 1,2,3,4 bit 제거 77.46 29.24
상기 표 2를 참조하면, 비트 플레인에서 하위1 비트를 제거했을 경우 MSE는 0.25이고 PSNR은 54.19 이고, 하위 1,2 비트를 제거했을 경우 MSE는 3.51이며 PSNR은 42.68인 것을 알 수 있다. 이와 같이 비트 플레인의 하위 비트인 LSB를 1 비트만 제거하고 보낸 Lena 이미지는 원 영상과의 차이를 느낄 수 없을 정도이고, 1에서 4까지의 하위 비트를 제거하여도 영상의 세부적인 섬세한 면이 제거되었기 때문에 번짐 현상이 나타날 뿐, 전체적인 영상 정보는 알아 볼 수 있는 것을 알 수 있다. 이렇게 DCT계수의 비트 플레인에서 LSB의 경우, 사람의 시각으로는 구별이 가지 않을 정도의 성분을 가지고 있음을 확인할 수 있다.
3. 단계 S8: 계층 부호화
본 발명에 따른 비트 플레인을 이용한 계층적 DCT 부호화 방식은 비트 플레인 변환과 계층적 DCT 방식을 이용하여 상위 비트 플레인을 포함한 계층을 우선 전송하게 함으로써 단일 계층 전송의 부호화보다 화질을 향상시킨 것이다.
계층 부호화(Layered coding)란 영상 정보를 여러 계층으로 나누어 중요도가 적은 정보의 경우 낮은 계층에 포함시키고, 중요도가 높은 정보는 높은 계층으로 나누어 전송하는 것으로, 데이터를 2개 이상의 계층으로 분리, 발생시키게 된다. 이 때 가장 기본이 되는 계층을 기본계층(base layer)이라 하고, 나머지 계층을 차례로 고급 계층1(enhancement layer1), 고급 계층2, ...라 한다. 고급 계층은 반드시 하위 계층의 데이터가 있어야 복호화가 가능하며, 기본 계층만으로 복호화했을 경우에 비해 공간적, 시간적으로 해상도가 좋다.
한편, 공간적으로 높은 상관도를 가지면서 배열되어 있는 데이터는 DCT를 통해 저주파 성분과 고주파 성분에 이르기까지 여러 주파수 성분의 DCT 계수로 나타낼 수 있다. 이때 각 픽셀이 주변 픽셀과 비슷한 값을 가지는 공간 중복성에 의해 주파수 영역에서는 저주파수 대역에 몰리게 되면서 AC 계수들은 DC 성분 근처에 집중되게 된다. 저주파 성분은 평균적 특성을 가지며 고주파 성분은 세부적인 특성을 가지고 있어, 저주파 성분이 가진 평균적 특성은 영상 복원 시에 필요한 기본적인 정보가 되고 고주파 성분은 세부적인 화질 향상을 가져올 수 있는 세밀한 정보가 된다. 세밀한 부분의 정보가 약간 손상되더라도 전체 화질에는 많은 영향을 끼치지 않으므로, 지그재그 코딩 시에 기본적인 정보와 세부적인 정보로 계층을 나누어 전송할 수가 있다.
도 7은 본 발명에 따라 DCT 계수를 중요도에 따라 몇개의 집합(significant DCT coefficient sets)으로 구분하여 계층적으로 전송한 예다. 이 방식의 기본 구조는 DCT 계수를 여러 주파수 성분의 계층으로 나누어 전송하는 방식이다. 블록으로 나누어 DCT를 한 후에 DCT 계수의 지그재그 스캔 시에 고주파 성분은 제거하고, 나머지 계수는 5개의 계층 집합(layers set)으로 나누어 저주파 성분 계층에 높은 우선 순위를 두어 전송하고, 나머지 고주파 성분을 계층별로 나누어 전송한다.
도 7의 경우 16×16 블록의 DCT 계수를 5개의 DCT 계수 집합(DCT coefficient sets)으로 나눈 후, 이들 계수집합(layered coefficient sets)으로 계층을 나누어 지그재그 스캔하여 전송한다. 예를 들어, C21의 계수까지 스캔을 해서 전송하는 경우, 21개의 8비트이므로 168비트를 코딩하게 되므로 제안한 방식인 비트 플레인으로 바꾸어 스캔하게 되면, 지그재그 스캔이 168비트가 될 때까지 지그재그 스캔을 한 후에 나머지 스캔되지 못한 LSB의 경우 제로(0)로 패딩을 해준다. 이렇게 해주면 C21의 LSB보다 더 하위 계수의 MSB까지 스캔하게 되어 상위 계수의 세밀한 정보인 LSB는 전송되지 못하더라도 하위 계수의 전체적인 영상 정보인 MSB가 전송되어 C21까지 스캔하여 전송하는 일반적인 코딩 방식보다 더 나은 화질의 결과를 보여준다.
이와 같이 본 발명에 따라 계층적 DCT 부호화를 Lena 이미지에 대해 적용하여 DCT 계수를 계수집합으로 나누어 전송을 해보았을 때의 결과는 다음 표 3과 같다.
DCT coefficient MSE PSNR
Low Res Coeffs(21) 155.36 26.22
Med Res Coeffs(45) 83.18 28.93
Med-High Res Coeffs(91) 37.93 32.34
High Res Coeffs(151) 15.47 36.23
상기 표 3은 계층적 DCT부호화로 얻은 이미지의 MSE와 PSNR 값으로 정리해 놓은 것으로서, 기본계층(Low Res Coeffs)의 경우 MSE가 155.36이고 PSNR이 26.22 dB인 것을 알 수 있다.
이와 같이 계층 부호화하여 전송 결과 이미지를 살펴보면, 고주파 성분을 제거하고 저주파 성분만을 보낸 Lena 이미지는 영상의 세부적인 면이 제거되었기 때문에 영상의 선 부분에서 번짐 현상이 나타나게 되나, 전체적인 영상의 정보는 알아 볼 수 있을 정도이며 섬세한 면이 조금 제거되었을 뿐이며 고주파 성분을 좀더 보낸 Lena 이미지의 경우 원 영상과의 차이는 눈으로 구별이 가지 않을 정도가 된다. 이렇게 사람의 시각으로는 구별이 가지 않을 정도의 고주파 성분을 제거하고 저주파 성분을 우선으로 보냄으로써 전송되는 데이터의 양을 줄일 수 있다.
이어서, 본 발명에 따른 비트 플레인을 이용한 계층화 DCT방법을 구체적으로 적용한 예를 설명하면 다음과 같다.
1) JPEG에 적용한 예
Lena 이미지로 통상의 계층적 DCT와 본 발명에서 제안한 방법을 JPEG에 적용시켜 보았을 때의 PSNR과 총 비트수는 다음 표 4와 같다.
# of coefficient 계층 DCT 본 발명의 방법 비교
PSNR Total bits PSNR Total bits EstimatedPSNR Layered DCTTotal bits
1 22.65 2099 21.92 1863 22.8 2099
2 23.67 2642 23.00 2238 24.0 2642
3 23.89 2905 23.43 2362 24.4 2905
4 24.81 3417 24.57 2978 25.0 3417
5 26.10 4011 24.99 3057 27.0 4011
6 26.61 4307 26.13 3940 27.2 4307
7 27.28 4665 26.20 3951 27.5 4665
8 27.79 4966 27.26 4345 27.9 4966
상기 표 4에는 기존의 DCT 계수를 늘려가며 계층적 DCT 방식과, 본 발명에 따른 방식인 DCT 계수의 비트 플레인 변환을 통한 지그재그 코딩 방식으로 나누어져 있다. 두 결과를 살펴보면, 본 발명에 따른 방식의 경우가 PSNR과 총 비트수가 계층적 DCT 방식에 비해 떨어지나, 계층적 DCT 방식의 코딩된 비트수만큼 제안된 방식에서 코딩된다고 가정하고 PSNR 값을 예측해 보았을 때, 조금 더 나은 결과를 얻을 수 있다.
2) H.263에 적용한 예
본 발명에서 제안하는 방법의 시뮬레이션을 위해 초저속 통신망을 이용한 비디오 서비스에서 동영상 정보를 압축하기 위한 표준인 H.263을 사용하였고, QCIF(176x144) 포맷의 Suzie 시퀀스 50 프레임을 사용하여 시험하였다. 각 DCT 계수를 계층적으로 나누어 일반적인 지그재그 스캔 방식과 AC 계수를 지그재그 스캔한 방식으로 실험한 결과는 도 8a 내지 도 8f에 도시된 바와 같다.
도 8a 내지 도 8f에서 횡축은 프레임(Frame)을 나타내고 종축은 PSNR을 나타내며, 도시된 그래프에서 실선은 DCT방식을 나타내고 점선은 본 발명에 따라 AC계수를 지그재그 스캔한 방식을 나타낸다. 도 8a는 1개의 AC계수, 도 8b는 2개의 AC 계수를, 도 8c는 3개의 AC계수를, 도 8d는 4개의 AC계수를, 도 8e는 5개의 AC 계수를, 도 8f는 6개의 AC계수를 각각 나타낸다.
이상에서 설명한 바와 같이, 본 발명에 따르면 영상의 세부 정보를 가진 고주파성분의 AC계수와 비트 플레인의 LSB의 경우에는 손상이 되어도 사람의 눈으로는 크게 인식할 수 없을 정도의 세밀함을 나타내는 정보임을 실험을 통해 확인하였다. 따라서 본 발명은 영상의 평균적이고 전체적인 정보를 가진 MSB 정보를 더 우선적으로 잘 전송할 수 있도록 하고, 저주파에서 고주파성분으로의 DCT 계수의 중요도에 따라 계층을 나누어 전송함으로써 계층을 나누지 않고 단일 계층으로 전송한 영상보다 영상의 화질이 개선된 효과를 제공한다.
도 1은 본 발명의 비트 플레인을 이용한 계층적 이산여현 변환방법을 도시한 순서도,
도 2는 본 발명에 적용되는 DCT 기반의 엔코더와 디코더를 도시한 도면,
도 3은 본 발명에 따라 8×8 DCT 블록의 DCT 과정을 도시한 도면,
도 4는 본 발명에 적용되는 DCT계수의 지그재그 스캔을 도시한 도면,
도 5는 본 발명에 따라 AC계수를 비트 플레인으로 나타낸 도면,
도 6은 본 발명에 따라 비트 플레인의 AC계수를 지그재그 스캔한 예,
도 7은 본 발명에 따른 계층 부호화를 위한 DCT 계수 집합의 예,
도 8a 내지 도 8f는 본 발명에 따른 결과를 나타낸 그래프들.
*도면의 주요부분에 대한 부호의 설명
210: DCT기반 엔코더 211: 이산여현 변환기
212: 양자화기 213: 엔트로피 엔코더
220: DCT기반 디코더 221: 엔트로피 디코더
222: 역양자화기 223: 역이산여현 변환기

Claims (5)

  1. 영상 데이터를 입력하는 제1 단계;
    소정 크기의 DCT블록을 형성하는 제2 단계;
    상기 DCT블럭에 대해 DCT 변환하는 제3 단계;
    상기 DCT변환된 계수를 소정 스케일로 양자화하는 제4 단계;
    상기 양자화된 AC DCT계수를 지그재그 스캔하는 제5 단계;
    상기 지그재그 스캔된 AC DCT 계수를 소정 비트의 비트 플레인으로 순차적으로 배열하는 제6 단계; 및
    상기 배열된 비트 플레인을 지그재그 스캔하는 제7 단계를 포함하는 것을 특징으로 하는 비트 플레인을 이용한 이산여현변환 방법.
  2. 제1항에 있어서, 상기 제7 단계는,
    상기 배열된 비트 플레인을 소정 수의 계수 집합으로 구분한 후 각 계수집합별로 지그재그 스캔하여 계층 부호화하는 것을 특징으로 하는 비트 플레인을 이용한 이산여현변환 방법.
  3. 제2항에 있어서, 상기 계층 부호화는 지정된 집합까지 지그재그 스캔을 한 후에 나머지 스캔되지 못한 LSB의 경우 제로로 패딩하는 것을 특징으로 하는 비트 플레인을 이용한 이산여현변환 방법.
  4. 제1항 또는 제2항에 있어서, 상기 DCT블록은 8x8 블록의 크기이고, AC 계수만 8비트 비트 플레인상에 순차적으로 배열하는 것을 특징으로 하는 비트 플레인을 이용한 이산여현변환 방법.
  5. 제1항 또는 제2항에 있어서, 상기 방법은 JPEG, H261, H263, MPEG 등에 적용한 것을 특징으로 하는 비트 플레인을 이용한 이산여현변환 방법.
KR10-2003-0015375A 2003-03-12 2003-03-12 비트 플레인을 이용한 계층적 이산여현 변환방법 KR100501815B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2003-0015375A KR100501815B1 (ko) 2003-03-12 2003-03-12 비트 플레인을 이용한 계층적 이산여현 변환방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2003-0015375A KR100501815B1 (ko) 2003-03-12 2003-03-12 비트 플레인을 이용한 계층적 이산여현 변환방법

Publications (2)

Publication Number Publication Date
KR20040080540A KR20040080540A (ko) 2004-09-20
KR100501815B1 true KR100501815B1 (ko) 2005-07-20

Family

ID=37365172

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2003-0015375A KR100501815B1 (ko) 2003-03-12 2003-03-12 비트 플레인을 이용한 계층적 이산여현 변환방법

Country Status (1)

Country Link
KR (1) KR100501815B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100586026B1 (ko) * 2005-03-25 2006-06-02 한국전자통신연구원 디지털 홀로그램 부호화 또는/및 복호화 장치 및 그 방법
CN114630125B (zh) * 2022-03-23 2023-10-27 徐州百事利电动车业有限公司 基于人工智能与大数据的车辆图像压缩方法与系统

Also Published As

Publication number Publication date
KR20040080540A (ko) 2004-09-20

Similar Documents

Publication Publication Date Title
JP5107495B2 (ja) 品質ベースのイメージ圧縮
JP4113114B2 (ja) Golomb−riceコーディングを使用するdct圧縮
US5952943A (en) Encoding image data for decode rate control
JP3699425B2 (ja) 適応ブロック・サイズによる画像圧縮方法およびシステム
KR100880039B1 (ko) 웨이블릿 기반 이미지 코덱에서의 부호화 이득을 달성하는방법 및 시스템
KR100809298B1 (ko) 플래그 인코딩 방법, 플래그 디코딩 방법, 및 상기 방법을이용한 장치
JP4365957B2 (ja) 画像処理方法及びその装置及び記憶媒体
US20040136457A1 (en) Method and system for supercompression of compressed digital video
EP1113672A2 (en) Quantization matrix for still and moving picture coding
US5831559A (en) Encoding/decoding video signals using multiple run-val mapping tables
US6912318B2 (en) Method and system for compressing motion image information
KR20030036129A (ko) 분산 기반의 적응형 블록 사이즈 dct 이미지 압축
JP2005507184A (ja) ゴロム・ライスを使用する無損失フレーム内符号化
US7177356B2 (en) Spatially transcoding a video stream
EP0519962A1 (en) DIGITAL IMAGE CODING USING RANDOM IMAGE FRAME ANALYSIS.
JP2014519215A (ja) データをロッシー圧縮符号化する方法および装置、および、データを再構築する対応する方法および装置
JP2005502235A (ja) ディジタル画像および音声データを無損失に復号化するためのシステムおよび方法
JP2891773B2 (ja) ディジタル画像シーケンスを処理する方法および装置
JP2004528791A (ja) インターフレーム符号化方法および装置
JP3234807B2 (ja) デコード方法
KR100801967B1 (ko) 문맥 기반 적응적 가변 길이 부호화 인코더 및 디코더,문맥 기반 적응성 가변 길이 부호화하는 방법과 복호화하는방법 및 이를 이용한 동영상 전송 시스템.
Li et al. A high performance image compression technique for multimedia applications
KR100501815B1 (ko) 비트 플레인을 이용한 계층적 이산여현 변환방법
AU2002230101A2 (en) Moving picture information compressing method and its system
JP3853708B2 (ja) デジタル画像符号化装置および符号化方法ならびにプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee