KR20090004362A - 웨이블릿 변환을 이용한 영상 압축 장치 - Google Patents

웨이블릿 변환을 이용한 영상 압축 장치 Download PDF

Info

Publication number
KR20090004362A
KR20090004362A KR1020070123767A KR20070123767A KR20090004362A KR 20090004362 A KR20090004362 A KR 20090004362A KR 1020070123767 A KR1020070123767 A KR 1020070123767A KR 20070123767 A KR20070123767 A KR 20070123767A KR 20090004362 A KR20090004362 A KR 20090004362A
Authority
KR
South Korea
Prior art keywords
code blocks
difference
code
differential
coefficients
Prior art date
Application number
KR1020070123767A
Other languages
English (en)
Other versions
KR101421231B1 (ko
Inventor
최혜자
문주희
Original Assignee
세종대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 세종대학교산학협력단 filed Critical 세종대학교산학협력단
Publication of KR20090004362A publication Critical patent/KR20090004362A/ko
Application granted granted Critical
Publication of KR101421231B1 publication Critical patent/KR101421231B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/635Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

이산 웨이블릿 변환을 이용한 영상 압축장치를 제공한다. 상기 장치는 수평방향, 수직방향, 및 시간방향인 세방향에서 주파수 대역 필터를 적용시켜 영상데이터를 복수의 서브밴드로 분해하는 이산 웨이블렛 변환부(Discrete Wavelet Transform), 상기 복수의 서브밴드 각각에 속하는 복수의 코드블록(code block)의 계수를 양자화하는 스칼라 양자화부, 상기 복수의 코드블록에 대해 상기 세방향으로 상기 복수의 코드블록내의 계수간의 차이값인 차분치(differential value)를 구하고, 상기 차분치로부터 얻은 상기 세방향의 차분 코드블록에 대해 각각 적응적 컨텍스트(context)를 적용하여 하나의 프레임 그룹에 적용되는 차분 방향을 결정하는 차분 방향 결정부, 및 상기 복수의 코드블록과 상기 차분 코드블록을 임베디드(embedded) 비트스트림(bit stream)으로 코딩하기 위해서 상기 컨텍스트 기반의 산술부호화를 수행하는 엡콧(EBCOT) 코딩부를 포함한다. 각 코드블록이 속한 서브밴드의 특성에 따라 차분 코드블록을 구하고, 적응적 컨텍스트를 이용하여 압축된 비트스트림을 전송할 수 있다. 또한 저주파에 편중되는 시간성분에 대한 에너지를 활용함으로써 보다 높은 압축효율을 얻을 수 있다.
웨이블릿, EBCOT 코딩, 컨텍스트(context), 차분 코드블록(code block), 차 분치, DWT, 영상데이터, 압축(compression)

Description

웨이블릿 변환을 이용한 영상 압축 장치{Apparatus for Compressing Video using Wavelet Transform}
본 발명은 영상 압축에 관한 것으로서, 보다 상세하게는 웨이블릿 변환을 이용한 영상 압축 장치에 관한 것이다.
최근 인터넷과 멀티미디어 기술이 발전함에 따라 멀티미디어 응용분야에서 영상정보가 중요한 정보전달매체로 부각되고 있다. 그에 따라 유선통신 혹은 무선통신상으로 송수신되는 영상 데이터의 양이 증가하고 있는 반면, 저장장치의 용량은 한정되어 있고 통신상에서의 데이터 전송률에도 한계가 있다. 따라서 영상데이터의 압축 기술은 필수적이며 중요한 기술로 인식된다.
프랙탈 압축 방식(Iterated Function System; IFS)은 영상데이터를 축소변환의 변수들만으로 표현함으로써 정보량을 줄이는 방법이다. 프랙탈 압축 방법은 영상의 닮음성의 관계를 변환식으로 표현하는 특징이 있으며, 복호화 과정이 빠르고 간단하고, 재생이 주로 요구되는 전자사전의 압축에 적합하다.
JPEG(Joint Photographic Expert Group) 압축 방식은 정지 영상 압축용 국제 표준 방식으로 지난 10여 년간 많은 응용분야에서 이용되어 왔다. JPEG 압축 방식 은 컬러정지영상을 약 20:1 정도로 압축했을 때 화질 열화가 적은 DCT(discrete Cosine Transform) 변환방식을 이용하는 방식으로서 영상압축 및 통신분야에서 많이 이용되고 있다. 그러나, JPEG 압축 방식은 영상 데이터의 압축률이 높아질수록 블록화현상이 발생하는 등의 문제를 가진다.
기존의 JPEG 압축 방식보다 고품질 압축 및 다양한 기능을 요구하는 사용자들의 요구를 해결할 수 있는 새로운 영상압축 방식의 국제표준이 채택되었는데 이것이 JPEG2000 압축방식이다. JPEG2000은 웨이블릿(Wavelet) 기반의 영상압축방식으로서 영상을 고비율로 압축하며, 기존의 JPEG 압축방식에 비해 왜곡율이 낮고 특정부분의 영상품질이 우수하여 데이터통신에 주로 활용될 수 있다.
JPEG2000 압축방식의 핵심 알고리즘 EBCOT(Embedded Block Coding with Optimized Truncation)는 공간상 중복정보만을 사용하여 압축하기 때문에 시간적으로 높은 상관성을 가지는 3D영상을 압축하는 경우 높은 압축효율을 기대하기 어렵다. 또한 최근 연구되고 있는 움직임 예측/보상이 수반된 DWT(Discrete Wavelet Transform)변환을 이용한 3D영상 압축방식은 부호화시 움직임 정보를 이용하지만 움직임이 거의 없는 영상의 경우 움직임 벡터에 필요 이상의 비트를 할당하고 있기 때문에 여전히 높은 압축효율을 기대하기 어렵다.
따라서 움직임 추정을 수행할 필요없이 시간정보와 공간정보를 이용하는 영상 압축 장치 및 방법이 필요하다.
본 발명의 기술적 과제는 웨이블릿 변환을 이용한 영상 압축 장치를 제공함에 있다.
본 발명의 일 양태에 따르면 이산 웨이블릿 변환을 이용한 영상 압축장치를 제공한다. 상기 장치는 수평방향, 수직방향, 및 시간방향인 세방향에서 주파수 대역 필터를 적용시켜 영상데이터를 복수의 서브밴드로 분해하는 이산 웨이블렛 변환부(Discrete Wavelet Transform), 상기 복수의 서브밴드 각각에 속하는 복수의 코드블록(code block)의 계수를 양자화하는 스칼라 양자화부, 상기 복수의 코드블록에 대해 상기 세방향으로 상기 복수의 코드블록내의 계수간의 차이값인 차분치(differential value)를 구하고, 상기 차분치로부터 얻은 상기 세방향의 차분 코드블록에 대해 각각 적응적 컨텍스트(context)를 적용하여 하나의 프레임 그룹에 적용되는 차분 방향을 결정하는 차분 방향 결정부, 및 상기 복수의 코드블록과 상기 차분 코드블록을 임베디드(embedded) 비트스트림(bit stream)으로 코딩하기 위해서 상기 컨텍스트 기반의 산술부호화를 수행하는 엡콧(EBCOT) 코딩부를 포함한다.
본 발명의 다른 양태에 따르면, 이산 웨이블릿 변환을 이용한 영상 압축방법을 제공한다. 상기 방법은 수평방향, 수직방향, 및 시간방향인 세방향에서 주파수 대역 필터를 적용시켜 영상데이터를 복수의 서브밴드로 분해하는 단계, 상기 복수 의 서브밴드 각각에 속하는 복수의 코드블록의 계수를 양자화하는 단계, 상기 복수의 코드블록에 대해 상기 세방향으로 각각 상기 복수의 코드블록내의 계수간의 차이값인 차분치를 구하는 단계, 상기 차분치로부터 얻은 상기 세방향상의 차분 코드블록에 대해 각각 적응적 컨텍스트를 적용하여 하나의 프레임 그룹에 적용되는 차분 방향을 결정하는 단계, 및 상기 복수의 코드블록과 상기 차분 코드블록을 비트스트림으로 코딩하기 위해서 상기 컨텍스트 기반의 산술부호화를 수행하는 단계를 포함한다.
각 코드블록이 속한 서브밴드의 특성에 따라 차분 코드블록을 구하고, 적응적 컨텍스트를 이용하여 압축된 비트스트림을 전송할 수 있다. 또한 저주파에 편중되는 시간성분에 대한 에너지를 활용함으로써 보다 높은 압축효율을 얻을 수 있다.
이하, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있을 정도로 상세하게 설명하기 위하여, 이 발명의 바람직한 실시예를 첨부된 도면을 참조로 설명하기로 한다. 그러나 본 실시예가 이하에서 개시되는 실시예에 한정할 것이 아니라 서로 다양한 형태로 구현될 것이며, 단지 본 실시예는 본 발명의 개시가 완전하도록 하며, 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이다. 도면에서의 요소의 형상등은 보다 명확한 설명을 강조하기 위하여 과장되게 표현된 부분이 있을 수 있으며, 도면상에서 동일 부호로 표시된 요소는 동일 요소를 의미한다.
도 1은 JPEG2000 기반의 영상 압축장치를 나타내는 블록도이다.
도 1을 참조하면, JPEG 2000 기반의 영상 압축장치(100)는 입력 RGB(Red, Green, Blue) 신호 각각에 대한 DC 옵셋(DC offset)처리를 수행하는 전처리부(111,112,113), 상기 전처리된 RGB 신호를 YUV 신호로 변환하는 칼라 변환부(Color Transformation, 120), 상기 YUV 신호 각각에 대하여 이산 웨이블릿 변환(Discrete Wavelet Transform; DTW)을 수행하는 웨이블릿 변환부(131,132,133), 상기 웨이블릿 변환된 각각의 YUV 신호인 웨이블릿 변환 계수에 대한 양자화를 수행하는 양자화부(Q: Quantization, 141,142,143), 상기 양자화된 각각의 양자화 데이터에 대해서 엔트로피 부호화(Entropy Coding)를 각각 수행하는 엔트로피 부호화부(151,152,153), 및 상기 엔트로피 부호화부(151,152,153)에서 출력된 YUV 신호를 비트 스트림으로 구성하는 비트 스트림 패킷화부(Bit Stream Packetizer, 160)를 포함한다.
전처리부(111,112,113)는 입력된 RGB 각각의 영상신호에 대하여 DC 옵셋(DC offset) 처리를 수행한다. DC 옵셋 처리된 RGB 신호는 칼라 변환부(120)에서 YUV로 칼라 변환이 이루어진 후에 다음과 같은 각각의 개별 압축 부호화 프로세스를 거치게 된다. 즉, 칼라 변환부(120)에서 상기 RGB 신호를 YUV 신호로 변환하고, 이 YUV 신호 각각에 대해서 다음과 같은 개별 압축 프로세스를 거치게 된다.
제1 웨이블릿 변환부(131)는 Y신호에 대해서 수평, 수직과 시간적 방향에 저주파와 고주파 대역 필터를 적용시켜 영상신호를 8개의 서브밴드로 분해하는 이산 웨이블릿 변환(Discrete Wavelet Transform)을 수행한다. 제2 웨이브릿 변환 부(132)는 U신호에 대해서 이산 웨이블릿 변환을 수행하고, 제3 웨이블릿 변환부(133)는 V신호에 대해서 이산 웨이블릿 변환을 수행한다.
도 2는 2레벨 몰렛(Mallat) 웨이블릿 변환된 3D 영상의 각 서브밴드를 나타내는 블록도이다.
도 2를 참조하면, H(High)밴드는 특정 방향(수직방향, 수평방향, 시간방향 중 어느 하나)으로 고주파 대역 필터를 적용하는 밴드를 나타내고, L(Low)밴드는 특정 방향으로 저주파 대역 필터를 적용하는 밴드를 나타낸다. 예를 들어, LHL 밴드는 수평방향으로 저주파 대역 필터를 적용하고, 수직방향으로 고주파 대역 필터를 적용하며, 시간방향으로 저주파 대역 필터를 적용하는 밴드를 나타낸다. 웨이블릿 변환하고 양자화가 수행된 각 서브밴드는 작은 3D 코드블록(code block) 단위로 나뉜다.
코드블록의 계수는 XY방향으로만 스캔(scan)되고 컨텍스트(context)를 이용하여 산술부호화되기 때문에 움직임이 적은 영상의 경우 저주파에 많이 몰리게 되는 시간적 성분에 대한 에너지를 활용할 수 없다.
다시 도 1을 참조하면, 이산 웨이블릿 변환의 결과로 각각의 웨이블릿 변환부(131,132,133)에서는 웨이블릿 변환 계수가 출력되며, 제1 웨이블릿 변환부(131)의 출력은 제1 양자화부(141)에 입력되고, 제2 웨이블릿 변환부(132)의 출력은 제2 양자화부(142)에 입력되며, 제3 웨이블릿 변환부(133)의 출력은 제3 양자화부(143)에 입력된다.
제1 양자화부(141)는 상기 제1 웨이블릿 변환부(131)의 출력인 웨이블릿 변 환 계수를 입력받아 이를 양자화하여 제1 엔트로피 부호화부(151)에 입력하고, 제1 엔트로피 부호화부(151)는 상기 제1 양자화부(141)에서 출력된 양자화 데이터를 엔트로피 부호화하여 출력하며, 부호화된 Y신호는 비트 스트림 패킷화부(160)에 입력된다. 제2 양자화부(142)는 상기 제2 웨이블릿 변환부(132)의 출력-웨이블릿 변환 계수를 입력받아 이를 양자화하여 제2 엔트로피 부호화부(152)에 입력하고, 제2 엔트로피 부호화부(152)는 상기 제2 양자화부(142)에서 출력된 양자화 데이터를 엔트로피 부호화하여 출력하며, 부호화된 U신호는 비트 스트림 패킷화부(160)에 입력된다.
제3 양자화부(143)는 상기 제3 웨이블릿 변환부(133)의 출력-웨이블릿 변환 계수를 입력받아 이를 양자화하여 제3 엔트로피 부호화부(153)에 입력하고, 제3 엔트로피 부호화부(153)는 상기 제3 양자화부(143)에서 출력된 양자화 데이터를 엔트로피 부호화하여 출력하며, 부호화된 V신호는 비트 스트림 패킷화부(160)에 입력된다.
비트 스트림 패킷화부(160)는 상기 엔트로피 부호화부(151,152,153)에서 출력된 각각의 신호를 입력받아 이를 비트 스트림으로 구성하여 출력한다.
도 3은 본 발명의 일 예에 따른 영상 압축 장치를 나타내는 블록도이다.
도 3을 참조하면, 영상 압축장치(200)는 이산 웨이블렛 변환부(DWT, 210), 스칼라 양자화부(220), 차분 방향 결정부(230), 및 EBCOT 코딩부(240)를 포함한다. 이산 웨이블렛 변환부(210)는 입력된 영상 데이터를 복수의 서브밴드(subband), 복수의 코드블록을 포함하는 계층적 조직으로 분해한다.
이산 웨이블렛 변환부(210)는 각 코드블록의 계수(또는 웨이블릿 변환 계수(coefficient))들은 스칼라 양자화부(220) 및 차분 방향 결정부(230)로 입력한다. 스칼라 양자화부(220)는 코드블록 계수를 입력받아 양자화하여 EBCOT 코딩부(240)로 보낸다.
차분 방향(differentiating direction) 결정부(230)는 코드블록이 속한 일부 서브밴드의 특성에 따라 상기 코드블록의 계수들에 대해 수평(X), 수직(Y) 및 시간(T) 방향으로 각각 차분치(differential value)를 구한다. 상기 일부 서브밴드는 저주파 영역이 될 수도 있고, 고주파 영역이 될 수도 있다. 이하에서는 상기 일부 서브밴드는 저주파 영역이라 가정하여 설명하나, 고주파 영역이 될 수 있음은 물론이다.
차분 방향 결정부(230)는 상기 저주파영역에서 구해진 각 방향별 차분치와 컨텍스트의 스캔방향으로부터 하나의 프레임 그룹(Group Of Frame;GOF)에 적용되는 가장 효율적인 차분 방향을 결정한다. 프레임 그룹은 일정한 길이의 프레임 시퀀스(sequence)를 하나의 그룹으로 지정한 것으로서, 하나의 프레임 그룹에 해당하는 프레임이 전부 읽힌 다음 시간방향 상의 웨이블릿 변환이 수행된다. 예를 들어, 16개 프레임 또는 32개 프레임 단위로 하나의 프레임 그룹이 지정될 수 있다. 부호기와 복호기에서는 3차원 영상을 프레임 그룹 단위로 따로따로 독립적으로 처리를 수행한다. 3차원 영상은 컴퓨터 혹은 네트워크상에서 전송될 때 저장, 지연 또는 계산 복잡도에 의해 전송제한을 받는다. MPEG 등에서 3차원 영상은 상기 일정한 수의 픽쳐인 픽쳐그룹(Group of Pictures;GOP) 단위로 압축되는데, 프레임 그룹(GOF)은 상기 픽쳐그룹과 유사한 개념이다.
차분 방향은 복수의 코드블록에 있어서, 코드블록간의 차이를 나타내는 차분 코드블록을 생성하는데 기준이 되는 방향을 의미한다. 컨텍스트란 코드블록을 비트 평면 부호화하기 위해 비트 평면 단위로 부호화 대상 샘플과 주위 비트의 중요도 값에 따라 구성된 테이블 값들이다.
차분 방향 결정부(230)는 입력되는 저주파 영역에 속하는 코드블록 계수로부터 구한 차분치와 각 스캔방향에 따른 컨텍스트를 적용하여 전체 영상의 차분 방향을 결정하고, 결정된 전체 영상의 차분 방향을 EBCOT 코딩부(240)로 알려준다. 차분 방향과 차분 코드블록이라 표기된 용어는 제한이 아니며, 동일한 의미를 가지는 다른 용어로 대체될 수 있음은 물론이다. 차분치와 차분 코드블록을 구하는 방법, 컨텍스트의 스캔방향 및 전체 영상의 차분 방향을 결정하는 방법에 관하여는 후술된다.
EBCOT 코딩부(240)는 각 코드블록을 독립적인 임베디드(embedded) 비트 스트림으로 코딩하기 위해서 컨텍스트 기반의 산술부호화를 수행한다. EBCOT 코딩부(240)는 각 코드블록을 하나씩 독립적으로 부호화(encoding)할 수 있다.
이하에서 각 저주파 영역에서 코드블록의 각 방향별 차분치를 구하는 방법, 컨텍스트 스캔방향을 결정하는 방법 및 차분 방향을 이용하여 고주파수 영역의 차분 코드블록을 얻는 방법에 관하여 설명한다.
도 4는 저주파 밴드인 LLL밴드에 속하는 각 코드블록의 모든 계수들에 대해 각 방향별(X, Y, T)로 차분치를 구하는 방법을 설명하는 도면이다.
도 4를 참조하면, 제1 프레임(frame)을 기준으로 차분치를 구한다고 가정한다. 먼저, X방향으로 차분치를 구하면, 제1 프레임에서 1행 1열의 코드블록의 계수와 상기 1행 1열의 코드블록에 인접한 1행 2열의 코드블록의 계수와의 차이값으로부터 차분치 Δx1을 구할 수 있다. 동일한 방법으로, 1행 2열의 코드블록의 계수와 상기 1행 2열의 코드블록에 인접한 1행 3열의 코드블록의 계수의 차이값으로부터 차분치 Δx2를 얻을 수 있다. 즉, 1행 N-1열의 코드블록 계수와 1행 N열의 코드블록의 계수의 차이값으로부터 차분치 ΔxN -1을 얻을 수 있다(N>1인 정수). 상기와 동일한 방법에 의해 m행 n열에 존재하는 코드블록의 계수에 관하여도 차분치를 구할 수 있다.
다음으로, Y 방향의 차분치를 구하면, 제1 프레임에서 1행 1열의 코드블록의 계수와 상기 1행 1열의 코드블록에 인접한 2행 1열의 코드블록의 계수의 차이값으로부터 차분치 Δy1을 구할 수 있다. 동일한 방법으로, 2행 1열의 코드블록의 계수와 상기 2행 1열의 코드블록에 인접한 3행 1열의 코드블록의 계수의 차이값으로부터 차분치 Δy2를 얻을 수 있다. 즉, N-1행 1열의 코드블록 계수와 N행 1열의 코드블록의 계수의 차이값으로부터 차분치 ΔyN -1을 얻을 수 있다(N>1인 정수). 상기와 동일한 방법에 의해 m행 n열에 존재하는 코드블록의 계수에 관하여도 차분치를 구할 수 있다.
마지막으로, T 방향의 차분치를 구하면, 제1 프레임의 1행 1열 코드블록의 계수와 상기 제1 프레임의 1행 1열 코드블록에 인접한 제2 프레임의 1행 1열 코드블록의 계수의 차이값으로부터 차분치 ΔT1을 구할 수 있다. 동일한 방법으로, 제 2 프레임의 1행 1열의 코드블록의 계수와 상기 제2 프레임의 1행 1열 코드블록에 인접한 제3 프레임의 1행 1열의 코드블록의 계수의 차이값으로부터 차분치 ΔT2를 얻을 수 있다. 즉, 제 N-1 프레임의 1행 1열의 코드블록 계수와 제 N 프레임의 1행 1열의 코드블록의 계수의 차이값으로부터 차분치 ΔTN -1을 얻을 수 있다(N>1인 정수). 상기와 동일한 방법에 의해 m행 n열에 존재하는 코드블록의 계수에 관하여도 차분치를 구할 수 있다.
이러한 방식으로 구한 차분치들 Δx1,Δx2,...,ΔxN -1,Δy1,Δy2 ,...,ΔyN -1,ΔT1,ΔT2 ,...,ΔTN -1 각각을 하나의 코드블록 계수로 간주할 수 있는데, 이렇게 각 차분치들이 계수인 새로운 코드블록을 차분 코드블록이라 한다. 차분 코드블록은 저주파 영역인 LLL 밴드에 위치한 코드블록의 계수로부터 얻어진 것들이므로 전체 영상의 차분 방향으로 결정하는데 충분한 신뢰성이 보장된다. 왜냐하면 저주파 LLL밴드에 전체 영상에 대한 에너지가 가장 많이 편중되기 때문이다.
도 5A 내지 5C는 코드블록을 스캔하는 방향을 나타낸다. 여기서 코드블록은 전술된 차분 코드블록일 수도 있고, 차분치를 얻기 이전의 코드블록일 수도 있다.
도 5A는 각 프레임에서 얻어진 코드블록내에 스캔방향이 XY(수직수평방향)인 경우를 나타낸다. 즉, XY 스캔방향은 제1 프레임의 XY축을 우선하여 스캔(제1 경 로)하고, 제1 프레임의 모든 코드블록 계수들을 스캔한 경우 제2 프레임을 스캔(제2 경로)한다.
도 5B는 각 프레임에서 얻어진 코드블록내에 스캔방향이 TX(시간수평방향)인 경우를 나타낸다. 즉, TX 스캔방향은 제1 프레임 내지 제N 프레임의 1행을 우선하여 스캔(제3 경로)하고, 다음으로 제1 프레임 내지 제N 프레임의 2행을 스캔(제4 경로)하는 방식이다.
도 5C는 각 프레임에서 얻어진 코드블록내에 스캔방향이 TY(시간수직방향)인 경우를 나타낸다. 즉, TY 스캔방향은 제1 프레임 내지 제N 프레임의 1열을 우선하여 스캔(제5 경로)하고, 다음으로 제1 프레임 내지 제N 프레임의 2열을 스캔(제6 경로)하는 방식이다.
도 4에서와 같이 저주파영역에서 얻은 차분 코드블록과, 도 5A 내지 도 5C의 스캔방향에 따른 각 컨텍스트를 적용하여 비트스트림이 가장 짧은, 효율적인 성능을 나타내는 조합이 하나의 프레임 그룹에 적용되는 가장 효율적인 차분 방향으로 결정된다. 즉, LLL 밴드에 속한 코드블록들이 많이 선택된 차분 방향이 하나의 프레임 그룹에 적용되는 차분 방향으로 결정된다. 이하에서 결정된 하나의 프레임 그룹에 적용되는 차분 방향을 이용하여 저주파 영역뿐만 아니라 고주파 영역에 걸친 모든 서브밴드의 차분 코드블록을 구하는 방법에 관하여 설명한다.
하나의 프레임 그룹에 적용되는 차분 방향이 X인 경우, LLL, LHL, LHH, LHH 밴드(즉, X방향이 L인 밴드의 경우)에 속한 코드블록에 한하여 X 방향의 차분 코드 블록을 구한다. 하나의 프레임 그룹에 적용되는 차분 방향이 Y인 경우, LLL, HLL, LLH, HLH 밴드(즉, Y방향이 L인 밴드의 경우)에 속한 코드블록에 한하여 Y 방향의 차분 코드블록을 구한다. 하나의 프레임 그룹에 적용되는 차분 방향이 T인 경우, LLL, HLL, LHL, HHL 밴드(즉, T방향이 L인 밴드의 경우)에 속한 코드블록에 한하여 Y 방향의 차분 코드블록을 구한다. 차분치와 차분 코드블록을 구하는 방법은 도 4에서 설명한 바와 같다.
표 1은 본 발명의 영상 압축방식에 따른 효과와 기존의 정지영상 압축인 JPEG2000, 3D 웨이블릿 변환하여 XY방향 컨텍스트를 적용한 알고리즘, 그리고 적응적 컨텍스트를 적용한 알코리즘과 같은 다른 영상 압축 방식의 평균 PSNR(Peak Signal to Noise Ratio)성능을 비교한 표이다. PSNR이 클수록 성능이 우수하다.
영상
기법 Akiyo(QCIF_32장) Hall Monitor(QCIF_32장)
본 발명의 영상 압축방식 42.71 38.66
적응적 context 40.67 36.61
XY방향 context 36.36 32.73
JPEG2000 30.60 26.15
표 1을 참조하면, 무손실 압축시 움직임이 적은 Akiyo영상의 압축률이 카메라가 고정된 상황하에 빠르게 움직이는 Hall Monitord의 압축률보다 높다.
상술한 모든 기능은 상기 기능을 수행하도록 코딩된 소프트웨어나 프로그램 코드 등에 따른 마이크로프로세서, 제어기, 마이크로제어기, ASIC(Application Specific Integrated Circuit) 등과 같은 프로세서에 의해 수행될 수 있다. 상기 코드의 설계, 개발 및 구현은 본 발명의 설명에 기초하여 당업자에게 자명하다고 할 것이다.
이상 본 발명에 대하여 실시예를 참조하여 설명하였지만, 해당 기술 분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시켜 실시할 수 있음을 이해할 수 있을 것이다. 따라서 상술한 실시예에 한정되지 않고, 본 발명은 이하의 특허청구범위의 범위 내의 모든 실시예들을 포함한다고 할 것이다.
도 1은 JPEG2000 기반의 영상 압축장치를 나타내는 블록도이다.
도 2는 2레벨 몰렛(Mallat) 웨이블릿 변환된 3D 영상의 각 서브밴드를 나타내는 블록도이다.
도 3은 본 발명의 일 예에 따른 영상 압축 장치를 나타내는 블록도이다.
도 4는 저주파 밴드인 LLL밴드에 속하는 각 코드블록의 모든 계수들에 대해 각 방향별(X, Y, T)로 차분치를 구하는 방법을 설명하는 도면이다.
도 5A는 각 프레임에서 얻어진 코드블록간에 스캔방향이 XY(수직수평방향)인 경우를 나타낸다.
도 5B는 각 프레임에서 얻어진 코드블록간에 스캔방향이 TX(시간수평방향)인 경우를 나타낸다.
도 5C는 각 프레임에서 얻어진 코드블록간에 스캔방향이 TY(시간수직방향)인 경우를 나타낸다.

Claims (9)

  1. 수평방향, 수직방향, 및 시간방향인 세방향에서 주파수 대역 필터를 적용시켜 영상데이터를 복수의 서브밴드로 분해하는 이산 웨이블렛 변환부(Discrete Wavelet Transform);
    상기 복수의 서브밴드 각각에 속하는 복수의 코드블록(code block)의 계수를 양자화하는 스칼라 양자화부;
    상기 복수의 코드블록에 대해 상기 세방향으로 상기 복수의 코드블록내의 계수간의 차이값인 차분치(differential value)를 구하고, 상기 차분치로부터 얻은 상기 세방향의 차분 코드블록에 대해 각각 적응적 컨텍스트(context)를 적용하여 하나의 프레임 그룹에 적용되는 차분 방향을 결정하는 차분 방향 결정부; 및
    상기 복수의 코드블록과 상기 차분 코드블록을 임베디드(embedded) 비트스트림(bit stream)으로 코딩하기 위해서 상기 컨텍스트 기반의 산술부호화를 수행하는 엡콧(EBCOT) 코딩부를 포함하는 영상 압축장치.
  2. 제 1 항에 있어서,
    상기 컨텍스트는 상기 복수의 코드블록을 수직수평방향, 시간수직방향 및 시간수평방향 중 어느 하나의 방향으로 스캔하여 얻어지는, 영상 압축장치.
  3. 제 1 항에 있어서,
    상기 복수의 코드블록은 저주파밴드에 속하는, 영상 압축장치.
  4. 제 1 항에 있어서,
    상기 하나의 프레임 그룹에 적용되는 차분 방향은 LLL 밴드에 속한 코드블록이 가장 많이 선택된 차분 방향인, 영상 압축장치.
  5. 제 1 항에 있어서,
    상기 차분 방향 결정부는 상기 차분치로 구성되는 차분 코드블록을 생성하는, 영상 압축장치.
  6. 수평방향, 수직방향, 및 시간방향인 세방향에서 주파수 대역 필터를 적용시켜 영상데이터를 복수의 서브밴드로 분해하는 단계;
    상기 복수의 서브밴드 각각에 속하는 복수의 코드블록의 계수를 양자화하는 단계;
    상기 복수의 코드블록에 대해 상기 세방향으로 각각 상기 복수의 코드블록내의 계수간의 차이값인 차분치를 구하는 단계;
    상기 차분치로부터 얻은 상기 세방향상의 차분 코드블록에 대해 각각 적응적 컨텍스트를 적용하여 하나의 프레임 그룹에 적용되는 차분 방향을 결정하는 단계; 및
    상기 복수의 코드블록과 상기 차분 코드블록을 비트스트림으로 코딩하기 위 해서 상기 컨텍스트 기반의 산술부호화를 수행하는 단계를 포함하는 영상 압축방법.
  7. 제 6 항에 있어서,
    상기 컨텍스트는 상기 복수의 코드블록을 수직수평방향, 시간수직방향 및 시간수평방향 중 어느 하나의 방향으로 스캔하여 얻어지는, 영상 압축방법.
  8. 제 6 항에 있어서,
    상기 차분치로 구성되는 차분 코드블록을 생성하는 단계를 더 포함하는, 영상 압축방법.
  9. 제 6 항에 있어서,
    상기 복수의 코드블록은 저주파밴드에 속하는, 영상 압축방법.
KR1020070123767A 2007-07-04 2007-11-30 웨이블릿 변환을 이용한 영상 압축 장치 KR101421231B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20070066947 2007-07-04
KR1020070066947 2007-07-04

Publications (2)

Publication Number Publication Date
KR20090004362A true KR20090004362A (ko) 2009-01-12
KR101421231B1 KR101421231B1 (ko) 2014-07-24

Family

ID=40486831

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070123767A KR101421231B1 (ko) 2007-07-04 2007-11-30 웨이블릿 변환을 이용한 영상 압축 장치

Country Status (1)

Country Link
KR (1) KR101421231B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8718391B2 (en) 2009-09-22 2014-05-06 Samsung Electronics Co., Ltd. Random access image encoding system and method

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6828184B2 (ja) * 2016-12-19 2021-02-10 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. Gcliのエントロピー符号化のためのサブバンドに依存する予測の適応を使用する符号化または復号のための装置および方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100203291B1 (ko) * 1996-11-30 1999-06-15 윤종용 큐빅격자구조 벡터양자화를 이용한 웨이브렛변환 영상부호화/복호화시스템
CN101820537B (zh) * 2004-04-23 2013-04-03 住友电气工业株式会社 活动图像数据的编码方法、终端装置以及双向对话型系统
KR100697516B1 (ko) * 2004-10-27 2007-03-20 엘지전자 주식회사 3차원 웨이블릿 변환 기반의 동영상 코딩 방법
KR20060099137A (ko) * 2005-03-10 2006-09-19 엘지전자 주식회사 Jpeg 2000 기반 영상 부호화 장치 및 그 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8718391B2 (en) 2009-09-22 2014-05-06 Samsung Electronics Co., Ltd. Random access image encoding system and method

Also Published As

Publication number Publication date
KR101421231B1 (ko) 2014-07-24

Similar Documents

Publication Publication Date Title
US8588536B2 (en) Guaranteed-rate tiled image data compression
EP1529401B1 (en) System and method for rate-distortion optimized data partitioning for video coding using backward adaptation
US6895050B2 (en) Apparatus and method for allocating bits temporaly between frames in a coding system
KR101151114B1 (ko) 부대역들의 엔트로피 코딩을 위한 부대역 스캐닝 기술들
US5640420A (en) Variable length coder using two VLC tables
US20040136457A1 (en) Method and system for supercompression of compressed digital video
US20050036549A1 (en) Method and apparatus for selection of scanning mode in dual pass encoding
JP2009302638A (ja) 情報処理装置および方法
Xing et al. Arbitrarily shaped video-object coding by wavelet
Kumar et al. Performance Comparison of Jpeg, Jpeg XT, Jpeg LS, Jpeg 2000, Jpeg XR, HEVC, EVC and VVC for Images
JPH06189290A (ja) 1d/2d dctを用いた映像信号符号化装置
EP1618742A1 (en) System and method for rate-distortion optimized data partitioning for video coding using parametric rate-distortion model
KR101246115B1 (ko) 3차원 웨이블릿 기반 영상 부호화/복호화 방법 및 장치
KR101421231B1 (ko) 웨이블릿 변환을 이용한 영상 압축 장치
KR100366382B1 (ko) 동영상 부호화 장치 및 방법
JP6402520B2 (ja) 符号化装置、方法、プログラム及び機器
JPH08163561A (ja) 画像データ圧縮装置
Shavit et al. Group testing for video compression
Chebil et al. Pre-compression rate allocation for JPEG2000 encoders in power constrained devices
JPH09107548A (ja) 画像圧縮装置および画像圧縮方法
Marpe et al. High-performance wavelet-based video coding using variable block-size motion compensation and adaptive arithmetic coding
Ezhilarasan et al. A hybrid transformation technique for advanced video coding
Mishra et al. Compression of Video Data for Transmission Over Low Bandwidth Network
Al-Shaykh et al. Video Sequence Compression
Watanabe et al. Lossless JPEG2000 coding for lossy images and its applications

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180625

Year of fee payment: 5