KR20010077752A - 인간 시각 시스템의 특성을 반영한 퍼지 논리를 적용한이산 웨이브렛 변환을 이용한 영상 압축 방법 및 장치 - Google Patents

인간 시각 시스템의 특성을 반영한 퍼지 논리를 적용한이산 웨이브렛 변환을 이용한 영상 압축 방법 및 장치 Download PDF

Info

Publication number
KR20010077752A
KR20010077752A KR1020000005779A KR20000005779A KR20010077752A KR 20010077752 A KR20010077752 A KR 20010077752A KR 1020000005779 A KR1020000005779 A KR 1020000005779A KR 20000005779 A KR20000005779 A KR 20000005779A KR 20010077752 A KR20010077752 A KR 20010077752A
Authority
KR
South Korea
Prior art keywords
value
block
image data
image
entropy
Prior art date
Application number
KR1020000005779A
Other languages
English (en)
Other versions
KR100349518B1 (ko
Inventor
허영
황재정
박영운
Original Assignee
허영
박승우
(주)맥스소프트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 허영, 박승우, (주)맥스소프트 filed Critical 허영
Priority to KR1020000005779A priority Critical patent/KR100349518B1/ko
Publication of KR20010077752A publication Critical patent/KR20010077752A/ko
Application granted granted Critical
Publication of KR100349518B1 publication Critical patent/KR100349518B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/007Transform coding, e.g. discrete cosine transform

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Discrete Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

본 발명은 인간 시각 시스템의 특성을 반영한 퍼지 논리를 적용한 이산 웨이브렛 변환을 이용한 영상 압축 방법 및 장치에 관한 것이다. 상술한 본 발명은 이산 웨이브렛 변환(DWT)을 이용한 영상 압축 방법에 있어서, 각 블록 단위로 이산 웨이브렛 변환한 결과 산출된 영상 데이터의 변환 계수를 가진 블록들을 인간 시각 시스템(HVS)의 공간 주파수 민감도(spatial frequency sensitivity)를 효과적으로 이용하기 위해 재배열하는 단계, 재배열된 각 블록마다 화소의 이미지 데이터의 휘도(luminance)의 분산값을 산출하는 단계, 재배열된 각 블록마다 엔트로피를 산출하는 단계, 인간 시각 시스템(HVS)의 특성을 반영한 퍼지 논리 규칙을 적용하여 각 블록의 분산 값 및 엔트로피로부터 각 블록의 유사치(relevance)를 산출하는 단계, 산출된 유사치를 이용하여 각 블록의 가중 분산값을 산출하는 단계, 산출된 가중 분산값을 이용하여 각 블록의 양자화 간격을 산출하는 단계, 양자화 간격을 행렬의 구성 요소로 가진 양자화 행렬을 참조하여 이산 웨이브렛 변환 결과 얻어진 영상 데이터의 변환 계수를 양자화한 이미지 코드를 생성하는 단계 및 양자화된 이미지 코드를 엔트로피 부호화하여 압축된 영상 데이터를 생성하는 단계를 포함하여 이루어진다. 그러므로, 본 발명은 영상 데이터의 특성에 따라 적응적으로 이미지 샘플들을 양자화하여 중간 정도의 휘도값을 갖는 영역과 경계 부근 또는 강조하고자 하는 이미지의 관심 있는 미소 부분의 화질을 개선할 수 있을 뿐만 아니라 블록 와이즈 이산 여현 변환(BDWT)에 의해 512*512의 이미지 데이터를 JPEG의 이산 여현 변환기의 입력 이미지로도 사용할 수 있다.

Description

인간 시각 시스템의 특성을 반영한 퍼지 논리를 적용한 이산 웨이브렛 변환을 이용한 영상 압축 방법 및 장치{Image compressing method and device by using the discrete wavelet transform applied for fuzzy logics considering the human vision system}
본 발명은 영상 이미지의 웨이브렛 변환을 이용하는 영상 압축 방법 및 장치에 관한 것으로, 특히 인간 시각 시스템의 특성을 반영한 퍼지 논리를 적용한 이산 웨이브렛 변환을 이용한 영상 압축 방법 및 장치에 관한 것이다.
대부분의 영상 정보는 디지털 이미지의 형태로 저장되어지고 전송되어진다. 디지털 이미지는 영상이 복잡하거나 영상의 크기가 커지면 그 이미지의 저장 용량은 엄청나게 커지므로 파일로 저장할 경우 많은 기억용량을 차지하게 되고 영상을 전송할 때에는 많은 시간과 비용이 소요되게 된다. 따라서 정보로서의 가치가 떨어지게 되므로 이에 대한 저장 정보량을 압축시켜주는 기술, 영상 부호화 기술과 압축된 영상을 원 영상으로 복원해 주는 복호화 기술의 개발은 정보화 시대를 윤택하게 해주는데 있어서 절대 필수적이라 하지 않을 수 없다.
지금까지 개발된 영상 압축 기술은 JBIG, JPEG 및 MPEG 등이 있다. JPEG은 칼라(full-color) 및 계조도 정지 영상 신호의 압축을 위해 만들어진 표준으로 평균 압축 비율이 15:1 정도이다. MPEG은 동영상 압축의 표준으로 널리 사용되고 있다. 상기 JPEG이나 MPEG은 푸리에변환의 변형인 이산 코사인 변환(DCT, Discrete Cosine Transform) 이론을 근간으로 개발되어져 왔다. 상기 웨이브렛 변환을 이용한 압축 기술은 최근 급속도로 발전된 컴퓨터와의 결합으로 푸리에 변환을 한 차원넘어서는 새로운 기저 함수(basis function)에 기반을 둔 웨이브렛 이론을 이용한다.
웨이브렛 변환을 이용한 영상 압축은 정지 영상 압축률이 JPEG에 비해 3배 이상 높기 때문에 최근 신호 및 영상 처리 분야에 많이 응용되고 있으며 국제적 표준으로 사용될 JPEG2000 규격에도 채택되었다.
웨이브렛 변환은 공간과 주파수의 두 영역에서 영상을 표시할 수 있기 때문에, 영상의 에지(edge) 등과 같은 공간적 특성과 저주파 영역에 에너지가 밀집되어 있는 영상의 주파수 특성을 보다 효율적으로 나타낼 수 있는 특징이 있다. 또한 웨이브렛 변환의 계층적 구조 특성으로 인하여 기존의 이산 코사인 변환(DCT) 기반 압축 방식의 낮은 비트 율(low bit rate)에서 심각하게 나타나는 block artifact가 없는 장점도 있다.
웨이브렛 변환의 특징은 웨이브렛 자체가 함수이고, 스켈링과 쉬프팅 특성을 갖는 기저함수를 갖고 있으므로 영상 신호내의 고주파 대역과 저주파 대역 특성에 따라 국부적 해상도를 조절할 수 있으므로, 스케일을 조절했을 경우 화소에 손상이 가서 그림이 깨진 것처럼 보이지 않으며, 화면을 확대하거나 축소하더라도 영상의 화질에 큰 영향을 주지 않고 디코딩 할 수 있다. 웨이브렛 변환을 이용한 영상 압축 기술은 DCT 보다 뛰어난 압축률과 발전된 부호화(encoding) 기술을 지원하기 때문에 전송속도가 점진적 전송도 가능하다. 웨이브렛 변환을 이용한 영상 압축 기술은 인터넷, CD-ROM, 대화형 TV, 원격 의료와 기타 소프트웨어 적인 부분 등 여러 분야에 폭넓게 응용될 수 있다.
상술한 이산 웨이브렛 변환을 이용한 영상 압축 부호화기(encoder)를 첨부 도면을 참조하여 설명한다.
도 1은 이산 웨이브렛 변환에 의해 이미지가 4개의 서브밴드로 분해된 상태를 나타낸 도면이고, 도 2는 이산 웨이브렛의 첫 번째 스텝의 분해 과정을 나타낸 도면이며, 도 3은 이산 웨이브렛 변환된 각부밴드 변환계수들을 소블록(521*512)으로 재구성하는 방법을 나타낸 도면이다. 도 4는 종래 기술에 따른 이산 웨이브렛 변환을 이용한 압축 부화기의 내부 구성을 나타낸 구성 블록도이다.
도 4에 도시된 바와 같이, 이산 웨이브렛 변환을 이용한 영상 압축 부호화기는 이산 웨이브렛 변환기(DWT)(410), 양자화기(Quantizer)(420), 양자화 행렬부(430), 엔트로피 부호화기(Entropy encoder)(440)로 구성된다. 여기서, 이산 웨이브렛 변환기(DWT)(410)는 소스 이미지 데이터를 입력받아 이를 웨이브렛 변환하여 웨이브렛 변환 계수를 생성한다.
웨이브렛 변환은 먼저 소스 이미지 데이터를 M*N 샘플 (수평*수직)로 구성된 작은 블록들로 분해한다. 각각의 블록 크기는 M*N 이며, 적용되는 시스템에 따라 4*4, 4*8, 8*8, 8*16, 16*16등으로 선택될 수 있다. 여기서, M 값은, 예를 들어, 3번 반복되는 3 레벨의 분해가 이루어지면 M= 23이 된다. 이하 8*8 크기의 블록을 기준으로 설명한다. 상기 소스 이미지 분해(Decomposition)는 소스 이미지 프레임의 수평 방향과 수직 방향으로 독립적으로 각각 수행되어 3 레벨의 피라미드 구조의 다해상도(multi-resolution) 이미지 블록을 생성한다. 상기 레벨 수는 3 레벨에 한정되는 것이 아니라 응용 목적에 따라 4 레벨 이상도 가능하다. 각 블록의 샘플들은 매 번의 분해 과정에서 고주파 및 저주파의 2 채널 필터 뱅크(2 channel filter bank)를 거치면서 주파수 영역으로 변환되어 도 1과 같이 4개의 서브 밴드(sub-band)로 나뉘어 진다.
즉, 도 2에 도시된 바와 같이, 첫 번째 레벨의 분해 후에 서브 밴드(sub-band) 중의 첫 번째는 수직, 수평 방향으로 모두 저주파인 이미지 데이터(휘도 값)(W1LL)를 갖고, 두 번째는 수직 방향으로는 저주파, 수평 방향으로는 고주파인 이미지 데이터(휘도 값)(W1LH)를 갖는다. 세 번째는 수직 방향으로는 고주파, 수평 방향으로는 저주파인 이미지 데이터(W1HL)를 갖고, 네 번째는 수직, 수평 방향으로 모두 고주파인 이미지 데이터(W1HH)를 갖는다. 두 번째 레벨의 분해는 상기 저주파인 W1LL데이터만을 대상으로 위와 같은 분해를 수행하여 W2LL, W2LL, W2LL, W2LL의 이미지 데이터를 생성한다. 세 번째 레벨 이후의 분해도 상기 저주파인 W2LL만을 대상으로 위와 같은 분해를 반복적으로 수행한다. 인간 시각 시스템(HVS; Human Vision System)의 공간 주파수 민감도(spatial frequency sensitivity)를 효과적으로 이용하면 복원 시 화질의 큰 저하 없이도 데이터의 압축률을 더 높일 수 있다. 즉, 인간의 시각으로 감지하기 쉬운 저주파 영역의 데이터를 작게 세분하여 양자화 하여 대부분 압축 데이터에 반영하여 전송하고, 시각으로 별 차이가 감지되지 않는 고주파 영역의 데이터를 크게 나누어 양자화 하여 제거하여 전송한다. 따라서, 압축된영상 정보의 대부분을 저주파 영역에 집중되도록 하고 고주파 영역의 데이터는 상당 부분 제거시켜도 인간의 시각으로 감지하는 영상 이미지는 큰 차이가 없게 되는 것이다. 블록-와이즈 이산 웨이브렛 변환기(BDWT; Block-wise Discrete Wavelet Transform coder)는 각 레벨마다 4개의 서브-밴드를 영상 프레임의 좌측 상단 영역에 낮은 공간 주파수의 이미지 데이터 WLL, 우측 상단에는 고주파 이미지 데이터 WLH, 좌측 하단에는 이미지 데이터 WHL, 우측 하단에는 이미지 데이터 WHH가 오도록 재배치한다. 이를 피라미드 계층 구조를 이룬다고 한다.
또한, 블록-와이즈 이산 웨이브렛 변환(BDWT)은 카메라 등으로부터 입력 영상이나 일반적인 실험 영상 사이즈인 512*512의 이미지 데이터를 도 3에서와 같이, 8*8 형태의 JPEG의 이산 여현 변환기(DCT)의 입력 이미지로도 쓸 수 있도록 여러 개의 8*8로 잘라서 출력한다.
상기 양자화기(quantizer)(420)는 종래의 JPEG 영상 압축 장치에서도 개시되어 있는 것으로서, 이산 웨이브렛 변환기(DWT)(410)의 출력인 8*8개 블록의 이산 웨이브렛 변환 계수 값을 입력받아 상기 변환 계수 값을 각각의 블록에 대응하는 8*8개의 양자화 행렬부(Quantization matrix 또는 Q-matrix)(430)의 계수 값으로 나눠준 값(양자화 비트 수)을 출력한다. 상기 양자화기(quantizer)(420)는 엔트로피(entropy)를 더 낮게 하고 압축률을 조정해주는 역할을 한다. 즉, 양자화 결과 영상의 질에 어떠한 영향도 미치지 않는 범위 내에서 변환 계수들의 진폭을 줄이고, 영(zero) 값을 가지는 계수의 수를 증가시켜준다. 상기 양자화 행렬부(430)은8*8개의 양자화 행렬의 계수들을 Q(i,j)로 구성된다. 각각의 Q(i,j) 계수는 1부터 255까지의 범위를 가진 정수 중에 하나의 값을 갖는다. 상기 양자화 행렬의 계수들은 양자화기(Quantizer)(420)에서 양자화 할 때의 양자화 스텝 크기(step size)를 나타낸다.
양자화기(quantizer)(420)의 출력은 엔트로피 부호화기(Entropy encoder)(440)에서 데이터 압축을 완성하는 부호화가 수행된다. 일반적으로, 양자화기(quantizer)(420) 출력 결과 큰 값을 가지는 저주파 계수들을 고주파 계수들 앞에 위치시켜 놓고 부호화를 수행하며, 양자화 된 이산 웨이브렛 변환 계수들을 좀 더 밀집된 형태로 부호화를 수행하여 부가적인 압축이 이루어진다.
상기와 같은 종래의 JPEG에서 사용되는 양자화 행렬은 압축된 영상의 화질과 압축률을 결정하는 역할을 한다. 고정된 공간 해상도를 갖는 영상에 대해 영상의 특징에 따라 샘플을 추출하는 적응적 방법을 사용하면, 많은 경우에 영상의 화질을 개선할 수 있다. 일반적으로 급격한 명암도 변이가 일어나는 근처에서는 미세한 양자화를 비교적 평탄한 변이가 일어나는 영역에서는 거친 표본화를 사용하는 것이 유용하다. 따라서, 종래의 JPEG에서 사용되는 고정된 양자화 행렬을 사용하기 때문에 각각의 블록이 가진 공간적 활성도(degree of the spatial activity)를 충분히 고려하지 못하는 근본적인 제한이 있었다. 따라서, 시각적 감도에 따라 양자화 행렬을 적응적으로 연결하는 연구가 필요하였다.
상기와 같은 문제점을 해결하기 위한 시도로 퍼지 이론(Fuzzy theory)을 영상 압축에 도입하려는 시도가 있었다. 퍼지 논리(fuzzy logics)를 영상 이미지의복원(restoration) 분야에 적용하면, 영상 데이터의 복원시 일부 영역의 화질 개선의 대가로 다른 영역의 화질의 저하가 생기는 문제가 완화될 수 있다.
퍼지 논리를 이용한 기술은 한 개의 이미지를 복수의 부 이미지들(sub-images)로 분류하여 인간 시각의 활동 기작에 맞도록 그룹화(grouping)할 수 있도록 해준다. 인간 시각 시스템(HVS)을 이용하여 퍼지 논리를 변환 계수에 적용하여 퍼지화하고 양자화 하려는 시도가 있었다. 그러나, 기존의 블록 에너지에 따른 블록 활성도를 퍼지화하여 경합적으로 결과를 출원하는 기법이었으며 인간의 공간 주파수에 휘도 에너지에 의하여 감도를 구체적으로 고려되지 못하였다.
상기의 퍼지 논리를 변환 계수에 적용하여 퍼지화하고 양자화 하려는 시도는 있었으나 이산 웨이브렛 변환을 이용한 영상 압축에는 시도된 바가 없었다.
따라서, 본 발명의 목적은 이산 웨이브렛 변환을 이용한 영상 압축 부호화기(encoder)에 있어서, 인간 시각 시스템의 특성을 반영한 퍼지 논리를 적용한 영상 압축 방법을 제공하는 것이다.
도 1은 이산 웨이브렛 변환에 의해 이미지가 4개의 서브밴드로 분해된 상태를 나타낸 도면.
도 2는 이산 웨이브렛의 첫 번째 스텝의 분해 과정을 나타낸 도면.
도 3은 이산 웨이브렛 변환된 각부밴드 변환 계수들을 소블록(512*512)으로 재구성하는 방법을 나타낸 도면.
도 4는 종래 기술에 따른 이산 웨이브렛 변환을 이용한 압축 부화기의 내부 구성을 나타낸 구성 블록도.
도 5는 본 발명에 따른 인각 시각 시스템의 특성을 갖는 퍼지 논리를 적용한 이산 웨이브렛 변환에 따른 영상 압축 장치의 내부 구성을 나타낸 구성 블록도.
도 6은 이산 웨이브렛 변환을 이용한 영상 압축을 수행하기 위한 순서도.
도 7은 도 5의 인간 시각 시스템을 갖는 퍼지 논리를 적용한 양자화 행렬을산출하기 위한 순서도.
도 8은 도 5의 인간 시각 시스템을 갖는 퍼지 논리를 적용한 유사치를 산출하기 위한 순서도.
도 9a 내지 도 9b는 각각 k번째 이미지 블록의 분산 값 및 엔트로피에 대한 소속 함수를 나타낸 도면.
도 9c는 k번째 블록의 유사치에 대한 퍼지 소속 함수를 나타낸 도면.
도 10은 퍼지 조합 메모리를 나타낸 도면.
도 11은 퍼지 유사치 패턴에 따른 이미지를 나타낸 도면.
도 12a는 일반적인 분산값을 이용하여 산출된 양자화 행렬을 나타낸 도면.
도 12b는 본 발명에 따른 분산값을 이용하여 산출된 양자화 행렬을 나타낸 도면.
도 12c는 이미지 데이터의 분산 에너지가 중간 레벨인 경우에 따른 분산값을 이용하여 산출된 양자화 행렬을 나타낸 도면.
도 13a는 도 12b의 양자화 행렬에 의해 재생된 이미지를 나타낸 도면.
도 13b는 도 12c의 양자화 행렬에 의해 재생된 이미지를 나타낸 도면.
<도면의 주요 부분에 대한 부호의 설명>
510 : 이산 웨이브렛 변환기(DWT)
520 : 블록 재배열 수단
530 : 양자화 수단
540 : 엔트로피 부화하기
상기 목적을 달성하기 위하여, 본 발명의 일 실시예에 따르면, 이산 웨이브렛 변환(DWT)을 이용한 영상 압축 방법에 있어서, 각 블록 단위로 이산 웨이브렛 변환한 결과 산출된 영상 데이터의 변환 계수를 가진 블록들을 인간 시각시스템(HVS)의 공간 주파수 민감도(spatial frequency sensitivity)를 효과적으로 이용하기 위해 재배열하는 단계, 재배열된 각 블록마다 화소의 이미지 데이터의 휘도(luminance)의 분산값을 산출하는 단계, 재배열된 각 블록마다 엔트로피를 산출하는 단계, 인간 시각 시스템(HVS)의 특성을 반영한 퍼지 논리 규칙을 적용하여 각 블록의 분산 값 및 엔트로피로부터 각 블록의 유사치(relevance)를 산출하는 단계, 산출된 유사치를 이용하여 각 블록의 가중 분산값을 산출하는 단계, 산출된 가중 분산값을 이용하여 각 블록의 양자화 간격을 산출하는 단계, 양자화 간격을 행렬의 구성 요소로 가진 양자화 행렬을 참조하여 이산 웨이브렛 변환 결과 얻어진 영상 데이터의 변환 계수를 양자화한 이미지 코드를 생성하는 단계 및 양자화된 이미지 코드를 엔트로피 부호화하여 압축된 영상 데이터를 생성하는 단계를 포함하는 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 방법이 제공된다.
바람직한 실시예에서, 상기 휘도의 분산값을 산출하는 단계는, 영상 데이터 한 블록의 크기 N 과 M, 각 블록 내의 (i,j) 번째의 화소의 휘도값 xij및 k 번째 블록의 평균 휘도값을 입력 값으로 하여 다음의 수학식에 의해 k 번째 블록의 휘도의 분산값을 산출하는 단계인 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 방법을 제공한다.
또한, 본 발명은 엔트로피를 산출하는 단계는, 최대 휘도값 Lmax, k 번째 블록에 있는 특정 휘도 값을 갖는 화소의 확률 pi를 입력 값으로 하여 다음의 수학식에 의해 k 번째 블록의 엔트로피를 산출하는 단계인 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 방법을 제공한다.
또한, 본 발명은 각 블록의 가중 분산값을 산출하는 단계는, 공간 주파수의 이득 WI, (i,j) 번째 블록의 유사치 Rij및 (i,j) 번째 블록의 이산 웨이브렛 변환 계수의 분산값을 입력 값으로 하여 다음의 수학식에 의해 (i,j) 번째 블록마다의 가중 분산값을 산출하는 단계인 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 방법을 제공한다.
본 발명의 다른 실시예에 따르면, 본 발명은 이산 웨이브렛 변환(DWT)을 이용한 영상 압축 장치에 있어서, 각 블록 단위로 이산 웨이브렛 변환한 결과 산출된 영상 데이터의 변환 계수를 가진 블록들을 인간 시각 시스템(HVS)의 공간 주파수 민감도(spatial frequency sensitivity)를 효과적으로 이용하기 위해 재배열하는 수단, 재배열된 각 블록마다 화소의 이미지 데이터의 휘도(luminance)의 분산값을 산출하는 수단, 재배열된 각 블록마다 엔트로피를 산출하는 수단, 인간 시각 시스템(HVS)의 특성을 반영한 퍼지 논리 규칙을 적용하여 각 블록의 분산 값 및 엔트로피로부터 각 블록의 유사치(relevance)를 산출하는 수단, 산출된 유사치를 이용하여 각 블록의 가중 분산값을 산출하는 수단, 산출된 가중 분산값을 이용하여 각 블록의 양자화 간격을 산출하는 수단, 양자화 간격을 행렬의 구성 요소로 가진 양자화 행렬을 참조하여 이산 웨이브렛 변환 결과 얻어진 영상 데이터의 변환 계수를 양자화한 이미지 코드를 생성하는 수단 및 양자화된 이미지 코드를 엔트로피 부호화하여 압축된 영상 데이터를 생성하는 수단을 포함하는 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 장치를 제공한다.
본 발명은 재배열하는 수단은 웨이브렛 변환과 동시에 웨이브렛 변환 계수의 크기가 A*A인 소블록으로 재배열 하는 단계로서, 디지털 필터로 구현되는 웨이브렛 변환을 3레벨 과정의 처리를 하게되면 그 특징이 영상 프레임의 좌측 상단 영역에 수직, 수평 방향으로 모두 낮은 공간 주파수를 갖는 이미지 데이터를 갖고, 우측 상단에는 수직 방향으로는 낮은 공간 주파수, 수평 방향으로는 높은 공간 주파수의 이미지 데이터를 갖고, 좌측 하단에는 수직 방향으로는 높은 공간 주파수, 수평 방향으로는 낮은 공간 주파수의 이미지 데이터를 갖고, 우측 하단에는 수직, 수평 방향으로 모두 높은 공간 주파수를 갖는 이미지 데이터가 오도록 재배치하는 수단 및 모니터를 포함하는 영상 출력 장치로부터의 256*256, 512*512 중 적어도 어느 하나의 형태의 이미지 데이터를 8*8 형태의 JPEG의 이산 여현 변환기(DCT)의 입력 이미지로도 쓸 수 있도록 여러 개의 8*8로 잘라서 출력하는 수단을 포함하는 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 장치를 제공한다.
이하, 본 발명에 따른 인간 시각 시스템의 특성을 반영한 퍼지 논리를 적용한 이산 웨이브렛 변환을 이용한 영상 압축 방법 및 장치를 첨부 도면을 참조하여 상세히 설명한다. 그러나, 하기의 실시 예에 의해 본 발명이 제한되거나 한정하는 것은 아니다.
도 5는 본 발명에 따른 인각 시각 시스템의 특성을 갖는 퍼지 논리를 적용한이산 웨이브렛 변환에 따른 영상 압축 장치의 내부 구성을 나타낸 구성 블록도이고, 도 6은 이산 웨이브렛 변환을 이용한 영상 압축을 수행하기 위한 순서도이다. 도 7은 도 5의 인간 시각 시스템을 갖는 퍼지 논리를 적용한 양자화 행렬을 산출하기 위한 순서도이고, 도 8은 도 5의 인간 시각 시스템을 갖는 퍼지 논리를 적용한 유사치를 산출하기 위한 순서도이다.
그리고, 도 9a는 대조 민감도 조절에 따른 휘도 분산 값의 퍼지 소속 함수를 나타낸 도면이고, 도 9b는 공간 민감도 조절에 따른 엔트로피 소속 함수를 나타낸 도면. 도 9c는 도 9a 및 도 9b에 따른 유사치의 출력을 나타낸 도면이다.
또한, 도 10은 퍼지 조합 메모리를 나타낸 도면이고, 도 11은 퍼지 유사치 패턴에 따른 이미지를 나타낸 도면이다. 도 12는 양자화 행렬을 나타낸 도면이고, 도 13은 도 12의 양자화 행렬에 의해 복원된 이미지를 나타낸 도면이다.
먼저, 본 발명은 인간 시각 시스템(HVS) 의 특성을 이용하기 위하여 퍼지 이론을 적용한다. 이를 위해 퍼지 소속 함수(fuzzy membership function)를 도입하여 설계한다.
인간의 시각 민감도(visual sensitivity)는 주로 휘도(luminance) 및 공간 주파수(spatial frequency) 특성에 의존한다.
첫째, 휘도 응답은 인간 시각이 휘도 변화를 얼마나 잘 인식하느냐를 의미하며, 이는 특정 이미지 객체와 배경 이미지와의 대조율(contrast ratio)로부터 얻어질 수 있다. 널리 알려진 베버의 법칙(Weber's law)에 의하면 대조 민감도(contrast sensitivity)는 휘도에 의존한다(대조 민감도 C = LogL, L은 휘도값). 따라서, 변환 계수의 분산 값 즉, 이산 웨이브렛 변환(DWT)후의 각각의 부 블록(sub-block)마다의 화소의 휘도의 변이, 즉 휘도의 분산 값을 대조 민감도(contrast sensitivity)를 대표하는 것으로 보고 인간 시각 시스템(HVS)의 특성을 양자화 행렬을 생성하는데 이용할 수 있다. 분산 값(variance) Ek은 아래 수학식에 의해 산출된다.
여기서, Xij는 8*8 블록의 k 번째 블록에 있는 (i,j) 화소의 휘도 값 k는 k 번째 블록에 있는 화소들의 휘도 값의 평균값을 의미한다. M, N 는 블록 크기를 의미하는 양의 정수 값(예를 들어 M=N=8)이다. 상기 분산 값은 부 블록(sub-block) 레벨에서 휘도의 분산 값을 의미하며 에너지 단위를 갖는다. 대조 민감도(contrast sensitivity)는 각 화소의 휘도의 절대값 및 휘도의 변이의 자승값의 함수이며, 상기 대조 민감도(contrast sensitivity)를 조절하여 구해진 에너지(휘도의 분산 값)의 퍼지 소속 함수를 도시하면 도 8a와 같다. 인간 시각은 지나치게 높거나 낮은 휘도에서는 휘도 변화를 거의 인식하지 못한다. 즉, 분산 값의 소속 함수는 중간 영역에서는 피크 값을 갖고 양쪽 끝에서 떨어지는 비선형 특성을 갖는다.
둘째, 공간 민감도(spatial sensitivity)란 인간 시각이 영상 데이터의 공간 주파수 변화를 얼마나 잘 인식하느냐를 의미한다. 공간 주파수(이하 주파수)란 이미지의 밝기 주기의 비율을 의미하며, 낮은 주파수는 이미지의 전체적인 형태 또는 이미지의 완만하게 변하는 특징을 제시해주며, 높은 주파수는 이미지의 모서리와 같은 날카로운 세부적인 특징들을 보여준다. 엔트로피는 영상 데이터의 주파수 응답에 의존한다. 즉, 낮은 공간 주파수는 이미지 데이터가 공간적으로 큰 물체로 구성됨을 의미하고, 높은 공간 주파수는 이미지 데이터가 공간적으로 작은 물체로 분포함을 의미한다. 낮은 공간 주파수는 엔트로피가 낮은 것이고, 높은 공간 주파수는 엔트로피가 높은 것이다. 따라서, 공간 민감도(spatial sensitivity) 응답은 영상의 각 블록의 엔트로피(entropy) 값을 계산함으로써 알 수 있다. 엔트로피는 다음의 수학식에 의해 계산될 수 있다.
Lmax는 휘도의 최대값으로, 예를 들어, 8*8개의 화소로 이루어진 부 블록의 각 화소의 휘도 값은 0 - 255의 값을 가지며 최대값은 255가 된다. Pi는 k 번째 블록에서 휘도의 크기가 i인 화소의 확률을 의미하며, 예를 들어 8*8 개의 화소로 이루어진 부 블록에서 휘도 값 255를 갖는 화소 수가 32개라면 Pi는 0.5가 된다. 만약, k 번째 블록의 8*8개의 화소들의 휘도가 0 - 255의 값을 하나씩 갖는다면 엔트로피는 최대가 됨을 알 수 있고, 64개의 화소들의 휘도가 모두 0의 값을 갖는다면 엔트로피는 최소 값인 0이 됨을 알 수 있다.
인간 시각은 지나치게 높거나 낮은 주파수에서는 주파수 변화를 거의 인식하지 못한다. 따라서, 공간 민감도는 중간 영역에서는 피크 값을 갖고 양쪽 끝에서 떨어지는 비선형 특성을 갖는다. 이러한 사실을 엔트로피 소속 함수로 나타내면 도 8b와 같다.
상기 휘도의 분산 값과 엔트로피간에는 일반적으로 서로 비례하는 상관 관계가 있다. 즉, 큰 분산 값은 큰 엔트로피를 나타낸다. 또한, 휘도값과 공간 주파수는 서로 밀접한 관계가 있다. 예를 들어 이미지 데이터의 공간 주파수가 연속적으로 고주파인 영역에서는 휘도값은 낮고, 이미지의 경계면 근처 영역에서는 휘도값은 높고 엔트로피는 낮은 값을 갖는다.
본 발명은 상기의 분산 값과 엔트로피의 상관 관계에 따른 유사치를 몇 개의 퍼지 논리 규칙을 간략화한 간단한 퍼지 집합(fuzzy set)을 이용하여 구한다. 상기 퍼지 규칙들(fuzzy rules)을 나타낸 퍼지 집합은 도 10의 퍼지 조합 메모리(FAM; Fuzzy Associative Memory)에 나타나 있다. 이를 설명하면 다음과 같다.
위에서 살펴본 바와 같이, 공간 영역(spatial domain)에서 인간 시각 시스템(HVS)은 중간 크기의 공간 주파수 신호를 잘 통과시키는 대역 통과 필터(bandpass filter) 특성을 갖는다. 상기 특성에 의하면, 에너지 Ek(휘도의 분산 값) 및/또는 엔트로피 값이 매우 높거나 매우 낮을 때에는 상기 유사치(relevance)는 매우 낮은 값을 갖는다. 왜냐하면, 인간의 시각은 상기의 조건에서 매우 둔감하므로 이미지 데이터의 손상이 일어나도 이미지의 손상 여부를 거의 감지하지를 못하기 때문이다. 도 8c에 테스트 이미지 데이터와 그에 대한 국부적인 유사치(relevance)의 출력 형태를 도시하였다. 여기에서 국부적인유사치(relevance)의 값은 0 - 1의 작은 값을 가지므로 이를 더 부각시키기 위해서 국부적인 유사치(relevance)의 값에 256을 곱하여 표시하였다. 도 9c를 참조하면 중간 정도의 휘도값을 갖는 영역과 경계 부근에서의 유사치(relevance) 값이 크게 얻어졌음을 알 수 있다.
따라서, 본 발명은 영상 이미지 데이터에 있어서 이러한 국부적인 특징을 더욱 강조하기 위해 상기 유사치(relevance)의 출력 형태를 아래의 수학식에 의해 양자화기(quantizer)(120)의 출력인 bij번째 블록의 하나의 화소를 저장 및 전송하는데 필요한 비트수)을 구하는데 이용한다.
Rij는 ij 번째 블록의 유사치(relevance)이고,는 ij 번째 블록의 분산 값이다. 또한, WI는 공간 주파수 응답의 이득을 나타낸다. 즉, 2 채널 필터 뱅크를 통과할 때의 이득이이므로 영상 이미지 데이터 분해시 각각의 레벨마다 2배의 이득을 얻는다. 또한, 도 12는 분산 값에 의해 발생된 양자화 행렬이다.
bav은 아래 수학식에 의해 얻어지는 평균 비트 수를 나타낸다.는 변환 계수의 분산값이다. 하나의 디지털 영상을 저장 및 전송하는데 필요한 비트수를 의미한다.즉, 각각의 변환 계수에 할당된 비트 수로서 양자화기(quantizer)(120)의 출력이 된다. 영상 이미지 데이터에서 중간 정도의 휘도값을 갖는 영역과 경계 부근에서는 인간 시각 시스템(HVS)의 특성을 반영한 퍼지 논리를 적용하여 구한 Rij값이 큰 값을 갖고, 그 결과 상기 수학식 3에 의해 가중 분산값이 커진다. 이렇게 분산값이 가중치로 보정되어 상기 수학식 4의 σij2대신 할당됨으로써 양자화기의 출력인 bij에 영향을 미치도록 작동한다. 즉, 영상 이미지 데이터에서 중간 정도의 휘도값을 갖는 영역과 경계 부근( 이는 이미지 데이터의 관심 있는 영역 및 인간의 시각에 쉽게 변화가 감지되는 영역(sensitivity area)이 될 수 있다.) 이 작게 세분하여 양자화 되어 대부분 압축 데이터에 반영됨으로써 더욱 강조되어 표현될 수 있도록 한다. 다만, 상기 영역을 제외한 영역의 이미지 데이터를 크게 나누어 양자화 하여 제거하여 전송하는 결과를 가져와 상기 퍼지 논리를 적용한 영상 압축된 데이터를 복원할 경우에 신호 대 잡음비(SNR)의 증가를 수반하는 단점은 있다.
본 발명은 영상 이미지 데이터의 특성과 인간 시각 시스템(HVS)의 특성을 퍼지 논리를 적용함으로써 적응적 방법으로 양자화 할 수 있는 방법을 제공한다. 즉, 본 발명의 퍼지 논리의 적용에 있어서는 인간 시각 시스템(HVS)의 여러 파라미터 중에서 영상의 휘도 및 공간 주파수 특성을 변환 계수의 분산 값(에너지) 및 엔트로피에 적용함으로써 적응적 방법으로 양자화 할 수 있는 방법을 제공한다.
도 5를 참조하여 본 발명에 따른 인간 시각 시스템의 특성을 반영한 퍼지 논리를 적용한 이산 웨이브렛 변환을 이용한 영상 압축 장치를 설명하면 다음과 같다.
도 5에 도시된 바와 같이, 본 발명에 따른 영상 압축 장치는 BDWT 수단(510), 블록 재배열 수단(520), 양자화 처리수단(530) 및 엔트로피 부호화기(540)를 포함한다.
상기 BDWT 수단(510)의 동작은 도 4에서 설명한 바와 같으므로 설명을 생략하고, 블록 재배열 수단(520)은 입력되는 소스 이미지 데이터를 복수개의 8*8 이미지 데이터들로 잘라서 재배열하여 출력한다.
상기 양자화 처리 수단(530)은 가중 분산값 산출부(532), 퍼지 논리를 적용한 유사치(relevance) 산출부(534), 양자화 행렬 산출부(536) 및 양자화기(quantizer)(538)를 포함한다.
상기 가중 분산값 산출부(532)는 블록 재배열 수단(520)에서 출력되는 재배열된 이미지 데이터의 각 블록의 분산 값(variance) Ek을 산출하고, 상기 퍼지 논리를 적용한 유사치(relevance) 산출부(534)는 위에서 설명한 퍼지 논리를 적용하여 영상의 각 블록의 분산 값 및 엔트로피(entropy) 값 Hk으로부터 유사치(relevance) 값을 산출한다. 이때 도 10의 퍼지 조합 메모리(FAM; Fuzzy Associative Memory)에 저장되어 있는 퍼지 논리 규칙을 적용한다.
여기서, 분산 에너지가 너무 높거나 낮으면 감도가 떨어지고, 중간 주파수가 중간이면 감도가 높아진다.
양자화 행렬 산출부(536)는 상기 퍼지 논리 적용한 유사치 산출부(534)로부터 산출된 유사치 값으로부터 양자화 행렬의 각 계수 값을 산출한다. 각각의 변환계수 값은 상기 산출된 양자화 행렬의 각 계수로 나누어 져서 각각의 변환 계수에 할당된 비트 수가 산출되며 이것이 각각의 변환 계수에 덧붙여져서 양자화기(538)의 출력이 된다.
엔트로피 부호화 처리부(540)는 상기 양자화기(538)의 출력을 입력받아 양자화 된 이산 웨이브렛 변환 계수들을 좀 더 밀집된 형태로 부호화를 수행하여 부가적인 압축이 이루어진다. 즉, 영상 이미지 데이터에서 중간 정도의 휘도값을 갖는 영역과 경계 부근 영역의 변환 계수가 작게 세분하여 양자화 되어 상기 영역의 이미지 데이터에 더 많은 비트수가 할당됨으로써 대부분 압축 데이터에 반영된다. 상기 엔트로피 부호화기(540)의 출력은 압축된 영상 이미지 데이터가 되어 저장되거나 전송된다.
본 발명에 따른 이산 웨이브렛 변환을 이용한 영상 압축 방법을 도 6을 참조하여 설명하면 다음과 같다.
도 6을 참조하면, 단계 610에서 소스 이미지 데이터를 이산 웨이브렛 변환(DWT)한다. 도 2에 설명된 것과 같이, 고주파 및 저주파의 2 채널 필터 뱅크(2 channel filter bank)를 거치면서 주파수 영역으로 변환되어 4개의 서브 밴드(sub-band)로 나뉘어 지고, 도 1과 같은 이미지 분해가 이루어진다. 단계 612에서 블록-와이즈 이산 여현 변환기(BDWT coder)에서 512*512의 이미지 데이터를 입력받아 상기 이미지 데이터를 복수개의 8*8 이미지 데이터들로 잘라서 재배열하여 출력한다. 이는 8*8 형태의 JPEG의 이산 여현 변환기(DCT)의 입력 이미지로도 쓸 수 있도록 해준다. 단계 614에서는 본 발명에 따른 퍼지 논리를 적용하여 산출된 양자화 행렬을 참조하여 이산 웨이브렛 변환(DWT) 계수를 양자화 한다. 단계 616에서는 양자화된 이미지 데이터를 엔트로피 부호화한다. 단계 618에서는 상기 엔트로피 부호화 결과 얻어진 압축된 이미지 데이터를 얻는다.
그리고, 본 발명에 따른 이산 웨이브렛 변환을 이용한 영상 압축 방법에 있어서 인간 시각 시스템의 특성을 반영한 퍼지 논리를 적용한 양자화 행렬의 산출 방법을 도 7을 참조하여 설명한다.
도 7에 도시된 바와 같이, 단계 710에서 블록-와이즈 이산 여현 변환(BDWT)의 출력인 다수의 블록들의 순번을 나타내는 k의 값을 0으로 초기화한다. 단계 712에서 블록-와이즈 이산 여현 변환(BDWT)의 출력인 8*8 크기의 k 번째 블록의 변환 계수를 입력받는다. 단계 714에서 상기 변환 계수로부터 설명한 수학식 1 및 수학식 2에 의해 k 번째 블록의 분산 값 Ek, 엔트로피 Hk를 산출한다. 단계 716에서 상기 산출된 분산 값 Ek, 엔트로피 Hk를 이용하여 k 번째 블록의 유사치(relevance) Rk를 산출한다. 단계 718에서 상기 산출된 유사치(relevance) Rk 및 k 번째 블록의 분산 값, 공간 주파수 응답의 이득 WI를 이용하여 상기 수학식 3에 의해 가중 분산값을 산출하고, 이를 이용하여 양자화 행렬의 계수 값을 산출한다. 단계 720에서 k 값이 블록의 마지막인지를 판단하고, 판단 결과 블록의 마지막이면 종료하며 마지막이 아니면 다시 단계 712부터 반복한다. 여기서, 도 12b는 단계 718에서 산출된 가중 분산값에 의한 양자화 행렬을 나타낸다. 또한, 이미지 데이터의 분산 에너지가 중간 정도일 경우의 가중 분산값을 이용하여 위의 단계들을 수행함에 의해 도12c와 같은 양자화 행렬을 산출할 수 있다.
또한, 본 발명에 따른 인간 시각 시스템의 특성을 반영한 퍼지 논리를 적용하여 유사치를 산출하는 방법을 도 8을 참조하여 설명한다.
도 8을 참조하면, 단계 810에서 화소의 휘도 분산 값 Ek 및 엔트로피 Hk를 산출한다. 단계 812에서 위에서 설명한 퍼지 논리 규칙을 적용하여 퍼지 조합 메모리(FAM; Fuzzy Associative Memory) 뱅크를 생성한다. 단계 814에서 상기 생성된 퍼지 조합 메모리(FAM; Fuzzy Associative Memory) 뱅크의 Ek및 Hk의 크기 값의 대소(Very Low, Low, High, Very High)에 따라 Rk의 대소 값(Very Low, Low, High, Very High)을 결정하여 산출한다.
상술한 방법에 의해 도 11에서와 같이 전송하고자 하는 이미지를 퍼지 유사치 패턴과 같은 형태로 전송한다. 퍼지 유사치 패턴의 이미지 형태로 전송된 이미지는 본 발명의 가중 분산값에 의한 양자화 행렬에 의해 도 13a에서와 같이 복원되고, 이미지 데이터의 분산 에너지가 중간 정도일 경우의 가중 분산값에 의한 양자화 행렬에 의해 도 13b에서와 같이 복원된다.
본 발명은 상기 실시예에 한정되지 않으며, 많은 변형이 본 발명의 사상 내에서 당 분야에서 통상의 지식을 가진 자에 의하여 가능함은 물론이다.
상술한 바와 같이 본 발명은 인간 시각 시스템의 특성을 반영한 퍼지 논리를적용하여 영상 데이터의 특성에 따라 적응적으로 이미지 샘플들을 양자화하여 중간 정도의 휘도값을 갖는 영역과 경계 부근 또는 강조하고자 하는 이미지의 관심 있는 미소 부분의 화질을 개선할 수 있는 방법을 제공한다.
또한, 블록 와이즈 이산 웨이브렛 변환(BDWT)에 의해 512*512의 이미지 데이터를 JPEG의 이산 여현 변환기의 입력 이미지로도 쓸 수 있도록 하는 방법을 제공한다.

Claims (17)

  1. 이산 웨이브렛 변환(DWT)을 이용한 영상 압축 방법에 있어서,
    각 블록 단위로 이산 웨이브렛 변환한 결과 산출된 영상 데이터의 변환 계수를 가진 블록들을 인간 시각 시스템(HVS)의 공간 주파수 민감도(spatial frequency sensitivity)를 효과적으로 이용하기 위해 재배열하는 단계;
    상기 재배열된 각 블록마다 화소의 이미지 데이터의 휘도(luminance)의 분산값을 산출하는 단계;
    상기 재배열된 각 블록마다 엔트로피를 산출하는 단계;
    인간 시각 시스템(HVS)의 특성을 반영한 퍼지 논리 규칙을 적용하여 상기 각 블록의 분산 값 및 엔트로피로부터 각 블록의 유사치(relevance)를 산출하는 단계;
    상기 산출된 유사치를 이용하여 각 블록의 가중 분산값을 산출하는 단계;
    상기 산출된 가중 분산값을 이용하여 각 블록의 양자화 간격을 산출하는 단계;
    상기 양자화 간격을 행렬의 구성 요소로 가진 양자화 행렬을 참조하여 상기 이산 웨이브렛 변환 결과 얻어진 영상 데이터의 변환 계수를 양자화한 이미지 코드를 생성하는 단계; 및
    상기 양자화된 이미지 코드를 엔트로피 부호화하여 압축된 영상 데이터를 생성하는 단계
    를 포함하는 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 방법.
  2. 제1항에 있어서,
    상기 휘도의 분산값을 산출하는 단계는,
    영상 데이터 한 블록의 크기 N 과 M, 각 블록 내의 (i,j) 번째의 화소의 휘도값 xij및 k 번째 블록의 평균 휘도값을 입력 값으로 하여 다음의 수학식에 의해 k 번째 블록의 휘도의 분산값을 산출하는 단계
    인 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 방법.
  3. 제2항에 있어서,
    상기 엔트로피를 산출하는 단계는,
    최대 휘도값 Lmax, k 번째 블록에 있는 특정 휘도 값을 갖는 화소의 확률 Pi를 입력 값으로 하여 다음의 수학식에 의해 k 번째 블록의 엔트로피를 산출하는 단계
    인 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 방법.
  4. 제3항에 있어서,
    상기 각 블록의 가중 분산값을 산출하는 단계는,
    공간 주파수의 이득 WI, (i,j) 번째 블록의 유사치 Rij및 (i,j) 번째 블록의 이산 웨이브렛 변환 계수의 분산값을 입력 값으로 하여 다음의 수학식에 의해 (i,j) 번째 블록마다의 가중 분산값을 산출하는 단계
    인 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 방법.
  5. 제4항에 있어서,
    상기 각 블록의 가중 분산값을 산출하는 단계에 있어서 상기 퍼지 논리 규칙은,
    인간 시각 시스템(HVS)의 공간 주파수에 대한 중간 주파수를 잘 통과시키는 특성을 반영하여 분산 값, 엔트로피 값, 유사치(relevance)의 크기를 매우 큼(VH), 큼(HI), 작음(LO), 매우 작음(VL)으로 구분 할 때,
    상기 분산 값 및 엔트로피 값 중 어느 하나가 매우 큼(VH), 매우 작음(VL) 중 하나에 해당될 때 상기 유사치 출력을 작음(LO)이하의 값으로 설정해주는 단계 및
    상기 분산 값 및 엔트로피 값이 상기 조건에 해당되지 않을 때 상기 유사치 출력을 매우 높음(VH)의 값으로 설정해주는 단계
    를 포함하는 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 방법.
  6. 제4항에 있어서,
    상기 각 블록의 가중 분산값을 산출하는 단계에 있어서 상기 퍼지 논리 규칙은,
    인간 시각 시스템(HVS)의 공간 주파수에 대한 중간 주파수를 잘 통과시키는 특성을 반영하여 분산 값, 엔트로피 값, 유사치(relevance)의 크기를 매우 큼(VH), 큼(HI), 작음(LO), 매우 작음(VL)으로 구분 할 때,
    상기 분산 값 및 엔트로피 값 중 어느 하나가 높음(HI)을 갖고 다른 것이 높음(HI), 낮음(LO) 중 어느 하나를 가질 경우에 상기 유사치(relevance)의 크기를 매우 큼(VH)으로 설정하는 단계;
    상기 분산 값 및 엔트로피 값이 모두 낮음(LO)일 때 상기 유사치(relevance)의 크기를 매우 큼(VH)으로 설정하는 단계;
    상기 분산 값 및 엔트로피 값 중 어느 하나가 매우 높음(VH)이고 다른 하나가 매우 큼(VH), 작음(LO), 매우 작음(VL)인 경우에 상기 유사치(relevance)의 크기를 매우 작음(VL)으로 설정하는 단계;
    상기 분산 값 및 엔트로피 값 중 어느 하나가 매우 높음(VH)이고 다른 하나가 높음(HI)일 때 상기 유사치(relevance)의 크기를 낮음(LO)으로 설정하는 단계;
    상기 분산 값 및 엔트로피 값 중 어느 하나가 매우 낮음(VL)이고 다른 하나가 매우 큼(VH), 높음(HI), 매우 작음(VL)인 경우에 상기 유사치(relevance)의 크기를 매우 작음(VL)으로 설정하는 단계;
    상기 분산 값 및 엔트로피 값 중 어느 하나가 매우 낮음(VL)이고 다른 하나가 낮음(LO)일 때 상기 유사치(relevance)의 크기를 낮음(LO)으로 설정하는 단계
    를 포함하는 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 재배열하는 단계는,
    웨이브렛 변환과 동시에 웨이브렛 변환 계수의 크기가 A*A인 소블록으로 재배열 하는 단계로서, 디지털 필터로 구현되는 웨이브렛 변환을 3레벨 과정의 처리를 하게되면 그 특징이 영상 프레임의 좌측 상단 영역에 수직, 수평 방향으로 모두 낮은 공간 주파수를 갖는 이미지 데이터를 갖고, 우측 상단에는 수직 방향으로는 낮은 공간 주파수, 수평 방향으로는 높은 공간 주파수의 이미지 데이터를 갖고, 좌측 하단에는 수직 방향으로는 높은 공간 주파수, 수평 방향으로는 낮은 공간 주파수의 이미지 데이터를 갖고, 우측 하단에는 수직, 수평 방향으로 모두 높은 공간주파수를 갖는 이미지 데이터가 오도록 재배치하는 단계 및
    모니터를 포함하는 영상 출력 장치로부터의 256*256, 512*512 중 적어도 어느 하나의 형태의 이미지 데이터를 8*8 형태의 JPEG의 이산 여현 변환기(DCT)의 입력 이미지로도 쓸 수 있도록 여러 개의 8*8로 잘라서 출력하는 단계
    를 포함하는 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 방법.
  8. 이산 웨이브렛 변환(DWT)을 이용한 영상 압축 장치에 있어서,
    각 블록 단위로 이산 웨이브렛 변환한 결과 산출된 영상 데이터의 변환 계수를 가진 블록들을 인간 시각 시스템(HVS)의 공간 주파수 민감도(spatial frequency sensitivity)를 효과적으로 이용하기 위해 재배열하는 수단;
    상기 재배열된 각 블록마다 화소의 이미지 데이터의 휘도(luminance)의 분산값을 산출하는 수단;
    상기 재배열된 각 블록마다 엔트로피를 산출하는 수단;
    인간 시각 시스템(HVS)의 특성을 반영한 퍼지 논리 규칙을 적용하여 상기 각 블록의 분산 값 및 엔트로피로부터 각 블록의 유사치(relevance)를 산출하는 수단;
    상기 산출된 유사치를 이용하여 각 블록의 가중 분산값을 산출하는 수단;
    상기 산출된 가중 분산값을 이용하여 각 블록의 양자화 간격을 산출하는 수단;
    상기 양자화 간격을 행렬의 구성 요소로 가진 양자화 행렬을 참조하여 상기 이산 웨이브렛 변환 결과 얻어진 영상 데이터의 변환 계수를 양자화한 이미지 코드를 생성하는 수단 및
    상기 양자화된 이미지 코드를 엔트로피 부호화하여 압축된 영상 데이터를 생성하는 수단
    을 포함하는 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 장치.
  9. 제8항에 있어서,
    상기 휘도의 분산값을 산출하는 수단은,
    영상 데이터 한 블록의 크기 N 과 M, 각 블록 내의 (i,j) 번째의 화소의 휘도값 xij 및 k 번째 블록의 평균 휘도값을 입력 값으로 하여 다음 수학식에 의해 k 번째 블록의 휘도의 분산값을 산출하는 수단
    인 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 장치.
  10. 제9항에 있어서,
    상기 엔트로피 값을 산출하는 수단은,
    최대 휘도값 Lmax, k 번째 블록에 있는 특정 휘도값을 갖는 화소의 확률 pi를 입력 값으로 하여 다음 수학식에 의해 k 번째 블록의 엔트로피를 산출하는 수단
    인 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 장치.
  11. 제10항에 있어서,
    상기 각 블록의 가중 분산값을 산출하는 수단에 있어서 상기 퍼지 논리 규칙은,
    인간 시각 시스템(HVS)의 공간 주파수에 대한 중간 주파수를 잘 통과시키는 특성을 반영하여 분산 값, 엔트로피 값, 유사치(relevance)의 크기를 매우 큼(VH), 큼(HI), 작음(LO), 매우 작음(VL)으로 구분 할 때,
    상기 분산 값 및 엔트로피 값 중 어느 하나가 매우 큼(VH), 매우 작음(VL) 중 하나에 해당될 때 상기 유사치 출력을 작음(LO)이하의 값으로 설정해주는 단계 및
    상기 분산 값 및 엔트로피 값이 상기 조건에 해당되지 않을 때 상기 유사치 출력을 매우 높음(VH)의 값으로 설정해주는 단계
    를 포함하는 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 장치.
  12. 제10항에 있어서,
    상기 각 블록의 가중 분산값을 산출하는 단계에 있어서 상기 퍼지 논리 규칙은,
    인간 시각 시스템(HVS)의 공간 주파수에 대한 중간 주파수를 잘 통과시키는 특성을 반영하여 분산 값, 엔트로피 값, 유사치(relevance)의 크기를 매우 큼(VH), 큼(HI), 작음(LO), 매우 작음(VL)으로 구분 할 때,
    상기 분산 값 및 엔트로피 값 중 어느 하나가 높음(HI)을 갖고 다른 것이 높음(HI), 낮음(LO) 중 어느 하나를 가질 경우에 상기 유사치(relevance)의 크기를 매우 큼(VH)으로 설정하는 단계;
    상기 분산 값 및 엔트로피 값이 모두 낮음(LO)일 때 상기 유사치(relevance)의 크기를 매우 큼(VH)으로 설정하는 단계;
    상기 분산 값 및 엔트로피 값 중 어느 하나가 매우 높음(VH)이고 다른 하나가 매우 큼(VH), 작음(LO), 매우 작음(VL)인 경우에 상기 유사치(relevance)의 크기를 매우 작음(VL)으로 설정하는 단계;
    상기 분산 값 및 엔트로피 값 중 어느 하나가 매우 높음(VH)이고 다른 하나가 높음(HI)일 때 상기 유사치(relevance)의 크기를 낮음(LO)으로 설정하는 단계;
    상기 분산 값 및 엔트로피 값 중 어느 하나가 매우 낮음(VL)이고 다른 하나가 매우 큼(VH), 높음(HI), 매우 작음(VL)인 경우에 상기 유사치(relevance)의 크기를 매우 작음(VL)으로 설정하는 단계;
    상기 분산 값 및 엔트로피 값 중 어느 하나가 매우 낮음(VL)이고 다른 하나가 낮음(LO)일 때 상기 유사치(relevance)의 크기를 낮음(LO)으로 설정하는 단계
    를 포함하는 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 장치.
  13. 제8항 내지 제12항 중 어느 한 항에 있어서,
    상기 재배열하는 수단은,
    영상 프레임의 좌측 상단 영역에 수직, 수평 방향으로 모두 낮은 공간 주파수를 갖는 이미지 데이터를 갖고, 우측 상단에는 수직 방향으로는 낮은 공간 주파수, 수평 방향으로는 높은 공간 주파수의 이미지 데이터를 갖고, 좌측 하단에는 수직 방향으로는 높은 공간 주파수, 수평 방향으로는 낮은 공간 주파수의 이미지 데이터를 갖고, 우측 하단에는 수직, 수평 방향으로 모두 높은 공간 주파수를 갖는 이미지 데이터가 오도록 재배치하는 수단 및
    모니터를 포함하는 영상 출력 장치로부터의 256*256, 512*512 중 적어도 어느 하나의 형태의 이미지 데이터를 8*8 형태의 JPEG의 이산 여현 변환기(DCT)의 입력 이미지로도 쓸 수 있도록 여러 개의 8*8로 잘라서 출력하는 수단
    를 포함하는 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 장치.
  14. 영상 압축 방법에 있어서,
    영상 데이터를 블록 단위로 이산 웨이브렛 변환을 하여 얻어진 변환 계수를 출력하는 단계;
    각 블록 단위로 이산 웨이브렛 변환한 결과 산출된 영상 데이터의 변환 계수를 가진 블록들을 인간 시각 시스템(HVS)의 공간 주파수 민감도(spatial frequency sensitivity)를 효과적으로 이용하기 위해 재배열하는 단계;
    상기 재배열된 각 블록마다 화소의 이미지 데이터의 휘도(luminance)의 분산값을 산출하는 단계;
    상기 재배열된 각 블록마다 엔트로피를 산출하는 단계;
    인간 시각 시스템(HVS)의 특성을 반영한 퍼지 논리 규칙을 적용하여 상기 각 블록의 분산값 및 엔트로피로부터 각 블록의 유사치(relevance)를 산출하는 단계;
    상기 산출된 유사치를 이용하여 각 블록의 가중 분산값을 산출하는 단계;
    상기 산출된 가중 분산값을 이용하여 각 블록의 양자화 간격을 산출하는 단계;
    상기 양자화 간격을 행렬의 구성 요소로 가진 양자화 행렬을 참조하여 상기 이산 웨이브렛 변환 결과 얻어진 영상 데이터의 변환 계수를 양자화한 이미지 코드를 생성하는 단계 및
    상기 양자화된 이미지 코드를 엔트로피 부호화하여 압축된 영상 데이터를 생성하는 단계
    를 포함하는 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 방법.
  15. 제1항에 있어서,
    상기 재배열하는 단계는,
    웨이브렛 변환과 동시에 웨이브렛 변환 계수의 크기가 A*A인 소블록으로 재배열 하는 단계로서, 디지털 필터로 구현되는 웨이브렛 변환을 3레벨 과정의 처리를 하게되면 그 특징이 영상 프레임의 좌측 상단 영역에 수직, 수평 방향으로 모두 낮은 공간 주파수를 갖는 이미지 데이터를 갖고, 우측 상단에는 수직 방향으로는 낮은 공간 주파수, 수평 방향으로는 높은 공간 주파수의 이미지 데이터를 갖고, 좌측 하단에는 수직 방향으로는 높은 공간 주파수, 수평 방향으로는 낮은 공간 주파수의 이미지 데이터를 갖고, 우측 하단에는 수직, 수평 방향으로 모두 높은 공간 주파수를 갖는 이미지 데이터가 오도록 재배치하는 단계 및
    모니터를 포함하는 영상 출력 장치로부터의 256*256, 512*512 중 적어도 어느 하나의 형태의 이미지 데이터를 8*8 형태의 JPEG의 이산 여현 변환기(DCT)의 입력 이미지로도 쓸 수 있도록 여러 개의 8*8로 잘라서 출력하는 단계
    를 포함하는 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 방법.
  16. 영상 압축 장치에 있어서,
    영상 데이터를 이산 웨이브렛 변환(DWT)하는 수단;
    각 블록 단위로 이산 웨이브렛 변환한 결과 산출된 영상 데이터의 변환 계수를 가진 블록들을 인간 시각 시스템(HVS)의 공간 주파수 민감도(spatial frequency sensitivity)를 효과적으로 이용하기 위해 재배열하는 수단;
    상기 재배열된 각 블록마다 화소의 이미지 데이터의 휘도(luminance)의 분산값을 산출하는 수단;
    상기 재배열된 각 블록마다 엔트로피를 산출하는 수단;
    인간 시각 시스템(HVS)의 특성을 반영한 퍼지 논리 규칙을 적용하여 상기 각 블록의 분산값 및 엔트로피로부터 각 블록의 유사치(relevance)를 산출하는 수단;
    상기 산출된 유사치를 이용하여 각 블록의 가중 분산값을 산출하는 수단;
    상기 산출된 가중 분산값을 이용하여 각 블록의 양자화 간격을 산출하는 수단;
    상기 양자화 간격을 행렬의 구성 요소로 가진 양자화 행렬을 참조하여 상기 이산 웨이브렛 변환 결과 얻어진 영상 데이터의 변환 계수를 양자화한 이미지 코드를 생성하는 수단 및
    상기 양자화된 이미지 코드를 엔트로피 부호화하여 압축된 영상 데이터를 생성하는 수단
    을 포함하는 것을 특징으로 하는 이산 웨이브렛 변환(DWT)을 이용한 영상 압축 장치.
  17. 제16항에 있어서,
    상기 재배열하는 수단은,
    영상 프레임의 좌측 상단 영역에 수직, 수평 방향으로 모두 낮은 공간 주파수를 갖는 이미지 데이터를 갖고, 우측 상단에는 수직 방향으로는 낮은 공간 주파수, 수평 방향으로는 높은 공간 주파수의 이미지 데이터를 갖고, 좌측 하단에는 수직 방향으로는 높은 공간 주파수, 수평 방향으로는 낮은 공간 주파수의 이미지 데이터를 갖고, 우측 하단에는 수직, 수평 방향으로 모두 높은 공간 주파수를 갖는 이미지 데이터가 오도록 재배치하는 수단 및
    모니터를 포함하는 영상 출력 장치로부터의 256*256, 512*512 중 적어도 어느 하나의 형태의 이미지 데이터를 8*8 형태의 JPEG의 이산 여현 변환기(DCT)의 입력 이미지로도 쓸 수 있도록 여러 개의 8*8로 잘라서 출력하는 수단
    를 포함하는 것을 특징으로 하는 이산 웨이브렛 변환을 이용한 영상 압축 장치.
KR1020000005779A 2000-02-08 2000-02-08 인간 시각 시스템의 특성을 반영한 퍼지 논리를 적용한이산 웨이브렛 변환을 이용한 영상 압축 방법 및 장치 KR100349518B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020000005779A KR100349518B1 (ko) 2000-02-08 2000-02-08 인간 시각 시스템의 특성을 반영한 퍼지 논리를 적용한이산 웨이브렛 변환을 이용한 영상 압축 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020000005779A KR100349518B1 (ko) 2000-02-08 2000-02-08 인간 시각 시스템의 특성을 반영한 퍼지 논리를 적용한이산 웨이브렛 변환을 이용한 영상 압축 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20010077752A true KR20010077752A (ko) 2001-08-20
KR100349518B1 KR100349518B1 (ko) 2002-08-21

Family

ID=19644670

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020000005779A KR100349518B1 (ko) 2000-02-08 2000-02-08 인간 시각 시스템의 특성을 반영한 퍼지 논리를 적용한이산 웨이브렛 변환을 이용한 영상 압축 방법 및 장치

Country Status (1)

Country Link
KR (1) KR100349518B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100788703B1 (ko) * 2006-02-24 2007-12-26 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
KR101029417B1 (ko) * 2009-04-16 2011-04-15 인하대학교 산학협력단 분산처리 기반 인체인식을 위한 퍼지추론 기반 비트 압축 시스템

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100745164B1 (ko) * 2005-02-22 2007-08-01 (주)애드팍테크놀러지 영상압축률 향상을 위한 밝기 연동 색차양자화 방법
KR102379634B1 (ko) 2020-10-14 2022-03-28 세종대학교산학협력단 쌍직교 웨이블릿을 이용한 원격감지 이미지의 다중레벨 이미지 압축 장치 및 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100788703B1 (ko) * 2006-02-24 2007-12-26 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
KR101029417B1 (ko) * 2009-04-16 2011-04-15 인하대학교 산학협력단 분산처리 기반 인체인식을 위한 퍼지추론 기반 비트 압축 시스템

Also Published As

Publication number Publication date
KR100349518B1 (ko) 2002-08-21

Similar Documents

Publication Publication Date Title
US6101279A (en) Image compression system using block transforms and tree-type coefficient truncation
Talukder et al. Haar wavelet based approach for image compression and quality assessment of compressed image
Sudhakar et al. Image compression using coding of wavelet coefficients–a survey
Kaur et al. A review of image compression techniques
Rehna et al. Wavelet based image coding schemes: A recent survey
Setia et al. Coding of DWT Coefficients using Run-length coding and Huffman Coding for the purpose of Color Image Compression
Kalavathi et al. A wavelet based image compression with RLC encoder
KR100349518B1 (ko) 인간 시각 시스템의 특성을 반영한 퍼지 논리를 적용한이산 웨이브렛 변환을 이용한 영상 압축 방법 및 장치
Baligar et al. Low complexity, and high fidelity image compression using fixed threshold method
Kumar et al. Prediction error based compression of color images using WDR coding
US6633679B1 (en) Visually lossless still image compression for CMYK, CMY and Postscript formats
Kumari et al. Image quality estimation by entropy and redundancy calculation for various wavelet families
Kale et al. Visually improved image compression by combining EZW encoding with texture modeling using Huffman Encoder
Nivedita et al. A Comparative Study of DCT and DWT-SPIHT
Albanesi et al. Human vision model and wavelets for high-quality image compression
Al-Sammaraie Medical Images Compression Using Modified SPIHT Algorithm and Multiwavelets Transformation
Kranthi et al. Enhanced image compression algorithm for image processing applications
Ranjeeta et al. Image compression: an overview
Cai et al. Wavelet transform and bit-plane encoding
Ranjan et al. An Efficient Compression of Gray Scale Images Using Wavelet Transform
Das et al. Image compression using discrete cosine transform & discrete wavelet transform
SVEC et al. Image compression using transform coding methods
Voukelatos et al. A multiresolution adaptive VQ based still image codec with application to progressive image transmission
Elmourssi et al. A PERFORMANCE STUDY OF TWO JPEG COMPRESSION APPROACHES
Gupta et al. Image Compression Using Matlab

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee