KR20070026512A - 컬러 이미지 인코딩을 위한 방법, 시스템 및 소프트웨어제품 - Google Patents

컬러 이미지 인코딩을 위한 방법, 시스템 및 소프트웨어제품 Download PDF

Info

Publication number
KR20070026512A
KR20070026512A KR1020067024347A KR20067024347A KR20070026512A KR 20070026512 A KR20070026512 A KR 20070026512A KR 1020067024347 A KR1020067024347 A KR 1020067024347A KR 20067024347 A KR20067024347 A KR 20067024347A KR 20070026512 A KR20070026512 A KR 20070026512A
Authority
KR
South Korea
Prior art keywords
new
color
index sequence
node
cost
Prior art date
Application number
KR1020067024347A
Other languages
English (en)
Other versions
KR100868716B1 (ko
Inventor
은 후이 양
지안펑 젱
Original Assignee
슬립스트림 데이터 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/831,656 external-priority patent/US7525552B2/en
Application filed by 슬립스트림 데이터 인크. filed Critical 슬립스트림 데이터 인크.
Publication of KR20070026512A publication Critical patent/KR20070026512A/ko
Application granted granted Critical
Publication of KR100868716B1 publication Critical patent/KR100868716B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/40Tree coding, e.g. quadtree, octree
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)
  • Color Television Systems (AREA)
  • Color Image Communication Systems (AREA)
  • Chemical And Physical Treatments For Wood And The Like (AREA)
  • Heat Sensitive Colour Forming Recording (AREA)
  • Closed-Circuit Television Systems (AREA)

Abstract

본 발명은 컬러 이미지 데이터의 압축에 관한 것이다. 하드 디지션 픽셀 맵핑과 소프트 디시젼 픽셀 맵핑의 조합은 낮은 계산 복잡성 및 예를 들어 GIF/PNG 디코더 같은 표준 디코더와의 호환성을 유지하면서 양자화 왜곡 및 압축 레이트를 공동으로 처리하는데 사용된다.
하드 디시젼 픽셀 맵핑, 소프트 디시젼 픽셀 맵핑, 이미지 데이터 압축

Description

컬러 이미지 인코딩을 위한 방법, 시스템 및 소프트웨어 제품{METHOD, SYSTEM AND SOFTWARE PRODUCT FOR COLOR IMAGE ENCODING}
본 발명은 컬러 이미지 인코딩을 위한 방법, 시스템 및 소프트웨어 제품에 관한 것이다.
최근의 인터넷을 통한 컬러 이미지 데이터의 양은 폭발적으로 증가하고 있다. 특히, 웹 사이트, 디지털 카메라 및 온라인 게임에 대한 증가하는 인기 때문에, 컬러 이미지 데이터는 인터넷 트래픽의 상당 부분을 차지하고 있다. 반면에, 무선 채널 또는 저 전력의 소형 장치를 통한 컬러 이미지에 대한 접속은 여전히 시간을 소비하고 불편하며, 이는 주로 이미지 디스플레이 장치, 저장 및 전송 대역폭이 다수의 멀티미디어 애플리케이션에 대해 정체현상을 일으키는 한계 때문이다.- 참조, J. Barrilleaux, R hinkle 및 S. Wells, "컬러 이미지 인코딩을 위한 효과적인 벡터 양자화", 음향, 언어 및 신호 처리, IEEE 국제 회의 ICASSP '87 12권 pp 740-743, 1987 4월(이후 "참조 [1"]), M.T.Orchard 및 C.A. Bouman, "이미지의 컬러 양자화", 신호 처리, IEEE 회보, 39권, no. 12, pp 2677-2690, 1991년 12월(이후 "참조[2]"), I. Ashdown, "8진트리(8진트리) 컬러 양자화", C/C++ 사용자 저널, 13권, no 3. pp. 31-43, 1994(이후 "참조[3]"), X. Wu, "새로운 컬러 팔레트 구조 에서의 Yiq 벡터 양자화", IEEE 회보, 이미지 처리, 5권, no 2, pp321-329, 1996(이후 "참조[4]"), L. Velho, J. Gomes 및 M.V.R. Sobreiro, "쌍비교(pairwise) 클러스터링에 의한 컬러 이미지 양자화", 성명서, 제10회 브라질리언 심포지엄. 컴퓨터. 그래프. 이미지 처리., L.H. de Figueiredo 및 M. L. Netto, Eds. Campos do jordao, Spain, pp. 203-210, 1997년(이후 "참조[5]") 및 S. Wan, P. Prusinkiewicz, 및 S.Wong, "프레임 버퍼 디스플레이를 위한 컬러 이미지 양자화에 기초한 변화", Res. Appl, 15권, pp. 52-58 1990년 (이후, 참조[6]).
상기 한계를 완화하는 한가지 방법은 압축, 최적화, 또는 컬러 이미지를 재 인코드하는 효과적인 컬러 이미지 인코딩 방식을 사용하는 것이다. 일반적인 컬러 이미지 인코딩 방식은 컬러 팔레트, 픽셀 맵핑(mapping) 및 무손실 코드로 구성된다. 상기 컬러 팔레트는 벡터 양자화 코드북으로서 동작하고, 원래의 컬러 이미지대로 모든 컬러를 표현하는데 사용된다. 상기 픽셀 맵핑은 그 후 이미지 내의 각각의 픽셀을 컬러 팔레트의 컬러에 대응하여 인덱스에 맵(map)한다. 픽셀 맵핑은 RGB 컬러 벡터의 양자화가 컬러 팔레트의 일정 컬러에 고정되고 컬러 팔레트가 주어지면 이미지의 RGB 컬러 벡터의 픽셀의 위치에 대해서 독립적인 하드 디시젼(hard desicion) 픽셀 맵핑 및 RGB 컬러 벡터가 상이한 픽셀 위치에서 컬러 팔레트의 상이한 컬러로 양자화되는 소프트 디시젼(soft decision) 픽셀 맵핑 중 하나이다. 픽셀 맵핑으로부터 발생한 인덱스 시퀀스는 최종적으로 무손실 코드에 의해서 코드화된다.
예전에, 컬러 팔레트 설계, 픽셀 맵핑 및 코드는 분리되어 조사되었다. 컬 러 팔레트의 설계 및 픽셀 맵핑에서, 코딩 부분은 종종 무시되고 주목적은 양자화 왜곡을 감소시키고 양자화된 이미지의 시각적 품질을 개선하며 계산상의 복잡성을 감소시키는 것이었다. 몇몇의 트리 구조 분열 및 병합 컬러 이미지 양자화 방법은 상기 목적 이상 또는 이하로 달성할 수 있도록 논문(참조[1] 내지 [6])에서 제안되었다.
반면에, 코딩이 고려되었을 때, 컬러 팔레트 및 픽셀 맵핑은 종종 주어진 것으로 가정되며, 상기 목적은 압축 레이트를 감소시키도록 인덱스 시퀀스를 위한 효과적인 코드를 설계하는 것이다. 예를 들어, 컬러 양자화된 이미지의 LUV 컬러 공간에서의 손실이 있는 압축을 위한 알고리즘은 A. Zaccarin 및B. Liu, "컬러 양자화된 이미지 코딩을 위한 새로운 접속", 이미지 처리, IEEE 회보, 2권, no. 4, pp-442-453, 1993년 10월(이후 "참조[7]")에서 주어졌다. 2 개의 발견적 해법은 무손실 예측 코딩 기술에 의해 이미지를 인코딩하기 이전에 컬러 맵을 재 순서화하는 N. D Mermon 및 A. Venkateswaran, "무손실 예측 코딩을 위한 컬러 맵의 순서화", 이미지 처리 IEEE 회보, 5권, no11, pp 1522-1524, 1996년(이후 참조"[8]")에서 제안되었다. 2진법 트리 구조 및 상황 기반 엔트로피 코딩에 기초하여, 압축 알고리즘은 컬러 양자화 이미지의 단계적인 코딩을 제공하기 위해 X. Chen, S. Kwong 및J. fu Feng, "컬러 양자화 이미지를 위한 새로운 압축 방식", 비디오 기술을 위한 회로 및 시스템, IEEE 회보, 12권, no 10, pp 904-908, 2002년 10월(이후 "참조[9]")에서 제안되었다. 상기 알고리즘에서, 압축 효율은 압축된 비트 스트림이 PNG 디코더와 같은 표준 디코더와 호환 불가능해지는 것을 희생하여 달성된다.
본 발명의 제1 측면에 따라, 데이터 처리 시스템을 사용하여 N개의 상이한 컬러로 디지타이즈된 컬러이미지로부터, M개의 분리 클러스터로 디지타이즈된 컬러 이미지의 모든 픽셀의 트리 구조 분할을 생성하는 방법에 있어서, 상기 M은 N 이하이고, N개의 상이한 컬러의 각각의 컬러는 컬러 팔레트에서 복수의 P-비트 바이트에 의해서 디지털로 표현되며, 각각의 P-비트 바이트의 P-비트는 최상의 비트부터 최하위 비트로 순서화되는 방법이 제공된다. 상기 방법은 (a): 모든 N개의 상이한 컬러를 포함하는 루트 노드를 제공하는 단계; (b) 루트 노드와 연결된 제1 레벨의 형제 노드를 제공하는 단계에 있어서, N개의 상이한 컬러의 각각의 컬러는 데이터 처리 시스템에 의해서 복수의 P-비트 바이트의 각각의 P-비트 바이트 중 제1 비트 값에 기초하여 제1 레벨의 형제 노드의 연관 노드에 할당되는 단계; (c) 하나 이상의 컬러를 포함하는 k 번째 레벨의 노드에서 각각의 노드를 위해, (k+1) 번째 레벨에서 복수의 형제 노드를 제공하는 단계에 있어서, 상기 노드의 각각의 컬러는 데이터 처리 시스템에 의해 컬러를 위한 복수의 P-비트 바이트의 각각의 P-비트 바이트 중 (k+1) 번째 비트의 값에 기초하여 (k+1) 번째 레벨에서 복수의 형제 노드의 연관 노드에 할당되고, 그에 따라 N개의 상이한 컬러의 각각의 컬러를 위해서 각각의 컬러만을 포함하는 고유 리프 노드가 존재하는 단계; 및 (d) M 리프 노드가 남을 때까지 리프 노드를 선택 및 병합하는 단계를 포함한다.
본 발명의 제2측면에 따라서, N개의 상이한 컬러로 디지타이즈된 컬러 이미지로부터 M개의 분리 클러스터로 디지타이즈된 컬러이미지의 모든 픽셀의 트리 구조 분할을 생성하기 위한 데이터 처리 시스템에 있어서, 상기 M은 N이하이고, N개의 상이한 컬러에서 각각의 컬러는 컬러 팔레트의 복수의 P-비트 바이트에 의해서 디지털로 표현되며, 각각의 P-비트 바이트의 P-바이트는 최상위 비트부터 최하위 비트로 순서화되는 데이터 처리 시스템이 제공된다. 데이터 처리 시스템은: (a) (i) 모든 N개의 상이한 컬러를 포함하는 루트 노드를 제공하며; (ii) 루트 노드와 연결된 제1 레벨의 형제 노드를 제공함에 있어서, N개의 상이한 컬러의 각각의 컬러는 데이터 처리 시스템에 의해서 복수의 P-비트 바이트의 각각의 P-비트 바이트 중 제1 비트 값에 기초하여 제1 레벨의 형제 노드의 연관 노드에 할당되며; (iii) 하나 이상의 컬러를 포함하는 k 번째 레벨의 노드에서 각각의 노드를 위해, (k+1) 번째 레벨에서 복수의 형제 노드를 제공하는 단계에 있어서, 상기 노드의 각각의 컬러는 데이터 처리 시스템에 의해 컬러를 위한 복수의 P-비트 바이트의 각각의 P-비트 바이트 중 (k+1) 번째 비트의 값에 기초하여 (k+1) 번째 레벨에서 복수의 형제 노드의 연관 노드에 할당되고, 그에 따라 N개의 상이한 컬러의 각각의 컬러를 위해서 각각의 컬러만을 포함하는 고유 리프 노드가 존재하기 위한 노드 생성 수단; 및 (b) 오직 M개의 리프 노드가 남을 때까지 리프 노드를 선택하고 병합하는 노드 병합 수단을 포함한다.
본 발명의 제3 측면에 따라, N개의 상이한 컬러로 디지타이즈된 컬러 이미지로부터 M개의 분리 클러스터로 디지타이즈된 컬러이미지의 모든 픽셀의 트리 구조 분할을 생성하기 위해 컴퓨터 시스템에서 사용하는 컴퓨터 프로그램 제품에 있어서, 상기 M은 N이하이고, N개의 상이한 컬러에서 각각의 컬러는 컬러 팔레트의 복수의 P-비트 바이트에 의해서 디지털로 표현되며, 각각의 P-비트 바이트의 P-바이트는 최상위 비트로부터 최하위 비트로 순서화되는 컴퓨터 프로그램 제품이 제공된다. 컴퓨터 프로그램 제품은 기록 매체; 이하의 단계를 수행하도록 컴퓨터 시스템에 지시하기 위해서 상기 매체에 기록되는 수단을 포함하며, 상기 단계는: 모든 N개의 상이한 컬러를 포함하는 루트 노드를 제공하는 단계; (b) 루트 노드와 연결된 제1 레벨의 형제 노드를 제공하는 단계에 있어서, N개의 상이한 컬러의 각각의 컬러는 데이터 처리 시스템에 의해서 복수의 P-비트 바이트의 각각의 P-비트 바이트 중 제1 비트 값에 기초하여 제1 레벨의 형제 노드의 연관 노드에 할당되는 단계; (c) 하나 이상의 컬러를 포함하는 k 번째 레벨의 노드에서 각각의 노드를 위해, (k+1) 번째 레벨에서 복수의 형제 노드를 제공하는 단계에 있어서, 상기 노드의 각각의 컬러는 데이터 처리 시스템에 의해 컬러를 위한 복수의 P-비트 바이트의 각각의 P-비트 바이트 중 (k+1) 번째 비트의 값에 기초하여 (k+1) 번째 레벨에서 복수의 형제 노드의 연관 노드에 할당되고, 그에 따라 N개의 상이한 컬러의 각각의 컬러를 위해서 각각의 컬러만을 포함하는 고유 리프 노드가 존재하는 단계; 및 (d) M개의 리프 노드가 남을 때까지 리프 노드를 선택 및 병합하는 단계이다.
본 발명의 제4 측면에 따라서, 픽셀 맵핑을 나타내는 새로운 인덱스 시퀀스 및 원본 및 새로운 컬러이미지 모두 n 픽셀로 정의되는 경우 원본 디지타이즈 컬러이미지로부터 획득된 새로운 디지타이즈 컬러 이미지를 위한 컬러 팔레트를 나타내는 새로운 출력 함수를 획득하는 방법에 있어서, 원본 디지타이즈 컬러 이미지는 N 픽셀에 할당되는 N개의 고유 컬러에 의해서 제공되며, 새로운 디지타이즈 컬러 이미지는 n 픽셀에 할당되는 M개의 상이한 컬러에 의해서 제공되고, 새로운 인덱스 시퀀스는 n 픽셀을 나타내기 위한 n 인덱스 요소를 포함하고 새로운 출력 함수는 n 인덱스 요소를 M 컬러로 맵핑 하는 방법이 제공된다. 상기 방법은 (a) 원본 디지타이즈 컬러 이미지의 모든 픽셀을 원본 디지타이즈 컬러 이미지의 픽셀의 위치에 상관없이 원본 디지타이즈 컬러 이미지의 각각의 픽셀에 기초하여 M 분리 클러스터로 분할함으로써 제1 신규 인덱스 시퀀스를 제공하는 단계에 있어서, M은 N이하인 단계; (b) M 분리 클러스터의 픽셀에 대한 M개의 상이한 컬러의 1 대 1 맵핑을 제공하기 위해서 제1 신규 출력 함수를 제공하는 단계; (c) 제1 신규 인덱스 시퀀스를 위한 소프트 디시젼 최적화 처리 및 신규 인덱스 시퀀스를 제공하는 제1 신규 출력 함수를 사용하며 신규 출력 함수는 제1 신규 인덱스 시퀀스의 각각의 요소를 위해서 제1 신규 출력 함수에 의해 상기 요소에 할당된 컬러 값이 제1 신규 출력 함수에 의한 제1 신규 인덱스 시퀀스의 적어도 하나 이상의 기타 요소에 할당된 컬러 값과 상관되는 방법에 기초하는 단계를 포함한다.
본 발명의 제5 측면에 따라, 픽셀 맵핑을 나타내는 새로운 인덱스 시퀀스 및 원본과 새로운 컬러이미지 모두 n 픽셀로 정의되는 경우 원본 디지타이즈 컬러이미지로부터 획득된 새로운 디지타이즈 컬러 이미지를 위한 컬러 팔레트를 나타내는 새로운 출력 함수를 획득하는 데이터 처리 시스템에 있어서, 원본 디지타이즈 컬러 이미지는 N 픽셀에 할당되는 N개의 상이한 컬러에 의해서 제공되며, 새로운 디지타이즈 컬러 이미지는 n 픽셀에 할당되는 M개의 상이한 컬러에 의해서 제공되고, 새로운 인덱스 시퀀스는 n 픽셀을 나타내기 위한 n 인덱스 요소를 포함하고 새로운 출력 함수는 n 인덱스 요소를 M 컬러로 맵핑 하는 시스템이 제공된다. 상기 시스템은 (a) (i) 원본 디지타이즈 컬러 이미지의 모든 픽셀을 원본 디지타이즈 컬러 이미지의 픽셀의 위치에 상관없이 원본 디지타이즈 컬러 이미지의 각각의 픽셀에 기초하여 M 분리 클러스터로 분할함으로써 제1 신규 인덱스 시퀀스를 제공하며, 상기 M은 N이하이고; (ii) M 분리 클러스터의 픽셀에 대한 M개의 상이한 컬러의 1 대 1 맵핑을 제공하기 위해서 제1 신규 출력 함수를 제공하는 하드 디시젼 모듈 및; (b) 제1 신규 인덱스 시퀀스를 위한 소프트 디시젼 최적화 처리 및 신규 인덱스 시퀀스를 제공하는 제1 신규 출력 함수를 사용하며 신규 출력 함수는 제1 신규 인덱스 시퀀스의 각각의 요소를 위해서 제1 신규 출력 함수에 의해 상기 요소에 할당된 컬러 값이 제1 신규 출력 함수에 의한 제1 신규 인덱스 시퀀스의 적어도 하나 이상의 기타 요소에 할당된 컬러 값과 상관되는 방법에 기초하는 소프트 디시젼 모듈을 포함한다.
본 발명의 제6 측면에 따라서, 픽셀 맵핑 및 원본 및 새로운 컬러이미지 모두 n 픽셀로 정의되는 경우 원본 디지타이즈 컬러이미지로부터 획득된 새로운 디지타이즈 컬러 이미지를 위한 컬러 팔레트를 나타내는 새로운 출력 함수를 생성하기 위해 컴퓨터 시스템에서 사용되는 컴퓨터 프로그램 제품에 있어서, 원본 디지타이즈 컬러 이미지는 N 픽셀에 할당되는 N개의 상이한 컬러에 의해서 제공되고, 새로운 디지타이즈 컬러 이미지는 n 픽셀에 할당되는 M개의 상이한 컬러에 의해서 제공되며, 새로운 인덱스 시퀀스는 n 픽셀을 나타내기 위한 n 인덱스 요소를 포함하고 새로운 출력 함수는 n 인덱스 요소를 M 컬러로 맵핑 하는 컴퓨터 프로그램 제품이 제공된다. 상기 컴퓨터 프로그램 제품은 기록 매체 및 이하의 단계를 수행하도록 컴퓨터 시스템에 지시하기 위해서 상기 매체에 기록된 수단을 포함하며, 상기 단계는: (a) 원본 디지타이즈 컬러 이미지의 모든 픽셀을 원본 디지타이즈 컬러 이미지의 픽셀의 위치에 상관없이 원본 디지타이즈 컬러 이미지의 각각의 픽셀에 기초하여 M 분리 클러스터로 분할함으로써 제1 신규 인덱스 시퀀스를 제공하는 단계에 있어서, M은 N이하인 단계; (b) M 분리 클러스터의 픽셀에 대한 M개의 상이한 컬러의 1 대 1 맵핑을 제공하기 위해서 제1 신규 출력 함수를 제공하는 단계; (c) 제1 신규 인덱스 시퀀스를 위한 소프트 디시젼 최적화 처리 및 신규 인덱스 시퀀스를 제공하는 제1 신규 출력 함수를 사용하며 신규 출력 함수는 제1 신규 인덱스 시퀀스의 각각의 요소를 위해서 제1 신규 출력 함수에 의해 상기 요소에 할당된 컬러 값이 제1 신규 출력 함수에 의한 제1 신규 인덱스 시퀀스의 적어도 하나 이상의 기타 요소에 할당된 컬러 값과 상관되는 방법에 기초하는 단계를 포함한다.
본 발명의 양호한 측면의 자세한 설명은 첨부된 도면을 참고하여 이하에서 제공된다.
도1은 본 발명의 양호한 측면에 따른 컴퓨터 시스템에 대한 블록도.
도2는 본 발명의 양호한 측면에 따른 8진트리(octree) 구조에 대한 도면.
도3은 본 발명의 소프트 디시젼 최적화 측면의 제1 변경에 따른 비터비 알고리즘을 도시한 도면.
도4는 본 발명의 소프트 디시젼 최적화 측면의 제2 변경에 따른 비터비 알고 리즘을 도시한 도면.
도5는 도1의 컴퓨터 시스템의 CPU를 도시한 블록도.
도1을 참고하면, 본 발명의 한 측면에 따른 컴퓨터 시스템(10)의 블록도가 도시되어 있다. 상기 컴퓨터 시스템은 컬러 이미지 데이터를 저장하기 위한 메모리(12), 디지털 컬러 이미지를 디스플레이하기 위한 모니터(14), 이미지를 처리하고 낮은 계산 복잡성 및 GIF/PNG 디코더와의 호환성을 유지하면서 양자화, 왜곡 및 압축 가중차를 결합하여 최적화하는 컬러 데이터의 압축을 제공하는 CPU(16) 및 GIF 인코더 또는 PNG 인코더와 같이 전송로(20)를 통해서 컴퓨터 시스템(10)으로부터 전송하기 이전에 컬러 이미지 데이터를 인코딩하기 위한 인코더(20)를 포함한다.
컬러 이미지 인코딩의 공동 최적화 문제는 다음으로 정의될 수 있다:
가 RGB 컬러 공간이라고 하자.
Figure 112006085039577-PCT00002
가 N개의 상이한 컬러를 구비한 원본 컬러 이미지의 컬러 팔레트라고 가정한다. 만약 원본 이미지의 픽셀의 총 수가 n 이라면, 우리는 컬러 이미지를 상단에서 하단으로 좌에서 우로 스캔함으로써 인덱스 시퀀스
Figure 112006085039577-PCT00003
를 얻을 수 있으며, 여기서
Figure 112006085039577-PCT00004
는 k 번째 픽셀의 컬러 데이터가
Figure 112006085039577-PCT00005
라는 것을 의미한다. 만약 원본 컬러 이미지를 재생산하기 위해서 M 컬러(M<N)을 구비한 새로운 컬러 팔레트(C)를 사용하여야 한 다고 제한한다면, 공동 최적화 인코더는 새로운 컬러 팔레트
Figure 112006085039577-PCT00006
, 새로운 인덱스 시퀀스
Figure 112006085039577-PCT00007
및 원본 이미지를 재생산하고 비용 함수
Figure 112006085039577-PCT00008
를 최소화하는 무손실 코드워드 길이 함수(
Figure 112006085039577-PCT00009
)를 찾는 것을 목표로 하며, 여기서 λ는 라그랑주(Lagrangian) 곱수이며, d는
Figure 112006085039577-PCT00010
Figure 112006085039577-PCT00011
에 유도되는 에러 제곱이다:
[수학식 1.1]
Figure 112006085039577-PCT00012
무손실 코드워드 길이 함수와 무손실 코드 사이에 1 대 1 맵핑이 존재하기 때문에, 무손실 코드워드 길이 함수의 선택은 무손실 코드의 선택과 등가이다.
명백하게
[수학식 1.2]
Figure 112006085039577-PCT00013
는 총 에러 제곱(TSE)이며, 이는 양자화된 컬러 이미지의 시각적 품질과 밀접한 관계가 있다. TSE 또는 다른 유사한 왜곡 측정치의 최소화는 참조[1] 내지 참조[6]에서 고려된 양자화-배향 방법의 유일한 목적이라는 것에 주목하여야 한다. 마찬가지로, 새로운 컬러 팔레트(C) 및 픽셀 맵핑(이후 인덱스 시퀀스 U)을 가정하면, 모든 가능한 무손실 코드워드 길이 함 수(
Figure 112006085039577-PCT00014
) 중에서 비트 레이트
Figure 112006085039577-PCT00015
의 최소화는 참조[7] 내지 참조[9]에서 고려된 컬러 양자화된 이미지를 위한 코딩 방법의 유일한 목적이다. 상기에 주어진 비용 함수는 레이트 및 왜곡의 결합 최적화 문제를 제기한다. 양자화 왜곡은 컬러 팔레트(C) 및 픽셀 맵핑(즉, 인덱스 시퀀스 U)에 의해 결정된다; 압축 레이트는 픽셀 맵핑 및 무손실 코드워드 길이 함수(
Figure 112006085039577-PCT00016
) 양자에 의해서 결정된다. 물론 여기서 픽셀 맵핑은 소프트 디시젼 픽셀 맵핑이다. 그러므로 비록 무손실 코드워드 길이 함수(
Figure 112006085039577-PCT00017
)는 고정되어 있지만, 여전히 C 및 U를 변경함으로써 레이트 및 왜곡을 공동으로 최적화할 수 있다.
다수의 무손실 코드워드 길이 함수가 존재하며, 각각 D. A Huffman, "최소-잉여 코드 건설을 위한 방법", 회보, IRE, 40권, no 9, pp 1098-1101, 1953(이후 "참조[12]")의 호프만 코드, J.Ziv 및 A.Lempel, "시퀀셜 데이터 압축을 위한 유니버설 알고리즘", IEEE 회보, 정보 이론, 23 권, pp. 337-343, 1977(이후 "참조[11]"), J.Ziv 및 A.Lempel IEEE 회보, 정보 이론(이후 "참조[10]")의 Lempel-ziv 코드, I.H.Witten, M, Neal 및 J. G. Cleary, "데이터 압축을 위한 산술 코딩", 칼럼, ACM, 30권, pp. 520-540 1987년 6월(이후 "참조[13])의 산술 코드, E. H. Yang 및 J. C. Kieffer, "탐욕적(greedy) 시퀀셜 그래머 트랜스폼에 기초한 효과적인 유니버설 무손실 데이터 압출 알고리즘-파트 원: 문맥 모델 부존재", IEEE 회보. 정보 이론, 46권, no. 3, pp 755-777, 2000년 5월(이후 "참조[14]), J. C. Kieffer 및 E. H. Yang, "문법 기초 코드: 유니버설 무손실 자원 코드의 새로운 계 층", IEEE 회보, 정보 이론, 46권, no. 3, pp. 737-754, 2000년5월 (이후 "참조 [15]"), E. H. Yang 및 D. K. He, IEEE 회보. 정보 이론, 49권 pp. 2874-2894, 2003(이후 참조 [16]")의 문법 기초 코드 및 컬러 이미지 인코딩을 위해 특별히 설계된 무손실 코드 (참조[7] 내지 [9]를 참고하시오)와 같은 상이한 엔트로피 코드와 대응한다. 우리는 GIF/PNG 디코더와의 호환성이 유지되기를 바라기 때문에, 우리는 (
Figure 112006085039577-PCT00018
)이 GIF 디코더의 경우에 LZ78의 코드워드 길이 또는 그것의 변형이 되도록 선택하며 PNG 디코더의 경우의 LZ77 코드의 코드워드 길이 또는 그것의 변형이 되도록 선택할 것이며, J. Milano, "압축된 이미지 파일 형식: JPEG, png, gif, xbm, bmp", ACM 프레스, 2000년(이후 "참조[17]")를 참고할 수 있고, 각각의 경우
Figure 112006085039577-PCT00019
에 의해서 나타내어질 것이다. 그러므로 이 경우 최소화된 비용 함수는
Figure 112006085039577-PCT00020
이다.
상기에 주어진 비용 함수는 P. A. Chou, T. Lookabaugh 및 R. M. Gray, "엔트로피 제약 벡터 양자화", 음향, 언어 및 신호 처리[IEEE 회보 신호 처리 또한 참고], IEEE 최보 37권, no. 1, pp31-42, 1989년 1월(이후 "참조[18]")의 엔트로피 제약 벡터 양자화(ECVQ)에서 정의된 비용 함수와 유사한 형태이며, 좀 더 자세하게는 E. H. Yang 및 Z. Zhang, "가변 레이트 격자 소스 인코딩", IEEE 회보. 정보 이론, 45권, no 2. pp. 586-608, 199년3월(이후 "참조[19]")의 가변-레이트 격자 소스 인코딩(VRTSE)에서 정의된 비용 함수 형태와 유사하다. VRTSE는 격자 구조를 사용하고 결과 레이트, 왜곡 및 선택된 인코딩 경로를 공동으로 최적화한다는 점에서 엔트로피 제약 스칼라 양자화 및 벡터 양자화[18]의 일반화라고 볼 수 있다. 특히 낮은 레이트 영역에서, 그것의 효과적인 성능은 고 압축률이 저장 공간 및 전송 시간을 절약하기 위해서 필요한 경우 VRTSE를 특히 컬러 이미지 인코딩에 사용할 수 있게 한다.
VRTSE에 기초하여, 낮은 계산 복잡성 및 GIF/PNG 디코더와의 호환성을 유지하면서 공동으로 양자화 왜곡 및 압축 레이트를 결합하여 최적화할 수 있는 본 발명에 따른 두 가지 방법, 즉 가변-레이트 격자 컬러 양자화(VRTCQ 1) 및 VRTCQ 2를 개발하였다. VRTCQ 1 및 VRTCQ 2 양자 모두는 소프트 디시젼 픽셀 맵핑을 사용하며 반복된다. 추가로, 본 발명의 추가적인 측면에 따라, RGB 컬러를 위해 8진트리 데이터 구조를 사용하고 양자화된 컬러 이미지를 위해 엔트로피 제약 비용을 지역적으로 최소화하는 엔트로피 제약 계층 병합 양자화(ECHMQ)는 VRTCQ 1 및 VRTCQ 2를 위해 초기 컬러 이미지 인코딩 방식을 제공하도록 개발된다. 그 자체로, ECHMQ는 양자화된 컬러 이미지의 레이트와 왜곡을 교환하는 효과적인 방법을 제공한다.
가변-레이트 격자 소스 인코딩의 간단한 리뷰
[19]에서 표현된 가변-레이트 격자 소스 인코딩은 E. hui Yang, Z. Zhang, 및 T. Berger, "고정된 기울기 유니버설 손실 있는 데이터 압축", IEEE 회보. 정보 이론, 43권, no. 5, pp. 1465-1476, 1997년 9월(이후 "참조[20]")에 표현되었고, 격자 구조 디코더의 경우에 대한 고정된 기울기의 손실이 있는 코딩의 확장이다. 각각의 실수치의 소스 시퀀스
Figure 112006085039577-PCT00021
를 위해, 비용 함수
Figure 112006085039577-PCT00022
를 최소화하는 시퀀스
Figure 112006085039577-PCT00023
를 찾는 것을 목표로 하며, λ는 임의의 라그랑주(Lagrangian) 곱수이며,
Figure 112006085039577-PCT00024
은 무손실 코드워드 길이 함수이고,
Figure 112006085039577-PCT00025
Figure 112006085039577-PCT00026
에 대응하는 재생산 시퀀스이며, p는 임의의
Figure 112006085039577-PCT00027
에 대한
Figure 112006085039577-PCT00028
에 의해서 정의되는 에러 왜곡 제곱이다.
상기 재생산 시퀀스
Figure 112006085039577-PCT00029
는 격자 구조 디코더
Figure 112006085039577-PCT00030
를 통해
Figure 112006085039577-PCT00031
로 부터 결정되며, 여기서
Figure 112006085039577-PCT00032
는 상태 변이 함수이고,
Figure 112006085039577-PCT00033
는 상태 집합이며,
Figure 112006085039577-PCT00034
는 출력 함수이다. 함수
Figure 112006085039577-PCT00035
Figure 112006085039577-PCT00036
는 각각 격자 구조 및 재생산 레벨의 집합(컬러 팔레트와 유사함)을 결정한다. 초기 상태
Figure 112006085039577-PCT00037
를 가정하면, 재생산 시퀀스
Figure 112006085039577-PCT00038
은 이하와 같이 계산된다:
[수학식 2.3]
Figure 112006085039577-PCT00039
다른 말로 하면,
Figure 112006085039577-PCT00040
을 수신할 때, 디코더
Figure 112006085039577-PCT00041
는 상태 시퀀스
Figure 112006085039577-PCT00042
를 순환하는 동안 재생산 시퀀스
Figure 112006085039577-PCT00043
를 출력한다.
Figure 112006085039577-PCT00044
고정.
Figure 112006085039577-PCT00045
이 k차 전이 확률 함수
Figure 112006085039577-PCT00046
를 갖는 k차 정적 산술 코드워드 길이 함수
Figure 112006085039577-PCT00047
가 되도록 선택한다. 비터비 알고리즘은 그 후 최적 시퀀스
Figure 112006085039577-PCT00048
을 찾는데 사용될 수 있다:
[수학식 2.4]
Figure 112006085039577-PCT00049
Figure 112006085039577-PCT00050
고정.
Figure 112006085039577-PCT00051
,
Figure 112006085039577-PCT00052
Figure 112006085039577-PCT00053
(또는 등가적으로
Figure 112006085039577-PCT00054
)의 공동 최적화는 아래 식처럼 기술될 수 있다.
[수학식 2.5]
Figure 112006085039577-PCT00055
교호 알고리즘은 공동 최적화 문제(2.5)를 풀기 위해서 [19]에서 제안되었다. 상기 교호 알고리즘의 처리과정은 아래와 같이 기술된다:
단계1: t=0으로 설정. 다음을 만족시키는 출력 함수
Figure 112006085039577-PCT00056
및 전이 확률 함수
Figure 112006085039577-PCT00057
를 선택한다.
임의의
Figure 112006085039577-PCT00058
Figure 112006085039577-PCT00059
에 대해,
Figure 112006085039577-PCT00060
단계2:
Figure 112006085039577-PCT00061
Figure 112006085039577-PCT00062
고정.
Figure 112006085039577-PCT00063
Figure 112006085039577-PCT00064
로 대체하고
Figure 112006085039577-PCT00065
Figure 112006085039577-PCT00066
로 대체한 수학식 2.4를 만족시키는 시퀀스
Figure 112006085039577-PCT00067
를 발견하기 위해 비터비 알고리즘을 사용한다.
단계3:
Figure 112006085039577-PCT00068
를 고정. 인덱스 시퀀스
Figure 112006085039577-PCT00069
는 이하와 같이 전이 확률 함수 및 출력 함수의 갱신을 야기한다
Figure 112006085039577-PCT00070
Figure 112006085039577-PCT00071
여기서,
Figure 112006085039577-PCT00072
Figure 112006085039577-PCT00073
에 반응하여 격자 디코더
Figure 112006085039577-PCT00074
에 의해 순환된 상태이고,
Figure 112006085039577-PCT00075
Figure 112006085039577-PCT00076
Figure 112006085039577-PCT00077
를 만족시키는 모든
Figure 112006085039577-PCT00078
를 취한다.
단계4:t=0,1,2,..에서
Figure 112006085039577-PCT00079
까지 단계 2부터 3까지 반복. 여기서
Figure 112006085039577-PCT00080
는 규정된 작은 임계치이며,
Figure 112006085039577-PCT00081
는 k차 전이 확률 함수
Figure 112006085039577-PCT00082
와 연관된 k차 정적 산술 코드워드 길이 함수이다. 따라서, 출력은
Figure 112006085039577-PCT00083
Figure 112006085039577-PCT00084
이다.
VRTSE의 성능은 참조[19]의 정리 3 및 4로 표현된 레이트 왜곡 제한과 점근적으로 가까워진다. 가우시안, 라플라시안, 가우스-마르코프 소스를 통한 실험적 결과는 VRTSE가 특히 낮은 레이트 코딩에 적합하다는 것을 보여준다. VRTSE를 컬러 이미지 인코딩에 사용하기 위해서 이하의 문제들이 반드시 언급되어야 한다:
문제 1: VRTSE에서 사용되는 무손실 코드워드 길이 함수는 k차 정적 산술 코드워드 길이 함수
Figure 112006085039577-PCT00085
이다. 반면의 컬러 이미지 인코딩의 본 예에서, 무손실 코드워드 길이 함수는 Lempel-ziv 코드워드 길이 함수
Figure 112006085039577-PCT00086
이다.
문제 2: VRTSE에서, 초기 단계 단계1은 특정되지 않았다. 즉, 초기 함수
Figure 112006085039577-PCT00087
Figure 112006085039577-PCT00088
를 선택하는 방법이 종종 VTRSE에서 남아있다. 이는 우리의 컬러 이미지 인코딩 설정에서 어떻게 초기 컬러 이미지 인코딩 방식을 설계할 것인가로 해석된다.
문제 3: 계산 복잡성을 감소하기 위해서, VTRSE의 인덱스 집합
Figure 112006085039577-PCT00089
은 종종 높은 차수의 산술 코드워드 길이가 사용될 수 있도록
Figure 112006085039577-PCT00090
=2를 갖는 2진수로 선택된다. 반면에, 컬러 이미지 인코딩에서, 기수 M은 보통 비교적 큰 수이며, 256 정도일 수 있다. 그러므로 계산 복잡성을 감소할 수 있는 새로운 방법이 필요하다.
문제1을 해결하기 위해서, 우리는 Lempel-ziv 코드워드 길이 함수
Figure 112006085039577-PCT00091
의 상계를 설정할 것이다. 만약
Figure 112006085039577-PCT00092
가 LZ78의 코드워드 길이 함수라면, 그것은 임의의 시퀀스
Figure 112006085039577-PCT00093
에 대해서 무손실 소스 코딩 논문(예를 들어 참조[14])을 따라서,
[수학식 2.6]
Figure 112006085039577-PCT00094
이다.
여기서
Figure 112006085039577-PCT00095
는 비트당 심벌에서
Figure 112006085039577-PCT00096
의 k차 실험적 엔트로피이고,
Figure 112006085039577-PCT00097
는 k에 따른 상수이며 log는 밑이 2인 로그를 나타낸다. 만약
Figure 112006085039577-PCT00098
가 LZ77의 코드워드 길이 함수라면 유사한 상계가 또한 유효할 것이다. 왜곡 제한을 조건으로
Figure 112006085039577-PCT00099
를 최소화하는 것 대신, 우리는 VRTCQ 1에서 동일한 왜곡 제한을 조건으로 하여
Figure 112006085039577-PCT00100
를 최소화할 것이다. 상이한 상계가 VRTCQ 2에서 사용될 것이다. 문제 2와 문제3은 이하에서 언급된다.
엔트로피 제한 계층 병합 양자화
본 발명의 한 측면에 따라, 문제2는 엔트로피 제한 계층 병합 양자화(ECHMQ)를 통해서 언급될 것이며, 이는 VRTSE를 위한 초기 컬러 이미지 인코딩 방식을 제공한다. ECHMQ는 VRTCQ 1 및 VRTCQ 2 양자를 위해 제1 스테이지의 역할을 한다.
ECHMQ는 하드 디시젼 양자화이며, 원본 N 컬러를 겹치지 않은 M 클러스터로 분할하며, 각각의 클러스터를 위한 재생산 컬러를 발견하고, 2차원 이미지에서 원 본 컬러에 위치에 관계없이 각각의 원본 컬러를 위한 재생산 컬러를 결정한다. 이는 8진트리 데이터 구조 [3]을 이용하며 위치적으로 엔트로피 제약 비용을 최소화함으로써 레이트와 왜곡을 교환하며, 이하에서 정의된다.
컬러 팔레트
Figure 112006085039577-PCT00101
를 갖는 n- 픽셀 컬러 이미지를 가정하고 새로운 컬러 팔레트 크기 M<N이 필요하다면, 우리는 N 컬러를 M 클러스터
Figure 112006085039577-PCT00102
로 분할하기 위해서 양자화기 q를 사용하며, M 클러스터는
Figure 112006085039577-PCT00103
Figure 112006085039577-PCT00104
에 대해서 다음 식을 만족시킨다.
[수학식 3.7]
Figure 112006085039577-PCT00105
클러스터 중심의 정수 형태는 컬러 팔레트
Figure 112006085039577-PCT00106
를 구성하며, 원본 컬러로부터 클러스터로의 맵핑은 명시적으로 각각의 픽셀에서 인덱스로 맵핑 된다.
Figure 112006085039577-PCT00107
가 인덱스에 대한 모든 픽셀의 맵핑으로부터 획득된 인덱스 시퀀스라고 하자. 그러면 양자화된 이미지의 엔트로피 제한 비용은 다음과 같이 정의된다.
[수학식 3.8]
Figure 112006085039577-PCT00108
여기서 λ는 라그랑주 곱수이다. 식(3.8)에서
Figure 112006085039577-PCT00109
는 총 시퀀스 에러이며 다음과 같이 정의된다.
[수학식 3.9]
Figure 112006085039577-PCT00110
여기서,
Figure 112006085039577-PCT00111
일 때,
Figure 112006085039577-PCT00112
는 원본 컬러 이미지에서 컬러
Figure 112006085039577-PCT00113
가 발생한 횟수이며,
Figure 112006085039577-PCT00114
는 식(1.1)에서 정의한 것처럼 RGB 공간에서 2 개의 컬러 사이의 유클리드 거리이다.
Figure 112006085039577-PCT00115
는 인덱스 시퀀스
Figure 112006085039577-PCT00116
의 코드워드 길이이다. 컬러로부터 인덱스로의 맵핑은 컬러 이미지에서의 컬러 위치에 대해 독립적이기 때문에, 1차 엔트로피가 코드워드 길이를 계산하기 위해서 사용된다.
[수학식 3.10]
Figure 112006085039577-PCT00117
식(3.8)에서 정의된 비용 함수는 참조[18]의 엔트로피 제한 벡터 양자화(ECVQ)에서 정의된 라그랑주 함수와 유사하다. 주요 논점은 양오한 레이트 왜곡 트레이트오프 및 낮은 인코딩 복잡성을 가진 하드 디시젼 양자화기 q를 설계하는 것이다. 8진트리 구조가 병합 및 양자화된 이미지의 레이트와 왜곡을 교환하는 식(3.8)에서 정의된 비용 함수의 속도를 높이기 위해서 사용된다.
각각의 픽셀의 컬러를 스캔하고 그것을 트리[3]에 삽입하는 온 더 플라이 8진트리 형성 과정과 다르게, 우리는 원본 컬러 이미지의 히스토그램을 얻어 초기 8진트리를 형성한다. 도2를 참고하면, 8진트리(22)의 그래프가 도시되어 있으며, 이는 모든 상이한 컬러 및 원본 컬러 이미지에서의 그것의 발생 횟수를 포함한다. 루트 노드(24), 즉 레벨 0은 컬러 이미지의 모든 상이한 컬러를 포함한다. RGB 컬러 공간의 각각의 컬러는 3 개의 8비트 바이트를 포함하기 때문에, 이들 각각은 주요 구성요소를 나타내며 3 개의 바이트 중에서 최상의 비트가 레벨 1에서 컬러의 위치를 결정한다. 하나 이상의 컬러가 노드를 통과하면, 그 노드는 중간 노드(26)이고 하위 RGB 비트의 조합에 따라서 추가로 분할된다. 리프 노드(28)를 통과하는 컬러는 그 리프 노드(28) 내에 있는 컬러라고 불리며, 상기 컬러는 실제로는 그 리프 노드의 중심에 있다. 각각의 컬러 구성요소 방향에서, 레벨 k에서 임의의 두 개의 리프 형제 노드의 중심 사이의 거리는
Figure 112006085039577-PCT00118
의 범위가 된다. 명백하게, k가 커질수록 중심 컬러는 더욱 유사해진다. 도2에 도시한 8진 트리(22)는 2 가지 이유로 고도로 불균형하며 비대칭적이라는 것을 기억하라: 첫째로, 평범한 컬러 이미지에 나타나있는 컬러의 수는 RGB 공간에서 사용할 수 있는 총
Figure 112006085039577-PCT00119
컬러보다 훨씬 작다(참조[17] 참고); 둘째로 만약 하나의 컬러가 노드를 통과한다면 노드는 분할을 멈춘다.
원본 컬러 이미지에서 각각의 고유 컬러
Figure 112006085039577-PCT00120
는 이제 8진트리의 상이한 리프 노드
Figure 112006085039577-PCT00121
에 삽입된다. 그럴 때마다 두 개의 리프 형제 노드를 병합하는 것을 반복함으로써, 우리는 리프 노드의 수를 N으로부터 M으로 감소시킬 수 있다. 각각의 결과 리프 노드의 중심의 정수형태는 새로운 컬러 팔레트에서의 컬러이다. 리프 형제 노드의 반복된 병합 후에, 각각의 리프 노드는 원본 컬러 이미지의 컬러 팔레트의 컬러의 서브셋에 대응한다는 것을 기억해라.
Figure 112006085039577-PCT00122
가 원본 컬러 이미지의 컬러 팔레트라고 가정하자.
Figure 112006085039577-PCT00123
Figure 112006085039577-PCT00124
가 부모 노드
Figure 112006085039577-PCT00125
의 두 개의 리프 형제 노드라고 하고, 여기서
Figure 112006085039577-PCT00126
이며
Figure 112006085039577-PCT00127
이다.
Figure 112006085039577-PCT00128
Figure 112006085039577-PCT00129
를 위한 중신 컬러이고,
Figure 112006085039577-PCT00130
Figure 112006085039577-PCT00131
를 위한 중심 컬러라고 하자. 노드
Figure 112006085039577-PCT00132
의 발생의 횟수
Figure 112006085039577-PCT00133
는 노드
Figure 112006085039577-PCT00134
의 각각의 컬러의 발생의 횟수의 합으로 정의된다.
Figure 112006085039577-PCT00135
여기서,
Figure 112006085039577-PCT00136
는 원본 이미지의 컬러
Figure 112006085039577-PCT00137
의 발생 횟수를 의미한다. 노드
Figure 112006085039577-PCT00138
의 발생의 횟수
Figure 112006085039577-PCT00139
는 유사한 방법을 계산된다:
Figure 112006085039577-PCT00140
여기서
Figure 112006085039577-PCT00141
는 원본 이미지의 컬러
Figure 112006085039577-PCT00142
의 발생의 횟수를 나타낸다. 두 개의 노드 새로운 노드
Figure 112006085039577-PCT00143
Figure 112006085039577-PCT00144
를 새로운 노드
Figure 112006085039577-PCT00145
로 병합함으로써, 우리는
Figure 112006085039577-PCT00146
Figure 112006085039577-PCT00147
의 모든 컬러를 새로운 노드
Figure 112006085039577-PCT00148
로 이동할 수 있다. 즉
Figure 112006085039577-PCT00149
이다. 따라서, 노드
Figure 112006085039577-PCT00150
의 발생 횟수는
Figure 112006085039577-PCT00151
이다. 실수치의 컬러가 허용된다고 가정하자. 이하의 명제는
Figure 112006085039577-PCT00152
Figure 112006085039577-PCT00153
Figure 112006085039577-PCT00154
로 병합함으로써 발생하는 엔트로피 제한 비용 증분을 산출한다.
명제1:
Figure 112006085039577-PCT00155
Figure 112006085039577-PCT00156
를 병합함으로써, 엔트로피 제한 비용은 이하 식에 의해 증가한다.
[수학식 3.11]
Figure 112006085039577-PCT00157
여기서,
Figure 112006085039577-PCT00158
는 노드
Figure 112006085039577-PCT00159
의 중심이다, 즉
[수학식 3.12]
Figure 112006085039577-PCT00160
증명: 우리가 셀의 중심을 이용하여 셀의 모든 구성요소를 재생산할 때, 최소 총 에러 제곱이 달성된다. 이는 S. P. Lloyd, "pcm의 최소 제곱 양자화", IEEE 회보, 정보 이론, no 28, pp 127-135, 1982 3월(이후 "참조[21]")의 중심 조건으로 양자화 방법에서 널리 사용된다. 본 명세서에서, 양자화 레벨, 즉 노드의 모든 컬러를 위한 재생산 컬러로서 리프 노드의 중심을 사용한다. 이러한 수단으로, 각각의 가능한 병합을 위한 엔트로피 제한 비용은 병합 전과 병합 후의 총 엔트로피 제한 비용 사이의 차이에 대한 계산 없이 계산될 수 있다.
Figure 112006085039577-PCT00161
이고
Figure 112006085039577-PCT00162
이기 때문에, 새로운 노드
Figure 112006085039577-PCT00163
의 중심은
Figure 112006085039577-PCT00164
이다.
증가된 엔트로피 제한 비용
Figure 112006085039577-PCT00165
을 위한 식(3.11)은 증가된 에러 제곱
Figure 112006085039577-PCT00166
과 증가된 코드워드 길이
Figure 112006085039577-PCT00167
를 분리하여 계산함으로써 증명된다.
Figure 112006085039577-PCT00168
Figure 112006085039577-PCT00169
를 위한 양자화 레벨로서
Figure 112006085039577-PCT00170
를 사용하여 발생한 총 에러 제곱을 의미한다. 그 러므로
Figure 112006085039577-PCT00171
이다.
마찬가지로,
Figure 112006085039577-PCT00172
Figure 112006085039577-PCT00173
를 얻는다.
Figure 112006085039577-PCT00174
를 식(3.12)의 표현으로 교체하고
Figure 112006085039577-PCT00175
를 위한 표현을 단순화하여, 우리는
Figure 112006085039577-PCT00176
를 얻는다. 그러므로,
Figure 112006085039577-PCT00177
이다.
Figure 112006085039577-PCT00178
가 노드
Figure 112006085039577-PCT00179
의 컬러로 모든 픽셀을 엔트로피 코딩함으로써 발생하는 비트의 총 수를 의미한다고 하자. 그러면,
Figure 112006085039577-PCT00180
이다. 마찬가지로
Figure 112006085039577-PCT00181
Figure 112006085039577-PCT00182
을 얻을 수 있다. 그러므로,
Figure 112006085039577-PCT00183
이며,
이는
Figure 112006085039577-PCT00184
와 함께 식(3.11)에 적용된다. 이는 명제 1의 증명을 완성한다.
명제 1은 두 개의 리프 형제 노드를 병합하는 규칙을 제공한다. 스테이지 1에서 우리의 목적은 양자화된 이미지의 레이트와 왜곡 사이에서 효과적인 교환을 제공하는 하드 디시젼 양자화기를 생성하는 것이다. 원본 컬러 팔레트가 유한하기 때문에, 우리는 모든 가능한 조합을 통해 검색함으로써 포괄적인 최적 하드 디시젼 양자화기를 찾을 수 있다. 그러나 이런 방법은 매우 높은 계산 복잡성을 가지고 그로 인해 실시간 압축에서는 실행할 수 없다. 명제 1은 대안-트리 구조 하드 디시젼 양자화기를 설계하기 위한 탐욕적(greedy) 방법을 제안한다. N 리프 노드를 가진 원래의 8진트리에 기초하여, M 리프 노드가 남을 때까지 엔트로피 제한 비용의 최소한의 증분으로 두 개의 리프 형제 노드를 반복적으로 병합할 수 있다. 엔트로피 제한 계층 병합 양자화(ECHMQ)라고 불리는 상기 방법은 빠르며 양자화된 이미지의 레이트와 왜곡 사이에서 상당히 좋은 교환을 제공한다. ECHMQ의 자세한 단계는 이하와 같다:
단계 1: n-픽셀 원본 컬러 이미지
Figure 112006085039577-PCT00185
를 읽고 컬러 팔레트
Figure 112006085039577-PCT00186
Figure 112006085039577-PCT00187
일 때 각각의 컬러
Figure 112006085039577-PCT00188
를 위한 발생 횟수
Figure 112006085039577-PCT00189
를 얻는다.
단계 2: 각각의 컬러
Figure 112006085039577-PCT00190
를 상이한 리프 노드
Figure 112006085039577-PCT00191
로 트리에 삽입함으로써 8진트리를 생성한다. 그리고 각각의 리프 노드
Figure 112006085039577-PCT00192
를 위해서, 그것의 중심
Figure 112006085039577-PCT00193
, TSE
Figure 112006085039577-PCT00194
, 발생 횟수
Figure 112006085039577-PCT00195
및 코드워드 길이
Figure 112006085039577-PCT00196
를 계산한다.
단계 3: k=N으로 한다.
단계 4: 모든 두 개의 형제 노드
Figure 112006085039577-PCT00197
Figure 112006085039577-PCT00198
를 위해서, 식(3.12)에 의해 중심
Figure 112006085039577-PCT00199
을 계산하고 식(3.11)에 의해서 증가된 엔트로피 제한 비용을 계산한다.
단계 5: 모든 리프 형제 노드 쌍 사이에서, 이전 단계에서 계산된 증가된 엔트로피 제한 비용을 최소화하는 두 개의 리프 형제 노드
Figure 112006085039577-PCT00200
Figure 112006085039577-PCT00201
를 선택한다. 만약
Figure 112006085039577-PCT00202
Figure 112006085039577-PCT00203
가 그들의 부모 노드 아래의 유일한 형제라면
Figure 112006085039577-PCT00204
Figure 112006085039577-PCT00205
Figure 112006085039577-PCT00206
Figure 112006085039577-PCT00207
의 부모 노드와 동일한 새로운 리프 노드
Figure 112006085039577-PCT00208
로 병합하고 그렇지 않으면
Figure 112006085039577-PCT00209
Figure 112006085039577-PCT00210
의 부모 노드 아래서 새로 조합된 리프 노드로 병합한다.
Figure 112006085039577-PCT00211
의 중심
Figure 112006085039577-PCT00212
를 계산하고,
Figure 112006085039577-PCT00213
Figure 112006085039577-PCT00214
Figure 112006085039577-PCT00215
이다.
단계 6: 8진트리로부터 노드
Figure 112006085039577-PCT00216
Figure 112006085039577-PCT00217
를 제거한다.
단계 7: 1만큼 k를 감소시킨다.
단계 8: k=M 까지 단계 4에서 단계 7까지 반복한다. 그 후 상이한 인덱스
Figure 112006085039577-PCT00218
를 최종 8진트리의 남아 있는 M 리프 노드의 각각에 할당한다. 리프 노드의 중심의 정수 형태는 새로운 컬러 팔레트의 상이한 컬러이며, 상기 리프 노드의 모든 컬러는 상기 리프 노드에 대응하는 인덱스로 맵핑 된다.
원하는 컬러의 개수에 도달하였을 때, 원본 이미지를 양자화하기 위한 최종 엔트로피 제한 비용은
Figure 112006085039577-PCT00219
이며, 여기서
Figure 112006085039577-PCT00220
은 N개의 상이한 컬러를 갖는 원본 이미지의 비용이며,
Figure 112006085039577-PCT00221
는 우리가 두 개의 선택된 리프 노드를 병합하고 8진트리에서 리프 노드의 개수를 i로부터 i-1로 감소시킬 때 증가된 비용이다. 우리가 8진트리에서 두 개의 리프 형제 노드를 병합할 때마다 최소로 증가된 엔트로피 제한 비용을 발견함으로써, ECHMQ는 엔트로피 제한 비용을 최소화하는 지역적인 최적화 방법을 제공한다.
ECHMQ는 순수한 왜곡 TSE보다 엔트로피 제한 비용을 (지역적으로) 최소화하는 것을 목적으로 한다. 그러므로 양자화된 이미지의 레이트 및 왜곡은 라그랑주 곱수에 의해 제어되고 교환된다. λ가 증가함에 따라, 평균 왜곡은 감소하고 대응하는 레이트는 증가한다. 실제로 - λ는 발생된 레이트 왜곡 커브의 기울기로서 해석된다. 그러므로 ECHMQ에서 우리는 양자화된 이미지의 레이트 및 왜곡을 변화시키기 위해서 교환 인자로서 λ를 사용할 수 있는 유연성을 갖게 된다.
ECHMQ의 또 다른 이점은 그것의 낮은 계산 복잡성이다. 이를 설명하기 위해서, 우리가 레벨 7에 32개의 부모 노드 아래에 레벨 8에서 모두 할당된 총 256개의 리프 노드를 가지고 있다고 우선 가정하자. 리프 노드의 개수를 255개로 감소시키 기 위해서, 우리는 리프 형제 노드의
Figure 112006085039577-PCT00222
쌍을 위한 증가된 엔트로피 제한 비용을 계산할 필요가 있다. 만약 8진트리 구조가 사용되지 않는다면, 우리는
Figure 112006085039577-PCT00223
를 위한 증가된 비용을 계산할 필요가 있으며, 이는 기본적으로 [5]의 쌍비교(pairwise) 클러스터링에 의해서 사용된다.
Figure 112006085039577-PCT00224
식(3.11)을 다시 쓰면, 우리는 8개의 덧셈, 7개의 뺄셈, 10개의 곱셈, 1개의 나누기 및 1 개의 로그 연산과 관련된 리프 형제 노드의 각각의 쌍을 위한 증가된 비용의 계산을 볼 수 있다. 각각의 분할을 위해서 자코비(Jocobi) 방법이 적용된 TSE 기반 계층 분할 방법[2] 같은 다른 방법에서 사용된 높은 계산성과 비교하면, ECHMQ는 매우 낮은 복잡성을 갖는다. 또한, 팔레트 및 픽셀 맵핑은 단계 8에서 쉽게 획득된다; 이는 또다시 팔레트 설계 및 픽셀 맵핑과 관련된 현저한 양의 계산이 존재하는 참조[5] 및 [6]에서 기술된 것과 같은 논문에 포함된 다른 방법과 유리하게 비교된다.
만약 우리가 이하에 기술된 추가적인 최적화를 뛰어넘는다면, ECHMQ의 결과로 획득되는 새로운 컬러 팔레트 및 픽셀 맵핑은 GIF/PNG 인코더에 의해서 직접 인코딩될 수 있다. 구체적으로 이하에 기술된 것은 엔트로피 코더로서 PNG 인코더를 사용하는 것이다. PNG 인코더를 사용가능한 GIF 인코더로 대체하여, 우리는 쉽게 GIF 디코더와 호환가능한 출력을 얻을 수 있다.
VRTCQ 1
본 섹션에서, 우리는 GIF/PNG 디코더와의 호환성을 유지하면서 양자화된 컬러 이미지의 압축 레이트 및 왜곡을 추가로 공동 최적화하기 위해 소프트 디시젼 양자화를 채택한다. 초기 컬러 이미지 인코딩 방식으로서 ECHMQ의 결과로 획득되는 하드 디시젼 양자화기를 사용하여, 우리는 VRTSE를 VRTCQ 1을 발생시키는 컬러 이미지 인코딩으로 확장한다.
우선 VRTCQ 1의 VTRSE 설정으로 시작하자. 우리는 GIF/PNG 디코더와의 호환성 유지를 원하기 때문에, 출력 함수
Figure 112006085039577-PCT00225
는 어떠한 상태에도 의존하지 않는다. 다른 말로, 상태 집합 S는 오직
Figure 112006085039577-PCT00226
만으로 구성된다. 이 경우, 상태 전이 함수 f는 떨어져 나갈 수 있고, 출력 함수
Figure 112006085039577-PCT00227
Figure 112006085039577-PCT00228
으로부터 RGB 공간으로의 단순한 맵핑 이며, 컬러 팔레트에서 인덱스와 컬러 사이의 대응관계를 정의하며, 격자 디코더는
Figure 112006085039577-PCT00229
로 떨어진다. 원본 컬러 이미지
Figure 112006085039577-PCT00230
을 가정하면, 우리는 임의의 시퀀스
Figure 112006085039577-PCT00231
에 대해서
Figure 112006085039577-PCT00232
를 정의한다.
우리는 식(2.6)에서 주어진 상계를 사용하고 왜곡 제한을 조건으로
Figure 112006085039577-PCT00233
를 최소화한다. 구체적으로, k=1로 한다. 그러나 이하에 시술된 처리과정은 쉽게 임의의 k에 대해서 확장될 수 있다.
초기 출력 함수
Figure 112006085039577-PCT00234
및 전이 확률 함수
Figure 112006085039577-PCT00235
는 ECHMQ의 결과로 획득된 컬러 팔레트와 픽셀 맵핑으로부터 유도될 수 있다. VRTCQ 1의 자세한 처리과정은 이하에서 기술된다:
단계 1: t=0으로 설정. ECHMQ로부터
Figure 112006085039577-PCT00236
,
Figure 112006085039577-PCT00237
Figure 112006085039577-PCT00238
를 획득:
Figure 112006085039577-PCT00239
는 하드 디시젼 양자화기로부터 얻어지는 양자화된 이미지의 인덱스 시퀀스이며,
Figure 112006085039577-PCT00240
는 ECHMQ의 결과로 획득되는 새로운 컬러 팔레트의 인덱스
Figure 112006085039577-PCT00241
에 대응하는 컬러이며, 임의의
Figure 112006085039577-PCT00242
Figure 112006085039577-PCT00243
에 대해서
Figure 112006085039577-PCT00244
이다.
또한, 초기 비용
Figure 112006085039577-PCT00245
을 계산한다.
단계 2:
Figure 112006085039577-PCT00246
Figure 112006085039577-PCT00247
를 고정한다. 식(2.4)에서
Figure 112006085039577-PCT00248
에 의해
Figure 112006085039577-PCT00249
를 대체하고
Figure 112006085039577-PCT00250
Figure 112006085039577-PCT00251
를 대체한 것을 만족하는 시퀀스
Figure 112006085039577-PCT00252
를 찾기 위해 비터비 알고리즘을 사용한다.
단계 3:
Figure 112006085039577-PCT00253
를 고정한다. 인덱스 시퀀스
Figure 112006085039577-PCT00254
는 이하와 같이 전이 확률 함수 및 출력 함수의 갱신을 야기한다.
임의의
Figure 112006085039577-PCT00255
Figure 112006085039577-PCT00256
에 대해서
Figure 112006085039577-PCT00257
이고
임의의
Figure 112006085039577-PCT00258
에 대해서
Figure 112006085039577-PCT00259
이며, 여기서
Figure 112006085039577-PCT00260
Figure 112006085039577-PCT00261
를 위한 모든 i에 대해서 취해진다.
Figure 112006085039577-PCT00262
가 원본 이미지의 i 번째 픽셀의 컬러를 나타낸다는 것을 유의하여야 한다.
단계 4: 갱신된 비용을 계산한다.
Figure 112006085039577-PCT00263
단계 5: t=0,1,2...
Figure 112006085039577-PCT00264
까지 단계 2 내지 단계4를 반복한다. 여기서
Figure 112006085039577-PCT00265
는 규정된 임계치이다.
그 후
Figure 112006085039577-PCT00266
Figure 112006085039577-PCT00267
를 출력한다.
단계 6: [17]에서 기술된 PNG 인코더를 사용하여 컬러 팔레트
Figure 112006085039577-PCT00268
및 인덱스 시퀀스
Figure 112006085039577-PCT00269
를 인코드한다.
단계 2 내지 단계 6은 편리하게 VRTCQ 1의 스테이지 2로서 호칭 될 수 있다. 여기서 사용된 비터비 알고리즘은 도3에서 그래프로 도시되었다. 스테이지로부터 다른 스테이지로 변화시 증가된 비용은 이하 식과 같이 계산된다:
[수학식 4.13]
Figure 112006085039577-PCT00270
여기서 임의의
Figure 112006085039577-PCT00271
에 대해
Figure 112006085039577-PCT00272
이다. 단계 i에서 단계 j에 도달하는 생존 경로를 찾기 위해서, 우리는 M 축적 비용을 비교할 필요가 있으며, 이들 각각은 3 개의 덧셈, 3 개의 뺄셈 및 곱셈을 필요로 한다. 그러므로 총 계산 복잡도는
Figure 112006085039577-PCT00273
이다.
스테이지 2의 최적성은 [19]의 정리 3에 의해서 증명된다. 전체적으로, VRTCQ 1은 GIF/PNG 디코더와의 호환성이 유지되는 동안, 어느 정도까지 양자화된 이미지의 레이트 및 왜곡을 공동으로 최적화한다. 실험은 수렴이 합당한 정도로 빠르다는 것을 보여준다; 일반적으로 2 내지 3번 반복 후에
Figure 112006085039577-PCT00274
는 한계에 매우 가까워진다.
우리는 VRTCQ 1의 전체적인 계산 복잡성과 관련된 본 섹션의 결론을 내린다. 스테이지 2와 비교하여, VRTCQ 1의 스테이지 1, 즉 ECHMQ는 훨씬 낮은 계산 복잡도를 가진다. 그러므로 VRTCQ 1의 주요 계산 복잡성은 스테이지 2에 있고, 특히 비터비 알고리즘에 있다. 비터비 알고리즘의 각각의 반복은 계산 복잡성
Figure 112006085039577-PCT00275
을 갖기 때문에, VRTCQ 1의 전체적인 계산 복잡성은 M이 클 경우 실시간 압축을 위해서는 불편할 정도로 높다. 그러므로 큰 M의 경우에 계산 복잡성을 낮추는 것이 필요하다. 이러한 문제는 VRTCQ 2에 의해서 언급된다.
VRTCQ 2
큰 M의 경우에 VRTCQ 1의 계산 복잡성을 낮추기 위해서, 우리는 지금 식(2.6)과는 다른 방법으로 Lempel-Ziv 코드워드 길이 함수의 상계를 취한다. 이를 위해서, 우리는 k차 실험 엔트로피
Figure 112006085039577-PCT00276
과는 상이한 새로운 정보량을 정의한다. M'가 엄밀하게 M보다 작은 정수라고 하자.
Figure 112006085039577-PCT00277
Figure 112006085039577-PCT00278
부터
Figure 112006085039577-PCT00279
에 대한 맵핑으로 한다. b와 관련해서, 우리는
Figure 112006085039577-PCT00280
를 M' 그룹
Figure 112006085039577-PCT00281
로 분할한다. 임의의
Figure 112006085039577-PCT00282
에 대해서,
Figure 112006085039577-PCT00283
라고 한다.
정의
Figure 112006085039577-PCT00284
상기 정보량은
Figure 112006085039577-PCT00285
Figure 112006085039577-PCT00286
가 주어진
Figure 112006085039577-PCT00287
의 조건부 실험 엔트로피라고 불린다. 우리가 원하는 정보량은 아래와 같이 정의된다.
Figure 112006085039577-PCT00288
여기서
Figure 112006085039577-PCT00289
Figure 112006085039577-PCT00290
의 k차 실험 엔트로피이다.
Figure 112006085039577-PCT00291
이 보이는 것은 어렵지 않다.
그러므로 식(2.6)을 감안하여, Lempel-Ziv 코드워드 길이 함수
Figure 112006085039577-PCT00292
는 또한 다음 식에 의해서 상계가 취해질 수 있다.
[수학식 5.14]
Figure 112006085039577-PCT00293
왜곡 제한을 조건으로
Figure 112006085039577-PCT00294
를 최소화하는 대신, 우리는 이제 VRTCQ 2의 왜곡 제한을 조건으로
Figure 112006085039577-PCT00295
를 최소화한다.
Figure 112006085039577-PCT00296
는 모든 k차 정적 산술 코드워드 길이 함수
Figure 112006085039577-PCT00297
에 의해 산출된 최소 코드워드 길이라는 사실과 유사하게,
Figure 112006085039577-PCT00298
또한 코드워드 길이 함수와 관련이 있다.
Figure 112006085039577-PCT00299
Figure 112006085039577-PCT00300
부터
Figure 112006085039577-PCT00301
까지의 확률 전이 함수로 두고
Figure 112006085039577-PCT00302
Figure 112006085039577-PCT00303
부터
Figure 112006085039577-PCT00304
까지의 확률 전이 함수로 둔다. 임의의
Figure 112006085039577-PCT00305
에 대해서 다음 식을 설정한다.
[수학식 5.15]
Figure 112006085039577-PCT00306
Figure 112006085039577-PCT00307
Figure 112006085039577-PCT00308
Figure 112006085039577-PCT00309
을 인코딩하기 위해서 전이 확률
Figure 112006085039577-PCT00310
을 갖는 k차 정적 산술 코드를 우선 사용하여 인코드 되고, 그 후 주어진
Figure 112006085039577-PCT00311
를 조건으로
Figure 112006085039577-PCT00312
를 인코딩하는 것을 통해 무손실 코드와 대응하는 코드워드 길이 함수라는 것을 아는 것은 쉽다. 게다가,
Figure 112006085039577-PCT00313
를 보이는 것은 어렵지 않다.
따라서, 주어진 맵핑 b, VRTCQ 2의 공동 최적화 문제는 이하의 수학식이 된다.
[수학식 5.16]
Figure 112006085039577-PCT00314
구체적으로, k=1로 두자. 그럼에도, 모든 인수 및 이하의 과정은 일반적인 k가 적용될 수 있다. 주어진 g,
Figure 112006085039577-PCT00315
Figure 112006085039577-PCT00316
에 대해서, 식(5.16)에 안쪽 최소화는
Figure 112006085039577-PCT00317
대신에
Figure 112006085039577-PCT00318
의 복잡성을 가진 비터비 알고리즘으로 풀 수 있다. 이러한 경우, 식(5.15)을 고려하여, t가 증가할 때마다, 이하 수학식에 의해 비용이 증가한다는 것을 유의해야 한다.
[수학식 5.17]
Figure 112006085039577-PCT00319
식 (5.17)에서, 오직 첫 번째 항만이
Figure 112006085039577-PCT00320
를 통해서 과거의 값에 의존한다. 그러므로 상태 집합
Figure 112006085039577-PCT00321
을 구비한 격자 및 두 개의 연속적인 스테이지의 상태 사이에서 완전한 접속을 만들 수 있고, 그 후 안쪽 최소화 문제를 풀기 위해 격자에서 비터비 알고리즘을 실행한다. 비터비 알고리즘을 실행하기 전에, 우리는 모든 (s, x)의 조합에 대해 최소 서브 비용
Figure 112006085039577-PCT00322
을 계산하며, 여기서,
Figure 112006085039577-PCT00323
이며
Figure 112006085039577-PCT00324
이다. 최소 서브 비용 및 (s, x)쌍을 위한 최소 서브 비용을 달성하는 대응 컬러 인덱스 u는 검색표에 있다. 격자의 스테이지 t-1의 상태
Figure 112006085039577-PCT00325
로부터 격자의 스테이지 t의 상태
Figure 112006085039577-PCT00326
로 전이하는 비용은
Figure 112006085039577-PCT00327
이다. 원본 이미지
Figure 112006085039577-PCT00328
를 가정하고, 만약
Figure 112006085039577-PCT00329
가 격자를 통과하는 최적 경로라면,
Figure 112006085039577-PCT00330
이고, 여기서
Figure 112006085039577-PCT00331
는 최소 비용을 달성하고,
Figure 112006085039577-PCT00332
는 식(5.16)의 내부 최소화를 달성하는 최적 인덱스 시퀀스이다.
VRTCQ 1과 유사하게, VRTCQ 2는 반복되는 방법으로 공동 최적화 문제(5.16)를 푼다. VRTCQ 2의 스테이지 1은 맵핑 b를 결정하고, 초기 출력 함수
Figure 112006085039577-PCT00333
및 전이 확률 함수
Figure 112006085039577-PCT00334
Figure 112006085039577-PCT00335
를 제공한다. VRTCQ 2의 스테이지 2는 그 후 최소화 문제를 풀기 위해 대안적인 과정을 사용한다. VRTCQ 2의 자세한 과정은 이하에 기술된다.
A. 스테이지 1의 과정
단계 1: M 리프 노드, 크기 M의 컬러 팔레트, 대응하는 하드 디시젼 픽셀 맵핑을 갖는 8진트리
Figure 112006085039577-PCT00336
을 얻기 위해서 원본 이미지에서 ECHMQ를 실행한다.
단계 2:
Figure 112006085039577-PCT00337
에 기초하여,
Figure 112006085039577-PCT00338
리프 노드가 남을 때까지 ECHMQ의 단계 4 내지 단계 7을 반복한다.
단계 3: 8진트리
Figure 112006085039577-PCT00339
로부터 단계 2에서 얻은
Figure 112006085039577-PCT00340
의 서브트리에 해당하는
Figure 112006085039577-PCT00341
리프 노드를 구비한 8진트리 에 대한 맵핑 b를 결정한다. 특히,
Figure 112006085039577-PCT00343
의 i 번째 리프 노드가
Figure 112006085039577-PCT00344
의 j 번째 리프 노드에 뿌리박힌
Figure 112006085039577-PCT00345
의 서브트리에 놓여 있는 경우에만,
Figure 112006085039577-PCT00346
Figure 112006085039577-PCT00347
이다.
B. 스테이지 2의 과정
단계 1: ㅅ=0으로 설정. VRTCQ 2의 스테이지 1로부터 b,
Figure 112006085039577-PCT00348
Figure 112006085039577-PCT00349
획득하고, 여기서
Figure 112006085039577-PCT00350
는 하드 디시젼 픽셀 맵핑으로부터 발생한 인덱스 시퀀스이며,
Figure 112006085039577-PCT00351
일 때
Figure 112006085039577-PCT00352
은 스테이지 1의 단계 1에서 획득된 새로운 컬러 팔레트의 인덱스 u에 대응하는 컬러이고,
Figure 112006085039577-PCT00353
이며
Figure 112006085039577-PCT00354
이다.
또한 초기 비용을 아래와 같이 계산한다.
Figure 112006085039577-PCT00355
단계 2:
Figure 112006085039577-PCT00356
Figure 112006085039577-PCT00357
고정. 검색표 만듬. 각각의 (s, x) 쌍을 위해서
Figure 112006085039577-PCT00358
이고
Figure 112006085039577-PCT00359
일 때, 아래와 같이 최소 서브 비용을 계산하고
Figure 112006085039577-PCT00360
Figure 112006085039577-PCT00361
를 달성하는 컬러 인덱스
Figure 112006085039577-PCT00362
를 기록.
단계 3:
Figure 112006085039577-PCT00363
,
Figure 112006085039577-PCT00364
Figure 112006085039577-PCT00365
를 고정. 격자
Figure 112006085039577-PCT00366
를 통과하는 최적 경로를 찾기 위해 b 및 검색표와 함께 비터비 알고리즘을 사용하고,
Figure 112006085039577-PCT00367
에 의해
Figure 112006085039577-PCT00368
를 대신하고,
Figure 112006085039577-PCT00369
에 의해
Figure 112006085039577-PCT00370
를 대신하며
Figure 112006085039577-PCT00371
에 의해
Figure 112006085039577-PCT00372
를 대신하여 식(5.16)의 내부 최소화를 달성하는 최적 인덱스 시퀀스
Figure 112006085039577-PCT00373
를 결정한다.
단계 4"
Figure 112006085039577-PCT00374
Figure 112006085039577-PCT00375
를 고정. 상기 두 개의 시퀀스는 전이 확률 함수 및 출력 함수를 이하와 같이 갱신한다.
Figure 112006085039577-PCT00376
,
Figure 112006085039577-PCT00377
Figure 112006085039577-PCT00378
이다.
여기서
Figure 112006085039577-PCT00379
Figure 112006085039577-PCT00380
인 모든 i 에 대해 취해진다.
단계 5: 갱신된 비용을 아래와 같이 계산한다.
Figure 112006085039577-PCT00381
단계 6: t=0,1,2...에서
Figure 112006085039577-PCT00382
까지 단계 2 내지 단계 5를 반복하며, 여기서
Figure 112006085039577-PCT00383
는 규정된 임계치이다.
그 후
Figure 112006085039577-PCT00384
Figure 112006085039577-PCT00385
를 출력한다.
단계 7: [17]의 PNG 인코더에 의해 컬러 팔레트
Figure 112006085039577-PCT00386
및 인덱스 시퀀스
Figure 112006085039577-PCT00387
를 인코딩한다.
단계 3에서 사용한 비터비 알고리즘은 도4의 그래프로 도시되었다. 그래프에서 각각의 원은 그룹을 나타내며, 원안의 검은 점은 그룹의 모든 컬러 인덱스
Figure 112006085039577-PCT00388
를 나타낸다.
VRTCQ 1과 유사하게, VRTCQ 2의 주요 계산 복잡성은 그것의 스테이지 2에 있다. VRTCQ 1의 스테이지 2와 비교하여 VRTCQ 2의 스테이지 2가 추가적인 단계, 즉 단계 2를 가지고 있지만, 본 단계는 계산이 복잡하지는 않다. 오히려, 그것의 계산 복잡성은
Figure 112006085039577-PCT00389
이고, 이는 원본 이미지의 크기 n에 의존하기 않으므로 n이 클 때의 비터비 알고리즘의 복잡성과 비교하면 무시할 수 있다. VRTCQ 2의 스테이지 2의 단계 3의 비터비 알고리즘은 이제
Figure 112006085039577-PCT00390
계산 복잡성을 가지며, 이는 VRTCQ 1에서 사용된 비터비 알고리즘의
Figure 112006085039577-PCT00391
계산 복잡성과 순조롭게 비교된다. 그러므로,
Figure 112006085039577-PCT00392
일 때, VRTCQ 2는 VRTCQ 1보다 훨씬 빠르다. 추가로, M'가 고정되면, VRTCQ 2의 계산 복잡성은 어느 정도는 M에 대해 독립적이다. 이점은 VRTCQ 2가 컬러가 풍부한 이미지에 대해서 매력적이게 한다. VRTCQ 2에서 지급된 대가는 느슨한 한계가 Lempel-Ziv 코드워드 길이 함수의 상계를 설정하는데 사용되기 때문에 압축 레이트와 왜곡 사이의 교환과 관련한 압축 성능의 경미한 손실이다.
도5를 참고하면, 블록도가 도시되어 있고, 이는 도1의 컴퓨터 시스템(10)의 CPU(16)이다. 도시한 것처럼, CPU(16)은 하드 디시젼 모듈(40) 및 소프트 디시젼 모듈(42)을 포함한다. 하드 디시젼 모듈(40)은 상술한 것처럼 ECHMQ를 제공한다. 소프트 디시젼 모듈(42)은 상술한 것처럼 VRTCQ 1 및 VRTCQ 2 모두를 제공한다.
상술한 것처럼, 하드 디시젼 모듈(40)은 8진 트리 구조를 건설하기 위한 노드 생성 서브 모듈, 리프 노드를 선택하고 병합하기 위한 노드 병합 서브 모듈 및 리프 노드 쌍의 잠재적인 병합을 위해 각각의 병합에 대한 엔트로피 제한 비용 증분을 계산하는 비용 계산 서브 모듈을 포함한다. 하드 디시젼 모듈(40)과 유사하 게, 소프트 디시젼 모듈(42)은 소프트 디시젼 모듈(42)에 의한 소프트 디시젼 최적화의 각각의 반복 이후 비용의 증분 감소를 결정하는 비용 계산 서브 모듈을 포함한다.
본 발명의 또 다른 변화 및 변형은 가능하다. 예를 덜어, 상술한 것처럼, ECHMQ는 하드 디시젼 픽셀 맵핑을 제공하기 위해서 다른 소프트 디시젼 최적화의 VRTCQ를 사용하지 않고 그 자체로 사용될 수 있다. 대안으로, VRTCQ는 초기 하드 디시젼 픽셀 맵핑을 제공하기 위해 ECHMQ를 사용하지 않고 사용될 수 있다. 대신에, 몇몇의 다른 초기 하드 디시젼 과정이 제공된다. 게다가, 다른 소프트 디시젼 최적화 방법이 VRTCQ 대신에 ECHMQ와 결합하여 사용될 수 있다. 또한, 상술한 설명이 대부분 낮은 계산성 및 PNG 디코더 같은 표준 디코더와의 호환성을 유지하면서 공동으로 양자화 왜곡 및 압축 레이트를 함께 다루는 방법에 대한 것이지만, 당업자라면 ECHMQ와 VTRCQ가 다른 환경의 컬러 이미지 데이터의 압축에도 적용될 수 있다는 것을 알 수 있을 것이다. 모든 변형 또는 변화는 본원에 첨부된 청구항에 의해서 정의되는 본 발명의 분야 및 범위 내이다.

Claims (42)

  1. 데이터 처리 시스템을 사용하여 N개의 상이한 컬러로 디지타이즈된 컬러 이미지로부터, M개의 분리 클러스터로 디지타이즈된 컬러 이미지의 모든 픽셀의 트리 구조 분할을 생성하는 방법에 있어서, 상기 M은 N 이하이고, N개의 상이한 컬러의 각각의 컬러는 컬러 팔레트에서 복수의 P-비트 바이트에 의해서 디지털로 표현되며, 각각의 P-비트 바이트의 P-비트는 최상의 비트부터 최하위 비트로 순서화되는 상기 방법은:
    (a) 모든 N개의 상이한 컬러를 포함하는 루트 노드를 제공하는 단계;
    (b) 루트 노드와 연결된 제1 레벨의 형제 노드를 제공하는 단계에서, N개의 상이한 컬러의 각각의 컬러는 데이터 처리 시스템에 의해서 복수의 P-비트 바이트의 각각의 P-비트 바이트 중 제1 비트 값에 기초하여 제1 레벨의 형제 노드의 연관 노드에 할당되는 것인 제1 레벨의 형제노드를 제공하는 단계;
    (c) 하나 이상의 컬러를 포함하는 k 번째 레벨의 노드에서 각각의 노드를 위해 (k+1) 번째 레벨에서 복수의 형제 노드를 제공하는 단계에서, 상기 노드의 각각의 컬러는 데이터 처리 시스템에 의해 컬러를 위한 복수의 P-비트 바이트의 각각의 P-비트 바이트 중 (k+1) 번째 비트의 값에 기초하여 (k+1) 번째 레벨에서 복수의 형제 노드의 연관 노드에 할당되고, 그에 따라 N개의 상이한 컬러의 각각의 컬러를 위해서 상기 각각의 컬러만을 포함하는 상이한 리프 노드가 존재하는 것인 복수의 형제 노드를 제공하는 단계; 및
    (d) M개의 리프 노드만이 남을 때까지 리프 노드를 선택하고 병합하는 단계를 포함하는 방법.
  2. 제1항에 있어서, 상기 단계(d)는 M개의 리프 노드만이 남을 때까지 리프 형제 노드 쌍을 반복적으로 선택하고 병합하는 단계를 포함하는 방법.
  3. 제1항에 있어서, 상기 단계(d)는 M개의 리프 노드만이 남을 때까지 병합이 최소 엔트로피 제한 비용 증분을 가지는 리프 형제 노드 쌍을 반복적으로 선택하고 병합하는 단계를 포함하는 방법.
  4. 제3항에 있어서, 단계(d)는 병합 전 총 엔트로피 제한 비용과 병합 후 총 엔트로피 제한 비용의 차이를 계산하지 않고 최소 엔트로피 제한 비용 증분을 계산하는 단계를 포함하는 방법.
  5. 제1항에 있어서, N개의 상이한 컬러에서 각각의 컬러를 위한 복수의 P-비트 바이트는 복수의 주요 컬러에서 각각의 주요 컬러를 위한 P-비트 바이트를 포함하는 방법.
  6. 제3항에 있어서, 복수의 주요 컬러는 빨강, 초록 및 파랑을 포함하는 방법.
  7. 제1항에 있어서, M개의 상이한 컬러를 갖는 새로운 디지타이즈된 이미지를 생성하는 단계를 추가로 포함함에 있어서, M 개의 상이한 컬러와 단계(d)의 완료 후에 남아있는 M 개의 리프 노드 사이에는 1대1 대응관계가 존재하는 방법.
  8. N개의 상이한 컬러로 디지타이즈된 컬러 이미지로부터, M개의 분리 클러스터로 디지타이즈된 컬러이미지의 모든 픽셀의 트리 구조 분할을 생성하기 위한 데이터 처리 시스템에 있어서, 상기 M은 N이하이고, N개의 상이한 컬러에서 각각의 컬러는 컬러 팔레트의 복수의 P-비트 바이트에 의해서 디지털로 표현되며, 각각의 P-비트 바이트의 P-바이트는 최상위 비트부터 최하위 비트로 순서화되는 상기 데이터 처리 시스템은:
    (i) 모든 N개의 상이한 컬러를 포함하는 루트 노드를 제공하며;
    (ii) 루트 노드와 연결된 제1 레벨의 형제 노드를 제공함에 있어서, N개의 상이한 컬러의 각각의 컬러는 데이터 처리 시스템에 의해서 복수의 P-비트 바이트의 각각의 P-비트 바이트 중 제1 비트 값에 기초하여 제1 레벨의 형제 노드의 연관 노드에 할당되며;
    (iii) 하나 이상의 컬러를 포함하는 k 번째 레벨의 노드에서 각각의 노드를 위해, (k+1) 번째 레벨에서 복수의 형제 노드를 제공함에 있어서, 상기 노드의 각각의 컬러는 데이터 처리 시스템에 의해 컬러를 위한 복수의 P-비트 바이트의 각각의 P-비트 바이트 중 (k+1) 번째 비트의 값에 기초하여 (k+1) 번째 레벨에서 복수 의 형제 노드의 연관 노드에 할당되고, 그에 따라 N개의 상이한 컬러의 각각의 컬러를 위해서 각각의 컬러만을 포함하는 고유 리프 노드가 존재하기 위한
    노드 생성 수단; 및
    (b) M개의 리프 노드만이 남을 때까지 리프 노드를 선택하고 병합하는
    노드 병합 수단을 포함하는 데이터 처리 시스템.
  9. 제8항에 있어서, 상기 노드 병합 수단은 M개의 리프 노드만이 남을 때까지 리프 형제 노드 쌍을 반복적으로 선택하고 병합하도록 작동하는 데이터 처리 시스템.
  10. 제8항에 있어서, 리프 노드 쌍의 잠재적인 병합을 위해 각각의 병합에 대한 엔트로피 제한 비용 증분을 계산하는 비용 계산 수단을 추가로 포함하고, 상기 비용 계산 수단은 상기 노드 병합 수단에 연결되고 노드 병합 수단은 M 개의 리프 노드만이 남을 때까지 병합이 비용 계산 수단에 의해서 결정된 최소 엔트로피 제한 비용 증분을 갖는 리프 형제 노드 쌍을 반복해서 선택하고 병합하도록 작동하는 데이터 처리 시스템.
  11. 제10항에 있어서, 상기 비용 계산 수단은 병합 전 총 엔트로피 제한 비용과 병합 후 총 엔트로피 제한 비용의 차이를 계산하지 않고 최소 엔트로피 제한 비용 증분을 계산하도록 작동하는 데이터 처리 시스템.
  12. 제8항에 있어서, N 개의 상이한 컬러의 각각의 컬러를 위한 복수의 P 비트 바이트는 복수의 주요 컬러의 각각의 주요 컬러를 위한 P 비트 바이트를 포함하는 데이터 처리 시스템.
  13. 제10항에 있어서, 복수의 주요 컬러는 빨강, 초록 및 파랑을 포함하는 데이터 처리 시스템.
  14. 제8항에 있어서, M 개의 상이한 컬러를 갖는 새로운 디지타이즈된 컬러 이미지를 생성하는 것을 추가로 포함함에 있어서, M 개의 상이한 컬러와 단계(d)의 완료 후에 남아있는 M 개의 리프 노드 사이에는 1대1 대응관계가 존재하는 데이터 처리 시스템.
  15. N개의 상이한 컬러로 디지타이즈된 컬러 이미지로부터 M개의 분리 클러스터로 디지타이즈된 컬러이미지의 모든 픽셀의 트리 구조 분할을 생성하기 위해 컴퓨터 시스템에서 사용하는 컴퓨터 프로그램 제품에 있어서, 상기 M은 N이하이고, N개의 상이한 컬러에서 각각의 컬러는 컬러 팔레트의 복수의 P-비트 바이트에 의해서 디지털로 표현되며, 각각의 P-비트 바이트의 P-바이트는 최상위 비트로부터 최하위 비트로 순서화되는 컴퓨터 프로그램 제품은:
    기록 매체; 및
    이하의 단계를 수행하도록 컴퓨터 시스템에 지시하기 위해서 상기 매체에 기록되는 수단을 포함하며; 상기 단계는,
    (a) 모든 N개의 상이한 컬러를 포함하는 루트 노드를 제공하는 단계;
    (b) 루트 노드와 연결된 제1 레벨의 형제 노드를 제공하는 단계에서, N개의 상이한 컬러의 각각의 컬러는 데이터 처리 시스템에 의해서 복수의 P-비트 바이트의 각각의 P-비트 바이트 중 제1 비트 값에 기초하여 제1 레벨의 형제 노드의 연관 노드에 할당되는 것인 제1 레벨의 형제 노드를 제공하는 단계;
    (c) 하나 이상의 컬러를 포함하는 k 번째 레벨의 노드에서 각각의 노드를 위해, (k+1) 번째 레벨에서 복수의 형제 노드를 제공하는 단계에서, 상기 노드의 각각의 컬러는 데이터 처리 시스템에 의해 컬러를 위한 복수의 P-비트 바이트의 각각의 P-비트 바이트 중 (k+1) 번째 비트의 값에 기초하여 (k+1) 번째 레벨에서 복수의 형제 노드의 연관 노드에 할당되고, 그에 따라 N개의 상이한 컬러의 각각의 컬러를 위해서 각각의 컬러만을 포함하는 고유 리프 노드가 존재하는 것인 복수의 형제 노드를 제공하는 단계; 및
    (d) M개의 리프 노드가 남을 때까지 리프 노드를 선택하고 병합하는 단계인 컴퓨터 프로그램 제품.
  16. 제15항에 있어서, 상기 단계 (d)는 M개의 리프 노드만이 남을 때까지 리프 형제 노드 쌍을 반복적으로 선택하고 병합하는 단계를 포함하는 컴퓨터 프로그램 제품.
  17. 제15항에 있어서, 상기 단계 (d)는 M개의 리프 노드만이 남을 때까지 병합이 최소 엔트로피 제한 비용 증분을 가지는 리프 형제 노드 쌍을 반복적으로 선택하고 병합하는 단계를 포함하는 컴퓨터 프로그램 제품.
  18. 제15항에 있어서, 단계(d)는 병합 전 총 엔트로피 제한 비용과 병합 후 총 엔트로피 제한 비용의 차이를 계산하지 않고 최소 엔트로피 제한 비용 증분을 계산하는 단계를 포함하는 컴퓨터 프로그램 제품.
  19. 제15항에 있어서, N개의 상이한 컬러에서 각각의 컬러를 위한 복수의 P-비트 바이트는 복수의 주요 컬러에서 각각의 주요 컬러를 위한 P-비트 바이트를 포함하는 컴퓨터 프로그램 제품.
  20. 제15항에 있어서, 복수의 주요 컬러는 빨강, 초록 및 파랑을 포함하는 컴퓨터 프로그램 제품.
  21. 제15항에 있어서, M개의 상이한 컬러를 갖는 새로운 디지타이즈된 이미지를 생성하는 것을 추가로 포함함에 있어서, M 개의 상이한 컬러와 단계(d)의 완료 후에 남아있는 M 개의 리프 노드 사이에는 1대1 대응관계가 존재하는 컴퓨터 프로그 램 제품.
  22. 픽셀 맵핑을 나타내는 새로운 인덱스 시퀀스 및 원본과 새로운 컬러이미지 모두 n 픽셀로 정의되고 원본 디지타이즈된 컬러이미지로부터 획득된 새로운 디지타이즈된 컬러 이미지를 위한 컬러 팔레트를 나타내는 새로운 출력 함수를 획득하는 방법에 있어서, 상기 원본 디지타이즈된 컬러 이미지는 N 픽셀에 할당되는 N개의 상이한 컬러에 의해서 제공되며, 상기 새로운 디지타이즈된 컬러 이미지는 n 픽셀에 할당되는 M개의 상이한 컬러에 의해서 제공되고, 상기 새로운 인덱스 시퀀스는 n 픽셀을 나타내기 위한 n 인덱스 요소를 포함하고 상기 새로운 출력 함수는 n 인덱스 요소를 M 개의 컬러로 맵핑 하는 방법은:
    (a) 원본 디지타이즈된 컬러 이미지의 모든 픽셀을 원본 디지타이즈된 컬러 이미지의 픽셀의 위치에 상관없이 원본 디지타이즈된 컬러 이미지의 각각의 픽셀에 기초하여 M 분리 클러스터로 분할함으로써 제1 신규 인덱스 시퀀스를 제공하는 단계에서, M은 N이하인 것인 단계;
    (b) M 분리 클러스터의 픽셀에 대한 M개의 상이한 컬러의 1 대 1 맵핑을 제공하기 위해서 제1 신규 출력 함수를 제공하는 단계;
    (c) 제1 신규 인덱스 시퀀스를 위한 소프트 디시젼 최적화 처리 및 신규 인덱스 시퀀스를 제공하는 제1 신규 출력 함수를 사용하며 신규 출력 함수는 제1 신규 인덱스 시퀀스의 각각의 요소를 위해서 제1 신규 출력 함수에 의해 상기 요소에 할당된 컬러 값이 제1 신규 출력 함수에 의한 제1 신규 인덱스 시퀀스의 적어도 하 나 이상의 기타 요소에 할당된 컬러 값과 상관되는 방법에 기초하는 단계를 포함하는 방법.
  23. 제22항에 있어서, 새로운 인덱스 시퀀스는 소프트 디시젼 픽셀 맵핑을 제공하며, 상기 맵핑은 새로운 디지타이즈된 컬러 이미지의 각각의 픽셀을 위해서 새로운 인덱스 시퀀스에 의해 픽셀에 할당된 컬러 값 및 새로운 출력 함수가 컬러 이미지의 픽셀의 위치에 의존하도록 하는 방법.
  24. 제22항에 있어서, 단계 (c)는 반복적인 소프트 디시젼 최적화 처리를 사용하는 단계 및 각각의 반복 후에 원본 디지타이즈된 컬러 이미지의 압축 및 왜곡을 나타내는 비용 함수의 증분 감소를 결정하는 단계를 포함하고,
    단계 (c)는 증분 감소가 선택된 임계치 이하로 떨어질 때 결정된 새로운 인덱스 시퀀스 및 새로운 컬러 맵핑을 종료하는 방법.
  25. 제24항에 있어서, 단계 (c)는
    (i) 카운터 k를 1로 설정하는 단계;
    (ii) k 번째 인덱스 시퀀스를 위해서 모든 가능한 인덱스 시퀀스를 통해 k 번째 출력 함수 및 k 번째 전이 확률 함수를 위한 비용 함수를 최적화함으로써 k+1 번째 인덱스 시퀀스를 결정하는 단계;
    (iii) k+1 번째 인덱스 시퀀스로부터 k+1 번째 출력 함수 및 k+1 번째 전이 확률 함수를 결정하는 단계;
    (iv) k+1 번째 인덱스 시퀀스, k+1 번째 출력 함수 및 k+1 번째 전이 확률 함수로부터 k+1 번째 비용을 결정하는 단계;
    (v) k+1 번째 비용과 k 번째 비용 사이의 k+1 번째 비용 차이를 계산하고, 상기 k+1 번째 비용차이가 선택된 임계치보다 작으면 새로운 인덱스 시퀀스 및 새로운 출력 함수로서 각각 k+1 번째 인덱스 시퀀스 및 k+1 번째 출력 함수를 선택하고, 그렇지 않으면 k를 1만큼 증가시키고 단계 (ii) 내지 (v)를 반복하는 단계를 포함하는 방법.
  26. 제25항에 있어서, 단계 (ii)의 모든 가능한 인덱스 시퀀스를 통해 k 번째 출력 함수 및 k 번째 전이 확률 함수를 위한 비용 함수를 최적화함으로써 k+1 번째 인덱스 시퀀스를 결정하는 단계는 비터비 알고리즘을 이용하는 것을 포함하는 방법.
  27. 제26항에 있어서,
    단계 (a)는 M 개의 분리 클러스터를 M'의 분리 그룹으로 그룹화하는 단계를 추가로 포함하고;
    단계 (c)는 M' 분리 그룹에 대해서 소프트 디시젼 최적화 처리를 사용하는 단계를 포함하는 방법.
  28. 제27항에 있어서, 비용 함수는 M 및 M' 모두에 의존하는 방법.
  29. 픽셀 맵핑을 나타내는 새로운 인덱스 시퀀스 및 원본과 새로운 컬러이미지 모두 n 픽셀로 정의되고 원본 디지타이즈된 컬러이미지로부터 획득된 새로운 디지타이즈된 컬러 이미지를 위한 컬러 팔레트를 나타내는 새로운 출력 함수를 획득하는 데이터 처리 시스템에 있어서, 원본 디지타이즈된 컬러 이미지는 N 픽셀에 할당되는 N개의 상이한 컬러에 의해서 제공되며, 새로운 디지타이즈된 컬러 이미지는 n 픽셀에 할당되는 M개의 상이한 컬러에 의해서 제공되고, 새로운 인덱스 시퀀스는 n 픽셀을 나타내기 위한 n 인덱스 요소를 포함하고 새로운 출력 함수는 n 인덱스 요소를 M 컬러로 맵핑 하는 데이터 처리 시스템은:
    (a) (i) 원본 디지타이즈된 컬러 이미지의 모든 픽셀을 원본 디지타이즈된 컬러 이미지의 픽셀의 위치에 상관없이 원본 디지타이즈된 컬러 이미지의 각각의 픽셀에 기초하여 M(M은 N이하이고) 분리 클러스터로 분할함으로써 제1 신규 인덱스 시퀀스를 제공하며;
    (ii) M 분리 클러스터의 픽셀에 대한 M개의 상이한 컬러의 1 대 1 맵핑을 제공하기 위해서 제1 신규 출력 함수를 제공하는
    하드 디시젼 모듈 및;
    (b) 제1 신규 인덱스 시퀀스를 위한 소프트 디시젼 최적화 처리 및 신규 인덱스 시퀀스를 제공하는 제1 신규 출력 함수를 사용하며 신규 출력 함수는 제1 신규 인덱스 시퀀스의 각각의 요소를 위해서 제1 신규 출력 함수에 의해 상기 요소에 할당된 컬러 값이 제1 신규 출력 함수에 의한 제1 신규 인덱스 시퀀스의 적어도 하나 이상의 기타 요소에 할당된 컬러 값과 상관되는 방법에 기초하는 소프트 디시젼 모듈을 포함하는 데이터 처리 시스템.
  30. 제29항에 있어서, 새로운 인덱스 시퀀스는 소프트 디시젼 픽셀 맵핑을 제공하며, 상기 맵핑은 새로운 디지타이즈된 컬러 이미지의 각각의 픽셀을 위해서 새로운 인덱스 시퀀스에 의해 픽셀에 할당된 컬러 값 및 새로운 출력 함수가 컬러 이미지의 픽셀의 위치에 의존하도록 하는 데이터 처리 시스템.
  31. 제29항에 있어서,
    상기 소프트 디시젼 모듈은 (i) 반복적인 소프트 디시젼 최적화 처리를 사용하고, (ii) 각각의 반복 후에 원본 디지타이즈된 컬러 이미지의 압축 및 왜곡을 나타내는 비용 함수의 증분 감소를 결정하며, (iii) 증분 감소가 선택된 임계치 이하로 떨어질 때 결정된 새로운 인덱스 시퀀스 및 새로운 컬러 맵핑을 종료하도록 동작하는 데이터 처리 시스템.
  32. 제31항에 있어서, 반복적인 소프트 디시젼 최적화 처리는:
    (i) 카운터 k를 1로 설정하는 단계;
    (ii) k 번째 인덱스 시퀀스를 위해서 모든 가능한 인덱스 시퀀스를 통해 k 번째 출력 함수 및 k 번째 전이 확률 함수를 위한 비용 함수를 최적화함으로써 k+1 번째 인덱스 시퀀스를 결정하는 단계;
    (iii) k+1 번째 인덱스 시퀀스로부터 k+1 번째 출력 함수 및 k+1 번째 전이 확률 함수를 결정하는 단계;
    (iv) k+1 번째 인덱스 시퀀스, k+1 번째 출력 함수 및 k+1 번째 전이 확률 함수로부터 k+1 번째 비용을 결정하는 단계;
    (v) k+1 번째 비용과 k 번째 비용 사이의 k+1 번째 비용 차이를 계산하고, 상기 k+1 번째 비용차이가 선택된 임계치보다 작으면 새로운 인덱스 시퀀스 및 새로운 출력 함수로서 각각 k+1 번째 인덱스 시퀀스 및 k+1 번째 출력 함수를 선택하고, 그렇지 않으면 k를 1만큼 증가시키고 단계 (ii) 내지 (v)를 반복하는 단계를 포함하는 데이터 처리 시스템.
  33. 제32항에 있어서, 단계 (ii)의 모든 가능한 인덱스 시퀀스를 통해 k 번째 출력 함수 및 k 번째 전이 확률 함수를 위한 비용 함수를 최적화함으로써 k+1 번째 인덱스 시퀀스를 결정하는 단계는 비터비 알고리즘을 이용하는 것을 포함하는 데이터 처리 시스템.
  34. 제33항에 있어서,
    하드 디시젼 모듈은 M 개의 분리 클러스터를 M'의 분리 그룹으로 그룹화하도록 동작하고;
    하드 디시젼 모듈은 M' 분리 그룹에 대해서 소프트 디시젼 최적화 처리를 사 용하도록 동작하는 데이터 처리 시스템.
  35. 제34항에 있어서, 비용 함수는 M 및 M' 모두에 의존하는 데이터 처리 시스템.
  36. 픽셀 맵핑 및 원본과 새로운 컬러이미지 모두가 n 픽셀로 정의되고 원본 디지타이즈된 컬러이미지로부터 획득된 새로운 디지타이즈된 컬러 이미지를 위한 컬러 팔레트를 나타내는 새로운 출력 함수를 생성하기 위해 컴퓨터 시스템에서 사용되는 컴퓨터 프로그램 제품에 있어서, 원본 디지타이즈된 컬러 이미지는 N 픽셀에 할당되는 N개의 상이한 컬러에 의해서 제공되고, 새로운 디지타이즈된 컬러 이미지는 n 픽셀에 할당되는 M개의 상이한 컬러에 의해서 제공되며, 새로운 인덱스 시퀀스는 n 픽셀을 나타내기 위한 n 인덱스 요소를 포함하고 새로운 출력 함수는 n 인덱스 요소를 M 컬러로 맵핑 하는 컴퓨터 프로그램 제품은:
    기록 매체 및
    이하의 단계를 수행하도록 컴퓨터 시스템에 지시하기 위해서 상기 매체에 기록되는 수단을 포함하며,
    상기 단계는: (a) 원본 디지타이즈된 컬러 이미지의 모든 픽셀을 원본 디지타이즈된 컬러 이미지의 픽셀의 위치에 상관없이 원본 디지타이즈된 컬러 이미지의 각각의 픽셀에 기초하여 M(M은 N이하이며) 분리 클러스터로 분할함으로써 제1 신규 인덱스 시퀀스를 제공하는 단계에 있어서;
    (b) M 분리 클러스터의 픽셀에 대한 M개의 상이한 컬러의 1 대 1 맵핑을 제공하기 위해서 제1 신규 출력 함수를 제공하는 단계;
    (c) 제1 신규 인덱스 시퀀스를 위한 소프트 디시젼 최적화 처리 및 신규 인덱스 시퀀스를 제공하는 제1 신규 출력 함수를 사용하며 신규 출력 함수는 제1 신규 인덱스 시퀀스의 각각의 요소를 위해서 제1 신규 출력 함수에 의해 상기 요소에 할당된 컬러 값이 제1 신규 출력 함수에 의한 제1 신규 인덱스 시퀀스의 적어도 하나 이상의 기타 요소에 할당된 컬러 값과 상관되는 방법에 기초하는 단계를 포함하는 컴퓨터 프로그램 제품.
  37. 제36항에 있어서, 새로운 인덱스 시퀀스는 소프트 디시젼 픽셀 맵핑을 제공하며, 상기 맵핑은 새로운 디지타이즈된 컬러 이미지의 각각의 픽셀을 위해서 새로운 인덱스 시퀀스에 의해 픽셀에 할당된 컬러 값 및 새로운 출력 함수가 컬러 이미지의 픽셀의 위치에 의존하도록 하는 컴퓨터 프로그램 제품.
  38. 제36항에 있어서, 단계 (c)는 반복적인 소프트 디시젼 최적화 처리를 사용하는 단계 및 각각의 반복 후에 원본 디지타이즈된 컬러 이미지의 압축 및 왜곡을 나타내는 비용 함수의 증분 감소를 결정하는 단계를 포함하고,
    단계 (c)는 증분 감소가 선택된 임계치 이하로 떨어질 때 결정된 새로운 인덱스 시퀀스 및 새로운 컬러 맵핑을 종료하는 컴퓨터 프로그램 제품.
  39. 제38항에 있어서, 단계 (c)는
    (i) 카운터 k를 1로 설정하는 단계;
    (ii) k 번째 인덱스 시퀀스를 위해서 모든 가능한 인덱스 시퀀스를 통해 k 번째 출력 함수 및 k 번째 전이 확률 함수를 위한 비용 함수를 최적화함으로써 k+1 번째 인덱스 시퀀스를 결정하는 단계;
    (iii) k+1 번째 인덱스 시퀀스로부터 k+1 번째 출력 함수 및 k+1 번째 전이 확률 함수를 결정하는 단계;
    (iv) k+1 번째 인덱스 시퀀스, k+1 번째 출력 함수 및 k+1 번째 전이 확률 함수로부터 k+1 번째 비용을 결정하는 단계;
    (v) k+1 번째 비용과 k 번째 비용 사이의 k+1 번째 비용 차이를 계산하고, 상기 k+1 번째 비용차이가 선택된 임계치보다 작으면 새로운 인덱스 시퀀스 및 새로운 출력 함수로서 각각 k+1 번째 인덱스 시퀀스 및 k+1 번째 출력 함수를 선택하고, 그렇지 않으면 k를 1만큼 증가시키고 단계 (ii) 내지 (v)를 반복하는 단계를 포함하는 컴퓨터 프로그램 제품.
  40. 제39항에 있어서, 단계 (ii)의 모든 가능한 인덱스 시퀀스를 통해 k 번째 출력 함수 및 k 번째 전이 확률 함수를 위한 비용 함수를 최적화함으로써 k+1 번째 인덱스 시퀀스를 결정하는 단계는 비터비 알고리즘을 이용하는 것을 포함하는 컴퓨터 프로그램 제품.
  41. 제40항에 있어서,
    단계 (a)는 M 개의 분리 클러스터를 M'의 분리 그룹으로 그룹화하는 단계를 추가로 포함하고;
    단계 (c)는 M' 분리 그룹에 대해서 소프트 디시젼 최적화 처리를 사용하는 단계를 포함하는 컴퓨터 프로그램 제품.
  42. 제41에 있어서, 비용 함수는 M 및 M' 모두에 의존하는 컴퓨터 프로그램 제품.
KR1020067024347A 2004-04-21 2005-04-15 컬러 이미지 인코딩을 위한 방법, 시스템 및 소프트웨어제품 KR100868716B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US56403304P 2004-04-21 2004-04-21
US60/564,033 2004-04-21
US10/831,656 2004-04-23
US10/831,656 US7525552B2 (en) 2004-04-21 2004-04-23 Method, system and software product for color image encoding

Publications (2)

Publication Number Publication Date
KR20070026512A true KR20070026512A (ko) 2007-03-08
KR100868716B1 KR100868716B1 (ko) 2008-11-13

Family

ID=35136304

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067024347A KR100868716B1 (ko) 2004-04-21 2005-04-15 컬러 이미지 인코딩을 위한 방법, 시스템 및 소프트웨어제품

Country Status (10)

Country Link
EP (1) EP1745439B1 (ko)
JP (1) JP4607953B2 (ko)
KR (1) KR100868716B1 (ko)
CN (1) CN101065779B (ko)
AT (2) ATE447748T1 (ko)
AU (2) AU2005236504B2 (ko)
BR (1) BRPI0510076B1 (ko)
CA (1) CA2563122C (ko)
DE (2) DE602005024054D1 (ko)
SG (1) SG136944A1 (ko)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7525552B2 (en) 2004-04-21 2009-04-28 Slipstream Data Inc. Method, system and software product for color image encoding
CN102510434A (zh) * 2011-09-30 2012-06-20 深圳市融创天下科技股份有限公司 一种图像数据发送、恢复方法、装置及终端
HUE054084T2 (hu) * 2011-12-15 2021-08-30 Tagivan Ii Llc Luminancia-krominancia kódolt blokk jelölõk (CBF) jelzése videokódolásban
KR102257783B1 (ko) * 2013-04-08 2021-05-28 돌비 인터네셔널 에이비 Lut를 인코딩하는 방법, lut를 디코딩하는 방법 및 대응하는 장치들
GB201321851D0 (en) 2013-12-10 2014-01-22 Canon Kk Run length parameters coding for palette mode
CN105637861B (zh) * 2014-03-17 2018-11-20 富士通株式会社 基于调色板的编码装置、方法以及图像处理设备
JP6348746B2 (ja) * 2014-03-28 2018-06-27 株式会社メガチップス 画像圧縮回路および画像圧縮方法
CN105335989B (zh) * 2014-06-11 2019-04-05 富士通株式会社 图像编码方法和图像编码装置
KR101953482B1 (ko) * 2014-07-07 2019-02-28 에이치에프아이 이노베이션 인크. 인덱스 맵 부호화의 예측자로서 이스케이프 픽셀을 취급하는 방법
WO2016029420A1 (zh) * 2014-08-29 2016-03-03 富士通株式会社 基于调色板的图像编码方法、装置以及图像处理设备
WO2016048092A1 (ko) 2014-09-26 2016-03-31 주식회사 케이티 비디오 신호 처리 방법 및 장치
KR102470832B1 (ko) 2014-10-20 2022-11-28 주식회사 케이티 비디오 신호 처리 방법 및 장치
WO2016114583A1 (ko) 2015-01-15 2016-07-21 주식회사 케이티 비디오 신호 처리 방법 및 장치
US10477244B2 (en) 2015-01-29 2019-11-12 Kt Corporation Method and apparatus for predicting and restoring a video signal using palette entry and palette mode
KR102422484B1 (ko) 2015-01-29 2022-07-20 주식회사 케이티 비디오 신호 처리 방법 및 장치
CN107455007B (zh) 2015-04-02 2021-02-09 株式会社Kt 对视频信号进行编解码的方法
US10448058B2 (en) * 2015-05-21 2019-10-15 Qualcomm Incorporated Grouping palette index at the end and index coding using palette size and run value
CN106296757A (zh) * 2015-06-09 2017-01-04 中兴通讯股份有限公司 一种图像处理方法和装置
CN109416830A (zh) * 2016-07-08 2019-03-01 深圳市大疆创新科技有限公司 用于图像处理的系统和方法
CN110070496B (zh) * 2019-02-28 2020-07-31 北京字节跳动网络技术有限公司 图像特效的生成方法、装置和硬件装置
WO2021136470A1 (en) * 2019-12-31 2021-07-08 Beijing Bytedance Network Technology Co., Ltd. Clustering based palette mode for video coding
CN113068043B (zh) * 2020-01-02 2024-04-30 武汉金山办公软件有限公司 一种png图像压缩方法、装置、电子设备及存储介质
CN115457167B (zh) * 2022-09-21 2023-06-09 山东大学 基于色彩排序的调色板设计系统
CN116469336B (zh) * 2023-06-20 2023-08-18 联士光电(深圳)有限公司 一种彩色微显示芯片的数字驱动方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6215910B1 (en) 1996-03-28 2001-04-10 Microsoft Corporation Table-based compression with embedded coding
JPH10173538A (ja) * 1996-12-13 1998-06-26 Hajime Matsuoka ベクトル量子化圧縮を高速化する方法
JP3847349B2 (ja) 1997-02-03 2006-11-22 シャープ株式会社 デジタル画像の埋め込み符号器、レート―歪み最適化方法、復号器及び復号方法
EP0905651A3 (en) 1997-09-29 2000-02-23 Canon Kabushiki Kaisha Image processing apparatus and method
US6160918A (en) * 1997-10-02 2000-12-12 At&T Corp. Method and apparatus for fast image compression
US6113068A (en) 1998-10-05 2000-09-05 Rymed Technologies Swabbable needleless injection port system having low reflux
GB0104939D0 (en) * 2001-02-28 2001-04-18 Ccc Network Systems Group Ltd Method and system for improved image processing

Also Published As

Publication number Publication date
ATE484040T1 (de) 2010-10-15
ATE447748T1 (de) 2009-11-15
CN101065779A (zh) 2007-10-31
BRPI0510076A (pt) 2007-10-16
BRPI0510076B1 (pt) 2019-01-29
DE602005017486D1 (de) 2009-12-17
CA2563122C (en) 2012-02-28
AU2005236504A1 (en) 2005-11-03
JP4607953B2 (ja) 2011-01-05
KR100868716B1 (ko) 2008-11-13
EP1745439B1 (en) 2009-11-04
SG136944A1 (en) 2007-11-29
DE602005024054D1 (de) 2010-11-18
AU2005236504B2 (en) 2010-02-25
CN101065779B (zh) 2012-10-10
JP2007534239A (ja) 2007-11-22
CA2563122A1 (en) 2005-11-03
EP1745439A1 (en) 2007-01-24
AU2010200101A1 (en) 2010-01-28
EP1745439A4 (en) 2007-12-19
AU2010200101B2 (en) 2011-11-24

Similar Documents

Publication Publication Date Title
KR100868716B1 (ko) 컬러 이미지 인코딩을 위한 방법, 시스템 및 소프트웨어제품
EP1873720B1 (en) Method, system and software product for color image encoding
KR100845090B1 (ko) 화상 부호화 장치, 화상 복호 장치 및 그것들의 제어 방법
US20230388531A1 (en) Methods and apparatuses for encoding and decoding a bytestream
JP3978478B2 (ja) 推定画素値により固定速度のブロック単位の画像圧縮を行うための装置及び方法
US6205256B1 (en) Table-based compression with embedded coding
US5818877A (en) Method for reducing storage requirements for grouped data values
US6054943A (en) Multilevel digital information compression based on lawrence algorithm
JPH0937271A (ja) 画像圧縮方法
JP6178798B2 (ja) 終了可能な空間ツリー型位置符号化および復号
TW202002636A (zh) 網格寫碼之量化係數寫碼
JP2023543752A (ja) 点群コーデック方法及びシステム、並びに点群エンコーダ及び点群デコーダ
JP2024518718A (ja) 更新モデルを使用して、ニューラルネットワークパラメーターを復号化する装置、方法及びコンピュータープログラム、並びにニューラルネットワークパラメーターを符号化する装置、方法及びコンピュータープログラム
Krivokuća et al. Zerotree Coding of Subdivision Wavelet Coefficients in Dynamic Time-Varying Meshes
TW202320543A (zh) 支援轉換係數等級的適應性相依量化的解碼器、編碼器及方法
Alsous et al. Developing a High Performance Adjustable Quality Data Compression Scheme for Multimedia Messaging
KR20040052176A (ko) 이미지 압축 부호화 방법 및 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121019

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20131017

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20141023

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20151026

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20161024

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20171023

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20181024

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20191029

Year of fee payment: 12