KR20090018090A - 화상 데이터 압축 장치, 압축 방법 및 프로그램을 기록한 기록 매체 및 화상 데이터 복원 장치, 복원 방법 및 프로그램을 기록한 기록 매체 - Google Patents

화상 데이터 압축 장치, 압축 방법 및 프로그램을 기록한 기록 매체 및 화상 데이터 복원 장치, 복원 방법 및 프로그램을 기록한 기록 매체 Download PDF

Info

Publication number
KR20090018090A
KR20090018090A KR20087029607A KR20087029607A KR20090018090A KR 20090018090 A KR20090018090 A KR 20090018090A KR 20087029607 A KR20087029607 A KR 20087029607A KR 20087029607 A KR20087029607 A KR 20087029607A KR 20090018090 A KR20090018090 A KR 20090018090A
Authority
KR
South Korea
Prior art keywords
pixel
value
image
image data
prediction
Prior art date
Application number
KR20087029607A
Other languages
English (en)
Other versions
KR101037421B1 (ko
Inventor
준이치 오다기리
히로노리 야하기
시게루 요시다
Original Assignee
후지쯔 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후지쯔 가부시끼가이샤 filed Critical 후지쯔 가부시끼가이샤
Publication of KR20090018090A publication Critical patent/KR20090018090A/ko
Application granted granted Critical
Publication of KR101037421B1 publication Critical patent/KR101037421B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/16Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

양자화기는, 압축 대상 화소 X와 예측값 X'의 차분값인 "예측 오차"를 양자화하는 것이다. 가변 길이 부호화기는, 양자화기의 양자화 테이블로부터 얻어지는 양자화 번호를 입력으로 해서, 가변 길이 부호(압축 부호)를 출력한다. 예측값 후보 산출 모듈은, 주변 화소 A, C, B를 기초로 예측값 후보 1∼k를 산출하여 멀티플렉서(MPX)에 송신한다. 예측값 결정 모듈은, 예측값 후보 1∼k 중 어느 것을 예측값으로 할지를 화상 포맷에 따른 중간값 대응표 및 중간값·화상 포맷 대응표를 기초로 결정하고, 제어 신호를 멀티플렉서(MPX)에 송신한다. 멀티플렉서(MPX)는 결정한 예측값 후보 1∼k 중 어느 하나를 예측값 X'로서 출력한다. 이와 같이 화상 포맷에 따라서 예측값을 구별하여 사용함으로써, 각각의 화상 포맷에 대하여 예측 오차를 경감시키는 것이 가능해진다.

Description

화상 데이터 압축 장치, 압축 방법 및 프로그램 및 화상 데이터 복원 장치, 복원 방법 및 프로그램{IMAGE DATA COMPRESSION DEVICE, COMPRESSION METHOD, PROGRAM, AND IMAGE DATA DECOMPRESSION DEVICE, DECOMPRESSION METHOD, AND PROGRAM}
본 발명은 특성이 다른 2종류의 화상(영화 등의 자연 화상과, 디지털 지도 등의 CG 화상) 양방에 대하여 유효한, 고화질로 실시간 처리 가능한 화상 데이터 압축 장치, 압축 방법 및 상기 압축을 행하기 위한 프로그램 및 압축 화상 데이터를 복원하는 화상 데이터 복원 장치, 복원 방법 및 상기 복원을 행하기 위한 프로그램에 관한 것이다.
방대한 정보량을 포함하는 화상 정보를 전송하기 위해서는 데이터 압축이 필요하다. 특히 동화상의 경우는 1초 사이에 30∼60 프레임 정도의 화상 데이터가 송수신되기 때문에, 데이터 압축이 불가결해진다.
그런데, 화상 정보로서는 일반 텔레비전 화상이나 영화 등으로 대표되는 자연 화상과, 카 내비게이션의 지도 등으로 대표되는 CG 화상(디지털 화상)이 알려져 있으며, 일반적으로 자연 화상에서는 저주파 성분이, 또한 디지털 화상에서는 고주파 성분이 많이 포함되어 있다. 최근의 차량탑재 단말이나 휴대 전화를 포함하는 휴대 단말에서는, 지도 등의 디지털 화상과, TV나 영화 등의 자연 화상의 양방을 취급하게 되어 오고 있으며, 양방의 화상 데이터를 효율적으로 전송하기 위해서는, 저주파 성분과 고주파 성분의 양방에 효과적인 데이터 압축 방식이 요망되고 있다.
종래의 화상 데이터 압축 방식으로서, 도 1에 도시하는 바와 같은 JPEG(Joint Photographic Experts Group), MPEG(Moving Picture Experts Group)에 의해 데이터 압축을 행하는 제1 종래 기술이 알려져 있다. 이 제1 종래 기술에 속하는 특허 문헌으로서, 하기 특허 문헌 1 및 2를 들 수 있다. 도 1에 도시하는 바와 같이, 제1 종래 기술은, 화상 데이터(110)를 블록(통상 8*8 화소)화(도시하지 않음)하고, 블록 화상에 대하여 주파수 변환(210)을 가하며, DCT 계수에 대하여 양자화(310)를 행하고, 출현 빈도에 따른 부호를 할당하는 가변 길이 부호화(410)하여 전송한다.
여기서 주파수 변환이란 통상, DCT(Discrete Cosine Transfer)가 이용되며, 화상 데이터를 주파수 변환하는 것이다. 인간의 눈은 저주파 성분(화상 중의 평탄한 부분)에 민감하기 때문에, 저주파에 관한 DCT 계수는 미세하게, 고주파에 관한 DCT 계수는 개략적으로 양자화함으로써 자연 화상에 대해서는 화질 저하가 눈에 띄지 않도록 높은 압축률로 압축하는 것이 가능하다. 그러나, 인간의 눈에 검지되기 쉬운 저주파 성분을 미세하게 양자화하기 때문에 자연 화상의 압축에 대해서는 문제 없으나, 지도 화상(CG 화상) 중의 선, 문자와 같은 고주파 성분에 대해서는 화질 저하가 눈에 띄기 때문에, CG 화상에는 부적합하다는 문제가 있다.
또한 종래의 화상 데이터 압축 방식으로서, 도 2에 도시하는 바와 같은 JPEG-LS(Lossless)를 이용한 제2 종래 기술이 알려져 있다. 이 제2 종래 기술은, 도 2에 도시하는 바와 같이, 화상 데이터(120)를 압축하는 경우, 압축 대상 화소의 레벨값으로부터 MED(Median Edge Detector) 예측기(이 예측기는 MAP: Median Adaptive Predictor의 일종)를 사용하여 레벨값 예측을 행하고, 그 예측 오차를 직접 부호화하는 것이다. 이 제2 종래 기술에서는 예측 오차의 출현 빈도는 기본적으로 0 근방에 집중하기 때문에, 0 근방의 예측 오차에는 짧은 부호, 값이 큰 예측 오차에는 긴 부호를 할당함으로써 압축한다. 압축률은 1/3 정도이지만, 고·저주파를 불문하고 화소 단위로 부호화하기 때문에, CG 화상에 대해서도 화질 저하는 발생하지 않는다.
그러나, 인터레이스 화상이나 라인 간의 상관이 낮은 화상에서는 예측이 어려워 예측 오차가 증대하는 경향에 있다. 이 결과, 출현 빈도가 낮은(부호 길이가 긴) 가변 길이 부호를 할당하게 되고, 또한, 부호화 시에 계산 처리를 필요로 하는 등 각 처리가 느려, 실시간의 압축 처리에는 부적합하다는 문제가 있다.
특허 문헌 1: 일본 특허 공개 제2001-061149호 공보
특허 문헌 2: 일본 특허 공개 제2000-069479호 공보
JPEG, MPEG와 같은 DCT에 의한 변환 부호화를 행하는 것에 관해서는, CG 화상에 대한 화질 저하가 눈에 띄고, JPEG-LS에 관해서는, 인터레이스 화상이나 가로 방향으로 긴 화상에 대한 예측 오차가 커지는 결과, 긴 부호를 많이 사용하지 않을 수 없어, 압축 효율이 악화된다.
이러한 점에서, 자연 화상과 CG 화상의 양방을 취급하는 차량탑재 단말용 화상 데이터 압축 장치로서는, CG 화상에 대해서도 고화질로 압축하고, 또한 영화 등의 자연 화상에 보여지는 인터레이스 화상이나 가로 방향으로 긴 화상에 대해서도 압축 효율을 저하시키지 않는 것이 필요해진다.
상기와 같은 과제를 해결하기 위해서 본 발명의 목적은, 예측 대상 화소의 레벨값을 상기 예측 대상 화소의 주변 화소의 레벨값으로부터 예측하고, 그 예측 결과의 오차를 양자화함으로써 압축하는 화상 데이터 압축 장치, 압축 방법 및 상기 압축을 행하기 위한 프로그램 및 압축 화상 데이터를 복원하는 화상 데이터 복원 장치, 복원 방법 및 상기 복원을 행하기 위한 프로그램을 제공하는 것이다.
본 발명의 화상 데이터 압축 장치는, 예측기를 가지며, 상기 예측기로 압축 대상 화소의 화소 레벨값을 예측한다. 그 경우, 압축 대상 화소 주변의 화소 레벨값 및 화상 포맷에 기초하여 예측값을 결정한다. 이렇게 함으로써, 각각의 화상 포맷에 대하여 예측 오차를 경감시킬 수 있고, 압축 효율을 높일 수 있다. 또한 화상 포맷에 따라서 예측값을 전환하는 것만으로 충분하기 때문에, 실장 시의 프로그램, 회로 구성의 단순화를 도모할 수 있다.
또한 본 발명의 화상 데이터 압축 방법은, 유지된 상기 주변의 화소 A, B 및 C의 화소값을 기초로 복수의 예측값 후보를 산출하는 과정과, 중간값 대응표 및 중간값·화상 포맷 대응표를 기초로 상기 복수의 예측값 후보 중 어느 것을 예측값으로 할지를 결정하여, 제어 신호를 송신하는 과정을 포함하고 있다. 이와 같이 예측값 결정 모듈 및 예측값 산출 모듈의 각각에 있어서 병렬 처리하여, 각 예측값 후보의 산출을 종료한 단계에서, 어떤 예측값을 사용할지를 결정할 수 있기 때문에, 이 병렬 처리에 의해 고속으로 데이터 압축을 행하는 것이 가능해진다.
또한 본 발명의 화상 데이터의 압축을 행하는 프로그램은, 압축 대상 화소의 화소 레벨값을 예측하면서 화상 데이터의 압축을 행하기 위한 프로그램으로서, 컴퓨터에, 부호화하기 전에 압축 대상 화소의 주변의 화소에 대하여, 좌측의 화소를 A, 위의 화소를 C, 좌측 위의 화소를 B로 하고, 상기 화소 A, B 및 C의 화소값 및 바로 근방 1라인분의 화소값을 유지하는 단계, 유지된 상기 주변의 화소 A, B 및 C의 화소값을 기초로 복수의 예측값 후보를 산출하는 단계, 중간값 대응표 및 중간값·화상 포맷 대응표를 기초로 상기 복수의 예측값 후보를 압축해서 하나의 예측값을 결정하여 출력하는 단계, 출력된 예측값과 압축 대상 화소로부터 예측 오차를 산출하고, 상기 예측 오차를 양자화 테이블에 입력하여 양자화 번호를 취득하며, 상기 양자화 번호를 부호화 테이블에 입력하여 압축 부호를 얻는 단계를 실행시킨다. 이렇게 함으로써, 예측값 결정 및 예측값 산출의 각 단계에서 병렬 처리하여, 각 예측값 후보의 산출을 종료한 단계에서, 어떤 예측값을 사용할지를 결정할 수 있기 때문에, 이 병렬 처리에 의해 고속으로 데이터 압축을 행할 수 있다.
또한 본 발명의 화상 데이터 복원 장치 및 화상 데이터 복원 방법은, 상술한 화상 데이터 압축 장치로 압축된 화상 데이터를 역조작에 의해 복원하고 있기 때문에, 화상 데이터 압축 장치와 마찬가지로, 각각의 화상 포맷에 대하여 예측 오차를 경감시킬 수 있고, 압축 효율을 높일 수 있다. 또한 화상 포맷에 따라서 예측값을 전환하는 것만으로 충분하기 때문에, 실장 시의 프로그램, 회로 구성의 단순화를 도모할 수 있다.
또한 본 발명의 화상 데이터의 복원을 행하는 프로그램은, 상술한 화상 데이터의 압축을 행하는 프로그램에 의한 조작과 반대의 조작을 행하는 것이기 때문에, 상술한 화상 데이터의 압축을 행하는 프로그램과 마찬가지로, 예측값 결정 및 예측값 산출의 각 단계에 있어서 병렬 처리하여, 각 예측값 후보의 산출을 종료한 단계에서, 어떤 예측값을 사용할지를 결정할 수 있기 때문에, 이 병렬 처리에 의해 고속으로 데이터 복원을 행할 수 있다.
도 1은 JPEG, MPEG에 의해 데이터 압축을 행하는 제1 종래 기술을 도시하는 도면이다.
도 2는 JPEG-LS에 의해 데이터 압축을 행하는 제2 종래 기술을 도시하는 도면이다.
도 3은 본 발명의 실시형태에 따른 화상 데이터 압축 장치의 구성을 도시하는 블록도이다.
도 4는 본 발명의 실시형태에 따른 화상 데이터 압축 장치에서의 압축 대상 화소와 주변 화소의 배치 관계를 도시하는 도면이다.
도 5는 본 발명의 실시형태에 따른 양자화기에서의 양자화 테이블을 도시하는 도면이다.
도 6은 본 발명의 실시형태에 따른 화상 데이터 압축 장치의 예측값 결정 모듈에서의 중간값 대응표를 도시하는 도면이다.
도 7은 본 발명의 실시형태에 따른 화상 데이터 압축 장치의 예측값 결정 모듈에서의 중간값·화상 포맷 대응표를 도시하는 도면이다.
도 8은 본 발명의 실시형태에 따른 화상 데이터 압축 장치의 제어 신호와 예측값 후보 1∼k의 대응 관계를 나타내는 대응 테이블을 도시하는 도면이다.
도 9a는 본 발명의 실시형태에 따른 화상 데이터 압축(부호화) 장치의 동작을 설명하기 위한 플로우차트이다.
도 9b는 도 9a에서의 단계 S008에 있어서의 "로컬 디코더"의 처리를 설명하는 플로우차트이다.
도 10은 본 발명의 실시형태에 따른 화상 데이터 압축 장치에서의 압축 대상 화소 및 예측용 라인 버퍼의 어느 시점에서의 화소 레벨값을 도시하는 도면이다.
도 11은 본 발명의 실시형태에 따른 화상 데이터 압축 장치에서의 인터레이스용 예측기의 양자화 결과를 도시하는 도면이다.
도 12는 본 발명의 실시형태에 따른 화상 데이터 압축 장치에서의 프로그레시브용 예측기의 양자화 결과를 도시하는 도면이다.
도 13은 본 발명의 실시형태에 따른 화상 데이터 압축 장치의 시스템 구성을 도시하는 기능 블록도이다.
도 14는 본 발명의 실시형태에 따른 화상 데이터 복원 장치의 구성을 도시하는 블록도이다.
도 15는 본 발명의 실시형태에 따른 역양자화기에서의 역양자화 테이블을 도시하는 도면이다.
도 16은 본 발명의 실시형태에 따른 화상 데이터 복원 장치에서의 복원 대상 화소와 주변 화소의 배치 관계를 도시하는 도면이다.
도 17은 본 발명의 실시형태에 따른 화상 데이터 복원 장치의 예측값 결정 모듈에서의 중간값 대응표를 도시하는 도면이다.
도 18은 본 발명의 실시형태에 따른 화상 데이터 복원 장치의 예측값 결정 모듈에서의 중간값·화상 포맷 대응표를 도시하는 도면이다.
도 19는 본 발명의 실시형태에 따른 화상 데이터 복원 장치의 제어 신호와 예측값 후보 1∼k의 대응 관계를 나타내는 대응 테이블을 도시하는 도면이다.
도 20a는 본 발명의 실시형태에 따른 화상 데이터 복원(복호화) 장치의 동작을 설명하기 위한 플로우차트이다.
도 20b는 도 20a에서의 단계 S027에 있어서의 "로컬 디코더"의 처리를 설명하는 플로우차트이다.
도 21은 본 발명의 실시형태에 따른 화상 데이터 복원 장치에서의 예측용 라인 버퍼의 어느 시점에서의 화소 레벨값을 도시하는 도면이다.
도 22는 본 발명의 실시형태에 따른 화상 데이터 복원 장치에서의 인터레이스용 예측기의 양자화 결과를 도시하는 도면이다.
도 23은 본 발명의 실시형태에 따른 화상 데이터 복원 장치에서의 프로그레시브용 예측기의 양자화 결과도이다.
도 24는 본 발명의 실시형태에 따른 화상 데이터 복원 장치의 시스템 구성을 도시하는 기능 블록도이다.
이하, 본 발명의 실시형태를, 도면을 참조하면서 설명한다.
도 3은 본 발명의 실시형태에 따른 화상 데이터 압축(부호화) 장치의 구성을 도시하는 블록도이다. 도 3에서, 화상 데이터(001)는, 압축 대상이 되는 화소의 집합을 나타내며, 디지털로 화상을 처리하는 화상 처리 장치(도시하지 않음)에 의해 추출된다. 그리고 압축 대상 화소 X(002)는, 현단계에서 압축 대상이 되는 화소를 나타내고 있다. 도 4는 화상 포맷이 인터레이스 화상 또는 프로그레시브 화상일 때의 압축 대상 화소 X와 주변 화소의 배치 관계를 도시하는 도면이다. 또한 도 4에서 라인은 파선으로 나타나 있다. 양자화기(003)는, 압축 대상 화소 X(002)와 예측값 X'(006)의 차분값인 "예측 오차"를 양자화한다.
도 5는 본 발명의 실시형태에 따른 예측 오차(X-X')에 대한 양자화값 및 양자화 번호의 대응을 나타내는 양자화 테이블예이다. 도 5에 도시하는 양자화 테이블에서는, 예측 오차(X-X')를 입력으로 해서, 예측 오차 양자화값(단순히 양자화값이라고도 말함)과 양자화 번호를 출력한다. 양자화 단계의 폭은, 예측 오차의 절대값이 작은 경우일수록 좁고, 예측 오차의 절대값이 큰 경우일수록 넓은 것이 바람직하다. 이것은, 일반적으로 예측 오차가 작은 경우는 예측이 맞기 쉬운 평탄한 화상이고, 반대로 예측 오차가 큰 경우는 예측이 빗나가기 쉬운 에지 근방인 경향이 있어, 평탄한 부분에 오차가 있으면 사람의 눈에 검지되기 쉽기 때문에, 예측 오차가 작은 경우에는 단계 폭을 좁게 할 필요가 있다. 적응 양자화를 행할지의 여부에 따르지만, 구체적으로는 최소 단계 폭은 1∼4가 바람직하다. 한편, 예측 오차가 큰 경우의 단계 폭은, 출현 빈도가 적은 것과, 압축 효율을 높이기 위해서 힘을 다해 많은 예측 오차를 하나의 양자화 단계로 통합하도록 하기 위하여, 24∼32가 바람직하다. 또한, 에지가 많은 복잡한 도안을 압축하면 소정의 압축률에 이르지 않는 경우가 있기 때문에, 양자화 단계 폭이 다른 복수의 양자화 테이블을 갖고, 소정의 압축률을 초과할 것 같은 경우에는 단계 폭이 전체적으로 개략적인 양자화 테이블을 선택하는 적응 양자화를 행해도 상관없다. 또한 도 5에 도시하는 양자화값과 양자화 번호의 대응은, 압축측, 복원측에서 동일한 대응으로 되어 있을 필요가 있다. 그 때문에 도 5에 대응하여 양자화값과 양자화 번호의 대응을 나타내는 역양자화 테이블(도 15 참조)을 복원측에 갖게 한다. 이것에 대해서는 후술한다.
가변 길이 부호화기(004)는, 도 5의 양자화 테이블로부터 얻어지는 양자화 번호를 입력으로 해서, 가변 길이 부호를 출력한다. 압축 부호 버퍼(005)는 가변 길이 부호화기(004)로부터 출력되는 가변 길이 부호, 다시 말하면 압축 부호를 일시 축적한다.
예측값 X'(006)는, 예측값 후보 산출 모듈(011)에 의해 산출된 예측값 후보 1∼k(본 실시형태의 설명에서는 k=6으로 함) 중에서 멀티플렉서[MPX](015)에 의해 선택된 예측값 후보 중 하나이다. 주변 화소 A(007)는, 도 4에 도시되어 있는 바와 같이, 압축 대상 화소 X(002)의 좌측의 화소, 즉, 동일한 라인 중에서 하나 이전에 처리한 화소이다. 예측용 라인 버퍼(008)는, 예측용으로서 양자화 결과를 약 1라인분 유지하는 버퍼이며, 예컨대 시프트 레지스터로 구성된다. 도 4에 도시되어 있는 바와 같이, 주변 화소 C(009)는, 압축 대상 화소 X 위의 화소, 즉, 하나 앞서 처리 한 라인 중에서 동일한 열의 화소이다. 주변 화소 B(010)는, 압축 대상 화소 X의 좌측 위의 화소, 즉, 하나 앞서 처리한 라인 중에서 C(009)의 하나 앞에서 처리한 화소이다. 원화상에서 보면, 주변 화소 C 및 주변 화소 B는, 압축 대상 화소 X에 있어서, 인터레이스 화상의 경우에는 2라인 위의 화소에 대응하고, 프로그레시브 화상의 경우에는 1라인 위의 화소에 대응한다.
예측값 X'(006)는, 주변 화소 A(007), C(009), B(010)를 기초로 예측값 후보 산출 모듈(011)에 의해 산출된 예측값 후보 중 하나인데, 처음에 화상 포맷이 프로그레시브 화상인 경우의 예측값 후보의 산출에 대해서 설명한다. 도 4에 도시하는 바와 같이 프로그레시브 화상인 경우에는, 1라인 앞서 처리한 화소 C, B의 화소 레벨값과 동일한 라인 중에서 하나 앞서 처리한 화소 A의 화소 레벨값을 이용하여 3개의 방향의 상관을 고려한 예측값 X'(006)의 예측값 후보는, A, C, (A+C-B)가 된다.
다음으로, 화상 포맷이 인터레이스 화상인 경우의 예측값 후보의 산출에 대해서 설명한다. 도 4에 도시하는 바와 같이 인터레이스 화상인 경우에는, 짝수 라인과 홀수 라인이 교대로 송신되기 때문에, 프레임 메모리 등을 갖지 않고서 라인 단위로 처리를 행하기 위해서는 상관이 낮은 2라인 이전에 처리한 화소를 사용하게 된다. 이 때문에, 직접 2라인 이전에 처리한 화소 C, B의 화소 레벨값을 사용하지 않고서, 2개의 라인 사이의 화소 C'(화소 X와 화소 C 사이에 있는 화소), B'(화소 A와 화소 B 사이에 있는 화소)를 상정한다. 상기한 프로그레시브 화상과 동일하게 처리하기 위해서 화소 C'의 화소 레벨값을 화소 A와 C의 보간값 "(A+C)/2"로 하고, 화소 B'의 레벨값을 화소 A와 B의 보간값 "(2A+C-B)/2"를 사용하여 산출한다. 또한 화소 C' 및 화소 B'에 더하여, 동일한 라인 중에서 하나 이전에 처리한 화소 A의 화소 레벨값을 이용하여 3개의 방향의 상관을 고려한 예측값 X'(006)의 예측값 후보는, A, (A+C)/2, (2A+C-B)/2가 된다.
이와 같이 예측값 후보 산출 모듈(011)은, 주변 화소 A(007), C(009), B(010)를 기초로 이하에 나타내는 예측값 후보 1∼k를 산출하여 멀티플렉서[MPX](015)에 송신한다. 즉,
예측값 후보 1: (A+C)/2
예측값 후보 2: A
예측값 후보 3: (2A+C-B)/2
예측값 후보 4: C
예측값 후보 5: A
예측값 후보 6: A+C-B
상기에 있어서 예측값 후보 산출 모듈(011)은, 인터레이스 화상의 경우에 예측값으로서, 계수 m, n의 값이 모두 0을 취하지 않는 어떤 값(0을 포함하는 양의 정수)이고, 또한 시프트 연산에 의한 처리가 가능하도록 m+n의 값이 2의 i승인 계수 m, n을 이용하여, 3개의 예측값 후보 "A", "(m*A+n*C)/(m+n)", "A+(m*A+n*C)/(m+n)-(m*A+n*B)/(m+n)"의 중간값으로 할 수 있다. 이러한 예측값을 얻기 위해서는, 상기한 예측값 후보 산출 모듈(011)은, 상기 예측값 후보 1∼6 외에, 예측값 후보 7∼9로서의 3개의 예측값 후보 "A", "(m*A+n*C)/(m+n)", "A+(m*A+n*C)/(m+n)-(m*A+n*B)/(m+n)"을 산출한다. 그 결과, k의 값은 9가 된다. 즉 계수 m, n을 고려한 경우의 인터레이스 화상에 대해서는, 상술한 계수가 고려되어 있지 않은 인터레이스 화상 또는 프로그레시브가 화상 외에, 화상 포맷이 하나 더해지게 되기 때문에, k의 값은 9가 된다. 게다가 또한 화상 포맷수가 증가하게 되면 k는 화상 포맷수의 3배가 된다. 또한 계수 m, n으로서, 예컨대 m=1, n=3을 이용한 인터레이스용 예측값으로서, "A", "(A+3*C)/4" 및 "(4*A+3*C-3*B)/4"를 사용하여 세로 방향의 화소 레벨값의 변동에 강한 예측값을 산출하는 것이 가능하다. 즉, 세로 방향의 상관이 강한 화상에 대해서는, m보다도 n의 값을 크게 함으로써 대응한다. 또한 프로그레시브 화상의 경우에서의 상기 계수의 값으로서는, m=0, n=1로 미리 결정해 두고, 결과적으로 종래의 MAP 예측기와 동일한 예측값이 되도록 한다.
화상 포맷(012)은, 화상 처리 장치(도시하지 않음)로부터 본 화상 데이터 압축 장치에 제공되지만, 일반적으로 화상 데이터 포맷은, 가로 방향으로 화소 상관이 강한 화상인지 세로 방향으로 화소 상관이 강한 화상인지를 나타내는 신호로서 지시된다. 즉 상기한 인터레이스 화상은 가로 방향으로 화소 상관이 강한 화상이고, 또한 상기한 프로그레시브 화상은 세로 방향으로 화소 상관이 강한 화상(가로 방향의 화소 상관이 세로 방향의 상관보다도 강하다고 하는 것은 아닌 화상)이라고 지시된다. 또한 화상 포맷이, 예컨대 화상 데이터의 샘플링 포맷을 나타내는 신호라고 해도 마찬가지이다.
예측값 결정 모듈(013)은, 예측값 후보 1∼k 중 어느 것을 예측값으로 할지 를 이하의 도 6 및 도 7에 도시하는 2개의 대응표를 기초로 결정하여, 제어 신호(014)로서 멀티플렉서[MPX](015)에 송신한다. 도 6은 주변 화소 A, B 및 C의 화소 레벨값의 대소를 비교하여 주변 화소 A, B 및 C의 중간값을 산출한 결과를 기초로, 예측값 후보 (1)∼(3)으로 좁히기 위한 중간값 대응표이다. 도 6에 도시하는 예측값 후보 (1)∼(3)과 중간값의 대응은, 압축측, 복원측에서 동일한 대응으로 되어 있을 필요가 있다. 그 때문에 도 6에 대응하여 복원측에 예측값 후보 (1)∼(3)과 중간값의 대응을 나타내는 중간값 대응표(도 17 참조)를 갖게 한다. 이것에 대해서는 후술한다.
도 7은 도 6에서 좁힌 예측값 후보 (1)∼(3)과, 화상 포맷(012)이 가로 방향으로 화소 상관이 강한 화상(인터레이스 화상)인지 또는 세로 방향으로 화소 상관이 강한 화상(프로그레시브 화상)인지로, 최종적으로 예측값 후보 1∼k 중 어느 것을 예측값에 사용할지를 나타내는 제어 신호(014)를 멀티플렉서[MPX](015)에 송신하는 중간값·화상 포맷 대응표이다. 제어 신호(014)로서 출력되는 것은, 도 7의 대응표에 나타나는 바와 같이 (000∼101)의 3비트 신호이다. 또한, 상기한 바와 같이 예측값 후보 산출 모듈(011)로부터 계수 m, n이 고려된 인터레이스 화상에 대한 3개의 예측값 후보 "A", "(m*A+n*C)/(m+n)", "A+(m*A+n*C)/(m+n)-(m*A+n*B)/(m+n)"의 산출 출력이 추가되는 경우에는, 예측값 후보 (1)∼(3)에 대응하여 가로 방향 화소 상관이 강한 화상란에 제어 신호(이 경우는 4비트로 표현됨)에 의해 식별되는 예측값 후보 "A", "(m*A+n*C)/(m+n)", "A+(m*A+n*C)/(m+n)-(m*A+n*B)/(m+n)"이 부가되게 된다. 또한, 도 7에 도시하는 중간값과 화상 포맷의 대응은, 압축측, 복원 측에서 동일한 대응으로 되어 있을 필요가 있다. 그 때문에 도 7에 대응하여 복원측에 중간값과 화상 포맷의 대응을 나타내는 중간값·화상 포맷 대응표(도 18 참조)를 갖게 한다. 이것에 대해서는 후술한다.
멀티플렉서[MPX](015)는, 제어 신호(014)를 기초로, 예측값 후보 1∼k 중 어느 것을 예측값으로서 선택할지를 결정한다. 도 8은 제어 신호(014)와 상술한 예측값 후보 1∼6의 대응 관계를 도시하는 대응 테이블이다. 즉, 제어 신호(000)는 예측값 후보 1에 대응하고, 제어 신호(001)는 예측값 후보 2에 대응하며, 제어 신호(010)는 예측값 후보 3에 대응하고, 제어 신호(011)는 예측값 후보 4에 대응하며, 제어 신호(100)는 예측값 후보 5에 대응하고, 제어 신호(101)는 예측값 후보 6에 대응하게 된다. 또한, 상기한 바와 같이 예측값 후보 산출 모듈(011)로부터 계수 m, n이 고려된 인터레이스 화상에 대한 3개의 예측값 후보 "A", "(m*A+n*C)/(m+n)", "A+(m*A+n*C)/(m+n)-(m*A+n*B)/(m+n)"의 산출 출력이 추가되는 경우에는, 도 8의 표에 있어서 사용하는 예측값 후보로서 예측값 후보 "A", "(m*A+n*C)/(m+n)", "A+(m*A+n*C)/(m+n)-(m*A+n*B)/(m+n)"이 부가되게 된다. 게다가 제어 신호도 추가된 3개의 예측값 후보를 식별할 수 있는 비트폭의 제어 신호(이 경우는 4비트 신호)가 필요해진다. 그리고 도 8에 도시하는 제어 신호와 예측값 후보의 대응은, 압축측, 복원측에서 동일한 대응으로 되어 있을 필요가 있다. 도 8에 대응하여 복원측에 제어 신호와 예측값 후보의 대응을 나타내는 대응 테이블(도 19 참조)을 갖게 한다. 이것에 대해서는 후술한다. 또한, 본 실시형태에서는 제어 신호(014)로서 3비트의 제어 신호(000) 내지 제어 신호(101)를 대응시키고 있 으나, 예측값 후보 1∼6에 대응시킬 수 있는 것이면 이러한 형식의 제어 신호가 아니어도 상관없다.
또한, 인터레이스인지 프로그레시브인지에 한하지 않고, 화상 데이터의 샘플링 포맷을 나타내는 신호로 어떤 예측값을 사용할지를 나타내는 대응표를 예측값 결정 모듈(013)에 유지해 두고, 이것을 기초로 예측값을 결정할 수도 있다.
또한 도시하지 않으나 예측값 결정 모듈(013)로부터 화상 데이터의 샘플링 포맷을 나타내는 제어 신호를 예측값 후보 산출 모듈(011)에 송신하고, 이것을 기초로 예측값 후보 산출 모듈(011)은, 상술한 계수 m, n의 값을 결정하도록 해도 좋다.
도 9a는 본 발명의 실시형태에 따른 화상 데이터 압축(부호화) 장치의 동작을 설명하기 위한 플로우차트이다. 도 9b는 도 9a에서의 단계 S008에 있어서의 "로컬 디코더"의 처리를 설명하는 플로우차트이다. 도 9a 및 도 9b에서는 단계를 S라고 약기한다.
도 9a에서의 단계의 설명에 들어가기 전에 본 예에서는 전체 화상 데이터분에 대해서 처리가 종료될 때까지 루프하는 것을 전제로 하고 있는 것에 주의해 주길 바란다.
S001: 화상 데이터(001)로부터 압축 대상 화소 X(002)를 취득한다.
S002: 예측값 결정 모듈(013)로, 주변 화소 A(007), C(009), B(010)에 있어서의 화소 레벨값의 대소 관계를 비교한다. 이 대소 관계와 화상 포맷(012)을 기초로 도 6 및 도 7에 도시한 대응표를 참조하여, 제어 신호(014)를 멀티플렉 서[MPX](015)에 송신한다.
S003: 예측값 후보 산출 모듈(011)로, 주변 화소 A(007), C(009), B(010)를 기초로 예측값 후보 1∼6을 산출한다. 이 경우, 정수 연산 및 시프트 연산으로 예측값을 산출한다. 그리고 정수 연산 시에는 (2A+C-B+1)/2 및 (A+C+1)/2의 소수점 이하는 버린다. 실수 연산 시에는, 1 가산하여 버리지 않고 (2A+C-B)/2 및 (A+C)/2의 값을 그대로 사용한다.
S004: MPX(015)로, 예측값 후보 1∼6 및 제어 신호(014)를 기초로 예측값을 결정한다.
S005: 압축 대상 화소(002)의 화소 레벨값으로부터 예측값(006)을 감산하여, 예측 오차를 산출한다.
S006: 예측 오차를 양자화기(003)로 양자화하여, 양자화값과 양자화 번호를 취득한다.
S007: 가변 길이 부호화기(004)로 양자화 번호를 기초로 가변 길이 부호를 생성한다. 이 부호는 Golomb 부호여도 산술 부호여도 상관 없는 것으로 한다.
S008: 다음 화소를 압축하기 위해서, 주변 화소 A, B 및 C와 예측용 라인 버퍼(008)를 갱신(로컬 디코더)한다.
S009: 주변 화소 C(009)를 다음 압축 대상 화소의 주변 화소 B(010)로서 대입한다.
S010: 예측용 라인 버퍼(008)로부터 다음 압축 대상 화소의 주변 화소 C(009)를 취득한다.
S011: 주변 화소 A(007)를 예측용 라인 버퍼(008)에 대입한다.
S012: 양자화값과 예측값을 가산하여, 다음 압축 대상 화소의 주변 화소 A(007)로서 대입한다.
또한, 예컨대 예측용 라인 버퍼(008)와 압축 대상 화소 X(002)가 도 10에 도시되는 바와 같은 값인 경우, 인터레이스용 예측기 및 프로그레시브용 예측기의 양자화 결과는 도 11 및 도 12에 도시하는 표와 같이 나타난다. 예측용 라인 버퍼(008)와 압축 대상 화소 X(002)가 도 10에 도시하는 바와 같은 픽셀값을 취할 때, 도 11 및 도 12에 도시하는 표는, 상술한 도 9a 및 도 9b에 도시한 본 발명의 실시형태에 따른 화상 데이터 압축(부호화) 장치의 동작으로부터 간단히 도출할 수 있다. 이 경우, 이전회 압축 시의 화소 C(009)는 이번회 압축 시의 화소 B(010)가 되고, 이전회의 "예측값+예측 오차 양자화값"은 이번회의 화소 A(007)가 된다.
도 13은 본 발명의 실시형태에 따른 화상 데이터 압축 장치의 시스템 구성을 도시하는 기능 블록도이며, 상기에서 설명한 내용을 기능화하여 블록으로 표현한 것이다. 도 13에서 본 발명의 실시형태에 따른 화상 데이터 압축 장치는, 압축 처리해야 할 화상 데이터(102)를 압축 처리부(110)에 입력하고, 압축 처리부(110)에서는, 우선 입력된 화상 데이터(102)를 라인마다 판독부(111)로 판독하여 압축 대상 화소를 추출하며, 추출한 압축 대상 화소에 대하여 예측 처리부(112)에서는, 도 6에 도시한 바와 같은 중간값 대응 테이블(113), 도 7에 도시한 바와 같은 중간값·화상 포맷 대응 테이블(114)을 참조하여, 도 3의 예측값 후보 산출 모듈(011)에 상당하는 예측값 후보 산출부(115)로 예측값 후보를 산출하고, 또한, MPX(015)에 상당하는 예측값 결정부(116)에서는 화상 포맷(104)을 기초로 산출되는 예측값 후보 중에서 예측값을 결정하며, 결정한 예측값과 압축 대상 화소의 차분으로부터 예측 오차를 구하고, 이 예측 오차를 양자화부(003)에 상당하는 양자화 처리부(115)에 입력하며, 양자화 처리부(117)에서는 도 5에 도시한 바와 같은 양자화 테이블(118)을 참조하여 예측 오차로부터 예측 오차 양자화값과 양자화 번호를 얻으며 양자화 번호를 입력하고, 가변 길이 부호화기(004)에 상당하는 부호화 처리부(119)로부터 가변 길이 부호(압축 부호)를 얻어 이것을 압축 처리부(110)의 출력으로서 축적하여 압축 데이터(106)를 얻는 것이다.
이와 같이 본 발명의 화상 데이터 압축 장치에 따르면, 화상 포맷에 따라서 예측값을 구별하여 사용함으로써, 각각의 화상 포맷에 대하여 예측 오차를 경감시키는 것이 가능해지기 때문에, 압축 효율을 높일 수 있다. 또한 화상 포맷에 따라서 예측값을 전환하는 것만으로 충분하기 때문에, 실장 시의 프로그램, 회로 구성의 단순화를 도모할 수 있다.
상기에서는, A, B 및 C의 중간값을 구하고, 중간값 대응표를 기초로 어떤 예측값 후보를 선택할지를 결정하고 있었으나, 예측값 후보를 산출하고 나서 예측값 후보의 중간값을 구하도록 해도 좋다.
또한, 상기에서는, 인터레이스용 예측값은 (A+C)/2, A 및 (2A+C-B)/2였으나, 예측값 후보 산출 모듈(011)에 있어서, 화소 레벨값 A, B 및 C로부터 계수 m, n을 이용하여, "A", "(m*A+n*C)/(m+n)" 및 "A+(m*A+n*C)/(m+n)-(m*A+n*B)/(m+n)"을 산출하고, 계수 m, n은 모두 0을 취하지 않는 어떤 값(0을 포함하는 양의 정수)이며, 또한 시프트 연산에 의한 처리가 가능하도록 m+n의 값이 2의 i승인 값을 대입해서, 예컨대 인터레이스용 예측값으로서 "A", "(A+3*C)/4" 및 "(4*A+3*C-3*B)/4"를 사용하여 세로 방향의 화소 레벨값의 변동에 강한 예측값의 산출이 가능하다.
또한 인터레이스인지 프로그레시브인지의 화상 포맷에 한하지 않고, 화상 데이터의 샘플링 포맷을 나타내는 신호로 예측값을 구별하여 사용해도 동일한 효과가 발생된다.
예컨대, 일반적인 DVD에 저장되어 있는 화상 데이터의 샘플링 포맷은, 통상, 4:2:2 포맷으로 되어 있다. 이것은, Y 성분(휘도 성분)의 화상 사이즈는 720×480, C 성분(색 성분)의 가로 화상 사이즈는 Y 성분의 절반으로 되어 있다. 이 때문에, C 성분은 세로 방향으로 상관이 강한 화상 데이터로 되어 있으므로, 이 때문에 계수 m, n에 관해서는 m보다 n의 값을 크게 취함으로써 대응이 가능하다. 다시 말하면, 세로 방향의 상관이 강한 주변 화소에 대한 비중을 무겁게 함으로써(n의 값을 크게 함), 예측 오차의 악화를 방지하는 것이 가능해진다. 예컨대, 화상 데이터의 샘플링 포맷 4:2:2, 화상 사이즈 720×480의 인터레이스 화상에 대하여, C 성분의 경우에는, m=1, n=3으로 해서 세로 방향으로 상관이 있는 화상 데이터로서의 대응을 행하고, Y 성분에 대해서는 화상 사이즈 720×480의 경우에는, m=1, n=1로 함으로써, 가로 방향으로 상관이 있는 화상 데이터로서의 대응을 행한다. 가로 방향으로 상관이 있는 화상 데이터의 경우에서의 계수 m, n에 관해서는 m과 n을 동일한 값으로 하고, 그런데도 예측 오차의 악화가 보여지면 n보다 m의 값을 크게 취함으로써 대응이 가능하다. 또한 다른 예로서 화상 데이터의 샘플링 포맷이 4:4:4 포맷 이고, 화상 사이즈가 800×480인 프로그레시브 화상의 경우에는, m=0, n=1로 한다.
또한 필드 메모리(1라인분의 버퍼)만을 이용하고, 프레임 메모리가 불필요하기 때문에, 실장 시 비용을 삭감할 수 있다.
또한, 상기에서는, 예측값 후보 산출 모듈(011)이, 예측값 후보를 k개(상술한 설명에서는 6개) 산출하고, 도 6, 도 7을 기초로 압축된 제어 신호를 기초로 멀티플렉서[MPX](015)로 하나의 예측값을 선택하고 있다. 이러한 처리 순서에 따르면, 예측값 후보를 도 6, 도 7에서 압축하는 것과, 예측값 산출을 동일한 타이밍으로 실행하는 것이 가능해져, 처리 속도를 향상시킬 수 있다. 즉, 예측값 결정 모듈 및 예측값 산출 모듈의 각각에 있어서 병렬 처리하여, 각 예측값 후보의 산출을 종료한 단계에서, 어떤 예측값을 사용할지를 결정할 수 있기 때문에, 이 병렬 처리에 의해 고속으로 데이터 압축을 행하는 것이 가능해진다. 또한 예측값 결정 모듈 및 예측값 산출 모듈에 있어서는 테이블을 이용하여 연산 처리하기 때문에, 프로그램 처리를 고속화하는 것이 가능하다.
한편, 처리 속도를 중시하지 않고 구성 규모를 삭감하는 경우의 실장으로서는, 도 6의 중간값 대응표를 구성에서 제외시키고, 도 7을 기초로 미리 아는 화상 포맷에 따라서 먼저 3개의 예측값을 산출하며, 3개의 예측값 중에서 중간값을 직접 구한다고 하는 구성도 고려된다. 또한, 다른 패턴으로서, 도 6의 중간값 대응표에서 어떤 예측값 후보식에 의해 산출하면 좋을지를 결정하고, 상기 결정한 하나의 식만 계산 처리를 실행함으로써, 복수 산출한 예측값 중에서 채용해야 할 하나를 선택하는 구성을 삭감하는 방법도 고려된다.
또한, 본 발명의 화상 데이터 압축 장치는, 처리 대상으로 하는 화상이 프로그레시브 화상인 경우에는 프레임 단위로, 인터레이스 화상인 경우에는 필드 단위로 화면의 상부로부터 하부를 향한 순서로, 스트림 형상으로 흘러 오는 화상 데이터를 처리 대상으로 한다. 또한, 압축 부호화 후의 압축 데이터는, 본 장치가 접속하고 있는 전송로의 전송 규약에 따라서, 일정한 사이즈마다 패킷화되어 전송되게 된다.
도 14는 본 발명의 실시형태에 따른 화상 데이터 복원(복호화) 장치의 구성을 도시하는 블록도이다. 도 14에서, 압축 부호(021)는, 상기 도 3에 도시한 본 발명의 실시형태에 따른 화상 데이터 압축(부호화) 장치의 출력인 가변 길이 부호화된 화상 데이터의 압축 부호를 나타내고 있다. 그리고 역부호화기(022)는, 화상 데이터의 압축된 부호를 입력으로 해서, 그 부호에 해당하는 양자화 번호를 출력한다. 역양자화기(023)는, 양자화 번호를 입력으로 해서, 예측 오차의 양자화값 X(024)를 출력한다.
도 15는 역양자화기(023)에 구비된 상기 양자화 번호에 대한 예측 오차 양자화값의 대응을 나타내는 역양자화 테이블이다. 도 15에 도시하는 역양자화 테이블에서는, 양자화 번호를 입력으로 해서, 예측 오차 양자화값을 출력한다. 도 15에 도시하는 예측 오차 양자화값과 양자화 번호의 대응은, 복원측, 압축측에서 동일한 대응으로 되어 있을 필요가 있다. 그 때문에 도 15에 대응하여 압축측에 예측 오차 양자화값과 양자화 번호의 대응을 나타내는 양자화 테이블(도 5 참조)을 구비하고 있다.
또한 도 16은 화상 포맷(032)이, 예컨대, 인터레이스 화상, 또는, 프로그레시브 화상일 때의 복원 대상 화소 X와 주변 화소의 배치 관계를 도시하는 도면이다. 또한 도 15에서 라인은 파선으로 나타나 있다.
예측 오차 양자화값 X(024)는 예측값 X'(026)와 가산하여 복원 화상 데이터(025)를 얻으며, 다음 복원 대상 화소의 주변 화소 A(027)로도 된다.
주변 화소 A(027)는, 도 16에 도시되어 있는 바와 같이, 복원 대상 화소의 좌측의 화소이다. 예측용 라인 버퍼(028)는, 예측용으로서 양자화 결과 약 1라인분을 유지하는 버퍼이며, 예컨대 시프트 레지스터로 구성된다. 도 16에 도시되어 있는 바와 같이, 주변 화소 C(029)는, 복원 대상 화소 위(이전 라인)의 화소이고, 주변 화소 B(030)는, 복원 대상 화소의 좌측 위(이전 라인)의 화소이다.
예측값 X'(026)는, 주변 화소 A(027), C(029), B(030)를 기초로 예측값 후보 산출 모듈(031)에 의해 산출된 예측값 후보 중 하나인데, 처음에 화상 포맷이 프로그레시브 화상인 경우의 예측값 후보의 산출에 대해서 설명한다. 도 16에 도시하는 바와 같이 프로그레시브 화상의 경우에는, 1라인 앞서 처리한 화소 C, B의 화소 레벨값과 동일한 라인 중에서 하나 앞서 처리한 화소 A의 화소 레벨값을 이용하여 3개의 방향의 상관을 고려한 예측값 X'(026)의 예측값 후보는, A, C, (A+C-B)가 된다.
다음으로, 화상 포맷이 인터레이스 화상인 경우의 예측값 후보의 산출에 대해서 설명한다. 도 16에 도시하는 바와 같이 인터레이스 화상의 경우는, 짝수 라인과 홀수 라인이 교대로 송신되기 때문에, 프레임 메모리 등을 갖지 않고서 라인 단 위로 처리를 행하기 위해서는 상관이 낮은 2라인 앞서 처리한 화소를 사용하게 된다. 이 때문에, 직접 2라인 앞서 처리한 화소 C, B의 화소 레벨값을 사용하지 않고서, 2개의 라인 사이의 화소로서, 화소 C와 화소 X 사이의 화소 C', 및 화소 B와 화소 A 사이의 화소 B'를 상정하여 상기한 프로그레시브 화상과 동일하게 처리하기 위해서 화소 C', B'의 화소 레벨값을 화소 A와 C의 보간값 "(A+C)/2" 및 화소 A와 B의 보간값 "(2A+C-B)/2"를 사용하고, 또한 동일한 라인 중에서 하나 앞서 처리한 화소 A의 화소 레벨값을 이용하여 3개의 방향의 상관을 고려한 예측값 X'(026)의 예측값 후보는, A, (A+C)/2, (2A+C-B)/2가 된다.
이와 같이 예측값 후보 산출 모듈(031)은, 주변 화소 A(027), C(029), B(030)를 기초로 이하에 나타내는 예측값 후보 1∼k(본 실시형태의 설명에서는 k=6으로 함)를 산출하여 멀티플렉서[MPX](035)에 송신한다. 즉,
예측값 후보 1: (A+C)/2
예측값 후보 2: A
예측값 후보 3: (2A+C-B)/2
예측값 후보 4: C
예측값 후보 5: A
예측값 후보 6: A+C-B
상기에 있어서 예측값 후보 산출 모듈(031)은, 인터레이스 화상의 경우에 예측값으로서, 계수 m, n의 값이 모두 0을 취하지 않는 어떤 값(0을 포함하는 양의 정수)이며, 또한 시프트 연산에 의한 처리가 가능하도록 m+n의 값이 2의 i승인 계 수 m, n을 이용하여, 인터레이스 화상의 예측값으로서는, 3개의 예측값 후보 "A", "(m*A+n*C)/(m+n)", "A+(m*A+n*C)/(m+n)-(m*A+n*B)/(m+n)"의 중간값으로 할 수 있다. 이러한 예측값을 얻기 위해서는, 상기한 예측값 후보 산출 모듈(031)은, 상기 예측값 후보 1∼6 외에, 예측값 후보 7∼9로서의 3개의 예측값 후보 "A", "(m*A+n*C)/(m+n)", "A+(m*A+n*C)/(m+n)-(m*A+n*B)/(m+n)"을 산출한다. 그 결과, k의 값은 9가 된다. 즉 계수 m, n이 고려된 인터레이스 화상의 경우에는, 상술한 계수가 고려되어 있지 않은 인터레이스 화상 또는 프로그레시브가 화상 외에, 화상 포맷이 하나 더해지게 되기 때문에, k의 값은 9가 된다. 게다가 또한 화상 포맷수가 증가하게 되면 k는 화상 포맷수의 3배가 된다.
또한 계수 m, n으로서, 예컨대 m=1, n=3을 이용한 인터레이스용 예측값으로서, "A", "(A+3*C)/4" 및 "(4*A+3*C-3*B)/4"를 사용하여 세로 방향의 화소 레벨값의 변동에 강한 예측값을 산출하는 것이 가능하다. 또한 프로그레시브 화상의 경우에 있어서의 상기 계수의 값으로서는, m=0, n=1로 미리 결정해 두고, 결과적으로 종래의 MAP 예측기와 동일한 예측값이 되도록 한다.
화상 포맷(032)은, 화상 처리 장치(도시하지 않음)로부터 본 화상 데이터 복원 장치에 제공되지만, 일반적으로 화상 데이터 포맷은, 가로 방향으로 화소 상관이 강한 화상인지 세로 방향으로 화소 상관이 강한 화상인지를 나타내는 신호로서 지시된다. 즉 상기한 인터레이스 화상은, 가로 방향으로 화소 상관이 강한 화상이고, 또한 상기한 프로그레시브 화상은 세로 방향으로 화소 상관이 강한 화상이라고 해서 지시된다. 또한 화상 포맷이, 예컨대 화상 데이터의 샘플링 포맷을 나타내는 신호라고 해도 마찬가지이다.
예측값 결정 모듈(033)은, 예측값 후보 1∼k 중 어느 것을 예측값으로 할지를 이하의 도 17 및 도 18에 도시하는 2개의 대응표를 기초로 결정하고, 제어 신호(034)로서 멀티플렉서[MPX](035)에 송신한다. 도 17은 주변 화소 A, B 및 C의 화소 레벨값의 대소를 비교하여 주변 화소 A, B 및 C의 중간값을 산출한 결과를 기초로, 예측값 후보 (1)∼(3)으로 좁히기 위한 중간값 대응표이다. 도 17에 대응하여 압축측에 예측값 후보 (1)∼(3)과 중간값의 대응을 나타내는 중간값 대응표(도 6 참조)를 갖게 하고 있다.
도 18은 도 17에서 좁힌 예측값 후보 (1)∼(3)과, 화상 포맷(032)이 인터레이스 화상인지 또는 프로그레시브 화상인지의 구별로, 최종적으로 예측값 후보 1∼k 중 어느 것을 예측값으로 사용할지를 나타내는 제어 신호(034)를 멀티플렉서[MPX](035)에 송신하는 중간값·화상 포맷 대응표이다. 제어 신호(034)로서 출력되는 것은, 도 18의 대응표에 나타나는 바와 같이 (000∼101)의 3비트 신호이다. 또한, 상기한 바와 같이 예측값 후보 산출 모듈(031)로부터 계수 m, n이 고려된 인터레이스 화상에 대한 3개의 예측값 후보 "A", "(m*A+n*C)/(m+n)", "A+(m*A+n*C)/(m+n)-(m*A+n*B)/(m+n)"의 산출 출력이 추가되는 경우에는, 예측값 후보 (1)∼(3)에 대응하여 가로 방향 화소 상관이 강한 화상란에 제어 신호(이 경우는 4비트로 표현됨)에 의해 식별되는 예측값 후보 "A", "(m*A+n*C)/(m+n)", "A+(m*A+n*C)/(m+n)-(m*A+n*B)/(m+n)"이 부가되게 된다. 또한, 도 18에 대응하여 압축측에 중간값과 화상 포맷의 대응을 나타내는 중간값·화상 포맷 대응표(도 7 참조)를 갖게 하고 있다.
멀티플렉서[MPX](035)는, 제어 신호(034)를 기초로, 예측값 후보 1∼k 중 어느 것을 예측값으로서 선택할지를 결정한다. 도 19는 제어 신호(034)와 상술한 예측값 후보 1∼6의 대응 관계를 나타내는 대응 테이블이다. 즉, 제어 신호(000)는 예측값 후보 1에 대응하고, 제어 신호(001)는 예측값 후보 2에 대응하며, 제어 신호(010)는 예측값 후보 3에 대응하고, 제어 신호(011)는 예측값 후보 4에 대응하며, 제어 신호(100)는 예측값 후보 5에 대응하고, 제어 신호(101)는 예측값 후보 6에 대응하게 된다.
또한, 상기한 바와 같이 예측값 후보 산출 모듈(031)로부터 계수 m, n이 고려된 인터레이스 화상에 대한 3개의 예측값 후보 "A", "(m*A+n*C)/(m+n)", "A+(m*A+n*C)/(m+n)-(m*A+n*B)/(m+n)"의 산출 출력이 추가되는 경우에는, 도 19의 표에 있어서 사용하는 예측값 후보로서 예측값 후보 "A", "(m*A+n*C)/(m+n)", "A+(m*A+n*C)/(m+n)-(m*A+n*B)/(m+n)"이 부가되게 된다. 게다가 제어 신호도 추가된 3개의 예측값 후보를 식별할 수 있는 비트폭의 제어 신호(이 경우는 4비트 신호)가 필요해진다. 도 19에 대응하여 압축측에 제어 신호와 예측값 후보의 대응을 나타내는 대응 테이블(도 8 참조)을 갖게 하고 있다. 또한, 본 실시형태에서는 제어 신호(034)로서 3비트의 제어 신호(000) 내지 제어 신호(101)를 대응시키고 있으나, 예측값 후보 1∼6에 대응시킬 수 있는 것이면 이러한 형식의 제어 신호가 아니어도 상관없다.
또한, 인터레이스인지 프로그레시브인지에 한하지 않고, 화상 데이터의 샘플 링 포맷을 나타내는 신호로 어떤 예측값을 사용할지를 나타내는 대응표를 예측값 결정 모듈(033)에 유지해 두고, 이것을 기초로 예측값을 결정할 수도 있다.
또한 개시하지는 않았지만 예측값 결정 모듈(033)로부터 화상 데이터의 샘플링 포맷을 나타내는 제어 신호를 예측값 후보 산출 모듈(031)에 송신하고, 이것을 기초로 예측값 후보 산출 모듈(031)은, 상술한 계수 m, n의 값을 결정하도록 해도 좋다.
도 20a는 본 발명의 실시형태에 따른 화상 데이터 복원(복호화) 장치의 동작을 설명하기 위한 플로우차트이다. 도 20b는 도 20a에서의 단계 S027에 있어서의 "로컬 디코더"의 처리를 설명하는 플로우차트이다. 도 20a 및 도 20b에서는 단계를 S라고 약기한다.
도 20a에서의 단계의 설명에 들어가기 전에 본 예에서는 전체 화상 데이터분에 대해서 처리가 종료될 때까지 루프하는 것을 전제로 하고 있는 것에 주의해 주길 바란다.
S021: 부호 데이터(021)를 역부호화기(022)에 입력하여, 양자화 번호를 출력한다.
S022: 양자화 번호를 역양자화기(023)에 입력하여, 예측 오차의 양자화값(024)을 출력한다.
S023: 예측값 결정 모듈(033)로, 주변 화소 A(027), C(029), B(030)에 있어서의 화소 레벨값의 대소 관계를 비교한다. 이 대소 관계와 화상 포맷(032)을 기초로 도 17 및 도 18에 도시한 대응표를 참조하여, 제어 신호(034)를 멀티플렉 서[MPX](035)에 송신한다.
S024: 예측값 후보 산출 모듈(031)로, 주변 화소 A(027), C(029), B(030)를 기초로 예측값 후보 1∼6을 산출한다. 이 경우, 정수 연산 및 시프트 연산으로 예측값을 산출한다. 그리고 정수 연산 시에는 (2A+C-B+1)/2 및 (A+C+1)/2의 소수점 이하는 버린다. 실수 연산 시에는, 1 가산하여 버리지 않고 (2A+C-B)/2 및 (A+C)/2의 값을 그대로 사용한다.
S025: MPX(035)로, 예측값 후보 1∼6 및 제어 신호(034)를 기초로 예측값을 결정한다.
S026: S022에서 취득한 예측 오차의 양자화값과 S024에서 취득한 예측값을 가산하여, 복원 대상 화소[복원 화상 데이터(025)]를 산출한다.
S027: 다음 화소를 복원하기 위해서, 주변 화소 A, B 및 C와 예측용 라인 버퍼(028)를 갱신(로컬 디코더)한다.
S028: 주변 화소 C(029)를 다음 복원 대상 화소의 주변 화소 B(030)로서 대입한다.
S029: 예측용 라인 버퍼(028)로부터 다음 복원 대상 화소의 주변 화소 C(029)를 취득한다.
S030: 주변 화소 A(027)를 예측용 라인 버퍼(028)에 대입한다.
S031: 양자화값과 예측값을 가산하여, 다음 복원 대상 화소의 주변 화소 A(027)로서 대입한다.
또한, 예컨대 예측용 라인 버퍼(028)가 도 21에 도시되는 바와 같은 값인 경 우, 인터레이스용 예측기 및 프로그레시브용 예측기의 양자화 결과는 도 22 및 도 23에 도시하는 표와 같이 나타난다. 예측용 라인 버퍼(028)가 도 21에 도시하는 바와 같은 픽셀값을 취할 때, 도 22 및 도 23에 도시하는 표는, 상술한 도 20a 및 도 20b에 도시한 본 발명의 실시형태에 따른 화상 데이터 복원(복호화) 장치의 동작으로부터 간단히 도출할 수 있다. 이 경우, 이전회 복원 시의 화소 C(029)는 이번회 복원 시의 화소 B(030)가 되고, 이전회의 "예측값+예측 오차 양자화값"은 이번회의 화소 A(027)가 된다.
도 24는 본 발명의 실시형태에 따른 화상 데이터 복원 장치의 시스템 구성을 도시하는 기능 블록도이며, 상기에서 설명한 내용을 기능화하여 블록으로 표현한 것이다. 도 24에서 본 발명의 실시형태에 따른 화상 데이터 복원 장치는, 상술한 화상 데이터 압축 장치의 출력인 압축 데이터(202)를 복원 처리부(210)에 입력하고, 복원 처리부(210)에서는, 우선 입력된 화상 데이터(202)를 도 14의 역부호화기(022)에 상당하는 역부호화 처리부(211)에 입력하며, 역부호화 처리부(211)로부터 양자화 번호를 얻는다. 이어서 양자화 번호를 역양자화기(023)에 상당하는 역양자화 처리부(212)에 입력한다. 역양자화 처리부(212)에서는 도 15에 도시한 바와 같은 역양자화 테이블(213)을 참조하여 양자화 번호로부터 예측 오차 양자화값을 얻는다. 얻어진 예측 오차 양자화값을 예측 처리부(214)에 입력한다. 예측 처리부(214)에서는, 도 17에 도시한 바와 같은 중간값 대응 테이블(215), 도 18에 도시한 바와 같은 중간값·화상 포맷 대응 테이블(216)을 참조하여, 예측값 후보 산출 모듈(031)에 상당하는 예측값 후보 산출부(217)에서 예측값 후보를 산출하고, 또한 MPX(035)에 상당하는 예측값 결정부(218)에서는 화상 포맷(204)을 기초로 예측값 후보 산출부(217)에서 산출된 예측값 후보 중에서 예측값을 결정한다. 그리고, 예측 처리부(214)는, 출력으로서 예측값 후보 산출부(217)에서 산출한 예측 오차 양자화값과 예측값 결정부(218)에서 결정한 예측값을 출력하고, 출력한 예측값과 예측 오차 양자화값을 복원값 산출부(219)에 입력한다. 복원값 산출부(219)는 입력된 예측값과 예측 오차 양자화값을 가산하여 복원 화소값을 얻고 이것을 축적하여 복원(화상) 데이터(206)를 얻는 것이다.
이와 같이 본 발명의 화상 데이터 복원 장치는, 화상 포맷에 따라서 예측값을 구별하여 사용함으로써, 각각의 화상 포맷에 대하여 예측 오차를 경감시키는 것이 가능해지기 때문에, 복원 효율을 높일 수 있다. 또한 화상 포맷에 따라서 예측값을 전환하는 것만으로 충분하기 때문에, 실장 시의 프로그램, 회로 구성의 단순화를 도모할 수 있다.
또한 상기에서는, A, B 및 C의 중간값을 구하고, 중간값 대응표를 기초로 어떤 예측값 후보를 선택할지를 결정하고 있었으나, 예측값 후보를 산출하고 나서 예측값 후보의 중간값을 구하도록 해도 좋다.
또한, 상기에서는, 인터레이스 화상용 예측값은 (A+C)/2, A 및 (2A+C-B)/2였으나, 예측값 후보 산출 모듈에 있어서, 화소 레벨값 A, B 및 C로부터 계수 m, n을 이용하여, "A", "(m*A+n*C)/(m+n)" 및 "A+(m*A+n*C)/(m+n)-(m*A+n*B)/(m+n)"을 산출하고, 계수 m, n은 모두 0을 취하지 않는 어떤 값을 대입해서, 인터레이스용 예측값으로서 "A", "(A+3*C)/4" 및 "(4*A+3*C-3*B)/4"를 사용하여 세로 방향의 화소 레벨값의 변동에 강한 예측값의 산출이 가능하다. 또한, 예측값 결정 모듈 및 예측값 산출 모듈의 각각에 있어서 병렬 처리하여, 각 예측값 후보의 산출을 종료한 단계에서, 어떤 예측값을 사용할지를 결정할 수 있기 때문에, 이 병렬 처리에 의해 고속으로 데이터 복원을 행하는 것이 가능해진다.
또한 인터레이스인지 프로그레시브인지의 화상 포맷에 한하지 않고, 화상 데이터의 샘플링 포맷을 나타내는 신호로 예측값을 구별하여 사용해도 동일한 효과가 발생된다.
예컨대, 일반적인 DVD에 저장되어 있는 화상 데이터의 샘플링 포맷은, 통상, 4:2:2 포맷으로 되어 있다. 이것은, Y 성분(휘도 성분)의 화상 사이즈는 720×480, C 성분(색 성분)의 가로 화상 사이즈는 Y 성분의 절반으로 되어 있다. 이 때문에, C 성분은 세로 방향으로 상관이 있는 화상 데이터로 되어 있으므로, 이 때문에 계수 m, n에 관해서는 m보다 n의 값을 크게 취함으로써 대응이 가능하다. 다시 말하면, 세로 방향의 상관이 강한 주변 화소에 대한 비중을 무겁게 함으로써(n의 값을 크게 함), 예측 오차의 악화를 방지하는 것이 가능해진다. 예컨대, 화상 데이터의 샘플링 포맷 4:2:2, 화상 사이즈 720×480의 인터레이스 화상에 대하여, C 성분의 경우에는, m=1, n=3으로 해서 세로 방향으로 상관이 있는 화상 데이터로서의 대응을 행하고, Y 성분에 대해서는 화상 사이즈 720×480의 경우에는, m=1, n=1로 함으로써, 가로 방향으로 상관이 있는 화상 데이터로서의 대응을 행한다. 가로 방향으로 상관이 있는 화상 데이터의 경우에 있어서의 계수 m, n에 관해서는 m과 n을 동일한 값으로 하고, 그런데도 예측 오차의 악화가 보여지면 n보다 m의 값을 크게 취 함으로써 대응이 가능하다. 또 다른 예로서 화상 데이터의 샘플링 포맷이, 4:4:4 포맷이고, 화상 사이즈가 800×480인 프로그레시브 화상의 경우에는, m=0, n=1로 한다.
또한 필드 메모리(1라인분의 버퍼)만을 이용하고, 프레임 메모리가 불필요하기 때문에, 실장 시의 비용을 삭감할 수 있다. 또한, 예측값을 전환하는 것만으로, 인터레이스/프로그레시브의 양방에 대응할 수 있기 때문에, 회로 규모의 단순화를 도모할 수 있다.
또한, 상기에서는, 예측값 후보 산출 모듈(031)이, 예측값 후보를 k개(상술한 설명에서는 6개) 산출하고, 도 17, 도 18을 기초로 좁힌 제어 신호를 기초로 멀티플렉서[MPX](035)로 하나의 예측값을 선택하고 있다. 이러한 처리 순서에 따르면, 예측값 후보를 도 17, 도 18에서 좁히는 것과, 예측값 산출을 동일한 타이밍으로 실행하는 것이 가능해져, 처리 속도를 향상시킬 수 있다. 즉, 예측값 결정 모듈 및 예측값 산출 모듈의 각각에 있어서 병렬 처리하여, 각 예측값 후보의 산출을 종료한 단계에서, 어떤 예측값을 사용할지를 결정할 수 있기 때문에, 이 병렬 처리에 의해 고속으로 데이터 압축을 행하는 것이 가능해진다. 또한 예측값 결정 모듈 및 예측값 산출 모듈에 있어서는 테이블을 이용하여 연산 처리하기 때문에, 프로그램 처리를 고속화하는 것이 가능하다.
한편, 처리 속도를 중시하지 않고 구성 규모를 삭감하는 경우의 실장으로서는, 도 17의 중간값 대응표를 구성에서 제외시키고, 도 18을 기초로 미리 아는 화상 포맷에 따라서 먼저 3개의 예측값을 산출하며, 3개의 예측값 중에서 중간값을 직접 구한다고 하는 구성도 고려된다. 또한, 다른 패턴으로서, 도 17의 중간값 대응표에서 어떤 예측값 후보식에 의해 산출하면 좋을지를 결정하고, 상기 결정한 하나의 식만 계산 처리를 실행함으로써, 복수 산출한 예측값 중에서 채용해야 할 하나를 선택하는 구성을 삭감하는 방법도 고려된다.
본 발명의 화상 데이터 압축 장치 및 화상 데이터 복원 장치는, 1칩 LSI 화되어 원하는 애플리케이션 기기에 탑재 가능하고, 예컨대 카 내비게이션을 포함하는 차내 영상 데이터 전송 시스템이나 각종 오락(게임, 애니메이션 등) 기기에의 적용이 고려된다. 일례로서 차내 영상 데이터 전송 시스템에서는, 리어측에도 디스플레이가 설치되어, 프론트측과는 다른 영상을 감상할 수 있는 것이 요망된다. 그 때문에, 프론트측에 실장된 영상 데이터 처리 장치로 처리한 화상 데이터를 압축하여 리어측에 전송하고, 리어측에서는 그것을 복원하여 화상 데이터를 표시한다. 화상 데이터를 중계하는 경우에는 각 중계점에서 압축, 복원이 반복되게 된다.

Claims (14)

  1. 화상 데이터를 압축할 때에, 압축 대상 화소의 화소 레벨값을 예측하는 예측기를 가지며, 상기 예측기의 예측 결과와 실제의 화소 레벨값의 차분값을 양자화하고 나서 부호화 또는 차분값을 기초로 부호화하는 화상 데이터 압축 장치로서, 상기 예측기는, 압축 대상 화소 주변의 화소 레벨값 및 화상 포맷에 기초하여 예측값을 결정하는 것을 특징으로 하는 화상 데이터 압축 장치.
  2. 제1항에 있어서, 상기 화상 포맷은 가로 방향 화소 상관이 강한 화상과 세로 방향 화소 상관이 강한 화상 중 어느 하나를 지시하는 것을 특징으로 하는 화상 데이터 압축 장치.
  3. 제2항에 있어서, 가로 방향 화소 상관이 강한 화상은 인터레이스 화상이고, 세로 방향 화소 상관이 강한 화상은 프로그레시브 화상인 것을 특징으로 하는 화상 데이터 압축 장치.
  4. 제2항에 있어서, 상기 가로 방향 화소 상관이 강한 화상과 세로 방향 화소 상관이 강한 화상 중 어느 하나가 샘플링 포맷에 의해 규정되어 있는 것을 특징으로 하는 화상 데이터 압축 장치.
  5. 제2항에 있어서, 상기 압축 대상 화소에 대하여, 좌측의 화소를 A, 위의 화소를 C, 좌측 위의 화소를 B, 계수 m과 n이 모두 0을 취하지 않는 어떤 값으로 하고, 상기 예측값은, 3개의 예측값 후보 "A", "(m*A+n*C)/(m+n)", "A+(m*A+n*C)/(m+n)-(m*A+n*B)/(m+n)"의 중간값으로 하는 것을 특징으로 하는 화상 데이터 압축 장치.
  6. 제5항에 있어서, 상기 화상 데이터가 프로그레시브 화상일 때에는 m을 0, n을 1로 하고, 상기 화상 데이터가 인터레이스 화상일 때에는 m을 1, n을 1 또는 3으로 하는 것을 특징으로 하는 화상 데이터 압축 장치.
  7. 제2항에 있어서, 상기 압축 대상 화소에 대하여, 좌측의 화소를 A, 위의 화소를 C, 좌측 위의 화소를 B, 계수 m과 n이 모두 0을 취하지 않는 어떤 값으로 하고, 상기 압축 대상 화소의 주변의 화소 A, B 및 C의 중간값을 구하며, 상기 중간값이 A일 때에는 예측값을 "A"로 하고, 상기 중간값이 C일 때에는 예측값을 "(m*A+n*C)/(m+n)"으로 하며, 상기 중간값이 B일 때에는 예측값을 "A+(m*A+n*C)/(m+n)-(m*A+n*B)/(m+n)"으로 하는 것을 특징으로 하는 화상 데이터 압축 장치.
  8. 제5항에 있어서, 상기 계수 m과 n은 상기 샘플링 포맷에 따라서 규정되는 것을 특징으로 하는 화상 데이터 압축 장치.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 예측기는, 상기 압축 대상 화소의 주변의 화소에 대하여, 좌측의 화소를 A, 위의 화소를 C, 좌측 위의 화소를 B로 하고, 상기 화소 A, C 및 B의 화소값을 기초로 복수의 예측값 후보를 산출하는 예측값 후보 산출 모듈과, 중간값 대응표 및 중간값·화상 포맷 대응표를 기초로 상기 복수의 예측값 후보 중 어느 것을 예측값으로 할지를 결정하여, 제어 신호로서 멀티플렉서에 송신하는 예측값 결정 모듈과, 상기 제어 신호에 기초하여 복수의 예측값 후보 중 어느 하나를 예측값으로서 출력하는 멀티플렉서와, 상기 주변의 화소 A, B 및 C의 화소값을 유지하는 복수의 레지스터와, 1라인분의 화소값을 유지하는 라인 버퍼로 이루어지는 것을 특징으로 하는 화상 데이터 압축 장치.
  10. 압축 대상 화소의 화소 레벨값을 예측하는 예측기를 구비한 화상 데이터 압축 장치에 있어서,
    부호화하기 전에 압축 대상 화소의 주변의 화소에 대하여, 좌측의 화소를 A, 위의 화소를 C, 좌측 위의 화소를 B로 하고, 상기 화소 A, C 및 B의 화소값 및 바로 근방 1라인분의 화소값을 유지하는 과정과,
    유지된 상기 주변의 화소 A, C 및 B의 화소값을 기초로 복수의 예측값 후보를 산출하는 과정과,
    중간값 대응표 및 중간값·화상 포맷 대응표를 기초로 상기 복수의 예측값 후보 중 어느 것을 예측값으로 할지를 결정하여, 제어 신호를 송신하는 과정과,
    상기 제어 신호를 수신하여 복수의 예측값 후보 중 어느 하나를 예측값으로서 출력하는 과정과,
    출력된 예측값과 압축 대상 화소로부터 예측 오차를 산출하고, 산출한 예측 오차를 양자화기에 입력하여 양자화 번호를 취득하며, 상기 양자화 번호를 부호기에 입력하여 압축 부호를 얻는 과정
    을 포함하는 것을 특징으로 하는 화상 데이터 압축 방법.
  11. 압축 대상 화소의 화소 레벨값을 예측하면서 화상 데이터의 압축을 행하기 위한 프로그램으로서, 컴퓨터에,
    부호화하기 전에 압축 대상 화소의 주변의 화소에 대하여, 좌측의 화소를 A, 위의 화소를 C, 좌측 위의 화소를 B로 하고, 상기 화소 A, C 및 B의 화소값 및 바로 근방 1라인분의 화소값을 유지하는 단계,
    유지된 상기 주변의 화소 A, C 및 B의 화소값을 기초로 복수의 예측값 후보를 산출하는 단계,
    중간값 대응표 및 중간값·화상 포맷 대응표를 기초로 상기 복수의 예측값 후보를 압축해서 하나의 예측값을 결정하여 출력하는 단계,
    출력된 예측값과 압축 대상 화소로부터 예측 오차를 산출하고, 상기 예측 오차를 양자화 테이블에 입력하여 양자화 번호를 취득하며, 상기 양자화 번호를 부호화 테이블에 입력하여 압축 부호를 얻는 단계
    를 실행시키기 위한 프로그램.
  12. 압축 대상 화소 주변의 화소 레벨값 및 화상 포맷에 기초하여 예측값을 결정하는 예측기를 구비한 화상 데이터 압축 장치로 압축된 화상 데이터를 복원하는 화상 데이터 복원 장치로서, 압축 대상 화소 주변의 화소 레벨값 및 화상 포맷에 기초하여 예측값을 결정하는 예측기를 가지며, 상기 예측기로 결정된 예측값과 상기 압축된 화상 데이터를 역부호화기 및 역양자화기를 통해 얻은 예측 오차 양자화값을 가산하여 복원 화소 데이터를 얻으며 다음 주변 화소값을 얻는 것을 특징으로 하는 화상 데이터 복원 장치.
  13. 압축 대상 화소 주변의 화소 레벨값 및 화상 포맷에 기초하여 예측값을 결정하는 예측기를 구비한 화상 데이터 압축 장치로 압축된 화상 데이터를 복원하는 화상 데이터 복원 장치로서,
    압축된 부호를 복원하기 전에 복원 대상 화소의 주변의 화소에 대하여, 좌측의 화소를 A, 위의 화소를 C, 좌측 위의 화소를 B로 하고, 상기 화소 A, C 및 B의 화소값 및 바로 근방 1라인분의 화소값을 유지하는 과정과,
    유지된 상기 주변의 화소 A, C 및 B의 화소값을 기초로 복수의 예측값 후보를 산출하는 과정과,
    중간값 대응표 및 중간값·화상 포맷 대응표를 기초로 상기 복수의 예측값 후보 중 어느 것을 예측값으로 할지를 결정하여, 제어 신호를 송신하는 과정과,
    상기 제어 신호를 수신하여 복수의 예측값 후보 중 어느 하나를 예측값으로 서 출력하는 과정과,
    압축된 부호 데이터를 역부호화기에 입력하여 양자화 번호를 취득하고, 양자화 번호를 역양자화기에 입력하여 예측 오차 양자화값을 취득하며, 취득한 예측 오차 양자화값과 상기 예측값으로부터 화소값을 복원하는 과정
    을 포함하는 것을 특징으로 하는 화상 데이터 복원 방법.
  14. 압축 대상 화소 주변의 화소 레벨값 및 화상 포맷에 기초하여 예측값을 결정하는 예측기를 구비한 화상 데이터 압축 장치로 압축된 화상 데이터를 복원하기 위한 프로그램으로서, 컴퓨터에,
    압축된 부호를 복원하기 전에 복원 대상 화소의 주변의 화소에 대하여, 좌측의 화소를 A, 위의 화소를 C, 좌측 위의 화소를 B로 하고, 상기 화소 A, C 및 B의 화소값 및 바로 근방 1라인분의 화소값을 유지하는 단계,
    유지된 상기 주변의 화소 A, C 및 B의 화소값을 기초로 복수의 예측값 후보를 산출하는 단계,
    중간값 대응표 및 중간값·화상 포맷 대응표를 기초로 상기 복수의 예측값 후보를 압축해서 하나의 예측값을 결정하여 출력하는 단계,
    압축된 부호 데이터를 역부호화기에 입력하여 양자화 번호를 취득하고, 양자화 번호를 역양자화기에 입력하여 예측 오차 양자화값을 취득하며, 취득한 예측 오차 양자화값과 상기 예측값으로부터 화소값을 복원하는 단계
    를 실행시키기 위한 프로그램.
KR20087029607A 2006-05-17 2006-08-16 화상 데이터 압축 장치, 압축 방법 및 프로그램을 기록한 기록 매체 및 화상 데이터 복원 장치, 복원 방법 및 프로그램을 기록한 기록 매체 KR101037421B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006138070 2006-05-17
JPJP-P-2006-138070 2006-05-17

Publications (2)

Publication Number Publication Date
KR20090018090A true KR20090018090A (ko) 2009-02-19
KR101037421B1 KR101037421B1 (ko) 2011-05-30

Family

ID=38693641

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20087029607A KR101037421B1 (ko) 2006-05-17 2006-08-16 화상 데이터 압축 장치, 압축 방법 및 프로그램을 기록한 기록 매체 및 화상 데이터 복원 장치, 복원 방법 및 프로그램을 기록한 기록 매체

Country Status (6)

Country Link
US (1) US8311107B2 (ko)
EP (1) EP2034740B1 (ko)
JP (1) JP4985645B2 (ko)
KR (1) KR101037421B1 (ko)
CN (1) CN101438597B (ko)
WO (1) WO2007132538A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101491864B1 (ko) * 2009-11-30 2015-02-11 한국전자통신연구원 엔트로피 부호화를 위한 하이브리드 예측 장치 및 그 방법

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5529685B2 (ja) * 2010-09-03 2014-06-25 パナソニック株式会社 画像符号化方法、画像復号化方法、画像符号化装置及び画像復号化装置
CN102055974B (zh) * 2010-10-14 2013-04-17 华为技术有限公司 数据压缩、解压缩方法、装置及系统
GB2486726B (en) * 2010-12-23 2017-11-29 British Broadcasting Corp Compression of pictures
CN110198448B (zh) * 2011-11-08 2021-12-31 韩国电子通信研究院 用于共享候选者列表的方法和装置
CN103577338B (zh) * 2013-11-14 2016-06-29 华为技术有限公司 一种回收垃圾数据的方法及存储设备
JP6221820B2 (ja) * 2014-02-25 2017-11-01 株式会社Jvcケンウッド 符号化装置、符号化方法および符号化プログラム
CN109936740B (zh) * 2017-12-15 2023-04-18 中国科学院深圳先进技术研究院 一种用于图像无损压缩的像素值预测方法
US11044466B2 (en) 2018-01-26 2021-06-22 Samsung Electronics Co., Ltd. Image processing device
JP2020042726A (ja) * 2018-09-13 2020-03-19 株式会社東芝 Ogm圧縮回路、ogm圧縮伸長システム、および移動体システム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5836090A (ja) 1981-08-27 1983-03-02 Kokusai Denshin Denwa Co Ltd <Kdd> テレビジョン信号の中央値予測符号化方式
US4633325A (en) * 1983-09-01 1986-12-30 Nec Corporation Adaptive predictive encoding and/or decoding apparatus
JPH088642B2 (ja) * 1989-07-27 1996-01-29 富士通株式会社 網点画像データ圧縮装置
JPH11234683A (ja) * 1998-02-12 1999-08-27 Fuji Xerox Co Ltd 画像符号化方法および装置
JP2000069479A (ja) 1998-08-24 2000-03-03 Sony Corp 画像符号化装置および画像符号化方法
JP3804745B2 (ja) 1999-08-20 2006-08-02 Kddi株式会社 フレーム構造/フィールド構造切替式画像符号化装置
US6785422B2 (en) * 2000-10-20 2004-08-31 Sony Corporation Image processing apparatus utilizing pixel values of peripheral pixels adjacent the subject pixel
CN1190755C (zh) * 2002-11-08 2005-02-23 北京工业大学 基于感知器的彩色图像无损压缩方法
CN1241149C (zh) * 2003-04-07 2006-02-08 西安交通大学 一种jpeg2000多图像片压缩率预分配方法
KR100994771B1 (ko) * 2003-12-29 2010-11-16 삼성전자주식회사 블록정합에 의한 움직임 벡터 탐색방법 및 탐색장치
US7650039B2 (en) * 2005-03-03 2010-01-19 Canon Kabushiki Kaisha Image encoding apparatus, image decoding apparatus, control method therefor, computer program, and computer-readable storage medium
JP4587175B2 (ja) * 2005-05-19 2010-11-24 キヤノン株式会社 画像符号化装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101491864B1 (ko) * 2009-11-30 2015-02-11 한국전자통신연구원 엔트로피 부호화를 위한 하이브리드 예측 장치 및 그 방법

Also Published As

Publication number Publication date
US20090052530A1 (en) 2009-02-26
KR101037421B1 (ko) 2011-05-30
CN101438597B (zh) 2011-05-11
US8311107B2 (en) 2012-11-13
JP4985645B2 (ja) 2012-07-25
EP2034740A1 (en) 2009-03-11
WO2007132538A1 (ja) 2007-11-22
CN101438597A (zh) 2009-05-20
EP2034740B1 (en) 2013-07-17
EP2034740A4 (en) 2011-03-02
JPWO2007132538A1 (ja) 2009-09-17

Similar Documents

Publication Publication Date Title
KR101037421B1 (ko) 화상 데이터 압축 장치, 압축 방법 및 프로그램을 기록한 기록 매체 및 화상 데이터 복원 장치, 복원 방법 및 프로그램을 기록한 기록 매체
KR100980354B1 (ko) 화상 압축 장치, 압축 방법 및 프로그램을 기록한 기록매체 및 화상 복원 장치, 복원 방법 및 프로그램을 기록한 기록 매체
RU2720975C2 (ru) Способ кодирования и декодирования изображений, устройство кодирования и декодирования и соответствующие компьютерные программы
KR101138392B1 (ko) 색차 성분의 상관관계를 이용한 컬러 영상의 부호화,복호화 방법 및 그 장치
KR100913088B1 (ko) 베이스 레이어의 내부모드 블록의 예측정보를 이용하여영상신호를 엔코딩/디코딩하는 방법 및 장치
KR20060088461A (ko) 영상신호의 엔코딩/디코딩시에 영상블록을 위한 모션벡터를베이스 레이어 픽처의 모션벡터로부터 유도하는 방법 및장치
KR20060109249A (ko) 영상신호의 엔코딩/디코딩시에 베이스 레이어 픽처의모션벡터를 사용하여 영상블록을 위한 모션벡터를 예측하는방법 및 장치
JP4592562B2 (ja) 画像復号装置
KR20060059774A (ko) 시간적 분해레벨이 다른 픽처의 모션벡터를 이용하는영상신호의 엔코딩/디코딩 방법 및 장치
KR20060069227A (ko) 영상신호의 엔코딩/디코딩시에 영상블록을 위한 모션벡터를베이스 레이어 픽처의 모션벡터로부터 유도하는 방법 및장치
KR20060085150A (ko) 베이스 레이어의 내부모드 블록의 예측정보를 이용하여영상신호를 엔코딩/디코딩하는 방법 및 장치
CN115643406A (zh) 视频解码方法、视频编码方法、装置、存储介质及设备
KR100906473B1 (ko) 개선된 움직임 벡터 부호화 및 복호화 방법과 그 장치
KR20060043050A (ko) 영상 신호의 인코딩 및 디코딩 방법
CN116982262A (zh) 视频编码中依赖性量化的状态转换
KR102020953B1 (ko) 카메라 영상의 복호화 정보 기반 영상 재 부호화 방법 및 이를 이용한 영상 재부호화 시스템
KR100832872B1 (ko) 기하학적 변환을 이용한 영상 부호화 효율 향상 방법 및장치
US20060120457A1 (en) Method and apparatus for encoding and decoding video signal for preventing decoding error propagation
RU2808075C1 (ru) Способ кодирования и декодирования изображений, устройство кодирования и декодирования и соответствующие компьютерные программы
US20060133488A1 (en) Method for encoding and decoding video signal
JP2010288070A (ja) 画像符号化装置
KR20060059764A (ko) 앞서 변환된 에이취-픽처를 기준픽처로 이용하는 영상신호의 엔코딩 방법 및 장치와 그 영상신호를 디코딩하는 방법및 장치
WO2005062623A1 (ja) 動画像再生方法及び装置並びにプログラム
KR100627493B1 (ko) 동영상 부호화기 및 이를 이용한 부호화 방법
CN114900693A (zh) 一种基于方块截短编码的图像压缩方法、解压缩方法及装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140502

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee