KR940001839B1 - 영상 인코딩방법 및 그 정보 기억장치 - Google Patents

영상 인코딩방법 및 그 정보 기억장치 Download PDF

Info

Publication number
KR940001839B1
KR940001839B1 KR1019900006231A KR900006231A KR940001839B1 KR 940001839 B1 KR940001839 B1 KR 940001839B1 KR 1019900006231 A KR1019900006231 A KR 1019900006231A KR 900006231 A KR900006231 A KR 900006231A KR 940001839 B1 KR940001839 B1 KR 940001839B1
Authority
KR
South Korea
Prior art keywords
image
group
storage device
current
output
Prior art date
Application number
KR1019900006231A
Other languages
English (en)
Other versions
KR900019397A (ko
Inventor
디. 죤스턴 제임스
제이. 사프라넥 로버트
Original Assignee
아메리칸 텔리폰 앤드 텔레그라프 캄파니
더블유. 라이언
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아메리칸 텔리폰 앤드 텔레그라프 캄파니, 더블유. 라이언 filed Critical 아메리칸 텔리폰 앤드 텔레그라프 캄파니
Publication of KR900019397A publication Critical patent/KR900019397A/ko
Application granted granted Critical
Publication of KR940001839B1 publication Critical patent/KR940001839B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/4105Bandwidth or redundancy reduction for halftone screened pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N5/926Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation
    • H04N5/9261Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Color Television Systems (AREA)

Abstract

내용 없음.

Description

영상 인코딩방법 및 그 정보 기억장치
제1도는 본 발명이 동작되는 형태의 영상 코딩 기술의 일반적 구성의 블록 다이어그램.
제2도는 본 발명에 따라 구성된, 제1도의 인코더(12)의 블록 다이어그램.
제3도는 제2도의 분석 필터 뱅크 내에서 각각의 단 필터링용으로 사용된 필터 특성 곡선.
제4도는 제2도의 분석 필터 뱅크 구성을 설명하는 블록 다이어그램.
제5도는 본 발명에 따른 지각 모델 신호를 설명하는 도면.
제6도는 제2도의 인코더(25) 블록 다이어그램.
제7도는 제1도의 디코더(14)의 하나의 구성을 도시하는 블록 다이어그램.
제8도는 본 발명을 설명하는데 사용한 테이블 도시도.
제9도는 본 발명을 설명하는데 사용한 곡선.
제10도는 제7도의 재구성 필터 뱅크의 블록 다이어그램.
* 도면의 주요부분에 대한 부호의 설명
12 : 인코더 21 : 처리기
22 : 필터 뱅크 30 : 멀티 플랙서
본 발명은 영상 처리 특히, 높은 질의 영상 정보의 기억 및/또는 효과적 전송을 위한 영상 인코딩에 관한 것이다.
화도 영상 또는 다른 2차원 데이터에 대한 전자 서비스 요구가 영상에서 유도된 전자 데이터가 2차원 데이터 또는 재구성된 영상의 인식에 해가 되지 않는 방법으로 압축되지 않은 경우에, 전자 전송 및 기억 기술의 빠른 개발이 보조를 줄 수 없도록 빠르게 증가되어 왔다.
다른 압축 방법에 관한 기술은 화도 데이터의 이해가 증가되고 이론적 개발이 이루어지는 것처럼 개발되어 왔다. 차동 펄스 코드 변조(DPCM) 및 비트-플레인 코딩은 초기에 사용된 방법에 따르며, 가장 하부 비트비에 대해 영상 질을 트래딩(trading)하므로서 4-6까지의 압축 계수를 이룬다. 픽셀당 오직 하나의 비트로 코드된 DPCM에서 얻을 수 있는 것보다 더 높은 질을 가진 화상은, W.H. 찬과 C.H 스미쓰에 의해 1987년 11월 IEEE Trams, Comm. Vol. COM-25, 페이지 1285-1292에 상술된 "모노크롬 및 칼라 영상의 적응 코딩"의 적응 불연속 코싸인 변형(ADCT)과 같은 여러 다양한 방법으로 얻을 수 있다. ADCT 코딩 시스템에서, 상기 영상은 일반적으로 8×8의 블록으로 분해시키며 블록 각각에 대해 DCT(불연속 코싸인 변형)가 수행된다. 상기 압축은 가변의 임계값을 가진 DCT 계수의 양자화에 의해 얻어지며, 부분적으로, 가변의 워드 길이 인코딩에 따라, 인간 시각의 관찰력을 최대로 활용한다.
영상의 보조 대역 코딩은 화상 코딩에 안내된다. 하나의 장치가 1986년 10월, IEEE ASSP 5호, 34권, 페이지 1278-1288의 영상의 "보조 대역 코딩"에서 J.W. 우드 및 S.D. 오네일에 의해 제안되었다. 우드 등에 의해 제안된 장치는 영상신호를 차 주파수 성분의 대역으로 나누는 필터 뱅크를 포함하며, 각각의 필터 출력 신호는 DPCM을 통해 압축된다. 따라서 상기 압축 신호는 수신기에 전송되며 여기서 상기 처리가 반전된다. 특히, 각각의 신호는 DPCM 디코드되며 상기 원래 영상을 회복하기 위해 다른 필터된 신호와 함께, 업 샘플되어 필터되고, 조합된다.
1986년 9월 H. 지하라비 및 A. 다바타바이에 의한 Proc. SPIE, 707권 51페이지에서 61페이지의 "2차원 직각 미러 필터를 사용하는 영상의 보조 대역 코딩"에서 다수의 주파수 대역 신호를 얻기 위해 길고 복잡한 직각 미러 필터를 사용한다. 상기 "로우-로우" 대역은 2차원 DPCM 코드를 사용하는 DPCM 코드이다. 데드존 양자화기(dead-zone quantizer)는 PCM 코딩에 따라, 다른 대역에 대해 사용된다.
다른 보조 대역 코딩은 1986년 제7회 베네룩수 정보이론 심포지엄의 Proc.에서 P.H.Westerink, J.W.Wood 및 D.E.BoeKee에 의해 제안된 것과 같이 계획되며 상기 필터 뱅크 출력을 부호화하기 위해 벡터-양자화 기술을 제공한다.
H. 비헤다 및 A. 리지텐버그에 계류중인 1988년 7월 22일 출원된 특허 출원 제222,987호는 양수인에게 양도되어 있으며, 상기 다른 보조 대역 신호내에서 여분의 데이터는 첨가적으로 데이터 압축을 이루기 위해 제공된다. 사실, 상기 기술은 보조 대역 분석 기술에 기초한 영상 처리용으로 훌륭한 "전치(front end)"를 제공한다.
상기는 재구성된 영상의 질을 감지하고 매픽셀당 비트에 의하여 더욱 효과적으로 분석 정보를 양자화하는 문제가 남아 있다. 불연속 코사인 변형의 표시 변형은 인간시각 관찰력의 알려진 성질의 잠정적 사실을 수행할 수 없게 한다.
최근의 어떤 동작은 이러한 문제를 제기한다. 이러한 문제는 킴엔, 네칸등에 의한 논문 SPIE, 707권 시각 통신 및 영상 처리(1986)의 "인간 시각 시스템 모델과 상호 협조하는 코싸인 변형 코딩" 페이지 165 내지 171에서 보여지며, 특히, 대비 감도를 어드레싱한다. 상기 대비 감도는 매우 한정된 구성으로 양자화 처리에 제공되며, 다른 관련 파라미터는 제공되지 않는다. 실로, 일종의 프리엠파시스(pre-emphasis)는 양자화 전에 공급되며 양자화 처리에 의해 제어의 정확도를 더욱 양호하게 하여 표시된다.
본 발명에 따라, 전자 영상 처리용 보조 대역 분석 방법은 하나 이상의 주파수 파파미터, 대비 및 텍스처에 따라 정확히 감지할 수 없는 양자화 노이즈 양을 결정하는 것과, 양자화 노이즈 양이 상당히 가깝게, 그러나 이하에서, 감지가능한 제한으로 구성되도록 하나 이상의 파라미터와 같은 각각의 화소 양자화에 응답하여 적용하는 것을 포함한다. 그것을 감지할 수 없을 때 양자화 노이즈양 증가를 허용하므로서, 그로부터 재구성으로 감지할 수 있는 감소 없는 기억 영상 또는 전송된 새로운 데이터 압축을 가능하게 한다.
제1도는 본 발명을 실행하기 위한 기본 통신 시스템을 도시한다. 그것은 디코더(14)를 포함하는 수신기(13)에 대해, 전송 채널(15)을 통해 접속된 인코더(12)를 포함하는 송신기(11)를 구비한다. 전송 채널(15)은 컴팩트 디스크 판독 전용 메모리(CDROM) 또는 디지털 테이프 매체와 같은 기억 매체를 포함하기 위해 상당히 넓은 센스로 고려된다. 즉, "실제 시간"으로 수신기에 대해 인코드 신호를 보내기 보다는 "채널"과 같은 신호를 기억하며 요청시 후자 시간에서 그들을 재생한다.
상기 개념은 물론, 통상의 통신으로서 생각되지 않는 상태를 초래하며, 상기 채널 또는 "매체"는 획득된 기록이 되고 상기 송신기 및 수신기는 집에서 사용한 때라도, 고객에게 유용한 기록 및 재생 기능을 제공한다. 또 다른 주된 응용은 지질학 측량과 같은, 포토그라픽의 주요 수집물 기록을 포함한다. 그때는 상기 "채널"(15)이 기록국이 된다.
제2도는 인코더(12)의 블록 다이어그램을 도시한다. 상기 인코더는 영상 신호가 공급되는 분석 필터 뱅크(22)를 구비한다. 상기 영상 신호는 다수의 포맷을 가지며, 2차원 영상에 대한 표준 레스터 포맷중 하나를 수용하게 된다. 디지털 필터링에 대해, 상기 신호는 이전에 미리 샘플된다(도시하지 않음), 덧붙이면, 상기 신호 평균값은 처리기(21)에 의해 제거되며, 이는 8비트로 양자화되고 지각 모델(perceptual model)(28) 및 멀티 플랙서(30)에 존재한다. 제2도에서, 필터 벵크(22)는 (0, 0)에서 (3, 3)까지 16개의 출력을 가지며, 상기는 1보다 큰 번호가 된다. 이들은 저 및 고 대역과 수평 및 수직의 2개의 차원에서 2개의 중간 대역 필터된 영상의 16개의 가능한 신호에 대응한다. 예로 수평 차원에서 발생된 영상 데이터의 각각의 4개의 대역은 대응 "수직 필터"를 통해 통과된다. 여기에 함축된 데이터의 재구성은 상기 데이터가 샘플된 데이터 포맷일 때 간단하게 수행된다. 대부분의 장면 영상에 대해, 단순히 라인을 포함하는 영상과 대비하여 상기 최하부 대역 영상(수평 및 수직 2개로 저역 필터된)은 관련 시각 정보의 벌크를 포함하며, 반면, 다른 대역은 세부 정보를 포함한다.
이를 이용하여, 제2도는 2개의 방향에 대한 최하부 대역(0, 0) 영상에 응답한 코더(24)를 포함하고 있다. 코더(24)내의 양자화기-인코더 장치(25)는 지각 모델(28)에서 발생하는 지각 분석에 응답하여 양자화 및 인코더 처리를 하기 위해 리드(26)상에서 인간 시각 시스템 채택 신호에 응답한다. 코더(24)에서, 상기 양자화기 인코더(25)는 허프만 인코더(27)에 따라 멀티 플랙서(30)에 대해 신호를 보낸다. 모델(28)에 대해 입력중 하나는 대비 및 휘도에 관계한 각각의 픽셀에 대해 하나의 데이터를 제공하기 위해 처리기(21)로부터 유도된다.
상기 지각 모델(perceptual model)(28)에 대한 다른 입력은 코더(24)와 다른 15개의 유사한 코더에 대한 정확한 입력이 된다.
상기 다른 코더는 다른 주파수 대역에 응답하며, 즉, 코더(29) 및 코더(31)은 코더(24)의 구성과 비슷하게 구성된다.
본 시스템에서, 비헤드 등에 의해 계류중인 특허출원에 인용된 출원과 비교하여, 예를들면, 코더(24)에서 이루어진 데이터 압축은 본 발명 원리의 직접적 결과이며, 후에 상술되어 진다.
상기 필터 뱅크(22)의 하나의 가능한 수행은 1986년 10월 IEEE Trans. ASSP, ASSP-34권, 5호 "균일 및 비균일 공간 모조 미러 필터설계" 페이지 1090-1096에서 R.V.Cox에 의해 상술된 바와같이 일반적인 직각 미러 필터(GQMF)를 분리 가능하게 사용하는 필터 뱅크로 동일한 대역폭을 활용한다. 분리 가능한 2차원 필터는 직교 방향으로 제공된 2개의 1차원 필터로 구성된다. 상기 경우에서, GQMF 필터는 영상의 로우(row)에 가장 먼저 공급되며, 제4도의 필터(40-43)에 의해 상술된 바와같이 수평 필터링을 제공하며, 그때 상기와 같은 필터는 수직 필터링을 제공하기 위해 수평 필터된 영상의 컬럼에 공급된다. 통상의 필터 특성을 제3도의 곡선(36) 내지 (38)에 도시되어 있다.
제4도를 참고로, 필터(40-43)의 출력은 다운-샘플되며(때때로 서브샘플로 불린다); 결국, 다운 샘플링 스위치(45-48)는 필터(40-43)에 각각 응답한다. 다운-샘플링은, 예를들어 매 4개의 샘플중 3개의 출력(반면에, 예를들어, 업-샘플링은 주어진 샘플을 반복하므로서 이루어진다)에 관계없이 이루어진다. 상기 다운 샘플링 스위치(45-48)의 출력은 전치 매트릭스 수단으로 2차원 영상의 화소 신호를 전달하는 각각의 전치 메모리(50-53)에 공급된다. 전치 메모리(50-53)는 하나의 방법(로우에 따라)으로 신호가 기억되고 종래의 메모리는 다른 방법으로 억세스(컬럼에 따라)된다. 그러한 메모리 장치는 기술로 공지되어 있다. 그러므로, 완전하게 하기 위해, 아래에 따르는 간단한 실행이 제안된다. 전치를 얻기 위하여, 그들 사이에서 삽입된 논리 회로에 응답하는 메모리 및 어드레스 카운터를 사용한다. 상기 논리 회로는 카운터중 가장 높은 중요 비트와 카운터중 다수의 가장 적은 중요 비트를 상호 교환할 수 있게 한다. 정상적인 순서는 비트의 상호 교환없이 얻어지며, 전치 순서는 비트를 상호 교환하므로서 얻어진다.
상기 전치 메모리(50)의 출력은 필터(55) 내지 (58)에 공급되며, 비슷하게 전치 메모리(51) 내지 (53)의 출력은 필터(60-63), (65-68)의 셋, (도시되지 않음) 및 (70-73)에 각각 공급된다. 예를들어 (55-58)과 같은 이들 필터 셋은 같은 순서로 필터(40-43)와 완전히 같으며, 사실, 디지털 필터의 같은 셋에 의해 시간 공유 바이어스로 실행할 수 있다. 상기 필터(55-73)의 출력은 각각의 하부-샘플링 스위치(75-93)에 공급되며(각각 대응 필터보다 20 디지트 높게), 분석 필터 뱅크(22)의 출력을 발생한다, 상기 GQMF 필터는 4개의 동일한 대역폭으로 수평 및 수직 차원 둘다를 분리하여 사용된다. 상기 대역 번호는 약간의 대역이 주파수 분석을 상당히 조잡하게 제공하는 것처럼, 공간 및 주파수 국부화 사이에서 유리한 균형(trade off)를 제공하며, 대역은 공간 국부화를 더 희미하게 한다.
2개의 차원에서 가장 하부 주파수는 보조 대역(0, 0)에 있으며 2개 차원에서 가장 높은 주파수는 대역(3, 3)에 있다. 본 시스템에 사용된 GQMF 필터는 48 dB보다 큰 제1의 보조대역 억제부(fist subband suppression)가 되며, 8비트/화소 영상의 완전하게 재구성할 수 있다.
제2도를 다시 참고하면, 상기 지각 마스킹 모델(perceptual masking model)(28)은 원래의 영상과 코드 변형간의 차를 식별할 수 없도록 각각의 보조 대역 신호로 각각의 화소에 첨가된 코딩 일그러짐 결과를 평가한다. 상기 모델은 양호한 방법으로 인간 시각 시스템(HVS)의 여러 공지된 성질을 활용한다. 본 발명에서, 상기 성질은 주파수 응답; 대비감지(contrast sensitivity); 및 텍스처 마스킹(texture masking)를 사용한다. 상기 모델은 HVS의 설명을 완전히 의미하는 것은 아니고, 특별한 분석/합성 절차로 주어진 영상 인식으로 효과적인 주요 HVS 성질에 접근한다.
제5도로 돌아가, 지각 모델(28)내의 상기 주파수 응답 성분(102)은 입력으로서 미드글레이(mid-grey) 플랫 필드 영상을 주는 보조 대역 신호 각각에 첨가된 최대량의 일그러짐을 제공한다. 상기 HVS는 노이즈에 대해 더 민감하며 자극의 형태가 된다. 상기 모델의 다른 성분은 미드-글레이(블럭 103) 영상 휘도의 이탈과 플랫-필드(블럭 101) 이탈에 대해 이러한 일그러짐 평가를 조절한다. 이들 평가는 그때 결합(블럭 104)되며, 보조 대역 인코더(24) 각각에 대해 입력으로서 존재한다.
상기 베이스 감지 평가는 일종의 정신 물리학 실험에서 유도된다. 상기 균일한 미드-글레이 영상은 분석 필터 뱅크(22)에 존재한다. 상기 발생하는 보조 대역 신호중 하나의 신호에 대해서, (0, 0)이 되며 즉, 백색은, 균일한 랜덤 노이즈가 첨가된다. 상기 일그러진 신호는, 다른 15개의 일그러지지 않은 신호에 따라 상기 재구성 필터 뱅크(150)에 존재한다. 상기 변형된 영상과 원래의 영상은 6배의 영상 높이의 관측 거리로 어두운 방에서 차례차례 관측된다. 상기 첨가된 백색 노이즈 변형은 원래 영상 및 일그러진 영상간의 차를 인간이 감지하지 못하는 최대값을 알 수 있게 하기 위해 조절된다. 따라서 상기 처리는 교대로 각각의 보조 대역 신호에 대해 반복된다. 이러한 실험에 대해 형태적 RMS 노이즈 감지 값은 제8도에 표시된다. 이들 값은 실험적으로 유도되며 분석 필터 뱅크, 및 관측 거리에 사용된 특정 필터에 의존하며, 따라서 이들 값의 어떤 변화가 예측된다.
이들 값은 하나의 특별한 자극 즉, 미들-글레이 플랫 필드에 대해 허용가능한 코딩 일그러짐을 제공한다. 상기 휘도 조절 터엄은 다양한 휘도로 플랫 필드 자극에 대해 이 모델을 종합하기 위해 사용된다. 상기 앞의 실험은 보조 대역(0, 0)에 대해 반복되며, 상기 플랫 필드 입력의 글레이 레벨은 검은색에서 순백까지 변한다. 다시, 상기 자극에 첨가된 백색 노이즈의 최대량이 결정된다. 미드-글레이 프랫 필드에 대해 감지값으로부터의 발생되는 이탈값이 제9도에 도시되어 있다. 상기 보정 계수는 국부 영상 수단을 계산하고 제9도에서 보정 계수 값을 조사하여, 상기 값에 의한 보조 대역에 대해 베이스 감지를 멀티플라임 하므로서 공급된다. 상기 베이스 감지 실험(127 그레이레벨)이 상태에 대하여는, 조절없이 제공되며, 상당히 높고 낮은 레벨에 대해서는, 실제로 더욱 더 일그러진 코딩을 허용한다. 상기 보정 터엄의 완전한 실행은 각각의 보조 대역에 대해 상기 일련의 실험을 반복하며, 16개의 보정 곡선을 발생한다. 따라서, 상기 곡선의 형태가 모든 보조 대역에 대해 하나의 곡선을 사용하여 효과적으로 수행되도록, 관련 보조 대역 양단의 중요한 상수를 결정한다.
상기 지각 거리(perceptual metric)의 마지막 성분은 텍스처와 같은 비-플랫 필드 입력을 볼 수 있는 감소된 노이즈에 대해 조절된다. 플랫 필드 자극은 단지 DC 주파수 성분만을 가지며 텍스처 입력은 DC 및 AC 성분 둘다를 가진다. 상기 DC 성분에 대해 볼 수 있는 노이즈는 베이스 감지 및 휘도 조절 터엄에 의해 설명되며, 상기 텍스처 마스킹 터엄(101)은 AC 터엄을 조작한다. 상기 텍스처 마스킹 터엄은 각각의 보조 대역에서 AC 에너지 부분의 웨이트합으로 구성된다. 따라서 HVS는 일정치 않은 전달 함수를 가지며, 각각의 보조 대역에서 에너지는 각각의 보조 대역에 포함된 시각 관련 주파수에 의해 웨이트된다.
실제로, 지각 미터(perceptual metric)에 대한 값은 모든 보조 대역내의 모든 점에서 결정된다. 하나의 가능한 실행이 베이스 감지를 결정하기 위한 보조 대역 번호에 의해 인덱스된 조사 테이블 및 오버를 영상수단의 합에 의해 인덱스된 조사 테이블 및 휘도 조절을 결정하기 위해 보조 대역(0, 0)내의 각각의 점으로부터 국부(local)값을 사용하여 수행된다. 상기 텍스처 마스킹 터엄은 대역(0, 0)에서 평균 HVS 응답에 의해 웨이트된 보조 대역(0, 0)(상기는 가장 하부 주파수 보조 대역에서 AC 에너지를 계산한다)내에서 2×2화소 블록 이상의 변이를 수행하므로서 계산된다. 이는 다른 보조 대역 각각에 대해서는, 상기 터엄에 첨가되어 상기 보조 대역에 대해 평균 HVS 응답에 의해 웨이트된 2×2 픽셀 블록을 지난 평균 에너지가 된다. 따라서, 상기 혼합 터엄은 0.065승이 된다. 상기 값은 높게 텍스처된 영상이 투과성 코드로 되는 것을 보증하게 셋 된다. 이들 터엄 각각은 결합 블록(104)에 대한 입력이 되며 여기서 그들은 지각 미터(metric)에 대한 마지막 값을 발생하기 위해 함께 멀티플된다. 이 과정은 가시적인 투과성 코딩을 발생하는 미터를 제공한다. 어떤 지각 변형을 허용하면 이러한 미터는 상수>1.0에 의해 멀티플링 하여 완화된다.
따라서, 상기 지각 미터는 각각의 보조 대역에 대해 DPCM 인코더(25)(제2도)를 제어하기 위해 사용된다. DPCM 코딩은 종래의 기술로 잘 공지되어 있다. 상기 예측기 블록(108)은 이전점, 이전 로우를 활용하는 3개의 점 예측기로 사용되며, 백 대각(back diagonal)이 사용된다. 상기 최적 예측기 계수는 각각의 보조 대역에 대해 계산되며 정확히 5비트에 대해 양자화된다. 상기 보조 대역의 부분이 코드되는 경우, 이들 계수는 측 정보로서 상기 디코더에 보내진다.
또한 균일한 양자화기가 사용된다(106), 스텝 사이즈가 지각 미터 기능(제2도내의 28)에 의해 결정된다. 상기 원래의 신호 및 코드된 신호간의 차의 절대값이 미터값보다 작은 경우에, 상기 코드 영상은 시각적으로 원래 신호와 구별할 수 없게 된다. 상기 상태를 만족하는 하나의 수단은 양자화 스텝 사이즈 계산기(107)내에서 보조 대역을 지난 지각 미터의 최소값의 2배로 양자화 스텝 사이즈로 셋하기 위함이다. 상기 스텝 사이즈(step size)는 정확히 16비트로 양자화되며 측정보로서 상기 디코더에 보내진다. 상기 합산 기능화(105)은 보조 대역 영상 신호와 예측기(108) 출력으로 동작하여 균일한 양자화기(107)에 압력을 제공한다. 상기 양자화기의 출력은, 후에 코드 워드로 불리며, c(x, y, i, j)로 표시되고 여기서, x 및 y는 보조 대역 내의 특별한 위치이며, i 및 j는 보조 대역 번호이고 허프만 인코더(27)에 통과한다.
[무 노이즈 압축]
첫 번째로, 각각 보조 대역의 내측에, 상기 코드 워드 c(x, y, i, j)는 4×4구획으로 구획된다. 무노이즈 압축 논의 목적에 대해, 원래의 영상은 512×512 픽셀을 취한다. 그러므로, 각각의 보조 대역은 128×128이다. 32×32 구획이 존재하며, 각각은 128×128 보조 대역 영상에서 4×4 코드워드를 포함한다. 번호 512×512는 설명을 목적으로 선택되며, 원래 및/또는 보조 대역 영상의 다른 사이즈는 이러한 압축 알고리즘을 통해 압축된다. 따라서 무노이즈 압축은 각각의 보조 대역에서 동일하게 동작하며, 상기 표시법은 보조 대역을 표시하며, 즉 일반적으로는 i, j가 생략되었다. 상기 부분에 사용된 변수는 상기 구획에 대해 인덱스된 K, L, 0≤K, L<32이다. 첫째로, 각각의 구획에 대해, 가장 큰 절대값, LAV는 각각의 구획에서 포함되어 계산된다. 즉 LAV(k, L)=max(abs(c(x, y, i, j))), 4k≤×<4(k+L), 4L≤y<4(L+1)k, 여기서 C(*)는 위의 처리로부터 적당한 보조 대역에 대한 DPCM 코드 워드이다.
상기 LAV(*)가 계산된 후, 제로가 아닌 번호 LAV(K, L)이 계수된다. 제로가 아닌 LAV가 아닌 경우에, 상기 보조 대역은 코드 데이터를 보내지 않으며, 제로 비트를 보내고, 이 대역은 코드되지 않은 것을 표시한다. 제로가 아닌 LAV인 경우에, "1"비트가 보내진다. 제로가 아닌 LAV인 경우에, 150보다 다소 적게 되며, k, L, 즉, 각각의 어드레스가 보내지며, k 또는 L당 5비트 가격으로, 9비트 계산에 따라 어떻게 많은 코드된 구획이 존재하는가를 표시한다. 이들 k, L쌍은 블록이 그들의 C(*)인 코드를 표시하기 위해 사용된다. 상당히 다수의 제로가 아닌 구획이 있는 경우에, "차원수 맵"이 계수되어 전체 보조 대역에 대해 보내진다.
[차원수 코드 계산]
다수의 제로가 아닌 구획에 관계없이, 짧은 허프만 코드는 많은 제로가 아닌 구획의 경우에서 LAV의 4-웨이 구획 또는 소수의 제로가 아닌 구획의 경우에서 3-웨이 구획을 근거로 하여 LAV 분포로부터 계산된다. 상기 코드는 송신기에서 사용되는 "차원수 맵" 발생을 위해 사용되어 효과적으로 수신기에 전송된다. 4-웨이 경우에 대해서는, N2의 번호=제로 LAV 번호, N4d=0<LAV≤3의 번호, N2d=3<LAV≤25의 번호, 및 N1d=25<LAV의 번호가 계산되며 3-웨이 경우에 대해서는 Nz는 생략된다. 상기 2 내지 4 소자 코드는 데이터에 의한 수신기에 8-30 비트 비용으로 전송된다. 수신기에 대해서는 데이터 상에서 의존한다. 제로 발생의 심벌은 코드북 내에서 포함되지 않는다.
[차원수 맵 계산]
차원수 맵은 따라서, 위에서 계산된 코드를 사용하여, 수신기에 전송되며, 여기서 4개의 심벌 Z, 4d, 2d 또는 1d중 하나가 많은 제로가 아닌 구획의 경우에 각각의 구획에 보내지거나, 4d, 2d 또는 1d, 3개중 하나는 소수의 제로가 아닌 구획의 경우에 보내진다. "다수" 대 "소수"를 결정하기 위해 사용되는 번호 150은 K, L 어드레싱 비용과 전체 맵의 전송사이의 평균 고차점에 있기 때문에 선택된다.
상기 "차원수 맵"은 송신기 및 수신기 둘다에서, 상기 (*)가 인코드되는 방법을 결정하기 위해 사용된다. 소수의 제로가 아닌 구획의 경우에서, 상기 "차원수 맵"은 차원수 맵 위치로부터 함축적으로 결정되기 보다는 확실하게 전송되며 제로가 아닌 구획의 위치로서 "감소된 차원수 맵"으로 불린다.
[코드 워드 전송]
상기 코드워드, C(*)는 무노이즈 압축 순서로 마지막에 전송된다. 3개의 인코딩 방법중 하나는 상기 구획에 대해 차원수 맵에서 엔트리에 의존하여 상기 LAV가 제로가 아닌 각각의 구획에 대해 사용된다. 상기 경우는 상기 구획에 대한 LAV가 제로로 알려져 있는 경우나, 차원수 맵내에서 명백하게 또는 감소된 차원수 맵 내에서의 생략 중 하나로, C(*)가 전송되지 않는다.
[1d 코딩]
상기 제1d코딩은 상기 구획에서 16 C(*)의 일차원 허프만 코딩이며, 1d 심벌이 차원수 맵에 나타날 때 사용된다. 각각의 C(*)는 선택되어 미리 발생된 허프만 코드 북을 사용하여 분리하여 인코드된다. 제1코딩 용으로 각각의 전체 보조 대역에 대한 코드북선택(6개중 하나)은 가장 양호한 압축을 제공하는 6개의 1d 코드북에 기초하여 구성된다. 1d, 2d 및 4d에 대한 코드북 선택 정보는 상기 차원수 맵 후이지만 어떤 C(*) 데이터가 전송되기 전에 모두 전송된다.
[2d 코딩]
상기 2d 코딩은 차원수 맵 내에 2d 심벌을 가지는 구획 상에서 실행된다. 이들 구획이 8쌍의 2(*)로서 인코드되는데 대해, 6개의 2-차원 허프만 코드북 중 하나에서 엔트리를 발견하기 위해 인접 수평쌍을 사용한다. 다시 상기 가장 양호한 2d 코드 북은 차례로 보조 대역 상에서 선택되며, 코드북 선택은 상기와 같이 수신기를 지나간다.
[4d 코딩]
제4d코딩은 차원수 맵 내에서 4d 심벌을 가진 구획상에서 수행된다. 이들 구획에 대해, 상기 C(*)는 각각 4 소자의 4개의 그룹으로서 인코드된다. 상기 구획 각각의 2×2 서브-스퀘어는 4차원 허프만 코드북에서 하나의 코드 워드로서 인코드된다. 상기 코드북 선택은 위에서 설명한 바와 같이 수행된다.
[압축 결과]
상기 위에서 설명한 방법으로부터의 압축 결과는 다음과 같은 성질에 따른다. 전체적으로 빈(지각 센스) 보조 대역은 1 비트, 또는
Figure kpo00001
비트/픽셀(16384=1282)비를 사용하여 인코드된다. 단지 소수의 지각적으로 충분한 구획이 존재하는 보조 대역에서, 각각은 위치용으로 10 비트, 차원수에 대해서는 대략 2 비트, C(*)에 대해서는 작은 비트 번호로 인코드된다. 이는 어떤 주어진 보조 대역의 작은 부분이 충분히 인코딩할 수 있게 하며 여기서 어떤 부분은 지각적으로 중요하게 된다. 상기 대역의 대략
Figure kpo00002
이상이 인코드되는 대역에서, 모든 구획이 인코드되며, 모든 제로 구획은 모든 제로 구획이 공통인 경우,
Figure kpo00003
비트/픽셀 비로 인코드된다.
소수의 제로가 아닌값을 가지는 보조 대역 부분, 또는 모든 작은 값은 모든 제로 보조 구획에 대해 비트/픽셀의 최소값을 제공하는 4차원 코드북으로 인코드된다. 덧붙이면 2×2 스퀘어 이상으로 퍼진 어떤 나머지 상관은 효율적으로 인코드된다. 보통의 동작의 보조 대역의 부분은 비트/픽셀의 최소비에서 인코드되며, 나머지 보정 또는 코드북에 도움을 주게 된다. 매우 고 활성의 보조 대역 부분은 1비트/픽셀 최소비를 가진 코딩 방법으로 인코드되며, 각각의 소자에 대해 10g2(abs(2cmax)*2+1)의 사용을 요구하지 않고 지각 처리에 의해 요구되는 것처럼 최대값을 고려한다. 각각의 차원수에 대한 6 코드북의 사용은 다양한 확률/상관 조합으로부터 코더를 선택하게 한다. 반면에 상기 결과는 평균, 압축비를 상당히 증가시키지 않으며, 대부분 어려운 아이템으로 압축 알고리즘의 압축 효과를 상당히 증가시킨다. 상기 차원수 맵에 대해 내부적으로 짧게 발생된 허프만 코드 쇼트(4 소자) 사용은 차원수 맵의 효과적이고 충분한 차원수 전송을 허용한다. 예와 같이, 상당히 높은 보조 대역에서, 필요한 심벌은 단지 Z 및 4d이다. 국부적으로 계산되고 쉽게 전송된 코드북을 주어, 상기 경우에서 1비트/맵 소자가 오직
Figure kpo00004
비트/화소 "측정보" 비용으로 만들어 사용된다.
[코드북 발생]
상기 단락은 상기 C(*)의 허프만 압축에 대해 코드북 셋 발생을 위해 사용된 방법을 기술한다. 여기에는 미리 결정된 6개의 코드북의 3개 셋(4d, 2d 및 1d)이 존재한다.
상기 허프만 코드북은 허프만 코드가 효과적이 되도록 테스크가 그들의 통계치에 기초한 6셋 내에서 데이터 구획되는 것처럼, 그들의 인코드된, 데이터의 확률 분포로부터 발생된다. 상기는 여러 단계를 수행한다. 첫 번째로, 영상 바이어스에 의한 영상 또는, 전체 주파수 내용 및 수정된 K-평균 알고리즘을 통해 6개의 셋으로 적당한 데이터(4d, 2d 또는 1d)를 구획한다. 각각의 셋에 대해 상기 분포 사용하여, 허프만 코드북을 발생한다. 코드북 셋 사용자에 의해, 선택된 코드북에 각각의 코드북 슬롯에서의 생성 번호를 저장하고, 각각의 차원수에 대해 양호한 6개의 코드북을 선택하는 각각의 보조 대역에서 전체 트레이닝 셋을 인코드한다. 새로운 셋 분포를 사용하며, 새로운 허프만 코드북 셋을 발생한다. 코드북 사이의 보조 대역의 변화가 빈번하지 않을 때까지 상기 마지막 2개의 센텍스 처리가 반복된다.
이들 단계는 아래에 따른다. 매번 다른 코드북 선택은 새롭게 이루어져 더 좋은 인코딩이 선택된다. 코드북 변화가 이루어지지 않은 경우에, 평균비는 같게 남아있고 매번 새로운 코드북이 계산되며, 더 좋게 제공된 데이터로 고정되며, 마지막 반복 데이터보다는 현재 상태를 고정하기 위해 계산되기 때문에 같거나 또는 더 양호한 압축을 제공한다.
상기 코드북 선택 절차는 107 영상의 트레이닝 셋으로 동작한다.
[코드북 효과]
상기 트레이닝 셋에서 트레인되고 선택된 코드북은 트레이닝 영상과는 다르게 테스트 영상의 36소자 셋에서 테스트되며, 상기 압축 알로리즘 수행은, 코드북을 포함하여, 테스트 영상 수행은 트레이닝 셋 수행과 동일하다.
이는 특성 오프셋(±5 또는 ±10dB에 의해)의 변화와 같은, 여러 부당한 검토를 부과하며, 반면 제로 오픈셋용으로 코드북을 사용한다. 상기 압축 결과는, 적당히 생성된 코드북에 대해 가능한 양호하지 않게, +10 내지 -5범위내에서 지각 오프셋에 대해 적당히 생성된 코드북에 계속 근접하게 된다.
34626 엔트리의 전체 코드북 사이즈에 대해, 1d 셋에서 6*769 소자 및 2d 셋에서, 6*512, 4d 코드북 셋에서 6*74소자가 존재한다. 상기 작은 코드북 셋은 복잡한 텍스트 또는 텍스처 영상에 모든 방법의 하부 대비로 단순한 장면으로부터 영상 범위에 대해 만족한다.
본 발명의 예비 테스트는 코드될 필요성이 있는 정보량을 감소하기 위해 함께 동작하는 지각미터 및 영상의 저역 스펙트럼이 상호 작용을 설명하며, 보조 대역중 적어도 하나의 4×4 블록이 코드되어야만 하는 시간의 평균 퍼센트의 충분한 감소를 포함하며, 코드된 각각의 보조 대역의 퍼센트는 적어도 하나의 4×4 블록이 코드된다. 이들은 미세하게 증가하는 레벨로 "세부"영상으로서 보조 대역의 나머지 및 영상의 감소된 해상도 변형으로서 보조 대역(0, 0)을 검토하므로서 설명된다. 그러므로, 대역(0, 0)은 영상에 대해 감지 가능한 큰 정보량을 가지며, 반면에 고주파수 대역은 어떤 세부 형태일때만 감지 가능한 정보를 포함한다. 부드러운 하부 세부 영역은 오로지 하나의 보조 대역(감지 미터의 값이 상기 점에서 아주 작게 되는 경우)을 요구하는 반면에, 엣지와 같은, 상부 영역은 여러 보조 대역으로부터 정보를 요구한다.
제7도에서는, 본 발명에 따른, 제1도의 수신기(13) 및 디코더(14)의 상세한 수행을 도시한다.
제7도의 장치는 단순히 인코딩 처리로 반전된다. 상기 제7도의 수신기-디코더는 디멀티플렉서(110), 각각의 개별 16개의 보조 대역에 대한 허프만 디코더(111-126), 상기 반전 미분 PCM 처리기(디코더)(131-146), 재구성 필터 뱅크(150), 컴바이너 회로(151)를 구비하며, 이는 재구성 필터 뱅크(150)의 일부로서 도시되어 있다.
재구성 필터 뱅크(150)은 제11도에 상세히 설명되어 있으며 ; 상기 도면은 같은 형태의 장치를 제공하는 것을 보여주며 보조 대역은 제4도의 장치로서 다운-샘플링 대체 업-샘플링으로 합병하기 위해 동작한다.
물론, 제2도의 장치(21)에서 제거된 평균 값은 전송되거나 또는 기록되며 제6도 및 제7도의 컴바이너(151)에 재삽입되어야만 한다.
특히, 각각의 보조 대역은 각각의 업 샘플링 스위치(161-176)을 통해 통과되며, 상기 값은 컴바이너(151)에 대한 필터(211-214) 및, 업-샘플링 스위치(205-208), 변형 메모리(201-204), 컴바이너(197-200), 각각의 필터(181-196)을 통해, (4)배로 반복된다.
마지막으로, 상기 테스트로 매우 파워풀한 비트비 감소 계획을 제공하는 지각 미터에 부합하는 코딩 블록의 생략 및 다중 차원수 무노이즈 압축의 결합을 설명하기로 한다. 상기 선형 코드북은 저주파수 보조 대역부분에 대해서만 사용되는 반면에, 낮은 비트비를 가진 2D 및 4D 코드북은 어디에서나 사용된다. 상기 계획은 필요한 곳에서 가장 양호한 양자화 데이터를 허용하며 필요치 않는 곳에서는 큰 비트비 페널티(penalty)없이 허용된다. 2차원 정보의 재생은 상당히 양호한 질로 만들어지며 알고리즘은 감소를 감지 불가능하게 한다.
본 발명의 여러 수정은 위에서 상술된 동작 원리 범위내에서 가능해진다. 예를 들어, 주파수 조절 및 대비 감지는 제5도의 휘도 조절 처리 및 베이스 감지시 보다 더 안전하게 분리된다.

Claims (14)

  1. 영상 인코딩 방법에 있어서, a) 다수의 보조 대역을 포함하여 영상을 표시하는 주파수 도메인에서 발생하는 영상을 필터링하는 단계와, b) 상기 다수의 보조 대역 내의 각 보조 대역은, ⅰ) 현행 보조 대역에 대해 적어도 하나의 허용가능한 노이즈 레벨 그룹을 포함한 현행 보조 대역을 표시하는 지각 모델을 사용하는 출력을 발생하는 단계와, ⅱ) 상기 적어도 하나의 허용가능한 노이즈 레벨 그룹을 근거로 현행 보조 대역을 양자화 하는 단계를 포함하는 영상 인코딩 방법.
  2. 제1항에 있어서, 상기 출력 발생 단계는 a) 일련의 성질을 근거로, 일련의 성질에 관계한 일련의 값을 평가하는 단계와 b) 상기 지각 출력에서 발생하는 일련의 값을 조합하는 단계를 더 포함하는 영상 인코딩 방법.
  3. 제2항에 있어서, 상기 조합 단계는 일련의 값으로 각 값을 함께 멀티플라잉 하는 단계를 포함하는 영상 인코딩 방법.
  4. 제2항에 있어서, 상기 일련의 성질은, 주파수 응답, 대비감지(contrast sensitvity), 텍스처(texture masking) 마스킹인 영상 인코딩 방법.
  5. 제4항에 있어서, 다수의 보조 대역내의 각 보조 대역은 한 그룹의 픽셀과 출력을 발생하는 단계로 이루어지며, 다수의 보조 대역내의 각 보조 대역과 픽셀 그룹내의 각 픽셀은, a) 현행 픽셀에 대해 적어도 하나의 허용가능한 노이즈 레벨의 그룹을 포함한 현행 픽셀을 포함하는 현행 보근 대역을 표시하는 지각 모델을 사용하여 출력을 발생하는 단계와, b) 적어도 하나의 허용가능한 노이즈 레벨 그룹을 근거로 하여 출력을 발생하는 단계를 구비하는 영상 인코딩 방법.
  6. 제4항에 있어서, 적어도 하나의 허용가능한 노이즈 레벨 그룹을 근거로 하여 출력을 발생하는 단계는 출력이 적어도 하나의 허용가능한 노이즈 레벨 그룹에서 가장 작은 허용가능 노이즈 레벨과 관계하는 단계를 구비하는 영상 인코딩 방법.
  7. 제1항에 있어서, 상기 필터링 단계는 a) 수평적으로 필터된 영상을 발생하는 영상을 수평적으로 필터링하는 단계와, b) 상기 영상을 표시하는 주파수 도메인에서 수평적으로 필터된 영상을 수직적으로 필터링하는 단계를 포함하는 영상 인코딩 방법.
  8. 제1항에 있어서, 상기 인코딩용 영상은 다수의 영상 중 하나이며, 다수의 영상중 각 영상은 단계 (a) 및 단계 (b)에 따라 인코드되는 영상 인코딩 방법.
  9. 디지털 정보를 기억하기 위한 디지털 기억 장치에 있어서, 상기 디지털 정보는 다수의 영상을 표시하며, a) 다수의 보조 대역을 포함하여 영상을 표시한 주파수 도메인 표에서 영상을 필터링하는 단계와, b) 상기 다수의 보조 대역내의 각 대역은, ⅰ) 현행 보조 대역에 대해, 적어도 하나의 허용가능한 노이즈 레벨 그룹을 포함한 현행 보조 대역을 표시하는 지각 모델을 사용하는 출력을 발생하는 단계와, ⅱ) 적어도 하나의 허용가능 노이즈 레벨의 그룹을 근거로 현행 보조 대역을 양자화하는 단계를 포함하는 디지털 기억장치.
  10. 제9항에 있어서, 상기 디지털 기억장치는 컴팩트 디스크인 디지털 기억장치.
  11. 제9항에 있어서, 상기 디지털 기억장치는 가지 테이프인 디지털 기억장치.
  12. 제9항에 있어서, 상기 디지털 기억장치는 집적 회로인 디지털 기억장치.
  13. 제9항에 있어서, 상기 디지털 기억장치는 자기 자극에 응답하는 제1수단과 광학자극에 응답하는 제2수단으로 이루어진 디지털 기억장치.
  14. 영상의 일부를 인코딩 하는 방법에 있어서, a) 다수의 보조 대역을 포함하는 영상의 주파수 도메인 표시를 발생하는 영상을 필터링하는 단계와, b) 다수의 보조 대역내에서 적어도 하나의 보조 대역은, ⅰ) 현행 보조 대역에 대해, 적어도 하나의 허용가능 노이즈 레벨 그룹을 포함한 현행 보조 대역을 표시한 지각 모델을 사용하는 출력을 발생하는 단계와, ⅱ) 적어도 하나의 허용가능한 노이즈 레벨의 그룹을 기초로 현행 보조 대역을 양자화 하는 단계를 구비하는 영상의 일부를 인코딩 하는 방법.
KR1019900006231A 1989-05-04 1990-05-03 영상 인코딩방법 및 그 정보 기억장치 KR940001839B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US35043589A 1989-05-04 1989-05-04
US350,435 1989-05-04

Publications (2)

Publication Number Publication Date
KR900019397A KR900019397A (ko) 1990-12-24
KR940001839B1 true KR940001839B1 (ko) 1994-03-09

Family

ID=23376710

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019900006231A KR940001839B1 (ko) 1989-05-04 1990-05-03 영상 인코딩방법 및 그 정보 기억장치

Country Status (7)

Country Link
US (1) US5517581A (ko)
EP (1) EP0396368B1 (ko)
JP (1) JP2669707B2 (ko)
KR (1) KR940001839B1 (ko)
CA (1) CA2014935C (ko)
DE (1) DE69022623T2 (ko)
HK (1) HK33796A (ko)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5309526A (en) * 1989-05-04 1994-05-03 At&T Bell Laboratories Image processing system
US5542008A (en) * 1990-02-28 1996-07-30 Victor Company Of Japan, Ltd. Method of and apparatus for compressing image representing signals
GB2251756B (en) * 1991-01-11 1995-01-04 Sony Broadcast & Communication Compression of video signals
GB2252001B (en) * 1991-01-11 1995-01-04 Sony Broadcast & Communication Storage of video signals
GB2252002B (en) * 1991-01-11 1995-01-04 Sony Broadcast & Communication Compression of video signals
WO1993002526A1 (fr) * 1991-07-19 1993-02-04 Laboratoire De Traitement Des Signaux Procede de compression de sequences d'images numeriques
US5214507A (en) * 1991-11-08 1993-05-25 At&T Bell Laboratories Video signal quantization for an mpeg like coding environment
CA2088082C (en) * 1992-02-07 1999-01-19 John Hartung Dynamic bit allocation for three-dimensional subband video coding
GB2268666B (en) * 1992-06-24 1996-03-20 Sony Broadcast & Communication Serial data decoding
EP0576763A1 (en) * 1992-06-30 1994-01-05 International Business Machines Corporation Improved method for sub-band coding video signals and device for implementing said method
US5361098A (en) * 1992-11-30 1994-11-01 Scientific Atlanta, Inc. Methods and apparatus for generating a picture-in-picture digital television frame by inserting a mean-only frame into a full-size frame
JPH06284392A (ja) * 1993-03-30 1994-10-07 Toshiba Corp 映像信号送受信装置
US6301390B1 (en) 1993-03-31 2001-10-09 Canon Kabushiki Kaisha Encoding image data in blocks read out in a predetermined order
JP3360695B2 (ja) * 1993-06-17 2002-12-24 ソニー株式会社 画像データの量子化回路
BE1007490A3 (nl) * 1993-09-10 1995-07-11 Philips Electronics Nv Inrichting voor het overdragen van een pluraliteit van televisie signalen over een transmissie kanaal.
JP3332580B2 (ja) * 1994-06-14 2002-10-07 キヤノン株式会社 画像再生装置及び画像再生方式
KR0159434B1 (ko) * 1995-04-19 1999-01-15 김광호 휴먼 비쥬얼 시스템 모델링을 이용한 웨이블렛 영상 압축/복원장치 및 방법
US5694484A (en) * 1995-05-15 1997-12-02 Polaroid Corporation System and method for automatically processing image data to provide images of optimal perceptual quality
JPH08317219A (ja) * 1995-05-18 1996-11-29 Mitsubishi Electric Corp 画像圧縮伸長装置
JPH0970044A (ja) * 1995-08-31 1997-03-11 Sony Corp 画像信号処理装置および方法
KR100355375B1 (ko) * 1995-11-01 2002-12-26 삼성전자 주식회사 영상부호화장치에있어서양자화간격결정방법및회로
US5848195A (en) * 1995-12-06 1998-12-08 Intel Corporation Selection of huffman tables for signal encoding
US5682152A (en) * 1996-03-19 1997-10-28 Johnson-Grace Company Data compression using adaptive bit allocation and hybrid lossless entropy encoding
US5974159A (en) * 1996-03-29 1999-10-26 Sarnoff Corporation Method and apparatus for assessing the visibility of differences between two image sequences
US6075884A (en) * 1996-03-29 2000-06-13 Sarnoff Corporation Method and apparatus for training a neural network to learn and use fidelity metric as a control mechanism
US5694491A (en) * 1996-03-29 1997-12-02 David Sarnoff Research Center, Inc. Methods and apparatus for assessing the visibility of differences between two image sequences
US5990959A (en) * 1996-12-20 1999-11-23 U S West, Inc. Method, system and product for direct rendering of video images to a video data stream
US6360022B1 (en) 1997-04-04 2002-03-19 Sarnoff Corporation Method and apparatus for assessing the visibility of differences between two signal sequences
AU725719B2 (en) * 1997-09-29 2000-10-19 Canon Kabushiki Kaisha A method of digital image compression
US6937659B1 (en) * 1997-11-14 2005-08-30 Ac Capital Management, Inc. Apparatus and method for compressing video information
US6252994B1 (en) 1998-01-26 2001-06-26 Xerox Corporation Adaptive quantization compatible with the JPEG baseline sequential mode
US6175650B1 (en) 1998-01-26 2001-01-16 Xerox Corporation Adaptive quantization compatible with the JPEG baseline sequential mode
GB9819648D0 (en) * 1998-09-10 1998-11-04 Nds Ltd Determining visually noticeable differences between two images
WO2000051068A1 (en) * 1999-02-25 2000-08-31 Sarnoff Corporation Method and apparatus for assessing the visibility of differences between two signal sequences
JP2002314999A (ja) * 2001-04-12 2002-10-25 Nikon Corp 画像圧縮装置、画像圧縮プログラムおよび電子カメラ
US7035459B2 (en) * 2001-05-14 2006-04-25 Nikon Corporation Image compression apparatus and image compression program
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
JP3870193B2 (ja) 2001-11-29 2007-01-17 コーディング テクノロジーズ アクチボラゲット 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7426462B2 (en) * 2003-09-29 2008-09-16 Sony Corporation Fast codebook selection method in audio encoding
WO2006065078A1 (en) * 2004-12-14 2006-06-22 Samsung Electronics Co., Ltd. Apparatus for encoding and decoding image and method thereof
CN102567961B (zh) * 2010-12-30 2016-05-18 意法半导体研发(深圳)有限公司 感知块屏蔽估算系统
JP2013038768A (ja) * 2011-07-13 2013-02-21 Canon Inc 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
US20180336469A1 (en) * 2017-05-18 2018-11-22 Qualcomm Incorporated Sigma-delta position derivative networks

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4048443A (en) * 1975-12-12 1977-09-13 Bell Telephone Laboratories, Incorporated Digital speech communication system for minimizing quantizing noise
CA1158355A (en) * 1980-02-07 1983-12-06 Rca Corporation Adaptive amplitude averaging for weighting quantizing noise
US4405920A (en) * 1980-12-31 1983-09-20 Naomi Weisstein Enhancing the perceptibility of barely perceptible images
US4500911A (en) * 1981-05-25 1985-02-19 Nippon Hoso Kyokai Noise reduction apparatus
JPS5954376A (ja) * 1982-09-21 1984-03-29 Konishiroku Photo Ind Co Ltd 画像処理方法
JPS5992688A (ja) * 1982-11-19 1984-05-28 Fuji Photo Film Co Ltd 適応形画像圧縮方式
JPS63156475A (ja) * 1986-12-19 1988-06-29 Dainippon Screen Mfg Co Ltd 多階調画像読取装置
EP0339589A3 (en) * 1988-04-28 1992-01-02 Sharp Kabushiki Kaisha Orthogonal transform coding system for image data
US5309526A (en) * 1989-05-04 1994-05-03 At&T Bell Laboratories Image processing system
US4987480A (en) * 1989-07-11 1991-01-22 Massachusetts Institute Of Technology Multiscale coding of images
US4969040A (en) * 1989-10-26 1990-11-06 Bell Communications Research, Inc. Apparatus and method for differential sub-band coding of video signals

Also Published As

Publication number Publication date
DE69022623T2 (de) 1996-03-21
CA2014935C (en) 1996-02-06
DE69022623D1 (de) 1995-11-02
EP0396368A3 (en) 1991-05-15
HK33796A (en) 1996-03-08
US5517581A (en) 1996-05-14
CA2014935A1 (en) 1990-11-04
EP0396368B1 (en) 1995-09-27
JP2669707B2 (ja) 1997-10-29
KR900019397A (ko) 1990-12-24
EP0396368A2 (en) 1990-11-07
JPH02305191A (ja) 1990-12-18

Similar Documents

Publication Publication Date Title
KR940001839B1 (ko) 영상 인코딩방법 및 그 정보 기억장치
US6501860B1 (en) Digital signal coding and decoding based on subbands
US5177796A (en) Image data processing of correlated images
JP3868014B2 (ja) ビデオ信号符号化方法及び装置
US5541594A (en) Fixed quality source coder with fixed threshold
JP2527874B2 (ja) 局所的デ―タ損失に対する頑強性を圧縮化画像デ―タに付与するための装置
JP4377088B2 (ja) 異なった見る条件及び解像度に関連する情報を有する階層へ編成される圧縮ディジタル画像を生成する方法
US5592227A (en) Method and apparatus for compressing a digital signal using vector quantization
US5754793A (en) Wavelet image compression/recovery apparatus and method using human visual system modeling
EP0575201A2 (en) Coding and decoding
JPH01165283A (ja) ディジタルビデオ信号符号化装置とそれに対応する復号装置
JPH05507601A (ja) ビデオ信号記憶装置
US6285714B1 (en) Image signal interpolating apparatus
Wei An introduction to image compression
Safranek et al. Perceptually tuned sub-band image coder
US6580757B1 (en) Digital signal coding and decoding
JPH05191653A (ja) カラー画像の符号化と復号化の方法およびそれを用いた符号器と復号器
Deshlahra Analysis of Image Compression Methods Based On Transform and Fractal Coding
KR100349518B1 (ko) 인간 시각 시스템의 특성을 반영한 퍼지 논리를 적용한이산 웨이브렛 변환을 이용한 영상 압축 방법 및 장치
Chen et al. A transform video coder source model and its application
JPS62150475A (ja) 画像処理装置
JP2506402B2 (ja) 映像信号の直交変換符号化装置および直交逆変換復号装置
Ghafourian et al. Comparison between several adaptive search vector quantization schemes and JPEG standard for image compression
GB2324220A (en) Video data compression system
KR0153997B1 (ko) 데이타 코드북을 이용한 비트플랜 압축전송장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20020307

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee