KR20040004178A - 데이터 압축을 위한 개선된 최적화 기술 - Google Patents

데이터 압축을 위한 개선된 최적화 기술 Download PDF

Info

Publication number
KR20040004178A
KR20040004178A KR1020030045330A KR20030045330A KR20040004178A KR 20040004178 A KR20040004178 A KR 20040004178A KR 1020030045330 A KR1020030045330 A KR 1020030045330A KR 20030045330 A KR20030045330 A KR 20030045330A KR 20040004178 A KR20040004178 A KR 20040004178A
Authority
KR
South Korea
Prior art keywords
data
image data
encoding
video
dead zone
Prior art date
Application number
KR1020030045330A
Other languages
English (en)
Other versions
KR100965703B1 (ko
Inventor
알렉산드로스 토우라피스
시펭 리
펭 후
가리 술리반
Original Assignee
마이크로소프트 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마이크로소프트 코포레이션 filed Critical 마이크로소프트 코포레이션
Publication of KR20040004178A publication Critical patent/KR20040004178A/ko
Application granted granted Critical
Publication of KR100965703B1 publication Critical patent/KR100965703B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

데이터, 예를 들어, 이미지, 비디오 등을 인코딩하는 것에 관한 방법 및 장치가 제공된다. 예를 들어, 어떤 방법은, 복수개의 서로 다른 양자화 함수를 사용하여 복수개의 대응하여 양자화된 데이터 부분을 생성하기 위해서 데이터의 적어도 일부분을 처리하는 단계, 및 적어도 하나의 임계치에 기초하여 상기 양자화된 데이터 부분들 중 하나를 선택적으로 출력하는 단계를 포함한다. 또한, 그 방법은 초기 데이터를 복수개의 부분으로 분할하는 단계 및 적어도 하나의 분류 특성에 기초하여 데이터 부분을 분류하는 단계를 포함한다. 여기서, 예를 들어, 분류 특성에 관련된 임계치가 있을 수 있다. 추가적인 구문이, 여러 다른 모션 예측 케이스(motion prediction case)를 허용함으로써 상당히 높은 압축 효율이 가능하록 채택될 수 있다. 정적 시간 예측기(stationary temporal predictor) 뿐만 아니라 공간 모션 벡터 예측(spatial motion vector prediction)도 고려하는 고효율의 타임 스탬프 독립 다이렉트 모드(time stamp independent Direct Mode)가 제공된다.

Description

데이터 압축을 위한 개선된 최적화 기술{IMPROVED OPTIMIZATION TECHNIQUES FOR DATA COMPRESSION}
본 발명은 컴퓨터 및 유사 장치에 관한 것으로, 특히, 데이터를 압축/인코딩하고 압축풀기/디코딩하기 위한 방법, 장치 및 시스템에 관한 것이다.
데이터, 특히, 이미지 데이터와 비디오 데이터, 압축/인코딩하고 압축풀기/디코딩하기 위한 개선된 방법 및 장치에 대한 지속적인 요구가 있어 왔다. 코딩 효율의 개선은 보다 많은 정보가 컴퓨터 및 다른 유사 장치에 의해 보다 용이하게 처리, 전송 및/또는 저장될 수 있게 한다. 인터넷과 다른 유사 컴퓨터 네트워크, 및 무선 통신 시스템의 수적 증가에 기인하여, 가용 자원을 충분히 활용할 고효율의 인코딩 기술을 제공하는 것이 요구된다.
레이트 디스토션 최적화 (Rate Distoriton Optimization;RDO) 기술은, 종래의 인코딩 방식에 비해 인코딩 효율을 상당히 개설할 수 있기 때문에, 비디오 및 이미지 인코딩/디코딩 시스템에 매우 광범위하게 사용된다.
추가적인 정보는, 예를 들어, Trac Duy Tran 이 1994년 5월에 Massachusetts Institutue of Techonology 에서 "A Locally Adaptive Perceptual Masking Threshold Model for Image Coding"이라는 제목의 컴퓨터 과학기술의 석사학위 논문에서 발견될 수 있다.
보다 높은 인코딩 효율을 제공하고자 하는 지속적인 욕구가 있기 때문에, 기존 시스템에 비해 개선된 코딩 효율을 달성하기 위해 ROD 또는 다른 유사 기술의 성능을 더욱 향상시키는 개선된 방법 및 장치가 요구된다.
본 발명은 이미지, 비디오 및/또는 오디오 데이터를 포함하고 이에 한정되지않는 다양한 형태의 데이터를 압축/인코딩, 압축풀기/디코딩, 및/또는 다른 처리에서 사용될 수 있는 개선된 방법 및 장치를 제공한다.
상술한 요구 및 다른 요구들은, 예를 들어, 복수개의 서로 다른 양자화 함수(quantization function)를 사용하여 적어도 데이터 부분을 처리하여 복수개의 대응 양자화 데이터 부분을 생성하는 단계와 적어도 하나의 임계치에 기초하여 양자화된 데이터 부분들 중의 하나를 선택적으로 출력하는 단계를 포함하는 방법에 의해 충족된다. 또한, 그 방법은 초기 데이터를 복수개의 부분으로 분할하는 단계와 적어도 하나의 분류 특성(classification charateristic)에 기초하여 그 데이터 부분을 분류하는 단계를 포함할 수 있다. 이 때, 예를 들어, 그 분류 특성에 관련되는 임계치가 있을 수 있다.
예를 들어, 초기 데이터는 이미지 데이터, 비디오 데이터, 오디오 데이터, 스피치 데이터(speech data) 등을 포함할 수 있다. 선택되는 부분은 블록, 매크로블록(macroblock), 슬릿(slit), 슬라이스(slice), 섹션(section) 등의 형태를 취할 수 있다. 그 분류 특성(들)은 에지(edge) 특성, 텍스쳐(texture) 특성, 평활 (smoothness) 특성, 루미넌스(luminance) 특성, 크로미넌스(crominance) 특성, 컬러 특성, 노이즈 특성, 오브젝트 특성, 모션(motion) 특성, 사용자 선호도 특성, 사용자 인터페이스 초점(user interface focus) 특성, 레이어링(layering) 특성, 타이밍 특성, 볼륨(volume) 특성, 주파수 특성, 피치(pitch) 특성, 톤(tone) 특성, 품질 특성, 비트 레이트(bit rate) 특성, 데이터 유형 특성, 해상도(resolution) 특성, 암호화 특성등을 포함할 수 있다.
예시적인 일 구현예에서, 복수개의 서로 다른 함수는 2개 이상의 서로 달리 동작하는 데드존 양자화기(Deadzone Quantizer)를 포함할 수 있다. 이 때, 예를 들어, 데드존 양자화기는, 어댑티브 커버리지(adaptive coverage) 데드존 양자화기, 가변 커버리지 크기(variable coverage size) 데드존 양자화기 등일 수 있다. 또한, 그 방법은 양자화 부분을 인코딩하는 단계를 포함할 수 있다. 그 방법은 양자화된 데이터 부분을 선택하기 위해 레이트 디스토션 최적화(RDO;rate distortion optimization)를 이행하는 단계를 더 포함할 수 있다.
본 발명의 또다른 예시적인 구현예에서, 다른 방법은, 이미지 데이터의 적어도 일부분에 대하여 적어도 하나의 특성 분석(characteristic analysis)을 이행하는 단계와 그 특성 분석에 기초하여 인코더 내에 적어도 하나의 어댑티브 양자화 파라미터(adaptive quantization parameter)를 선택적으로 선택하는 단계, 및 그 인코더를 사용하여 이미지 데이터 부분을 인코딩하는 단계를 포함한다.
또다른 예시적인 구현예에서, 적어도 2개의 서로 다른 데드존 양자화기를 이용하여 이미지 데이터의 적어도 일부분이 인코딩되게 하는 단계, 및 적어도 하나의 판정 팩터(decision factor)에 관련되는 레이트 디스토션 최적화(RDO)에 기초하여 적어도 2개의 서로 다른 데드존 양자화기의 출력 내 바람직한 인코드 데이터를 식별하는 단계를 포함하는 방법이 제공된다.
또한, 상술한 요구 및 다른 요구들은, 제1 데드존 양자화기를 이용하여 이미지 데이터의 적어도 일부분을 인코딩하는 단계, 제1 데드존 양자화기가 적어도 하나의 판정 팩터를 충족하는 지를 판정하는 단계, 및 만약 그러하다면, 제1 데드존양자화기의 출력을 출력하는 단계를 포함하는 방법에 의해 충족된다. 만약 그렇지 않으면, 제1 데드존 양자화기와 다른 적어도 제2 데드존 양자화기를 이용하여 이미지 데이터의 부분을 인코딩되게 한다. 이 때, 예를 들어, 그 방법은 RDO 판정 또는 다른 판정에 기초하여 이미지 데이터 부분의 허용가능한 인코딩된 버젼을 식별하는 단계를 더 포함할 수 있다.
또다른 예시적인 구현예에서, 이미지 데이터의 적어도 일부분에 대하여 이미지 분석을 이행하는 단계, 분석된 이미지 데이터 부분에 대하여 차단 분류(block classification)를 이행하는 단계, 차단 분류된 이미지 데이터 부분의 데드존 양자화를 이행하는 단계, 및 데드존 양자화된 이미지 데이터 부분의 인코딩을 이행하는 단계를 포함하는 방법이 제공된다. 이 때, 예를 들어, 그 이미지 분석은 에지 검출 분석(edge detection analysis), 텍스쳐 분석(texture analysis) 등을 포함할 수 있다.
또다른 예시적인 구현예에 따라, 적어도 2개의 서로 다른 인코더를 이용하여 비디오 데이터의 적어도 일부분이 인코드되게 하는 단계 -상기 적어도 2개의 서로 다른 인코더는 비디오 이미지 데이터의 논 레지두얼 모드(Non Residual Mode)를 지원하도록 동작 구성된 데드존 양자화기를 포함함-, 및 적어도 하나의 판정 팩터에 관련되는 레이트 디스토션 최적화(RDO)에 기초하여 2개의 서로 다른 인코더들 중의 하나의 출력 내에 바람직한 인코드 프레임 데이터를 식별하는 단계를 포함한다.
또다른 예시적인 방법은, 이미지 데이터의 적어도 일부분의 적어도 하나의 특성에 기초하여 양자화 함수를 갖는 인코딩 로직을 동작 구성하는 적어도 하나의라그랑지 곱수(Lagrangian multiplier)를 선택적으로 변경하는 단계, 및 그 인코딩 로직을 이용하여 이미지 데이터 부분을 인코딩하는 단계를 포함한다.
또다른 예시적인 구현예서, 예시적인 방법은 인코더 로직을 이용하여 비디오 이미지 데이터의 적어도 일부분에서 인코딩하는 단계, 및 인코더 로직이 그 인코더 로직에 의해 채용되는 이동 벡터 예측 유형을 식별하는 구문 정보를 출력하게 하는 단계를 포함한다.
비디오 인코딩 관련 정보를 전달하는 데 이용되는 방법은, 비디오 데이터를 인코딩하는 단계, 및 인코드 비디오 데이터 구문 부분 내에 적어도 하나의 디스크립터-상기 디스크립터는 비디오 데이터로 인코딩된 적어도 하나의 B 프레임에 관련되는 어댑티브 공간/시공간 인코딩(adaptive spatial/spatio-temporal encoding)을 식별함-를 선택적을 설정하는 단계를 포함한다. 비디오 인코딩 관련 정보를 전달하는 데 이용되는 다른 방법은, 비디오 데이터를 인코딩하는 단계, 인코드된 비디오 데이터 구문 부분 내에 적어도 하나의 디스크립터(descriptor) -상기 디스크립터는 비디오 데이터로 인코드된 적어도 하나의 인터 프레임(Inter frame) 내에서 어댑티브 카피/모션 카피 스킵 모드(adpative copy/motion-copy skip mode)를 식별함-를 설정하는 단계를 포함한다.
비디오 프레임의 정적 시간/공간 부분을 고려하여 비디오의 타임 스탬프 독립 모드(time stamp independent mode) 인코딩에서 이용하기 위한 예시적인 방법이 제공된다. 이 때, 예를 들어, 그 방법은 비디오 시퀀스 내에 비디오 프레임의 적어도 일부분에 관련되는 모션의 공간적 예측을 선택적으로 적용하는 단계와, 만약다른 비디오 프레임의 참조 부분에 대한 시간적 모션 예측 정보가 0이면, 모션의 공간적 예측을 0으로 설정하는 단계를 포함한다.
도 1은 본 발명의 일 구현예에 따라 사용하기에 적합한 컴퓨터 형태의 예시적인 장치를 도시하는 블록도.
도 2a 내지 도 2d는 본 발명의 일 구현예에 따라 예시적인 선택가능 데드존 양자화기를 도시하는 그래프.
도 3은 본 발명의 일 구현예에 따라 서로 다른 양자화 프로세스를 데이터에 선택적으로 적용하기 위한 예시적인 방법을 도시하는 흐름도.
도 4는 본 발명의 일 구현예에 따라 서로 다른 양자화 프로세스를 데이터에 선택적으로 적용하기 위한 예시적인 로직을 도시하는 블록도.
도 5는 본 발명의 다른 구현예에 따라 서로 다른 양자화 프로세스를 데이터에 선택적으로 적용하기 위한 예시적인 로직을 도시하는 블록도.
도 6a 내지 도 6d는 본 발명의 또다른 구현예에 따라 서로 다른 양자화 프로세스를 데이터에 선택적으로 적용하기 위한 예시적인 로직을 도시하는 블록도.
도 7은 본 발명의 일 구현예에 따라 서로 다른 양자화 프로세스를 데이터에 선택적으로 적용하기 위한 예시적인 로직을 도시하는 블록도.
도 8은 본 발명의 일 구현예에 따라 이동 벡터에 대한 서로 다른 예측 방법을 선택적으로 적용하기 위한 로직에 사용되는 예시적인 구문 정보를 나열하는 차트.
도 9는 본 발명의 일 구현예에 따라 서로 다른 인코딩 방식을 비디오 데이터에 선택적으로 적용하기 위한 예시적인 로직을 도시하는 블록도.
도 10은 본 발명의 다른 구현예에 따라 서로 다른 인코딩 방식을 비디오 데이터에 선택적으로 적용하기 위한 예시적인 로직을 도시하는 블록도.
도 11은 본 발명의 일 구현예에 따라 선택적으로 적용된 인코딩 방식을 채용하여 비디오 시퀀스의 어떤 특징을 도시하는 도면.
도 12는 본 발명의 일 구현예에 따라 다이렉트 모드 비디오 시퀀스에 대한 시공간 예측을 위한 예시적인 방법을 도시하는 흐름도.
<도면의 주요 부분에 대한 부호의 설명>
120: 컴퓨팅 환경132: 처리부
134: 시스템 메모리136: 버스
148: 자기 디스크152: 광디스크
158: 운영 체제160: 애플리케이션 프로그램
166: 키보드172: 모니터
202, 204, 206, 208: 데드존 양자화기
도면을 참조하면, 유사 참조부호는 유사 구성요소를 나타내며, 본 발명은 적합한 컴퓨팅 환경에서 구현된 것으로서 기술된다. 비록 요구되는 것은 아니지만, 본 발명은, 개인용 컴퓨터의 형태를 취할 수 있는 서버 컴퓨터, 워크스테이션, 전용 서버, 복수개의 프로세서, 메인프레임 컴퓨터 등에 의해 실행되는 프로그램 모듈 등의 컴퓨터 실행가능 명령의 일반 구문에서 기재될 것이다. 일반적으로, 프로그램 모듈은, 특정 태스크를 이행하거나 특정 추상 데이터형(abstract data type)을 구현하는 루틴, 프로그램, 오브젝트, 콤포넌트, 데이터 구조 등을 포함한다. 본 발명은 통신 네트워크를 통하여 연결되는 원격 프로세싱 장치에 의해 태스크가 이행되는 분산 컴퓨팅 환경 내에서 실시될 수 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 로컬 및 원격 메모리 스토리지 장치에 배치될 수 있다.
예시적인 컴퓨팅 환경:
도 1은 적절한 컴퓨팅 환경(120)의 예를 도시하며, 그 컴퓨터 환경 상에서 이하 기술되는 방법 및 배치가 구현된다.
예시적인 컴퓨팅 환경(120)은 적합한 컴퓨팅 환경(120)의 일 실시예이며, 여기서 기재되는 개선된 방법 및 배치의 사용 또는 기능의 범주에 대한 어떠한 제한을 암시하려는 것은 아니다. 또한, 컴퓨팅 환경(120)도, 그 컴퓨팅 환경(120) 내에 도시되는 구성요소들 중의 임의의 단독 또는 조합에 관련하여 임의의 종속성 또는 요건을 갖는 것으로서 이해되어져서는 안된다.
여기서, 개선된 방법 및 배치는 수많은 다른 범용 또는 특정 목적 컴퓨팅 시스템 환경 또는 구성을 사용하여 동작한다.
도 1에 도시된 바와 같이, 컴퓨팅 환경(120)은 컴퓨터(130) 형태의 범용 컴퓨팅 장치를 포함한다. 컴퓨터의 구성요소(130)는 적어도 하나의 프로세서 또는 처리부(132), 시스템 메모리(134), 및 시스템 메모리(134)를 포함하는 다양한 시스템 구성요소를 프로세서(132)에 결합하는 버스(136)를 포함할 수 있다.
버스(136)는, 메모리 버스 또는 메모리 콘트롤러, 병렬 버스, 가속 그래픽 버스(accelerated graphics port), 임의의 다양한 버스 구조를 이용하는 프로세서 또는 로컬버스를 포함하는 임의의 여러 유형의 버스 구조들 중의 하나 이상의 버스 구조를 나타낸다. 예를 들어-한정이 아님- 이러한 구조는 산업 표준 구조 (ISA;Industry Standard Architecture) 버스, 마이크로 채널 구조 (MCA;Micro Channel Architecture) 버스, 향상된 ISA (EISA;Enhanced ISA) 버스, 비디오 전자표준협회(VESA;Video Electronics Standards Association) 로컬 버스, 및 메자닌 버스(Mezzanine bus)로 잘 알려진 주변 구성요소 접속(PCI;Peripheral Component Interconnect) 버스를 포함한다.
통상, 컴퓨터(130)는 다양한 컴퓨터 판독가능 매체를 포함한다. 이러한 매체는 컴퓨터(130)에 의해 액세스가능한 임의의 가용매체일 수 있으며, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 포함한다.
도 1에서, 시스템 메모리(134)는 랜덤 액세스 메모리(RAM;140)와 같은 휘발성 메모리 형태, 및/또는 판독전용 메모리(ROM;138)와 같은 비휘발성 메모리 매체의 형태의 컴퓨터 판독가능 매체를 포함한다. 기본 입출력 시스템(BIOS;142)은, 초기 시동(start-up) 동안과 같이, 컴퓨터(130) 내의 요소들 간의 정보를 전송할 수 있게 하는 기본 루틴을 포함하여, ROM(138)에 저장된다. 통상, RAM(140)은 프로세서(132)에 즉시 액세스 가능하고/가능하거나 프로세서(132)에 의해 현재 실행중인 데이터 및/또는 프로그램 모듈을 포함한다.
컴퓨터(130)는 다른 분리형/비분리형, 휘발성/비휘발성 컴퓨터 스토리지 매체를 더 포함할 수 있다. 예를 들어, 도 1은, 비분리형, 비휘발성 자기 매체(도시 생략, 통상 "하드 드라이브"라 지칭됨)로부터 판독하고 이에 기입하기 위한 하드 디스크 드라이브(144), 분리형, 비휘발성 자기 디스크(148;예를 들어, "플로피 디스크")로부터 판독하고 이에 기입하는 자기 디스크 드라이브, CD-ROM, CD-R, CD-RW, DVD-ROM, DVD-RAM과 같은 분리형, 비휘발성 광 디스크(152)로부터 판독하고 이에 기입하기 위한 광 디스크 드라이브(150)를 도시한다. 하드 디스크 드라이브(144), 자기 디스크 드라이브(146) 및 광 디스크 드라이브(150)는 하나 잇상의 인터페이스(154)에 의해 각각 버스(136)에 접속된다. 하드 디스크 드라이브(144), 자기 디스크 드라이브(146) 및 광디스크 드라이브(150)는 하나 이상의 인터페이스(154)에 의해 각각 버스(136)에 접속된다.
그 드라이브들과 관련 컴퓨터 판독가능 매체는 컴퓨터 판독가능 명령, 데이터 구조, 프로그램 모듈, 및 컴퓨터(130)용 다른 데이터의 비휘발성 스토리지를 제공한다. 비록, 여기서 기재된 예시적인 환경은, 하드 디스크, 분리형 자기디스크(148) 및 분리형 광디스크(152)를 채용하지만, 자기 카세트, 플래시 메모리 카드, 디지털 비디오 디스크, 랜덤 액세스 메모리(RAM), 판독전용 메모리(ROM) 등과 같은, 컴퓨터에 의해 액세스 가능한 데이터를 저장할 수 있는 다른 유형의 컴퓨터 판독가능 매체가 예시적인 운용 환경에서 또한 이용될 수 있음이 당업자에 의해 인식되어져야 한다.
다수의 프로그램 모듈은 하드 디스크, 자기 디스크(148), 광디스크(152), ROM(138), 또는 RAM(140) 상에, 예를 들어, 운용 시스템(158), 하나 이상의 애플리케이션 프로그램(160), 다른 프로그램 모듈(162), 및 프로그램 데이터를 포함하여, 저장될 수 있다.
여기서 기재되는 개선된 방법 및 배치는 운용 시스템(158), 하나 이상의 애플리케이션 프로그램(160), 다른 프로그램 모듈(162), 및/또는 프로그램 데이터(164) 내에서 구현될 수 있다.
사용자는 키보드(166) 및 포인팅 장치(168; 예를 들어, 마우스 등)와 같은 입력 장치를 통해 컴퓨터(130)에 명령과 정보를 제공한다. 다른 입력 장치들(도시 생략)은 마이크로폰, 조이스틱, 게임 패드, 위성 접시, 직렬 포트, 스캐너, 카메라 등을 포함할 수 있다. 이들 및 다른 입력장치는 버스(136)에 결합되는 사용자 입력 인터페이스(170)를 통하여 처리부(132)에 접속되지만, 병렬 포트, 게임 포트, 또는 공통 직렬버스(USB)와 같은 다른 인터페이스와 버스 구조에 의해 접속될 수 있다.
모니터(172) 또는 다른 유형의 디스플레이 장치는 또한 비디오 어댑터(174)와 같은 인터페이스를 통하여 버스(136)에 접속된다. 모니터(172)에 더하여, 통상, 컴퓨터는, 스피커와 프린터와 같은 다른 병렬 출력 장치(도시 생략)를 포함하며, 이들은 다른 출력 병렬 인터페이스(175)를 통하여 접속될 수도 있다.
컴퓨터(130)는 원격 컴퓨터(182)와 같은 적어도 하나의 원격 컴퓨터로의 논리 접속(logical connection)을 이용하여 네트워크 환경에서 작동할 수 있다. 원격 컴퓨터(182)는 컴퓨터(130)에 관련하여 여기서 기재되는 요소 및 특징들의 다수 또는 모두를 포함할 수 있다.
도 1에 도시된 논리 접속은 근거리 네트워크(LAN;177) 및 일반 광역 네트워크(WAN;179)이다. 이러한 네트워킹 환경은 사무실, 사내 광역 컴퓨터망(enterprise-wide computer networks), 인트라넷, 및 인터넷에서 흔한 것들이다.
LAN 네트워킹 환경에서 사용될 때, 컴퓨터(130)는 네트워크 인터페이스 또는 어댑터(186)를 통하여 LAN(177)에 접속된다. WAN 네트워킹 환경에서 사용될 때, 통상, 컴퓨터는 모뎀(178) 또는 WAN(179) 상에 통신을 확립하기 위한 다른 수단을 포함한다. MODEM(178) -내장형 또는 외장형일 수 있음- 은 사용자 입력 인터페이스(170) 또는 다른 적절한 메커니즘에 의해 시스템 버스(136)에 접속될 수 있다.
도 1에서는 인터넷을 통한 WAN의 특정 구현예가 도시된다. 이 때, 컴퓨터(130)는 인터넷(180)을 통하여 적어도 하나의 원격 컴퓨터(182)와 통신을 확립하기 위해 모뎀(178)을 채용한다.
네트워크 환경에서, 컴퓨터에 관련하여 도시된 프로그램 모듈은, 또는 그 부분은, 원격 메모리 스토리지 장치 내에 저장될 수 있다. 따라서, 예를 들어, 도 1에 도시된 바와 같이, 원격 애플리케이션 프로그램(189)은 원격 컴퓨터(182)의 메모리 장치에 상주할 수 있다. 도시된 네트워크 접속은 예시적이며, 컴퓨터들 간의 통신 링크를 확립하는 다른 수단이 사용될 수 있다.
개선된 레이트/디스토션 최적화 기술:
이하, 이미지 데이터 및/또는 비디오 데이터를 초기에 압축/인코딩 및 압축풀기/디코딩하도록 구성되는 어떤 예시적인 방법과 장치가 기재되지만, 데이터 압축 분야의 당업자는 제시된 기술들이 다른 유형의 데이터를 압축/인코딩 및 압축풀기/디코딩하기에 적합하고 이를 위해 채용될 수 있음을 인식할 것이다. 예를 들어, 어떤 방법과 장치는 오디오 데이터, 스피치 데이터 등을 압축/인코딩하는 데 사용하기에 적합할 수 있다.
또한, 예시적인 방법과 장치는 컴퓨터 내의 로직으로 구성될 수 있지만, 당업자는 이러한 방법 및 장치는 다른 유형의 장치, 기기 등으로 구현될 수 있음을 인식할 것이다. 여기서 사용되는 "로직"이라는 용어는 하드웨어, 펌웨어, 소프트웨어, 또는 이들의 임의의 결합, 및 원하는 기능을 전부 또는 부분 충족하도록 요구될 수 있는 것으로서 임의의 다른 지원 하드웨어 또는 다른 메커니즘을 포함하는 의미를 갖는다.
이를 감안하여, 데이터의 처리를 지원하는 어떤 형태의 로직에서 구현될 수 있는 여러 예시적인 방식이 제공된다.
본 발명의 일 태양에 따라, 비디오 및/또는 이미지 인코딩/디코딩 시스템의성능을 향상시키기 위한 여러 신규한 기술이 제공된다. 어떤 예시적인 구현예에서, 이들 기술은 JPEG 및 JVT(조인트 비디오 팀) 표준(예를 들어, H.264/AVC) 등의 이미지/비디오 코딩 표준을 사용하여 채용된다. 예를 들어, JVT의 경우, 모션 정보 등의 특정 비디오 파라미터를 예측하기 위해 이용될 수 있는 서로 다른 예측 유형의 적응 선택이 동작가능하게 할 수 있는 구문 변경이 제공된다.
레이트 디스토션 최적화(RDO) 기술은, 종래의 인코딩 방법과 비교하여 인코딩 효율을 상당히 개선할 수 있기 때문에, 비디오와 이미지 인코딩/디코딩 시스템에서 매우 인기있다. 보다 높은 인코딩 효율을 제공하기 위한 지속적인 요구가 있다. 본 명세서는 기존 시스템에 비해 개선된 코딩 효율을 달성하기 위해 RDO 또는 다른 유사 기술의 성능을 상당히 향상시킬 수 있는 방법과 장치를 기술한다.
본 발명의 또다른 태양에 따라, 이미지 또는 매크로블록의 특성에 기초하여 어댑티브 및/또는 가변 크기 데드존 양자화기를 사용함으로써, 예를 들어, 에지 및/또는 텍스쳐 검출 등의 이미지 선분석(pre-analysis)을 사용하여 RDO 또는 다른 유사 기술들을 더욱 결합 개선시킬 수 있다.
또한, 본 명세서는 프레임 레벨에서 서로 다른 예측 방식의 결합을 가능하도록 구현될 수 있는 몇몇 부가적인 예시적 구문 변화(syntax change)를 소개/정의함으로써, 비디오 코딩 방식의 성능을 더욱 향상시킨다. 예를 들어, 시퀀스의 몇몇 프레임 또는 부분에 있어서, 모션이 공간 도메인(spatial domain)보다 시간 도메인(temporal domain)에 더 상관될 수 있다 -또는 그 역(vice versa)-는 사실에 근거하여 하나의 기술이 발생한다. 이는, 프레임의 선분석을 이행함으로써, 또한,가능한 한 적어도 2개의 방법을 이용하여 RDO 및/또는 RDO 유사 센스에서 보다 바람직한 방식을 선택하여 동일 프레임을 인코딩함으로써 이용될 수 있다. 따라서, 바람직한 방법은, 예를 들어, 디코더가 적절하게 프레임을 디코드할 수 있도록, 예를 들어, 프레임 해더 내에서의 결과적 데이터에 전달된다. 이 때, 예를 들어, 이러한 예시적인 방법들 중 하나는, 공간 예측 또는 시간 예측을 이용하여 B프레임 내의 다이렉트 모드, 또는 공간 예측 모션 벡터 파라미터(spatial prediction motion vector parameter)나 시간 예측 모션 벡터 파라미터(temporal prediction motion vector parameter), 또는 심지어 0을 이용하여 P 프레임 내에 스킵 모드 모션 벡터 선택의 변경가능성을 포함할 수 있다.
하나 이상의 특성(파라미터)에 따라 어댑티브 및/또는 가변 데드존 양자화를 데이터에 적용:
이미지 데이터 압축 시스템에서, 예를 들어, 블록 또는 매크로블록과 같은 압축될 데이터는 다른 정보(데이터)와 비교하여 언제 서로 달리 코딩되어야 하는(예를 들어, 보다 높은 우선순위에서, 보다 높은 품질로, 등등) 보다 중요정보를 실제 포함할 수 있다. 이를 달성하는 하나의 방법은 서로 다른 양자화기 값을 이용하는 것이다. 예를 들어, 특정 구현예에서, 보다 작은 양자화기 값은 "보다 중요 정보"에 대하여 이용될 수 있으며, 보다 큰 양자화기 값은 "보다 덜 중요한 정보"에 대하여 이용될 수 있다. 그러나, 그렇게 행하는 것은, 통상, 추후 압축풀기/디코딩이 성공적이도록 각각의 블록, 매크로블록, 매크로블록의 그룹 등에 대하여 이용되는 각각의 양자화기 값을 식별하는 정보의 전송을 요구한다. 불행히도, 이러한 추가 정보는 압축 오버헤드(compressed overhead)와 인코더의 복잡도(complexitiy)를 증가시키는 경향이 있다. 따라서, 효율을 증가시키는 대신, 실제로는 효율이 감소될 수 있다.
도 2a 내지 도 2d를 참조하면, 어떤 예시적인 이미지/비디오 코딩 방식 내에 채용가능한 어떤 예시적인 데드존 양자화기를 도시하는 그래프를 각각 나타낸다. 도 2a 내지 도 2d의 각각의 도면에서, 수직(y축)은 양자화된 값을 수평(x축)은 오리지널 값을 나타낸다. 도시된 예시적인 데드존 양자화기(도 2a의 202), 예를 들어, 균일 양자화기(uniform Quantizer)에 비해 코딩 효율을 상당히 향상시킬 수 있는 데드존 양자화 A에 관련된다. 종래의 데드존 양자화기는 종종 그 양자화 프로세스를 통하여 일정 또는 균일하게 유지되어, 데이터 내에 모든 기존 리던던시(redundancy)를 완전하게 이용할 수 잇는 없었다.
데이터 내의 특정 정보의 중요성을 고려함으로써 그리고 블록/매크로블록 기반의 데드존 양자화기를 적용/변경함으로써, 예를 들어, 코딩 효율의 향상이 달성될 수 있다. 이는, 예를 들어, 각각의 양자화 빈(bin)(예를 들어, x축을 따라)의 커버리지를 적용함으로써, 그러나, 재구성 값(reconstructed value)을 변경시키지 않고, 행해질 수 있다. 예를 들어, 데드존 양자화기(202)를 도 2b 내지 도 2d의 데드존 양자화기(204, 206, 208)와 각각 비교해보자. 여기서, 재구성 값은, 물론 양자화 파라미터의 변경이 전달되지 않는다면, 코드된 데이터에 걸쳐 일정하게 유지될 것이다. 예를 들어, 제로 빈(도 2c)를 증가시킴으로써, 보다 많은 데이터가 이에 할당되어, 압축 방식에 따라 보다 높은 압축을 달성할 것이다. 재구성 값이동일하게 유지되기 때문에 양자화기 내의 변화를 전달하기 위한 디코터에 대한 요구가 없음은 명백하다. 비록 이러한 것이 양자화 성능을 손상시킬 수 있다고 주장할 수 있지만, 그 처리가 특정 조건이 만족될 때 선택적으로 행해진다면, 예를 들어, 압축이 새로운 양자화기를 사용하여 초래된 디스토션보다 상당히 높게 되면, 반드시 그러한 것만은 아니다.
도 2b에서, 예를 들어, 데드존 양자화기는 제1 양/음 빈에 대한 0 빈만을 영향을 주는 반면, 다른 모든 빈은 동일하게 유지되고 사용된 재구성 값에 변화가 없다. 데드존의 어댑티브 추정을 사용하는 어댑티브 방식도 또한 가능하다(예를 들어, 레이트 디스토션 최적화 및 어댑티브 추정).
본 발명의 특정 예시적인 구현예에 따라, 양자화 선택 로직이 적어도 하나의 특성 또는 파라미터에 기초하여 여러 데드존 양자화기(또는 양자화 값)들 중에서 선택하기 위해 압축/인코딩 시스템 내에 제공된다. 예를 들어, 로직은 특정 이미지 특성에 따라 여러 데드존 양자화기(202, 204, 206, 및 208) 사이에서 선택할 수 있다.
특히, 그 로직은 이미지 데이터 내의 텍스쳐 및/또는 에지를 "보다 중요한" 정보를 나타내는 것으로 특성화하고, 이에 따라 높은 레벨의 품질을 제공하기 위한 방식으로 이러한 데이터를 코드하도록 구성될 수 있다. 로직은 이러한 판정 프로세스를 지원하기 위해 종래 텍스쳐 분석/탐지 및 에지 탐지 알고리즘을 사용할 수 있다.
이를 감안하여, 이하, 도 3을 참조하며, 이는 본 발명의 일 구현예에 따라서로 다른 양자화 프로세스를 선택적으로 적용하기 위한 방법(300)을 나타내는 흐름도이다. 동작(302)에서, 초기 데이터 세트는 복수개의 데이터 부분으로 분할된다. 예를 들어, 이미지 또는 비디오 데이터는 복수개의 블록, 매크로블록, 슬릿, 슬라이스, 섹션 등으로 분할될 수 있다. 동작(304)에서, 동작(302)으로부터의 복수개의 데이터 부분들 중 적어도 하나는, 예를 들어, 적어도 하나의 특성 또는 파라미터에 기초하는 어떤 방식으로 분류된다. 예를 들어, 그 분류는 에지 특성, 텍스쳐 특성, 평활 특성, 루미넌스 특성, 크로미넌스 특성, 컬러 특성, 노이즈 특성, 오브젝트 특성, 모션 특성, 사용자 선호도 특성, 사용자 인터페이스 포커스 특성, 레이어링 특성, 타이밍 특성, 볼륨 특성, 주파수 특성, 피치 특성, 톤 특성, 품질 특성, 비트 레이트 특성, 데이터형 특성, 해상도 특성, 암호화 특성 등에 기초할 수 있다.
동작(306)에서, 동작(304)에서 분류된 부분은 대응 양자화 데이터를 산출하기 위해서 복수개의 양자화 프로세스 중 적어도 2개를 이용하여 처리된다. 동작(308)에서, 동작(306)으로부터의 양자화 데이터들 중의 하나가, 예를 들어, 적어도 적어도 하나의 임계치를 충족시키거나 동작(304)에 사용된 분류 파라미터에 관련되는 측정에 기초하여 선택되는 판정이 행해진다. 동작(310)에서, 동작(308)으로부터의 양자화 데이터는 추후 디코드될 수 있는 방식으로 인코드된다.
방법(300)을 사용하여, 이미지 또는 비디오 부분들을 근본적으로 분석하여 특정 부분들을 다른 것보다 보다 중요한 것으로 여기는 로직이 제공될 수 있다. 따라서, 여러 데드존 양자화기가 보다 중요한 데이터 부분에 적용되어, 그 결과,데드존 양자화기(들)가 이렇게 중요한 데이터에 대하여 원하는 임계치 요건을 충족하는 지를 판단하도록 양자화 데이터가 분석된다. 예를 들어, 품질 또는 노이즈 임계치 요건이 실행될 수 있다.
예를 들어, 비디오 시퀀스에서, 에지는 종종 모션 보상 기술에서 상당히 중요한 역할을 한다. 이는, 예를 들어, 이하 보다 상세히 설명하는 도 7에 나타낸 블록도에서 설명된다. 기본적으로, 복수개의 데드존 양자화기 중에 어느 것이 가장 사용하기에 적합한지를 판단하는 분석에 따라, 예를 들어, 레이트 디스토션 최적화(RDO) 기준에 따라, 이미지(프레임) 또는 이미지의 부분에 대한 이미지 분석을 이행하는 것 가능하다.
도 4를 참조하면, 로직(400)은 본 발명의 일 구현예에 따라 온 더 플라이 방식(on-the-fly) 판정 프로세스를 나타낸다. 여기서, 블록(402)에서 입력 프레임/이미지(또는 그 부분)은 이미지 분석된다. 이 예에서, 이미지 분석은 에지 탐지 및/또는 텍스쳐 분석 능력을 포함하며, 그 출력은 데드존 판정 블록(404)에 제공된다. 그 후, 데드존 판정 블록(404)은 인터도(406)가 입력 프레임/이미지(또는 그 부분)을 인코드할 때 특정 또는 달리 선택된 데드존 양자화기를 사용하도록 할 수 있다.
데드존 양자화에 대한 온 더 플라이 방식 판정을 행하는 대신, 도 5 내의 로직(500)은, 복수개의 데드존 양자화기가 사용되어 특정 임계치 기준에 기초하여 RDO 판정이 행해지는 방법(300)을 지원하도록 구성될 수 있다. 여기서, 입력 매크로블록(MB)/이미지(502; 또는 유사 부분)는 여러 데드존 인코딩 블록(504, 506,508 및/또는 510)에 (선택적으로) 제공되며, 이들 여러 데드존 인코딩 블록으로부터의 출력은 RDO 판정블록(512)과 선택된 인코드 데이터 출력에서 분석된다. 이 예에서 설명한 바와 같이, 데드존 인코딩 블록/프로세스의 부분 또는 전부는 병렬로 발생할 수 있다. 다른 구현예에서, 이러한 처리는 직렬로 발생하도록 타이밍될 수 있다.
도 6a 내지 도 6b는 선택적 기록 판정처리가 이용되는 로직을 도시한다. 도 6a에서, 예를 들어, 입력 MB/이미지(502)가 데드존 인코딩 블록(602, 604)에 제공된다. 기록 판정 블록(606)은 데드존 인코딩 블록(602)으로부터의 출력을 고려하며, 데드존 인코딩 블록(602, 604)의 출력들 간의 선택(608)에 영향을 준다. 기록 판정 블록(606)은 또한 데드존 인코딩 블록(604)을 선택적으로 초기화할 수 있다. 도 6b에서, 로직(610)은 로직(600)과 유사하지만 기록 판정 블록(606)에 관련된 선택(608)을 갖는 대신, 데드존 인코딩 블록(602, 604)으로부터의 출력을 분석하여 어느 것을 출력할 지를 판정하도록 구성된 RDO 판정 블록(612)을 포함한다.
도 6a와 도 6b의 기록 판정 블록(606)은 여러 기준에 기초하여 판정을 하도록 구성될 수 있다. 예를 들어, 특정 구현예에서, 품질 제한, 레이트 제한 및/또는 다른 RDO 개념/임계치가 고려될 수 있다.
예를 들어, 레이트/품질이 특정 임계치 이상인 것과 같이, 종전에 정의된 어떤 조건이 충전하기만 하면, 추가적인 데드존 양자화기를 사용가능 것이 가능하다. 특정 예시적인 실험에서, 오리지널 값보다 약 30% 이상 큰 데드존을 구비한 데드존 양자화기가 성공적으로 선택되었다. 다른 것으로, AC 주파수 또는 에지 유형과 같은 이미지 특성에 따라 어댑티브가능한, 데드존 양자화기가 또한 사용될 수 있다.
도 7에서, 예시적인 인코딩 로직(700)은 어떻게 초기 이미지(702; 또는 그 부분)가 이미지 분석 처리(704)에 따라 처리되어, 이 예에서는, 에지 탐지 데이터(706)를 생성하는지를 설명한다. 그 후, 에지 탐지 데이터(706)은 블록 분류 처리(708)에 제공되어 블록 분류 데이터(710)을 생성한다. 그 후, 블록 분류 데이터(710)는 초기 이미지(702)를 따라 이미지 인코딩 프로세스(712)에 제공되며, 이는 그 후 인코드된 이미지(714)를 생성한다. 이는 이미지에 대한 단순 인코딩 처리의 일 예이다. 여기서, 이미지는 분석(예를 들어, 에지 탐지 알고리즘을 사용하여)된 후, 블록이 이러한 정보에 따라 분류된다. 근본적으로, 매크로블록의 위치(i,j)에서 할당된 양자화기(QP)에 대한 적절한 데드존(DZ)을 추후에 할당하는 N-ary 매트릭스(DZP)가 정의된다(N은 정의된 데드존 개수에 의존).
논 레지두얼 모드(예를 들어, B 프레임 다이렉트 모드에 대하여)의 고려
비록 상기 설명이 정적 이미지에 주로 초점을 맞추어 기재하였으나, 동일한 개념이 또한 비디오에도 용이하게 적용될 수 있다. 예를 들어, 이미지 선분석 및 데드존 양자화기는 비디오 압축에서도 다소 직접적으로(strightforward) 사용될 수 있다.
대단히 흥미롭고 상기 개념으로부터 상당한 이점을 얻을 수 있는 일예로 B프레임 내의 다이렉트 모드의 사용을 들 수 있다. 다이렉트 모드는 기본적으로 모션 파라미터의 어떠한 전송도 요구하지 않는 특정 모드인 데, 이는 이러한 것이 시간또는 공간 예측을 통해 집적 예측될 수 있기 때문이다. 다이렉트 모드에 대한 추가적인 정보가 함께 계류중인 미국 가출원번호 제 60/385,965호에서 발견될 수 있다.
만약 전송될 레지듀(residue)가 없으면, 본 발명의 다른 양태에 따라, 여기서 논 레지두얼 다이렉트 모드(Non Residual Direct Mode)로서 지칭되는 특정 모드의 사용에 의해 효율이 더욱 향상될 수 있다. 후술하는 바대로, 논 레지두얼 다이렉트 모드는 런 렝쓰 인코딩(RLC;Run Length enCoding) 방식을 이용하도록 구성될 수 있다. 여기서, 예를 들어, 초래되는 디스토션이 충분히 작고 보다 높은 효율의 RLC에 기인한 비드 레이트 감소가 중요해지면, 데드존 양자화기가 원하는 솔류션을 제공할 수 있다. 기본적인 아이디어는, 특정 조건하에서, 비록 레지듀가 존재하더라도 그 레지듀 없이 코드되도록 다이렉트 모드(Direct Mode)를 선택적으로 하거나 코드되도록하는 것이다. 도 5와 동일한 개념에 기초한 방식은, 예를 들어, 도9에 나타낸 것과 같이, 구현될 수 있으며, 또한 모든 RDO 처리 내에서 논 레지두얼 다이렉트 모드가 다른 가용 모드와 비교되어 검사된다. 특정 사례에서, 이러한 방식의 성능은, 사용된 RDO가 이러한 경우에 대하여 부적절하기 때문에, 예측된 것 만큼 양호하지 않을 수 있다. 양자화 값에 의존하는 다른 처리는, 예를 들어, 블록킹 구조물(blocking artifact)을 제거하는 데 사용되는 인루프 필터(in-loop filter;도시 생략) 등에 영향을 받는다. 특히, 비록 성능이 더 낮은 비트 레이트에서는 양호해 보일지라도, 보다 높은 비트 레이트에서는 상당히 열화하면, 논 레지두얼 다이렉트 모드의 고려없이 보다 큰 양자화기의 사용에 의해 성능이 향상될수 있다.
이미지의 예에서 행해진 것과 유사하게, 본 발명의 특정 양태에 따라서, 종전에 정의된 어떤 조건들이 충족되기만 하면, 그리고 특히, 다이렉트 모드에 관련된 레지듀가 중요하지 않으면, 이러한 모드를 고려하도록 로직이 구성될 수 있다. 그 로직은, 예를 들어, 다이렉트 모드의 코드화된 블록 패턴(CBP;Coded Block Pattern)를 검사함으로써 이 레지듀가 얼마나 중요한 것인지의 추정 조건으로서 사용되도록 구성될 수 있다. CBP가, 크로미넌스 정보의 고려없이, 특정 임계치 이하이면, 이는 레지듀가 중요하지 않음을 암시하는 것으로 간주될 수 있고, 스킵되었으면, 과도한 디스토션을 초래하지 않을 것이다. 더욱이, 에지 및 텍스쳐의 부존재와 같이 다른 이미지 특성이 이러한 비디오 인코딩 처리/로직 내에 사용될 수 있다.
특정 구현예에서, 로직은 모든 루미넌스 레지듀가 손상되지 않으면서(intact) 크로미넌스 레지듀(crominance residue)만이 제거될 수 있는 지를 검사함으로써, 이를 보다 연장할 수 있다. 이러한 모드에 레지듀 전체 또는 크로미넌스를 전송하지 않는 것이, 보다 우수한 성능을 부여하는 지를 검사하는 것은, 이러한 개념을 매크로블록에 대한 모든 가능한 모드로 연장시킬 수 있다. 그러나, 이는 인코딩 복잡도를 훨씬 복잡하게 하는 것은 명확하다.
도 9를 참조하면, 로직(900)은, 입력 MB/이미지(902)가 서로 다른 다이렉트 모드(B 프레임) 또는 카피 모드(인터 프레임) 인코딩 처리 블록(902, 904, 906, 및 908)에 어떻게 제공되는지와 이들 처리블록으로부터의 출력이 적절한 출력을 선택하는 RDO 판정 블록(910)에 기초하여 어떻게 프레임에 제공되는지를 설명한다.
도 10을 참조하면, 또한, 로직(1000)이 어떻게 방식 판정 블록(1002)과 선택(1004)이 사용자 입력, 애플리케이션, 시스템 요건 등에 의존하여 추가적인 선택가능성을 제공하도록 포함되는 지를 더 설명한다. 여기서, 방식 판정 블록(1002)은 하나 이상의 다이렉트 모드(B 프레임) 또는 카피 모드(인터 프레임) 인코딩 처리 블록(902, 904, 906, 및 908)에 선택적으로 제공한다. 선택(1004)은 방식 판정 블록(1002) 또는 다른 처리/로직/입력에 의해 제어될 수 있다.
B 프레임에 대한 라그랑지 곱수의 예시적인 사용
RDO 기술은 종종 라그랑지 곱수(Lagrangian mupltiplier)의 개념에 기초한다. 예를 들어, 디스토션과 비트 레이트를 함께 최소화하는 특정 모드가 선택될 수 있다.
이러한 함수는 최소화로서
으로 표현되며, 여기서, QP는 매크로블록 양자화기, λ는 모드 판정을 위한 라그랑지 곱수가며,Mode는 RDO 처리내에 검사되어 가능하면 선택되는 매크로블록 모드를 나타낸다.
예를 들어, 특정 구현예에서, 라그랑지 곱수 λ는 인터 프레임 또는 인트라 프레임에 대하여
또는
으로 선택될 수 있으며, 그 반면에, B프레임에서는, JVT와 같은 대부분의 코덱에서, 이는으로서 선택된다.
λ의 추가 가중치는, 보다 낮은 오버헤드 모드, 예컨대 다이렉트 모드는 RDO 에 대하여 여전히 매우 우수한 성능을 제공할 수 있는 반면에, 특히 B프레임에 있어서는, 모드들이 전송된 다수의 모션 정보에 기인하여 대용량의 오버헤드를 가질 수 있기 때문에, 그 오버헤드 모드를 낮추기 위한 선호도를 부여하기 위해 행해진다.
그러나, 본 발명의 따른 특정 실험에 기초하여, 그 가중치는 상술한 바와 같이 상수이면 안되지만, 그 대신, 양자화기 QP값에 다시 의존하여야 함이 발견되었다.
특히,이라고 정의하면, 이들 실험으로부터, f(QP)=4 로 고정된 경우보다 훨씬 우수한 압축효율로 이용되는 2개의 f(QP)함수는
이다.
또한, 이러한 관측은 매우 높은 λ을 가짐으로써, 예를 들어, 모션 예측의 정확성과 같은 다른 중요 정보의 정확성에 영향을 주게 되어, 그 결과 주변 매크로블록의 인코딩에 부정적인 영향을 미친다는 사실에 기인한다.
예측 의존 MB 모드의 어댑티브 유형 선택의 사용
함께 계류중인 미국 가출원번호 제60/385,965호, 제60/376,005호, 미국 출원번호 제10/186284호에 기재된 바와 같이, 시퀀스와 프레임은 서로 다른 유형의 지배적 모션 상관관계를 가질 수 있다.
특히, 정적 배경에서 일정 속성를 갖는 소형 객체에 있어서, 시간적으로 인접한 프레임(시간 도메인)으로부터 모션 벡터(MVs)의 사용은 보다 우수한 예측을 이행하고, 보다 높은 성능을 낼 수 있게 한다. 부드로운 모션의 대형 객체는 공간 도메인(인접 매크로블록)에서 보다 높은 상관관계를 갖는 반면, 다른 경우에서는, 시간 도메인과 공간 도메인으로부터의 정보가 모두 예측을 위해 중요할 수 있다. 이들 유형의 상관관계는, 예를 들어, B와 P 프레임에서 다이렉트 모드와 P프레임에서의 모션 벡터 예측기에 대한 스킵 내에서 부분적으로 이용될 수 있다. P 프레임에서의 모션 벡터 예측기에 대한 스킵(Skip on Motion Vector Predictor)에 대하여 보다 많은 정보는, 예를 들어, Jani Lainema 및 Marta Karczewicz가 2002년 5월, JVT Meeting, Fairfax에서 "스킵 모드 모션 보상" 문서 JVT-C027을 참조하면 된다. 따라서, 로직이 어느 유형의 예측이 서로 다른 프레임에서 우세한 지를 어느 정도 전달하면, 매우 높은 성능이 달성될 수 있다.
따라서, 본 발명의 특정 양태에 따라, 인코딩 로직은, 예측 의존 모드에 대한 예측 방식이 사용되는 프레임, 슬라이스 또는 다른 유사 레벨에서 어떤 방식으로 전달 또는 식별하도록 구성된다. 이를 달성하기 위한 하나의 예시적 구문은,예를 들어 JVT 내에서, 도 8의 차트 800에 제공된다. 이 구문은, 물론, 다른 인코딩 디자인에서 변경/상이하다.
차트 800에서의 예시적인 구문에 있어서, 가능한 3개의 예측의 경우가 P 프레임 스킵 모드에 대하여 허용된다. 이 예에서, 모션 카피 예측 모드(Motion-Copy prediction mode), 시간 예측 스킵 모드(temporal prediction skip mode), 및 제로 스킵 모드(zero skip mode)이다. 이들 경우의 각각은 {0.1.2} 사이의 값으로 할당되며, 이는 고정 크기 코드워드, 이 예에서 u(2)=2를 사용하여 코드될 수 있거나, 심지어 엔트로피 코딩(entropy coding;UVLC 또는 CABC을 이용하는 e(v))된다. 당업자는 이런 채용될 수 있는 정보를 전달하는 다른 방식이 있음을 인식할 것이다. 차트 800에서, B 프레임에 대하여 어댑티브 공간/시공간 고려(Adpative Spatial/Spatio-temporal Consideration)(direct_mv_spatial)와 인터 프레임 내에 어댑티브 카피/모션 카피 스킵 모드(adaptvie Copy/Motion-Copy Skip Mode)(copy_mv_spatial)에 더하여 JVT 내에 픽쳐 레이어 RBSP 구문(picture layer RBSP syntax)을 설명한다. 단지 이들 두 모두가 사용되면, 정의된 디스크립터는 단지 1 비트만을 취하여, u(n=1)이지만, 보다 많은 케이스가 사용되면(제로 바이어스(zero bias)의 공간 예측 또는 정적 시간 예측의 고려), 보다 많은 비트가 할당되며(n>1) 심지어 e(v)에 의해 정의된 파라미터에 대하여 엔트로피 코딩을 사용할 수 있다.
B 프레임에 있어서, 이 예에서는, 공간 모션 벡터 예측은 모든 다이렉트 모드 모션 파라미터에 대하여 하나의 모드로서, 시간적으로 예측된 파라미터는 제2모드로서 사용될 수 있다. 기재된 다른 다이렉트 모드, 예를 들어, 함께 계류중인 미국 가출원번호 제60/385,965호가 또한 고려/포함될 수 있다. 인코딩 로직은 어느 예측 모드가 프레임 또는 슬라이스 레벨에서 이용될 수 있는 지를 전달하도록 구성된다. 그 부분은, 예를 들어, RDO 기반 방식(예를 들어, 도 9)을 사용하여 이행될 수 있다. 또한, 특정 구현예에서, 인코딩 로직은 인코더 및/또는 디코더 상의 특정 요건에 기인하여 명시적으로 특정 모드를 사용할 수도 있다. 특정 예에서, 통상, 공간 예측이 간단하게 계산 상 보다 간단한 것을 고려하면(예를 들어, 분할, 모션 벡터의 저장장치을 요구하지 않고, 타이밍 정보에 독립적이다), 공간 예측은 부분 애플리케이션(예를 들어, 도 10)에 대해서 바람직한 선택일 수 있다.
다른 구현예에서, 이러한 문제점들이 쟁점이 아니라면, 그 조합은 더욱 향상된 인코딩 성능을 산출할 수 있다. 인코딩된 시퀀스의 일예는 도 11의 예시적인 도면에 나타낸다. 여기서, P 및 B 프레임은 화면 변경(scene change)에 따라 도시된다. 화살표에 의해 나타낸 바와 같이, 서로 달리 전달된 P 및 B 프레임은 대응 스킵, 또는 다이렉트 모드 매크로블록에 대하여 도시된다. 또한, 전달링은 인코딩 로직이 모션 벡터 코딩에 대하여, 또는 다른 모드(예를 들어, 함께 계류중인 미국 가출원 번호 제60/376,005호, 미국출원번호 제10/186,284호)의 예측에 대하여 어떻게 모션 벡터 예측을 이행하는 지의 표시일 수 있다.
도 11에 도시된 바와 같이, 서로 다른 프레임들은 그들의 대응 다이렉트(B) 및 스킵 (P) 모드에 대하여 서로 다른 유형의 예측을 전달한다. Pz, PT, 및 PM은 예를 들어, 영의, 시간 및 공간 예측(모션 카피) 예측에 대하여 정의하며, 및 BT및 Bsp는 다이렉트 모드에 대한 시간 및 공간 예측을 정의한다.
정적 시간/공간 블록을 고려하는 타임 스탬프 독립 다이렉트 모드
여러 유형의 예측은, 특히, B 프레임에서 다이렉트 모드에 있어서, 서로 다른 유형의 모션 및 시퀀스에 대하여 보다 적합할 수 있다. 시간 또는 공간 예측만을 이용하여, 몇몇의 경우는 허용가능한 성능을 제공할 수 있지만, 다른 성능은 상당히 열악할 수 있다. 상술한 바와 같이, 또는 함께 계류중인 미국 가출원번호 제60/385,965가 제공되는 경우에 있어서, 솔류션은 훨씬 더 우수한 성능을 제공할 수 있다.
예를 들어, 매우 효율적이며 시간 및 공간 예측기 양자의 성능을 결합하는 또다른 경우가 제공되며, 분할 및/또는 독립적인 타이밍 요구하지 않음으로써 공간 예측을 간단하게 유지하는 경향이 있다.
특정 구현예에서, 공간 예측은 시간예측보다 유용하다(예를 들어, 속성에 기인하여). 따라서, 예를 들어, 공간 예측은 다이렉트 모드의 주 예측으로서 이용된다. 한가지 가능한 예외는 시간 예측기로부터의 모션 정보와 참조 프레임이 0인 경우이다. 이러한 경우, 다이렉트 모드의 대응 블록에 대한 모션 정보와 참조 프레임도 0으로 간주된다. 더욱이, 공간 예측은 공간 0 바이어스됨(spatial zero biased-ness) 및/또는 정적 서브파티션(stationary subpartition)을 또한 고려하여 세련(refine)되어질 수 있다. 따라서, 현재 예측된 블록에 대한 인접 매크로블록또는 블록의 전부 또는 부분이 0 모션(또는 매우 가까운(예를 들어, 정수 모션 벡터가 0))과 참조 프레임을 가지면, 또한 전부 또는 부분의 매크로블록이 0의 모션을 갖는 것으로 간주된다. 이들 개념은 모두 정적 배경을 보호하는데, 특히, 이동 객체의 에지에서 이러한 조건이 되지 않으면 매우 디스토션될 수 있는 것으로부터 보호할 수 있게 한다.
16×16 매크로블록의 경우에 대하여 간략화된 흐름도(1200)가 도 12에 도시된다. 다이렉트 모드에 대한 공간 예측을 사용하여 이러한 개념은 훨씬 작은 블록(예를 들어, 8×8 또는 4×4)(또는 대형 블록 또는 다른 형태의 부분)에 또한 연장될 수 있다. 동작(1202)에서, 공간 예측기(MVa, MVb, MVc) 및 시간 예측기(MVt)가 동작(1204)에 제공되며, MVDirect는 중간값(MVa, MVb, MVc)으로 설정된다. 동작(1206)에서, MVDirect가 0으로 설정되는 동작(1208) 또는 추가 판정을 위한 동작(1210)으로 진행하는 MVt에 기초하여 판정이 행해진다. 동작(1210)의 결과, MVDirect는 동작(1208)에서 0으로 설정되거나 변경되지 않으며, MVDirect는 출력이다.
본 발명의 다양한 방법 및 장치의 어떤 바람직한 구현예가 첨부한 도면에 도시되고 상기 상세한 설명에서 기재되었지만, 본 발명은 개시된 예시적인 실시형태에 한정하는 것이 아니고, 본 발명의 정신으로부터 벗어남이 없이 다수의 재배치, 변형 및 대체가 가능하다는 것이 인식될 것이다.
본 명세서에서, 이미지, 비디오 시퀀스, 또는 다른 유형의 데이터를 인코딩하기 위한 레이트 디스토션 최적화에 관련된 여러 개념들이 제공되었다. 여러 다른 예측의 경우, 특히, 이미지의 초기 개시에서 전달될 수 있는 P 및 B 프레임 내에서 각각 스킵 및 다이렉트 모드 등의 경우가 허용됨으로써, 상당이 높은 압축 효율을 가능하게 하는 비디오 시퀀스 내에 채택될 수 있는 추가적인 구문이 설명되었다. 정적 시간 예측기 뿐만 아니라 공간 모션 벡터 예측을 고려하는, B 프레임에 대한 고효율의 타임 스탬프 독립 다이렉트 모드(time stamp independent Direct Mode)가 제공되었다. 상기 방법 및 장치의 전부 또는 부분은 여러 이미지/비디오/데이터 코딩 시스템의 성능을 상당히 향상시키도록 구현될 수 있다.

Claims (94)

  1. 복수개의 서로 다른 양자화 함수(quantization function)를 사용하여 데이터의 적어도 일부분을 처리하여 복수개의 대응하여 양자화된(corresponding quantized) 데이터 부분을 생성하는 단계; 및
    적어도 하나의 임계치에 기초하여 상기 양자화된 데이터 부분들 중의 하나를 선택적으로 출력하는 단계를 포함하는 방법.
  2. 제1항에 있어서,
    초기 데이터를 상기 데이터의 적어도 일부분을 포함하여 복수개의 부분으로 분할하는 단계; 및
    상기 데이터의 적어도 일부분을 적어도 하나의 분류 특성(classification charateristic)에 기초하여 분류하는 단계를 더 포함하는 방법.
  3. 제2항에 있어서,
    상기 적어도 하나의 임계치는 상기 적어도 하나의 분류 특성에 관련되는 방법.
  4. 제2항에 있어서,
    상기 초기 데이터는 이미지 데이터, 비디오 데이터, 오디오 데이터, 및 스피치 데이터(speech data)를 포함하는 그룹으로부터 선택되는 데이터를 포함하는 방법.
  5. 제2항에 있어서,
    상기 초기 데이터는 이미지 데이터 또는 비디오 데이터를 포함하며, 상기 적어도 일부분은 블록, 매크로블록(macroblock), 슬릿(slit), 슬라이스(slice), 및 섹션(section)을 포함하는 그룹으로부터 선택되는 방법.
  6. 제2항에 있어서,
    상기 적어도 하나의 분류 특성은, 에지(edge) 특성, 텍스쳐(texture) 특성, 평활(smoothness) 특성, 루미넌스(luminance) 특성, 크로미넌스(crominance) 특성, 컬러 특성, 노이즈 특성, 오브젝트 특성, 모션(motion) 특성, 사용자 선호도 특성, 사용자 인터페이스 포커스(user interface focus) 특성, 레이어링(layering) 특성, 타이밍 특성, 볼륨(volume) 특성, 주파수 특성, 피치(pitch) 특성, 톤(tone) 특성, 품질 특성, 비트 레이트(bit rate) 특성,데이터형 특성, 해상도(resolution) 특성, 및 암호화 특성을 포함하는 특성들의 그룹으로부터 선택되는 방법.
  7. 제1항에 있어서,
    상기 복수개의 서로 다른 양자화 함수는 적어도 2개의 서로 달리 동작하는 데드존 양자화기(Deadzone Quantizer)를 포함하는 방법.
  8. 제7항에 있어서,
    상기 데드존 양자화기들 중 적어도 하나는 어댑티브 커버리지 데드존 양자화기(adaptive coverage Deadzone Quantizer)를 포함하는 방법.
  9. 제7항에 있어서,
    상기 데드존 양자화기들 중 적어도 하나는 가변 커버리지 크기 데드존 양자화기(variabel coverage size Deadzone Quantizer)를 포함하는 방법.
  10. 제1항에 있어서,
    상기 양자화된 데이터 부분들 중 하나를 선택적으로 출력하는 단계는 상기 양자화된 부분들 중 상기 하나를 인코딩하는 단계를 더 포함하는 방법.
  11. 제1항에 있어서,
    상기 적어도 하나의 임계치에 기초하여 상기 양자화된 데이터 부분들 중 하나를 선택적으로 출력하는 단계는, 레이트 디스토션 최적화(RDO;rate distortion optimization)를 이행하여 상기 양자화된 데이터 부분들 중의 하나를 선택하는 단계를 더 포함하는 방법.
  12. 이미지 데이터의 적어도 일부분에 대하여 적어도 하나의 특성 분석을 이행하는 단계;
    상기 적어도 하나의 특성 분석에 기초하여 인코더 내에 적어도 하나의 어댑티브 양자화 파라미터(adaptive quantization parameter)를 선택적으로 설정하는 단계; 및
    상기 인코더로 상기 이미지 데이터의 적어도 일부분을 인코딩하는 단계를 포함하는 방법.
  13. 제12항에 있어서,
    상기 적어도 하나의 특성분석은, 에지 특성, 텍스쳐 특성, 평활 특성, 루미넌스 특성, 크로미넌스 특성, 컬러 특성, 노이즈 특성, 오브젝트 특성, 모션 특성, 사용자 선호도 특성, 사용자 인터페이스 포커스 특성, 레이어링 특성, 타이밍 특성, 품질 특성, 비트 레이트 특성, 데이터형 특성, 및 해상도 특성을 포함하는 특성들의 그룹으로부터 선택되는 적어도 하나의 이미지 분석 특정을 고려하는 방법.
  14. 제12항에 있어서,
    상기 적어도 하나의 어댑티브 양자화 파라미터는 상기 인코더 내에 어댑티브 커버리지 데드존 양자화기와 관련되는 방법.
  15. 제12항에 있어서,
    상기 적어도 하나의 특성 분석에 기초하여 상기 인코더 내에 상기 적어도 하나의 어댑티브 양자화 파라미터를 선택적으로 설정하는 단계는, 비디오 프레임을 포함하는 상기 복수개의 이미지 데이터 부분들 각각에 대하여 온 더 플라이 방식으로(on-the-fly) 이행되는 방법.
  16. 적어도 2개의 서로 다른 데드존 양자화기를 이용하여 이미지 데이터의 적어도 일부분을 인코드하는 단계; 및
    적어도 하나의 판정 팩터(decision factor)에 관련되는 레이트 디스토션 최적화(RDO)에 기초하여 상기 적어도 2개의 서로 다른 데드존 양자화기들 중 하나의 출력에서 바람직한 인코드 데이터를 식별하는 단계를 포함하는 방법.
  17. 제1 데드존 양자화기를 이용하여 이미지 데이터의 적어도 일부분을 인코드하는 단계;
    상기 제1 데드존 양자화기의 출력이 적어도 하나의 판정 팩터를 만족하는 지를 판정하는 단계; 및
    만족하는 경우, 상기 제1 데드존 양자화기의 출력을 출력하며,
    만족하지 않는 경우, 상기 제1 데드존 양자화기와 다른 적어도 제2 데드존 양자화기를 이용하여 상기 제1 이미지 데이터의 일부분을 인코드하는 단계를 포함하는 방법.
  18. 제17항에 있어서,
    레이트 디스토션 최적화(RDO; rate distortion optimization) 판정에 기초하여 상기 이미지 데이터의 적어도 일부분의 허용가능한 인코딩 버젼(acceptable encoded version)을 식별하는 단계를 더 포함하는 방법.
  19. 이미지 데이터의 적어도 일부분에 대하여 이미지 분석을 이행하는 단계;
    상기 분석된 이미지 데이터 부분에 대하여 블록 분류를 이행하는 단계;
    상기 블록 분류된 이미지 데이터 부분의 데드존 양자화를 이행하는 단계; 및
    상기 데드존 양자화된 이미지 데이터 부분의 인코딩을 이행하는 단계를 포함하는 방법.
  20. 제19항에 있어서,
    상기 이미지 분석은 에지 탐지 분석 및 텍스쳐 분석을 포함하는 그룹으로부터 선택되는 적어도 한 유형의 분석을 포함하는 방법.
  21. 제19항에 있어서,
    상기 블록 분류는 상기 이미지 분석에 기초하여 동작 구성되며, 상기 데드존 양자화는 상기 블록 분류에 기초하여 동작 구성되는 방법.
  22. 적어도 2개의 서로 다른 인코더를 이용하여 비디오 이미지 데이터의 적어도 일부분을 인코드하는 단계 -상기 2개의 서로 다른 인코더들 중 적어도 하나는 상기비디오 이미지 데이터의 논 레지두얼 모드(Non Residual mode)를 지원하도록 동작 된 데드존 양자화기를 포함함-; 및
    적어도 하나의 판정 팩터에 관련되는 레이트 디스토션 최적화(RDO) 판정에 기초하여 상기 적어도 2개의 서로 다른 인코더 중 하나의 출력에서 바람직한 인코드 프레임 데이터를 식별하는 단계를 포함하는 방법.
  23. 제22항에 있어서,
    상기 데드존 양자화기는 어댑티브하며, 상기 논 레지두얼 모드를 선택적으로 사용하는 방법.
  24. 제22항에 있어서,
    상기 인코더들 중 적어도 하나는 상기 비디오 이미지 데이터의 다이렉트 모드(Direct Mode)를 지원하도록 동작 구성되는 방법.
  25. 제22항에 있어서,
    상기 인코더들 중 적어도 하나는 상기 비디오 이미지 데이터의 카피 모드(Copy Mode)를 지원하도록 동작 구성되는 방법.
  26. 제22항에 있어서,
    상기 논 레지두얼 모드는 런 렝쓰 인코딩(RLC;Run Length enCoding) 방식에기초하여 동작 구성되는 방법.
  27. 제22항에 있어서,
    상기 데드존 양자화기는 어댑티브하게 동작하는 방법.
  28. 제22항에 있어서,
    상기 데드존 양자화기는 상기 비디오 이미지 데이터의 적어도 일부분에 관련되는 적어도 하나의 특성에 기초하여 동작 구성되는 방법.
  29. 제22항에 있어서,
    상기 바람직한 인코드 프레임을 식별하는 단계는 상기 다이렉트 모드 프레임 데이터에 관련되는 레지듀(residue)의 양을 분석하는 단계를 더 포함하는 방법.
  30. 제29항에 있어서,
    상기 레지듀의 양을 분석하는 단계는 상기 다이렉트 모드 프레임 데이터의 코드화된 블록 패턴(CBP;Coded Block Pattern)을 검사하는 단계를 더 포함하는 방법.
  31. 제22항에 있어서,
    상기 데드존 양자화기를 구비한 상기 인코더는, 크로미넌스 레지듀데이터(chrominance residue data), 루미넌스 레지듀 데이터(luminance residue data), 및 모든 레지듀 데이터를 포함하는 레지듀 데이터 그룹으로부터 선택되는 적어도 한 유형의 레지듀를 제거하도록 동작 구성되는 방법.
  32. 이미지 데이터의 적어도 일부분의 적어도 하나의 특성에 기초하여 양자화 함수를 갖는 인코딩 로직을 동작 구성하는 적어도 하나의 라그랑지 곱수(Lagrangian multiplier)를 선택적으로 변경하는 단계; 및
    상기 인코딩 로직을 이용하여 상기 이미지 데이터의 적어도 일부분을 인코딩하는 단계를 포함하는 방법.
  33. 제32항에 있어서,
    상기 양자화 함수는
    에 기초하는 매크로블록 양자화기를 포함하며, 여기서, λ는 모드 판정에 대한 상기 라그랑지 곱수가며, Mode는 레이트 디스토션 최적화(RDO) 프로세스를 이용하여 검사되는 매크로블록 모드를 나타내는 방법.
  34. 제32항에 있어서,
    상기 라그랑지 곱수는 인터 프레임(Inter frame) 또는 인트라 프레임(Intra frame)에 대해 선택되는 방법.
  35. 제33항에 있어서,
    인 방법.
  36. 제33항에 있어서,
    인 방법.
  37. 인코더 로직(encoder logic)을 사용하여 비디오 이미지 데이터의 적어도 일부분을 인코딩하는 단계; 및
    상기 인코더 로직이 상기 인코더 로직에 의해 채용되는 모션 벡터 예측 유형을 식별하는 구문 정보를 출력하도록 하는 단계를 포함하는 방법.
  38. 제37항에 있어서,
    상기 인코더 로직은 공간 모션 벡터 예측(spatial motion vector prediction) 및 시간 모션 벡터 예측(temporal motion vector prediction)을 포함하는 그룹으로부터 선택되는 적어도 하나의 모션벡터 예측 유형을 선택적으로 채용하도록 구성되며, 레이트 디스토션 최적화(RDO) 판정에 적어도 부분적으로 기초하여 상기 구문정보와 대응 인코드된 비디오 이미지 데이터를 선택적으로 출력하도록 구성되는 방법.
  39. 비디오 인코딩 관련 정보를 전달하는 데 사용되는 방법에 있어서,
    비디오 데이터를 인코딩하는 단계; 및
    상기 인코드된 비디오 데이터의 구문 부분 내에 적어도 하나의 디스크립터(descriptor)를 선택적으로 설정하는 단계 -상기 디스크립터는 상기 비디오 데이터로 인코드된 적어도 하나의 B 프레임에 관련되는 어댑티브 공간/시공간 인코딩(adaptive Spatial/Sptio-temporal encoding)을 식별함- 를 포함하는 방법.
  40. 제39항에 있어서,
    상기 비디오 데이터를 인코딩하는 단계는, JVT 표준에 따라 상기 비디오 데이터를 인코딩하는 단계를 포함하며, 상기 인코드된 비디오 데이터의 구문 부분 내의 상기 적어도 하나의 디스크립터는 상기 인코드된 비디오 데이터의 픽쳐 레이어 부분을 갖는 direct_mv_spatial 파라미터를 포함하는 방법.
  41. 비디오 인코딩 관련정보를 전달하는 데 사용되는 방법에 있어서,
    비디오 데이터를 인코딩하는 단계; 및
    상기 인코드된 비디오 데이터의 구문 부분 내에 적어도 하나의 디스크립터를 선택적으로 설정하는 단계 -상기 디스크립터는 상기 비디오 데이터로 인코드된 적어도 하나의 인터 프레임 내에 어댑티브 카피/모션 카피 스킵 모드(adaptive Copy/Motion-Copy skip mode)를 식별함- 를 포함하는 방법.
  42. 제41항에 있어서,
    상기 비디오 데이터를 인코딩하는 단계는, JVT 표준에 따라 상기 비디오 데이터를 인코딩하는 단계를 포함하며, 상기 인코드된 비디오 데이터의 상기 구문 부분 내의 상기 적어도 하나의 디스크립터는 상기 인코드된 비디오 데이터의 픽쳐 레이터 부분을 갖는 copy_mv_spatial 파라미터를 포함하는 방법.
  43. 비디오 프레임의 정적 시간/공간(stationary temporal/spatial)을 고려한 비디오의 타임 스탬프 독립 모드 인코딩(time stamp independent mode encoding)에 사용되는 방법에 있어서,
    비디오 시퀀스 내에 비디오 프레임의 적어도 일부분에 관련되는 모션의 공간 예측을 선택적으로 적용하는 단계; 및
    다른 비디오 프레임의 참조 부분에 대한 시간 모션 예측 정보(spatial motion prediction information)가 0이면, 상기 모션의 공간 예측을 0으로 설정하는 단계를 포함하는 방법.
  44. 제43항에 있어서,
    상기 공간 예측은 공간 0 바이어스되는(spatial zero biased) 방법.
  45. 제43항에 있어서,
    상기 공간 예측은 상기 비디오 프레임 내에 다른 부분의 정적 서브 파티션(stationary subpartition)을 더 고려하며, 상기 서브 파티션들 중 적어도 하나가 거의 0인 대응 모션을 가지면, 상기 다른 부분도 0인 모션을 갖는 것으로 간주되는 방법.
  46. 복수개의 서로 다른 양자화 함수를 사용하여 데이터의 적어도 일부분을 처리하여 복수개의 대응하여 양자화된 데이터 부분을 생성하는 단계; 및
    적어도 하나의 임계치에 기초하여 상기 양자화된 데이터 부분들 중 하나를 선택적으로 출력하는 단계를 포함하는 동작을 이행하도록, 적어도 하나의 처리부를 구성하기 위한 컴퓨터 구현가능 명령을 갖는 컴퓨터 판독가능 매체.
  47. 제46항에 있어서,
    초기 데이터를 상기 데이터의 적어도 일부분을 포함하는 복수개의 부분으로 분할하는 단계; 및
    적어도 하나의 분류 특성에 기초하여 상기 데이터의 적어도 일부분을 분류하는 단계를 더 포함하는 컴퓨터 판독가능 매체.
  48. 제47항에 있어서,
    상기 적어도 하나의 임계치는 상기 적어도 하나의 분류 특정에 관련된 컴퓨터 판독가능 매체.
  49. 제47항에 있어서,
    상기 초기 데이터는, 이미지 데이터, 비디오 데이터, 오디오 데이터, 및 스피치 데이터를 포함하는 그룹으로부터 선택되는 데이터를 포함하며, 상기 초기 데이터는 이미지 데이터 또는 비디오 데이터를 포함하며, 상기 적어도 일부분은 블록, 매크로블록, 슬릿, 슬라이스, 및 섹션을 포함하는 그룹으로부터 선택되는 컴퓨터 판독가능 매체.
  50. 제47항에 있어서,
    상기 적어도 하나의 분류 특성은, 에지 특성, 텍스쳐 특성, 평활 특성, 루미넌스 특성, 크로미넌스 특성, 컬러 특성, 노이즈 특성, 오브젝트 특성, 모션 특성, 사용자 선호도 특성, 사용자 인터페이스 포커스 특성, 레이어링 특성, 타이밍 특성, 볼륨 특성, 주파수 특성, 피치 특성, 톤 특성, 품질 특성, 비트 레이트 특성,데이터형 특성, 해상도 특성, 및 암호화 특성을 포함하는 특성들의 그룹으로부터 선택되는 컴퓨터 판독가능 매체.
  51. 제46항에 있어서,
    상기 복수개의 서로 다른 양자화 함수는 적어도 2개의 서로 달리 동작하는데드존 양자화기를 포함하며, 상기 데드존 양자화기들 중 적어도 하나는 어댑티브 커버리지 데드존 양자화기를 포함하는 컴퓨터 판독가능 매체.
  52. 제46항에 있어서,
    상기 적어도 하나의 임계치에 기초하여 상기 양자화된 데이터 부분들 중 하나를 선택적으로 출력하는 단계는, 상기 양자화된 데이터 부분들 중 하나를 선택하기 위해서 레이트 디스토션 최적화(RDO)를 이행하는 단계를 더 포함하는 컴퓨터 판독가능 매체.
  53. 이미지 데이터의 적어도 일부분에 대하여 적어도 하나의 특성 분석을 이행하는 단계;
    상기 적어도 하나의 특성 분석에 기초하여 인코더 내의 적어도 하나의 어댑티브 양자화 파라미터를 선택적으로 설정하는 단계; 및
    상기 인코더로 상기 이미지 데이터의 적어도 일부분을 인코딩하는 단계를 포함하는 동작을 이행하도록, 적어도 하나의 처리부를 구성하기 위한 컴퓨터 구현가능 명령을 갖는 컴퓨터 판독가능 매체.
  54. 제53항에 있어서,
    상기 적어도 하나의 어댑티브 양자화 파라미터는 상기 인코더 내에서 어댑티브 커버리지 데드존 양자화기에 관련되는 컴퓨터 판독가능 매체.
  55. 제53항에 있어서,
    상기 적어도 하나의 특성 분석에 기초하여 상기 인코더 내의 적어도 하나의 어댑티브 양자화 파라미터를 선택적으로 설정하는 단계는, 비디오 프레임을 포함하는 상기 이미지 데이터의 복수개의 부분 각각에 대하여 온 더 플라이 방식으로 이행되는 컴퓨터 판독가능 매체.
  56. 적어도 2개의 서로 다른 데드존 양자화기를 사용하여 이미지 데이터의 적어도 일부분을 인코드하는 단계; 및
    적어도 하나의 판정 팩터에 관련되는 레이트 디스토션 최적화(RDO)에 기초하여 상기 적어도 서로 다른 데드존 양자화기들 중 하나의 출력에서 바람직한 인코드 데이터를 식별하는 단계를 포함하는 동작을 이행하도록, 적어도 하나의 처리부를 구성하기 위한 컴퓨터 구현가능 명령을 갖는 컴퓨터 판독가능 매체.
  57. 제1 데드존 양자화기를 사용하여 이미지 데이터의 적어도 일부분을 인코드하는 단계;
    상기 제1 데드존 양자화기가 적어도 하나의 판정 팩터를 충족하는 지를 판정하는 단계;
    만약 그렇다면, 상기 제1 데드존 양자화기의 출력을 출력시키는 단계;
    그렇지 않다면, 상기 제1 데드존 양자화기와 다른 적어도 제2 데드존 양자화기를 사용하여 상기 이미지 데이터의 적어도 일부분을 인코드하는 단계를 포함하는 동작을 이행하도록, 적어도 하나의 처리부를 구성하기 위한 컴퓨터 구현가능 명령을 갖는 컴퓨터 판독가능 매체.
  58. 제57항에 있어서,
    레이트 디스토션 최적화(RDO) 판정에 기초하여 상기 이미지 데이터의 적어도 일부분의 허용가능 인코드 버전을 식별하는 단계를 더 포함하는 컴퓨터 판독가능 매체.
  59. 이미지 데이터의 적어도 일부분에 대하여 이미지 분석을 이행하는 단계;
    상기 분석된 이미지 데이터 부분에 대하여 블록 분류를 이행하는 단계;
    상기 블록 분류된 이미지 데이터 부분의 데드존 양자화를 이행하는 단계; 및
    상기 데드존 양자화된 이미지 데이터 부분의 인코딩을 이행하는 단계를 포함하는 동작을 이행하도록, 적어도 하나의 처리부를 구성하기 위한 컴퓨터 구현가능 명령을 갖는 컴퓨터 판독가능 매체.
  60. 제59항에 있어서,
    상기 이미지 분석은 에지 탐지 및 텍스쳐 분석을 포함하는 그룹으로부터 선택되는 적어도 한 유형의 분석을 포함하는 컴퓨터 판독가능 매체.
  61. 제59항에 있어서,
    상기 블록 분류는 상기 이미지 분석에 기초하여 동작 구성되며, 상기 데드존 양자화는 상기 블록 분류에 기초하여 동작 구성되는 컴퓨터 판독가능 매체.
  62. 적어도 2개의 서로 다른 인코더를 사용하여 비디오 이미지 데이터의 적어도 일부분을 인코드하는 단계 -상기 2개의 서로 다른 인코더들 중 적어도 하나는 상기 비디오 이미지 데이터의 논 레지두얼 모드를 지원하도록 동작 구성되는 데드존 양자화기를 포함함-; 및
    적어도 하나의 판정 팩터에 관련되는 레이트 디스토션 최적화(RDO) 판정에 기초하여 상기 적어도 2개의 서로 다른 인코더의 출력 내에서 바람직한 인코드 프레임 데이터를 식별하는 단계를 포함하는 동작을 이행하도록, 적어도 하나의 처리부를 구성하기 위한 컴퓨터 구현가능 명령을 갖는 컴퓨터 판독가능 매체.
  63. 제62항에 있어서,
    상기 데드존 양자화기는 어댑티브하며, 상기 논 레지두얼 모드가 사용하는 컴퓨터 판독가능 매체.
  64. 제62항에 있어서,
    상기 인코더들 중 적어도 하나는 상기 비디오 이미지 데이터의 다이렉트 모드를 지원하도록 동작 구성되는 컴퓨터 판독가능 매체.
  65. 제62항에 있어서,
    상기 인코더들 중 적어도 하나는 상기 비디오 이미지 데이터의 카피 모드를 지원하도록 동작 구성되는 컴퓨터 판독가능 매체.
  66. 제62항에 있어서,
    상기 논 레지두얼 모드는 런 렝쓰 인코딩(RLC) 방식에 기초하여 동작 구성되는 컴퓨터 판독가능 매체.
  67. 제62항에 있어서,
    상기 데드존 양자화기를 갖는 상기 인코더는, 크로미넌스 레지듀 데이터, 루미넌스 레지듀 데이터, 및 모든 레지듀 데이터를 포함하는 레지듀 데이터의 그룹으로부터 선택되는 적어도 한 유형의 레지듀를 제거하도록 동작 구성되는 컴퓨터 판독가능 매체.
  68. 이미지 데이터의 적어도 일부분의 적어도 하나의 특성에 기초하여 양자화 함수를 갖는 인코딩 로직을 동작 구성하는 적어도 하나의 라그랑지 곱수를 선택적으로 변경하는 단계; 및
    상기 인코딩 로직을 사용하여 상기 이미지 데이터의 상기 적어도 일부분을 인코딩하는 단계를 포함하는 동작을 이행하도록, 적어도 하나의 처리부를 구성하기위한 컴퓨터 구현가능 명령을 갖는 컴퓨터 판독가능 매체.
  69. 인코더 로직을 사용하여 비디오 이미지 데이터의 적어도 일부분을 인코딩하는 단계; 및
    상기 인코더 로직이 상기 인코더 로직에 의해 채용되는 모션 백터 예측 유형을 식별하는 구문 정보를 출력하도록 하는 단계를 포함하는 동작을 이행하도록, 적어도 하나의 처리부를 구성하기 위한 컴퓨터 구현가능 명령을 갖는 컴퓨터 판독가능 매체.
  70. 비디오 데이터를 인코딩하는 단계; 및
    상기 인코드된 비디오 데이터의 구문 부분 내에 적어도 하나의 디스크립터를 선택적으로 설정하는 단계 -상기 디스크립터는 상기 비디오 데이터로 인코드된 적어도 하나의 B 프레임과 관련되는 어댑티브 공간/시공간 인코딩을 식별함- 를 포함하는 동작을 이행하도록, 적어도 하나의 처리부를 구성하기 위한 컴퓨터 구현가능 명령을 갖는 컴퓨터 판독가능 매체.
  71. 제70항에 있어서,
    상기 비디오 데이터를 인코딩하는 단계는 JVT 표준에 따라 상기 비디오 데이터를 인코딩하는 단계를 포함하며, 상기 인코드된 비디오 데이터의 상기 구문 부분 내에서 상기 적어도 하나의 디스크립터는 상기 인코드된 비이오 데이터의 픽쳐 레이어 부분을 갖는 direct_mv_spatial 파라미터를 포함하는 컴퓨터 판독가능 매체.
  72. 비디오 데이터를 인코딩하는 단계; 및
    상기 인코드된 비디오 데이터의 구문 부분 내에 적어도 하나의 디스크립터를 선택적으로 설정하는 단계 -상기 디스크립터는 상기 비디오 데이터로 인코드된 적어도 하나의 인터 프레임 내에 어댑티브 카피/모션 카피 스킵 모드를 식별함- 를 포함하는 동작을 이행하도록, 적어도 하나의 처리부를 구성하기 위한 컴퓨터 구현가능 명령을 갖는 컴퓨터 판독가능 매체.
  73. 제41항에 있어서,
    상기 비디오 데이터를 인코딩하는 단계는 JVT 표준에 따라 상기 비디오 데이터를 인코딩하는 단계를 포함하며, 상기 인코드된 비디오 데이터의 상기 구문 부분 내에서 적어도 하나의 디스크립터는 상기 인코드된 비디오 데이터의 픽쳐 레이어 부분을 갖는 copy_mv_spatial 파라미터를 포함하는 컴퓨터 판독가능 매체.
  74. 비디오 시퀀스 내에 비디오 프레임의 적어도 일부분에 관련되는 모션의 공간예측을 선택적으로 적용하는 단계; 및
    다른 비디오 프레임의 참조 부분에 대한 시간 모션 예측정보가 0이면, 상기 모션의 공간예측을 0으로 설정하는 단계를 포함하는 동작을 이행하도록, 적어도 하나의 처리부를 구성하기 위한 컴퓨터 구현가능 명령을 갖는 컴퓨터 판독가능 매체.
  75. 제43항에 있어서,
    상기 공간예측은 공간 0 바이어스되는 컴퓨터 판독가능 매체.
  76. 제43항에 있어서,
    상기 공간예측은 상기 비디오 프레임 내에 다른 부분의 정적 서브 파티션을 더 고려하고, 상기 서브 파티션들 중 적어도 하나가 대략 0인 대응 모션을 가지면, 상기 다른 부분은 또한 0 모션을 갖는 것으로 간주되는 컴퓨터 판독가능 매체.
  77. 복수개의 서로 다른 양자화 함수를 이용하여 데이터의 적어도 일부분을 처리하여 복수개의 대응하여 양자화된 데이터 부분을 생성하고,
    적어도 하나의 임계치에 기초하여 상기 양자화된 데이터 부분들 중 하나를 선택적으로 출력하도록 동작 구성되는 로직을 포함하는 장치.
  78. 제77항에 있어서,
    상기 로직은, 초기 데이터를 상기 데이터의 적어도 일부분을 포함하는 복수개의 부분으로 분할하고, 적어도 하나의 분류 특성에 기초하여 상기 데이터의 적어도 일부분을 분류하도록 더 구성되며,
    상기 적어도 하나의 임계치는 상기 적어도 하나의 분류 특성에 관련되는 장치.
  79. 제77항에 있어서,
    상기 복수개의 서로 다른 양자화 함수는 적어도 2개의 서로 달리 동작하는 데드존 양자화기를 포함하며,
    상기 데드존 양자화기들 중 적어도 하나는 어댑티브 커버리지 데드존 양자화기를 포함하는 장치.
  80. 제77항에 있어서,
    상기 로직은 상기 양자화된 데이터 부분들 중 하나를 선택하기 위해서 레이트 디스토션 최적화(RDO)를 이행하도록 더 구성되는 장치.
  81. 이미지 데이터의 적어도 일부분에 대하여 적어도 하나의 특성 분석을 이행하고, 상기 적어도 하나의 특성 분석에 기초하여 인코더 내에 적어도 하나의 어댑티브 양자화 파라미터를 선택적으로 확립하며, 상기 인코더 내에 상기 이미지 데이터 의 적어도 일부분이 인코드되도록 동작 구성되는 로직을 포함하는 장치.
  82. 제81항에 있어서,
    상기 적어도 하나의 어댑티브 양자화 파라미터는 상기 인코더 내에 어댑티브 커버리지 데드존 양자화기에 관련되는 장치.
  83. 적어도 2개의 서로 다른 데드존 양자화기를 이용하여 이미지 데이터의 적어도 일부분이 인코드되도록 하며, 적어도 하나의 판정 팩터에 관련된 레이트 디스토션 최적화(RDO)에 기초하여 적어도 2개의 서로 다른 데드존 양자화기들 중 하나의 출력 내에서 바람직한 인코드 데이터를 식별하도록 동작하게 구성되는 로직을 포함하는 장치.
  84. 제1 데드존 양자화기를 이용하여 이미지 데이터의 적어도 일부분이 인코드되도록 하며, 상기 제1 데드존 양자화기의 출력이 적어도 하나의 판정 팩터를 충족하는지를 판단하여, 충족한다면, 상기 제1 데드존 양자화기의 출력을 출력시키고, 충족하지 않으면, 상기 제1 데드존 양자화기와 다른 적어도 제2 데드존 양자화기를 이용하여 상기 이미지 데이터의 적어도 일부분이 인코드되도록 동작 구성되는 로직을 포함하는 장치.
  85. 제84항에 있어서,
    상기 로직은 레이트 디스토션 최적화(RDO) 판정에 기초하여 상기 이미지 데이터의 적어도 일부분의 허용가능 인코드 버젼을 식별하도록 더 구성되는 장치.
  86. 상기 이미지 데이터의 적어도 일부분에 대한 이미지 분석을 이행하고, 상기 분석된 이미지 데이터 부분에 대하여 블록 분류를 이행하며, 상기 블록 분류된 이미지 데이터 부분의 데드존 양자화를 이행하고, 상기 데드존 양자화된 이미지 데이터 부분이 인코드되도록 동작 구성되는 로직을 포함하는 장치.
  87. 적어도 2개의 서로 다른 인코더를 이용하여 비디오 이미지 데이터의 적어도 일부분을 인코드하도록 동작 구성되며, 상기 2개의 서로 다른 인코더들 중 적어도 하나는, 상기 비디오 이미지 데이터의 논 레지두얼 모드를 지원하며 적어도 하나의 판정 팩터에 관련된 레이트 디스토션 최적화(RDO) 판정에 기초하여 상기 적어도 2개의 서로 다른 인코더의 출력에서 바람직한 인코드된 프레임 데이터를 식별하도록 동작 구성되는 데드존 양자화기를 포함하는 장치.
  88. 제87항에 있어서,
    상기 데드존 양자화기는 어댑티브하고 상기 논 레지두얼 모드를 선택적으로 사용하는 장치.
  89. 제87항에 있어서,
    상기 인코더들 중 적어도 하나는 상기 비디오 이미지 데이터의 다이렉트 모드와 상기 비디오 이미지 데이터의 카피 포드를 포함하는 그룹으로부터 선택되는 적어도 하나의 모드를 지원하도록 동작 구성되는 장치.
  90. 이미지 데이터의 적어도 일부분의 적어도 하나의 특성에 기초하여 양자화 함수를 갖는 인코딩 로직을 동작 구성하는 적어도 하나의 라그랑지 곱수를 선택적으로 변경시키며, 상기 인코딩 로직을 이용하여 상기 이미지 데이터의 적어도 일부분이 인코드되도록 동작 구성되는 로직을 포함하는 장치.
  91. 인코더 로직을 이용하여 비디오 이미지 데이터의 적어도 일부분을 인코드하며, 상기 인코더 로직이, 상기 인코더 로직에 의해 채용된 모션 벡터 예측 유형을 식별하는 구분 정보를 출력하도록 동작 구성되는 로직을 포함하는 장치.
  92. 비디오 이미지를 인코드하고, 상기 인코드된 비디오 데이터의 구문 부분 내에 적어도 하나의 디스크립터를 선택적으로 설정하고, 상기 디스크립터는 상기 비디오 데이터로 인코드된 적어도 하나의 B 프레임에 관련되는 어댑티브 공간/시공간 인코딩을 식별하도록 동작 구성되는 로직을 포함하는 장치.
  93. 비디오 이미지를 인코드하고, 상기 인코드된 비디오 데이터의 구문 부분 내에 적어도 하나의 디스크립터를 선택적으로 설정하고, 상기 디스크립터는 상기 비디오 데이터로 인코드된 적어도 하나의 인터 프레임에 관련되는 어댑티브 카피/모션 카피 스킵 모드를 식별하도록 동작 구성되는 로직을 포함하는 장치.
  94. 비디오 시퀀스 내에서 비디오 프레임의 적어도 일부분에 관련된 모션의 공간 예측을 선택적으로 적용하고, 만약 다른 비디오 프레임의 참조 부분에 대한 시간 모션 예측 정보가 0이면, 상기 모션의 공간 예측을 0으로 설정하도록 동작 구성된로직을 포함하는 장치.
KR1020030045330A 2002-07-05 2003-07-04 비디오를 인코딩 및 디코딩하기 위한 방법 및 하나 이상의 컴퓨터로 하여금 비디오를 디코딩하기 위한 방법을 수행하게 하는 컴퓨터 실행가능 명령어가 저장된 하나 이상의 컴퓨터 판독가능 매체 KR100965703B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US39389402P 2002-07-05 2002-07-05
US60/393,894 2002-07-05

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020100028167A Division KR101038860B1 (ko) 2002-07-05 2010-03-29 비디오를 인코딩 및 디코딩하기 위한 방법

Publications (2)

Publication Number Publication Date
KR20040004178A true KR20040004178A (ko) 2004-01-13
KR100965703B1 KR100965703B1 (ko) 2010-06-24

Family

ID=29720452

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020030045330A KR100965703B1 (ko) 2002-07-05 2003-07-04 비디오를 인코딩 및 디코딩하기 위한 방법 및 하나 이상의 컴퓨터로 하여금 비디오를 디코딩하기 위한 방법을 수행하게 하는 컴퓨터 실행가능 명령어가 저장된 하나 이상의 컴퓨터 판독가능 매체
KR1020100028167A KR101038860B1 (ko) 2002-07-05 2010-03-29 비디오를 인코딩 및 디코딩하기 위한 방법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020100028167A KR101038860B1 (ko) 2002-07-05 2010-03-29 비디오를 인코딩 및 디코딩하기 위한 방법

Country Status (7)

Country Link
US (1) US7280700B2 (ko)
EP (2) EP1379090A3 (ko)
JP (1) JP4662697B2 (ko)
KR (2) KR100965703B1 (ko)
CN (1) CN100394447C (ko)
BR (1) BR0301992A (ko)
HK (1) HK1156454A1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100694050B1 (ko) * 2004-06-11 2007-03-12 삼성전자주식회사 움직임 예측 방법 및 그 장치
KR100790986B1 (ko) * 2006-03-25 2008-01-03 삼성전자주식회사 가변 비트율 비디오 코딩에서 비트율을 제어하는 장치 및방법
KR100957073B1 (ko) * 2008-11-19 2010-05-13 고려대학교 산학협력단 지문영상의 품질에 기초한 선택적 영상압축장치 및 방법, 그리고 이를 이용한 인증장치
US9071840B2 (en) 2004-01-30 2015-06-30 Thomson Licensing Encoder with adaptive rate control for H.264

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7003035B2 (en) * 2002-01-25 2006-02-21 Microsoft Corporation Video coding methods and apparatuses
JP4019790B2 (ja) * 2002-05-23 2007-12-12 富士ゼロックス株式会社 画像処理装置および画像処理プログラム
US20040001546A1 (en) 2002-06-03 2004-01-01 Alexandros Tourapis Spatiotemporal prediction for bidirectionally predictive (B) pictures and motion vector prediction for multi-picture reference motion compensation
US7280700B2 (en) 2002-07-05 2007-10-09 Microsoft Corporation Optimization techniques for data compression
US7154952B2 (en) 2002-07-19 2006-12-26 Microsoft Corporation Timestamp-independent motion vector prediction for predictive (P) and bidirectionally predictive (B) pictures
CN1206864C (zh) * 2002-07-22 2005-06-15 中国科学院计算技术研究所 结合率失真优化的码率控制的方法及其装置
US7609763B2 (en) * 2003-07-18 2009-10-27 Microsoft Corporation Advanced bi-directional predictive coding of video frames
US8064520B2 (en) * 2003-09-07 2011-11-22 Microsoft Corporation Advanced bi-directional predictive coding of interlaced video
EP1564997A1 (en) * 2004-02-12 2005-08-17 Matsushita Electric Industrial Co., Ltd. Encoding and decoding of video images based on a quantization with an adaptive dead-zone size
US8743956B2 (en) * 2004-02-20 2014-06-03 Nec Corporation Image encoding method, device thereof, and control program thereof
CN1296824C (zh) * 2004-10-28 2007-01-24 威盛电子股份有限公司 程序编码方法及其系统
WO2006052577A2 (en) * 2004-11-04 2006-05-18 Thomson Licensing Method and apparatus for fast mode decision of b-frames in a video encoder
US8548055B2 (en) * 2005-03-10 2013-10-01 Qualcomm Incorporated Encoding of multimedia data
CN101164336B (zh) * 2005-04-22 2010-06-23 松下电器产业株式会社 影像信息记录装置以及影像信息记录方法
US7859574B1 (en) * 2005-07-19 2010-12-28 Maxim Integrated Products, Inc. Integrated camera image signal processor and video encoder
SG135081A1 (en) * 2006-03-03 2007-09-28 Matrixview Ltd Streaming repetition coded compression
US8503536B2 (en) 2006-04-07 2013-08-06 Microsoft Corporation Quantization adjustments for DC shift artifacts
US7995649B2 (en) 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
US8711925B2 (en) 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
WO2008046492A1 (en) * 2006-10-20 2008-04-24 Dolby Sweden Ab Apparatus and method for encoding an information signal
US7885476B2 (en) * 2006-12-14 2011-02-08 Sony Corporation System and method for effectively performing an adaptive encoding procedure
US8437397B2 (en) * 2007-01-04 2013-05-07 Qualcomm Incorporated Block information adjustment techniques to reduce artifacts in interpolated video frames
DE102007005930A1 (de) * 2007-02-06 2008-08-07 Efficient Energy Gmbh Wärmepuppe, Kleinkraftwerk und Verfahren zum Pumpen von Wärme
US8594187B2 (en) * 2007-03-02 2013-11-26 Qualcomm Incorporated Efficient video block mode changes in second pass video coding
US8498335B2 (en) * 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
US8243797B2 (en) 2007-03-30 2012-08-14 Microsoft Corporation Regions of interest for quality adjustments
US8442337B2 (en) 2007-04-18 2013-05-14 Microsoft Corporation Encoding adjustments for animation content
WO2008153262A1 (en) 2007-06-15 2008-12-18 Sungkyunkwan University Foundation For Corporate Collaboration Bi-prediction coding method and apparatus, bi-prediction decoding method and apparatus, and recording midium
US8526499B2 (en) * 2007-06-15 2013-09-03 Sungkyunkwan University Foundation For Corporate Collaboration Bi-prediction coding method and apparatus, bi-prediction decoding method and apparatus, and recording medium
US8116581B2 (en) * 2007-06-28 2012-02-14 Microsoft Corporation Efficient image representation by edges and low-resolution signal
US8254455B2 (en) 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
US8982951B2 (en) * 2008-03-10 2015-03-17 Mediatek Inc. Adaptive motion estimation coding
CN101552924B (zh) * 2008-03-31 2011-08-03 深圳市融创天下科技发展有限公司 一种用于视频编码的空间预测方法
US20090262801A1 (en) * 2008-04-17 2009-10-22 Qualcomm Incorporated Dead zone parameter selections for rate control in video coding
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
US8204964B2 (en) * 2008-08-06 2012-06-19 Microsoft Corporation Efficient size optimization of visual information or auditory information
KR101271512B1 (ko) 2008-09-16 2013-06-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 적응형 비디오 인코더 제어 방법
US8189666B2 (en) 2009-02-02 2012-05-29 Microsoft Corporation Local picture identifier and computation of co-located information
KR102333204B1 (ko) * 2009-08-12 2021-12-02 인터디지털 브이씨 홀딩스 인코포레이티드 개선된 인트라 색차 엔코딩 및 디코딩을 위한 방법 및 장치
MX2013001659A (es) 2010-09-24 2013-03-21 Panasonic Corp Metodo de codificacion de imagen, metodo de decodificacion de imagen, aparato de codificacion de imagen, y aparato de decodificacion de imagen.
US8371941B2 (en) 2010-12-06 2013-02-12 SRM Institute of Science and Technology System and method for game state reduction
US9877019B2 (en) * 2011-01-03 2018-01-23 Hfi Innovation Inc. Method of filter-unit based in-loop filtering
KR20120084168A (ko) * 2011-01-19 2012-07-27 삼성전자주식회사 비디오 인코딩 모드 선택 방법 및 이를 수행하는 비디오 인코딩 장치
US20120294353A1 (en) 2011-05-16 2012-11-22 Mediatek Inc. Apparatus and Method of Sample Adaptive Offset for Luma and Chroma Components
US9112526B2 (en) * 2011-06-15 2015-08-18 Sony Corporation Binarization of DQP using separate absolute value and sign (SAVS) in CABAC
US8711928B1 (en) 2011-10-05 2014-04-29 CSR Technology, Inc. Method, apparatus, and manufacture for adaptation of video encoder tuning parameters
CN102883163B (zh) * 2012-10-08 2014-05-28 华为技术有限公司 用于运动矢量预测的运动矢量列表建立的方法、装置
KR101757341B1 (ko) 2013-01-29 2017-07-14 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 저-복잡도 음조-적응 오디오 신호 양자화
EP3014774A4 (en) * 2013-06-24 2017-04-05 Intel Corporation Dynamic compression/decompression (codec) configuration
CN104486503B (zh) * 2014-12-16 2016-04-13 努比亚技术有限公司 一种移动终端及其语音加密的方法
CN106878727A (zh) * 2016-12-31 2017-06-20 深圳市共进电子股份有限公司 视频数据处理方法及装置
EP3429207A1 (en) * 2017-07-13 2019-01-16 Thomson Licensing A method and apparatus for encoding/decoding a colored point cloud representing the geometry and colors of a 3d object
CN110213593B (zh) * 2018-05-25 2023-01-24 腾讯科技(深圳)有限公司 一种运动矢量的确定方法、编码压缩方法和相关装置

Family Cites Families (130)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US186284A (en) 1877-01-16 Improvement in plow-stocks
JPS56128070A (en) 1980-03-13 1981-10-07 Fuji Photo Film Co Ltd Band compressing equipment of variable density picture
JPS60158786A (ja) 1984-01-30 1985-08-20 Kokusai Denshin Denwa Co Ltd <Kdd> 画像動き量検出方式
US4661849A (en) 1985-06-03 1987-04-28 Pictel Corporation Method and apparatus for providing motion estimation signals for communicating image sequences
US4661853A (en) 1985-11-01 1987-04-28 Rca Corporation Interfield image motion detector for video signals
FR2599577B1 (fr) 1986-05-29 1988-08-05 Guichard Jacques Procede de codage par transformation pour la transmission de signaux d'image.
NL8700565A (nl) 1987-03-10 1988-10-03 Philips Nv Televisiesysteem waarin aan een transformatiekodering onderworpen gedigitaliseerde beeldsignalen worden overgebracht van een kodeerstation naar een dekodeerstation.
DE3855114D1 (de) 1987-05-06 1996-04-25 Philips Patentverwaltung System zur Übertragung von Videobildern
DE3854337T2 (de) 1987-06-09 1996-02-01 Sony Corp Bewegungskompensierte Interpolation von digitalen Fernsehbildern.
EP0294962B1 (en) 1987-06-09 1995-07-19 Sony Corporation Motion vector estimation in television images
FR2648254B2 (fr) 1988-09-23 1991-08-30 Thomson Csf Procede et dispositif d'estimation de mouvement dans une sequence d'images animees
US4985768A (en) 1989-01-20 1991-01-15 Victor Company Of Japan, Ltd. Inter-frame predictive encoding system with encoded and transmitted prediction error
JPH07109990B2 (ja) 1989-04-27 1995-11-22 日本ビクター株式会社 適応型フレーム間予測符号化方法及び復号方法
JPH0832047B2 (ja) 1989-04-28 1996-03-27 日本ビクター株式会社 予測符号化装置
USRE35910E (en) 1989-05-11 1998-09-29 Matsushita Electric Industrial Co., Ltd. Moving image signal encoding apparatus and decoding apparatus
EP0713340B1 (en) 1989-10-14 2001-08-22 Sony Corporation Video signal coding/decoding method and apparatus
JP2787599B2 (ja) 1989-11-06 1998-08-20 富士通株式会社 画像信号符号化制御方式
NL9000424A (nl) 1990-02-22 1991-09-16 Philips Nv Overdrachtsysteem voor gedigitaliseerde televisiebeelden.
JPH082107B2 (ja) 1990-03-02 1996-01-10 国際電信電話株式会社 動画像のハイブリッド符号化方法及びその装置
JPH03265290A (ja) 1990-03-14 1991-11-26 Toshiba Corp テレビジョン信号走査線変換器
US5103306A (en) 1990-03-28 1992-04-07 Transitions Research Corporation Digital image compression employing a resolution gradient
US5091782A (en) 1990-04-09 1992-02-25 General Instrument Corporation Apparatus and method for adaptively compressing successive blocks of digital video
US5068724A (en) 1990-06-15 1991-11-26 General Instrument Corporation Adaptive motion compensation for digital television
US5175618A (en) 1990-10-31 1992-12-29 Victor Company Of Japan, Ltd. Compression method for interlace moving image signals
USRE35093E (en) 1990-12-03 1995-11-21 The Trustees Of Columbia University In The City Of New York Systems and methods for coding even fields of interlaced video sequences
JP3119888B2 (ja) 1991-04-18 2000-12-25 松下電器産業株式会社 信号処理方法及び記録再生装置
JP3226539B2 (ja) 1991-05-24 2001-11-05 ブリティッシュ・ブロードキャスティング・コーポレーション ビデオ画像処理
US5467136A (en) 1991-05-31 1995-11-14 Kabushiki Kaisha Toshiba Video decoder for determining a motion vector from a scaled vector and a difference vector
US5317397A (en) 1991-05-31 1994-05-31 Kabushiki Kaisha Toshiba Predictive coding using spatial-temporal filtering and plural motion vectors
US5539466A (en) 1991-07-30 1996-07-23 Sony Corporation Efficient coding apparatus for picture signal and decoding apparatus therefor
JP2699703B2 (ja) 1991-07-31 1998-01-19 松下電器産業株式会社 動き補償予測方法とそれを用いた画像信号符号化方法
JPH0541862A (ja) 1991-08-03 1993-02-19 Sony Corp 動きベクトルの可変長符号化方式
US5428396A (en) 1991-08-03 1995-06-27 Sony Corporation Variable length coding/decoding method for motion vectors
JP2507204B2 (ja) 1991-08-30 1996-06-12 松下電器産業株式会社 映像信号符号化装置
JP2586260B2 (ja) 1991-10-22 1997-02-26 三菱電機株式会社 適応的ブロッキング画像符号化装置
JP2962012B2 (ja) 1991-11-08 1999-10-12 日本ビクター株式会社 動画像符号化装置及びその復号装置
US5231484A (en) * 1991-11-08 1993-07-27 International Business Machines Corporation Motion video compression system with adaptive bit allocation and quantization
US5510840A (en) 1991-12-27 1996-04-23 Sony Corporation Methods and devices for encoding and decoding frame signals and recording medium therefor
CA2088082C (en) * 1992-02-07 1999-01-19 John Hartung Dynamic bit allocation for three-dimensional subband video coding
US5594813A (en) 1992-02-19 1997-01-14 Integrated Information Technology, Inc. Programmable architecture and methods for motion estimation
US5293229A (en) 1992-03-27 1994-03-08 Matsushita Electric Corporation Of America Apparatus and method for processing groups of fields in a video data compression system
KR0166716B1 (ko) 1992-06-18 1999-03-20 강진구 블럭 dpcm을 이용한 부호화/복호화방법 및 장치
US5666461A (en) 1992-06-29 1997-09-09 Sony Corporation High efficiency encoding and decoding of picture signals and recording medium containing same
KR0166722B1 (ko) 1992-11-30 1999-03-20 윤종용 부호화 및 복호화방법 및 그 장치
US5467134A (en) 1992-12-22 1995-11-14 Microsoft Corporation Method and system for compressing video data
US5400075A (en) 1993-01-13 1995-03-21 Thomson Consumer Electronics, Inc. Adaptive variable length encoder/decoder
ES2431289T3 (es) 1993-03-24 2013-11-25 Sony Corporation Método de decodificación de señal de imagen y aparato asociado
US5442400A (en) 1993-04-29 1995-08-15 Rca Thomson Licensing Corporation Error concealment apparatus for MPEG-like video data
EP0625853B1 (en) 1993-05-21 1999-03-03 Nippon Telegraph And Telephone Corporation Moving image encoder and decoder
US5448297A (en) 1993-06-16 1995-09-05 Intel Corporation Method and system for encoding images using skip blocks
US5477272A (en) 1993-07-22 1995-12-19 Gte Laboratories Incorporated Variable-block size multi-resolution motion estimation scheme for pyramid coding
US5734755A (en) 1994-03-11 1998-03-31 The Trustees Of Columbia University In The City Of New York JPEG/MPEG decoder-compatible optimized thresholding for image and video signal compression
TW283289B (ko) 1994-04-11 1996-08-11 Gen Instrument Corp
US5796438A (en) 1994-07-05 1998-08-18 Sony Corporation Methods and apparatus for interpolating picture information
US5594504A (en) 1994-07-06 1997-01-14 Lucent Technologies Inc. Predictive video coding using a motion vector updating routine
KR0126871B1 (ko) 1994-07-30 1997-12-29 심상철 양방향 이동벡터 추정을 위한 고속 블럭정합 방식
JP3474005B2 (ja) 1994-10-13 2003-12-08 沖電気工業株式会社 動画像符号化方法及び動画像復号方法
US5659626A (en) * 1994-10-20 1997-08-19 Calspan Corporation Fingerprint identification system
US5623311A (en) 1994-10-28 1997-04-22 Matsushita Electric Corporation Of America MPEG video decoder having a high bandwidth memory
EP0710033A3 (en) 1994-10-28 1999-06-09 Matsushita Electric Industrial Co., Ltd. MPEG video decoder having a high bandwidth memory
US5619281A (en) 1994-12-30 1997-04-08 Daewoo Electronics Co., Ltd Method and apparatus for detecting motion vectors in a frame decimating video encoder
KR0171118B1 (ko) 1995-03-20 1999-03-20 배순훈 비디오신호 부호화 장치
KR0181027B1 (ko) 1995-03-20 1999-05-01 배순훈 화소 단위 움직임 추정을 이용하는 영상처리 시스템
US5724453A (en) 1995-07-10 1998-03-03 Wisconsin Alumni Research Foundation Image compression system and method having optimized quantization tables
US5764807A (en) * 1995-09-14 1998-06-09 Primacomp, Inc. Data compression using set partitioning in hierarchical trees
US5883678A (en) 1995-09-29 1999-03-16 Kabushiki Kaisha Toshiba Video coding and video decoding apparatus for reducing an alpha-map signal at a controlled reduction ratio
US5959673A (en) 1995-10-05 1999-09-28 Microsoft Corporation Transform coding of dense motion vector fields for frame and object based video coding applications
JPH09107547A (ja) 1995-10-09 1997-04-22 Hitachi Ltd 既圧縮動画データ量削減装置および既圧縮動画データ量削減システムならびに既圧縮動画データ量削減方法
US5929940A (en) 1995-10-25 1999-07-27 U.S. Philips Corporation Method and device for estimating motion between images, system for encoding segmented images
US6192081B1 (en) 1995-10-26 2001-02-20 Sarnoff Corporation Apparatus and method for selecting a coding mode in a block-based coding system
US5963673A (en) 1995-12-20 1999-10-05 Sanyo Electric Co., Ltd. Method and apparatus for adaptively selecting a coding mode for video encoding
US6055012A (en) 1995-12-29 2000-04-25 Lucent Technologies Inc. Digital multi-view video compression with complexity and compatibility constraints
US5787203A (en) 1996-01-19 1998-07-28 Microsoft Corporation Method and system for filtering compressed video images
US6957350B1 (en) * 1996-01-30 2005-10-18 Dolby Laboratories Licensing Corporation Encrypted and watermarked temporal and resolution layering in advanced television
US5982438A (en) 1996-03-22 1999-11-09 Microsoft Corporation Overlapped motion compensation for object coding
US5933546A (en) * 1996-05-06 1999-08-03 Nec Research Institute, Inc. Method and apparatus for multi-resolution image searching
US5847776A (en) 1996-06-24 1998-12-08 Vdonet Corporation Ltd. Method for entropy constrained motion estimation and coding of motion vectors with increased search range
US6130963A (en) 1996-11-22 2000-10-10 C-Cube Semiconductor Ii, Inc. Memory efficient decoding of video frame chroma
EP0889651B1 (en) 1996-12-12 2006-03-08 Matsushita Electric Industrial Co., Ltd Picture encoder and picture decoder
US6377628B1 (en) * 1996-12-18 2002-04-23 Thomson Licensing S.A. System for maintaining datastream continuity in the presence of disrupted source data
KR100322515B1 (ko) * 1997-02-14 2002-02-07 미야즈 준이치로 동화상의 예측 부호화 방법 및 복호 방법
US6201927B1 (en) 1997-02-18 2001-03-13 Mary Lafuze Comer Trick play reproduction of MPEG encoded signals
US5991447A (en) 1997-03-07 1999-11-23 General Instrument Corporation Prediction and coding of bi-directionally predicted video object planes for interlaced digital video
US6005980A (en) 1997-03-07 1999-12-21 General Instrument Corporation Motion estimation and compensation of video object planes for interlaced digital video
US6175592B1 (en) * 1997-03-12 2001-01-16 Matsushita Electric Industrial Co., Ltd. Frequency domain filtering for down conversion of a DCT encoded picture
US5844613A (en) 1997-03-17 1998-12-01 Microsoft Corporation Global motion estimator for motion video signal encoding
US6404813B1 (en) * 1997-03-27 2002-06-11 At&T Corp. Bidirectionally predicted pictures or video object planes for efficient and flexible video coding
US5973755A (en) 1997-04-04 1999-10-26 Microsoft Corporation Video encoder and decoder using bilinear motion compensation and lapped orthogonal transforms
JP3164031B2 (ja) 1997-05-30 2001-05-08 日本ビクター株式会社 動画像符号化復号化装置、動画像符号化復号化方法、及び動画像符号化記録媒体
US6067322A (en) 1997-06-04 2000-05-23 Microsoft Corporation Half pixel motion estimation in motion video signal encoding
EP1237376B1 (en) 1997-06-09 2015-08-05 Hitachi, Ltd. Image information recording medium
JPH1169345A (ja) 1997-06-11 1999-03-09 Fujitsu Ltd フレーム間予測動画像符号化装置及び復号装置並びにフレーム間予測動画像符号化方法及び復号方法
JP2897763B2 (ja) 1997-07-28 1999-05-31 日本ビクター株式会社 動き補償符号化装置、復号化装置、符号化方法及び復号化方法
US6094225A (en) 1997-12-02 2000-07-25 Daewoo Electronics, Co., Ltd. Method and apparatus for encoding mode signals for use in a binary shape coder
US5973743A (en) 1997-12-02 1999-10-26 Daewoo Electronics Co., Ltd. Mode coding method and apparatus for use in an interlaced shape coder
US6122017A (en) * 1998-01-22 2000-09-19 Hewlett-Packard Company Method for providing motion-compensated multi-field enhancement of still images from video
KR100281462B1 (ko) 1998-03-30 2001-02-01 전주범 격행 부호화에서 이진 형상 신호의 움직임 벡터 부호화 방법
US6125147A (en) 1998-05-07 2000-09-26 Motorola, Inc. Method and apparatus for reducing breathing artifacts in compressed video
JP3888597B2 (ja) 1998-06-24 2007-03-07 日本ビクター株式会社 動き補償符号化装置、及び動き補償符号化復号化方法
JP4026238B2 (ja) * 1998-07-23 2007-12-26 ソニー株式会社 画像復号装置及び画像復号方法
US6563953B2 (en) * 1998-11-30 2003-05-13 Microsoft Corporation Predictive image compression using a single variable length code for both the luminance and chrominance blocks for each macroblock
US6983018B1 (en) * 1998-11-30 2006-01-03 Microsoft Corporation Efficient motion vector coding for video compression
JP2000278692A (ja) * 1999-03-25 2000-10-06 Victor Co Of Japan Ltd 圧縮データ処理方法及び処理装置並びに記録再生システム
JP3411234B2 (ja) * 1999-04-26 2003-05-26 沖電気工業株式会社 符号化情報受信復号装置
EP1056297A3 (en) * 1999-05-24 2002-10-02 Agilent Technologies, Inc. (a Delaware corporation) Multimedia decoder with error detection
US6408026B1 (en) * 1999-08-06 2002-06-18 Sony Corporation Deadzone quantization method and apparatus for image compression
US6600836B1 (en) * 2000-01-28 2003-07-29 Qualcomm, Incorporated Quality based image compression
US20020114388A1 (en) * 2000-04-14 2002-08-22 Mamoru Ueda Decoder and decoding method, recorded medium, and program
CN1322759C (zh) * 2000-04-27 2007-06-20 三菱电机株式会社 编码装置和编码方法
US6876703B2 (en) * 2000-05-11 2005-04-05 Ub Video Inc. Method and apparatus for video coding
US6920175B2 (en) * 2001-01-03 2005-07-19 Nokia Corporation Video coding architecture and methods for using same
US6689410B2 (en) * 2001-01-25 2004-02-10 Flavor Burst Co. Product blender and dispenser
US6980596B2 (en) * 2001-11-27 2005-12-27 General Instrument Corporation Macroblock level adaptive frame/field coding for digital video content
CN101448162B (zh) * 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
CN100452883C (zh) * 2001-12-17 2009-01-14 微软公司 处理视频图像的方法
US6873657B2 (en) * 2001-12-27 2005-03-29 Koninklijke Philips Electronics, N.V. Method of and system for improving temporal consistency in sharpness enhancement for a video signal
US7003035B2 (en) * 2002-01-25 2006-02-21 Microsoft Corporation Video coding methods and apparatuses
EP3525465B1 (en) * 2002-04-19 2021-03-17 Panasonic Intellectual Property Corporation of America Picture decoding method and apparatus
KR100481732B1 (ko) * 2002-04-20 2005-04-11 전자부품연구원 다 시점 동영상 부호화 장치
US20040001546A1 (en) * 2002-06-03 2004-01-01 Alexandros Tourapis Spatiotemporal prediction for bidirectionally predictive (B) pictures and motion vector prediction for multi-picture reference motion compensation
US7280700B2 (en) * 2002-07-05 2007-10-09 Microsoft Corporation Optimization techniques for data compression
US7154952B2 (en) * 2002-07-19 2006-12-26 Microsoft Corporation Timestamp-independent motion vector prediction for predictive (P) and bidirectionally predictive (B) pictures
US20040136457A1 (en) * 2002-10-23 2004-07-15 John Funnell Method and system for supercompression of compressed digital video
JP4093405B2 (ja) * 2002-10-25 2008-06-04 株式会社リコー 画像処理装置、プログラム及び記憶媒体
US7426308B2 (en) * 2003-07-18 2008-09-16 Microsoft Corporation Intraframe and interframe interlace coding and decoding
US20050013498A1 (en) * 2003-07-18 2005-01-20 Microsoft Corporation Coding of motion vector information
US7961786B2 (en) * 2003-09-07 2011-06-14 Microsoft Corporation Signaling field type information
KR20050061762A (ko) * 2003-12-18 2005-06-23 학교법인 대양학원 부호화 모드 결정방법, 움직임 추정방법 및 부호화 장치
US7889792B2 (en) * 2003-12-24 2011-02-15 Apple Inc. Method and system for video encoding using a variable number of B frames
FR2872973A1 (fr) * 2004-07-06 2006-01-13 Thomson Licensing Sa Procede ou dispositif de codage d'une sequence d'images sources

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9071840B2 (en) 2004-01-30 2015-06-30 Thomson Licensing Encoder with adaptive rate control for H.264
KR100694050B1 (ko) * 2004-06-11 2007-03-12 삼성전자주식회사 움직임 예측 방법 및 그 장치
KR100790986B1 (ko) * 2006-03-25 2008-01-03 삼성전자주식회사 가변 비트율 비디오 코딩에서 비트율을 제어하는 장치 및방법
US8085679B2 (en) 2006-03-25 2011-12-27 Samsung Electronics Co., Ltd. Apparatuses and methods for controlling bit rates in variable bit rate video coding
KR100957073B1 (ko) * 2008-11-19 2010-05-13 고려대학교 산학협력단 지문영상의 품질에 기초한 선택적 영상압축장치 및 방법, 그리고 이를 이용한 인증장치

Also Published As

Publication number Publication date
KR20100048978A (ko) 2010-05-11
EP2309749B1 (en) 2015-04-15
KR101038860B1 (ko) 2011-06-02
HK1156454A1 (en) 2012-06-08
EP1379090A3 (en) 2005-06-22
KR100965703B1 (ko) 2010-06-24
US7280700B2 (en) 2007-10-09
JP4662697B2 (ja) 2011-03-30
BR0301992A (pt) 2004-08-31
CN1487474A (zh) 2004-04-07
EP2309749A3 (en) 2011-04-27
EP1379090A2 (en) 2004-01-07
EP2309749A2 (en) 2011-04-13
JP2004254274A (ja) 2004-09-09
CN100394447C (zh) 2008-06-11
US20040008899A1 (en) 2004-01-15

Similar Documents

Publication Publication Date Title
KR100965703B1 (ko) 비디오를 인코딩 및 디코딩하기 위한 방법 및 하나 이상의 컴퓨터로 하여금 비디오를 디코딩하기 위한 방법을 수행하게 하는 컴퓨터 실행가능 명령어가 저장된 하나 이상의 컴퓨터 판독가능 매체
CN110024398B (zh) 针对屏幕远程处理场景的局部的基于散列的运动估计
KR102088560B1 (ko) 자족식 코딩 구조를 인코딩 또는 디코딩할 때의 팔레트 예측자 초기화기
US8442337B2 (en) Encoding adjustments for animation content
TWI632805B (zh) 視訊解碼方法、視訊編碼方法、視訊解碼裝置、視訊編碼裝置以及非暫態的電腦可讀取儲存媒體
KR101897378B1 (ko) 팔레트 코딩 모드에서 팔레트를 인코딩 또는 디코딩하기 위한 방법 및 장치
KR100878827B1 (ko) 영상 신호의 코딩정보를 압축/해제하기 위해 모델링하는방법
KR101131689B1 (ko) 필터 선택을 이용한 비디오 압축 방법
JP2022523925A (ja) 映像コンテンツを処理するための方法及びシステム
JP2022520944A (ja) 変換スキップモードとブロック差分パルスコード変調の改善された残差コーディング
TW202029765A (zh) 用於編碼或解碼轉換塊的方法與裝置
JP7343669B2 (ja) Vvcにおける色変換のための方法及び機器
CA2610276A1 (en) Image encoder and image decoder, image encoding method and image decoding method, image encoding program and image decoding program, and computer readable recording medium recorded with image encoding program and computer readable recording medium recorded with image decoding program
KR20110015002A (ko) 향상 계층 비디오 코딩을 위한 적응 양자화
EP3120557B1 (en) Method for motion estimation of non-natural video data
JP2003179925A (ja) ディジタルビデオ信号を圧縮するプロセスおよびシステムとプログラム製品
CN113615185A (zh) 用于视频编码的方法和装置
JP2023512898A (ja) ビデオフィルタリングにおけるオフセットの方法及び装置
US20110228856A1 (en) Video encoder/decoder, method and computer program product
CN114830642A (zh) 图像编码方法和图像解码方法
JP7443527B2 (ja) ビデオコーディングのための方法、装置及びプログラム
CN114788270A (zh) 图像编码方法和图像解码方法
JP2023520915A (ja) 所定のフィルタによるサンプルオフセット
CN114830650A (zh) 图像编码方法和图像解码方法
BRPI0301992B1 (pt) método para codificar dados, meio legível por computador, e aparelho que compreende uma lógica operacionalmente configurada para receber dados de imagem

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
A107 Divisional application of patent
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130521

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20140516

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20150515

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160517

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20170522

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20180516

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20190515

Year of fee payment: 10