KR20090057236A - 분석적이고 경험적인 하이브리드 인코딩 왜곡 모델링을 위한 방법 및 장치 - Google Patents

분석적이고 경험적인 하이브리드 인코딩 왜곡 모델링을 위한 방법 및 장치 Download PDF

Info

Publication number
KR20090057236A
KR20090057236A KR1020097004287A KR20097004287A KR20090057236A KR 20090057236 A KR20090057236 A KR 20090057236A KR 1020097004287 A KR1020097004287 A KR 1020097004287A KR 20097004287 A KR20097004287 A KR 20097004287A KR 20090057236 A KR20090057236 A KR 20090057236A
Authority
KR
South Korea
Prior art keywords
distortion
zero quantized
quantized coefficient
video encoding
video
Prior art date
Application number
KR1020097004287A
Other languages
English (en)
Other versions
KR101377833B1 (ko
Inventor
후아 양
질 맥도날드 보이스
Original Assignee
톰슨 라이센싱
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 톰슨 라이센싱 filed Critical 톰슨 라이센싱
Publication of KR20090057236A publication Critical patent/KR20090057236A/ko
Application granted granted Critical
Publication of KR101377833B1 publication Critical patent/KR101377833B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)

Abstract

분석적이고 경험적인 하이브리드 인코딩 왜곡 모델링을 위한 방법 및 장치가 제공된다. 이 장치는, 비디오 인코딩 왜곡을 제1 부분 및 제2 부분으로 나누고, 경험적 계산을 이용해서 제1 부분을 계산하고, 분석적 계산을 이용해서 제2 부분을 계산함으로써 비디오 인코딩 왜곡을 모델링하는 왜곡 계산기(315, 320)를 포함한다.
Figure P1020097004287
비디오 인코딩, 왜곡 모델링, 레이트 제어, 경험적 계산, 분석적 계산

Description

분석적이고 경험적인 하이브리드 인코딩 왜곡 모델링을 위한 방법 및 장치{METHOD AND APPARATUS FOR ANALYTICAL AND EMPIRICAL HYBRID ENCODING DISTORTION MODELING}
관련 출원에의 상호 참조
본 출원은 2006년 8월 30일에 출원된 미국 가출원 일련 번호 제60/823,942호에 대해 우선권을 주장하고, 이 출원은 본 명세서에서 참조적으로 통합된다.
본 발명은 일반적으로 비디오 인코딩에 관한 것이고, 보다 구체적으로, 분석적이고 경험적인 하이브리드 인코딩 왜곡 모델링을 위한 방법 및 장치에 관한 것이다.
비디오 인코딩에서는, 비디오 프레임의 레이트-왜곡(RD;rate distortion) 곡선을 어떻게 가장 정확하게 추정하는 지를 결정하는 것이 바람직하다. 프레임의 레이트-왜곡 특성이 공지되면, 제한된 코딩 자원, 통상적으로 코딩 비트 레이트를 상이한 프레임들로 최적으로 할당하여, 최적화된 전체 코딩 성능이 달성될 수 있다. 종종, 과제는 레이트-왜곡 최적화된 프레임 레벨 비트 레이트 할당으로서 공식화되고, 여기에서, 그 목적은, 특정 전체 비트 레이트 및 버퍼 제한에 대한, 평균 또는 최대 평균 제곱 오차(MSE:mean squared error) 소스 코딩 왜곡을 최소화하 는 것이다. 따라서, 프레임의 레이트-왜곡 특성이 정확하게 추정될 수 있는지의 여부는 결과적인 전체 레이트 제어 성능에 심각하게 영향을 미칠 것이다.
실제로, 기존의 비디오 코딩 표준은 인코딩에 대한 한정된 수의 양자화 스케일을 특정한다. 효과적인 레이트 제어는, 각각의 적당한 양자화 스케일을 적용한 후에 프레임의 결과적 레이트-왜곡 데이터를 아는 것으로 수행될 수 있다. 편리성을 위해서, 본 명세서에서는, 변환 코딩에 대한 예측 레지듀 데이터(prediction residue data)는 이미 사용가능하다고 가정된다. 과제는 이제 모든 유효 Q들에 대한 모든 R-Q 및 D-Q 데이터를 계산하는 것이고, 여기에서 "R-Q"는 소정 Q의 결과적 코딩 비트를 나타내고, "D-Q"는 소정 Q의 결과적 코딩 왜곡을 나타내고, "Q"는 양자화 스케일, 즉, 양자화 스텝 사이즈를 나타낸다. 비디오 코딩 표준 및 권고에 정의된 양자화 파라미터(QP로 표시됨)와 Q 간에는 일대일 매핑이 존재한다는 것을 주지해야 한다. 예를 들어, 국제 표준화 기구/국제 전기 표준 회의(ISO;International Organization for Standardization/IEC;International Electrotechnical Commission) MPEG-4(Moving Picture Experts Group-4) 파트 10 고도 비디오 부호화(AVC;Advanced Video Coding) 표준/국제 전기통신 연합, 전기통신부(ITU-T;International Telecommunication Union, Telecommunication Sector) H.264 권고(이후, "MPEG-4 AVC 표준")에서, QP는 0에서 51까지의 범위에 있고, 각 QP는 소정의 양자화 스텝 사이즈 또는 스케일 Q에 대응한다. 레이트-왜곡 데이터를 정확하게 계산하기 위해서는, 완력을 이용해서 프레임을 모든 Q들과 전체적으로 모두 인코딩해야만 한다. 전체적인 계산은 높은 정확도를 제공하지만, 과중한 계 산 복잡도를 초래하고, 이에 따라, 실제로, 복잡도가 낮은 또는 감소된 정확한 레이트-왜곡 데이터 추정을 목표로 하는 다수의 다양한 레이트-왜곡 모델들이 제안되어 왔다.
대부분의 기존 레이트-왜곡 모델들은 분석적 모델이다. 이러한 분석적 모델에서, R 또는 D는 양자화 스케일 Q 및 레지듀 신호의 편차 σ2에 대한 양함수(explicit function)로서 표현된다.
대체로, 프레임 코딩의 결과적 레이트 및 왜곡은 양자화 스케일뿐만 아니라 소스 비디오 신호 자체의 특성에도 관련된다는 것이 공지되어 있다. 하지만, 소스 비디오 신호의 특성은 비고정적이다. 따라서, 분석적 모델에서, 예측 레지듀 신호의 편차는 통상적으로 비고정적 비디오 신호에 대한 어카운트(account)에 적응된다. 왜곡 모델링에 대해서, 왜곡 추정은, 종래 기술의 왜곡 추정 접근법의 Q 및 σ2에 대한 간단한 형식의 통합 함수를 포함할 수 있지만, 다른 접근법 D에서는 σ에 대한 Q의 상이한 상대적 크기에 따른 상이한 D-Q 또는 D-σ2 관계를 제공하는 구분적(piecewise) 함수를 통해 보다 정확하게 추정될 수 있다. 분석적 레이트-왜곡 모델링의 가장 뛰어난 장점은 낮은 계산 복잡도이다. 우선 σ2만을 계산하면 되며, 그 다음 선정된 함수에 따라 R 또는 D를 바로 추정할 수 있다. 편차 계산은, 변환 및 양자화 동작을 요구하지 않으면서, 공간 도메인 레지듀 신호에서 간단하게 수행될 수 있으며, 이에 따라, 계산 복잡도가 매우 낮게 된다. 하지만, D-Q 분석적 모 델링의 단점은 절충된 추정 정확도이고, 이는 주로, 레이트-왜곡 추정에서의 비디오 신호 비고정성의 영향에 대해서 전체 어카운트에 대한 편차만을 사용하는 것의 부적합성 때문이다. 이러한 단점은 보다 최근의 ρ-도메인 분석적 RD 모델에서 개선되었으며, 여기에서는, 종래의 R-Q 및 D-Q 모델 대신에, 새로운 모델이, Q와 일대일 매핑을 갖는 ρ로 표시되는 제로(zero) 양자화된 계수의 비율에 기초한다. ρ는 변환된 레지듀 신호에 Q를 적용한 결과이고, 그에 따라, Q의 정보뿐만 아니라 비고정 소스 비디오 신호의 정보도 반영한다는 것을 주지해야 한다. ρ-도메인 모델은 다른 기존의 Q-기반의 모델보다 더 좋은 모델링 성능을 제공하지만, 여기에서는 이산 코사인 변환(DCT;Discrete Cosine Transform)의 추가적 관련으로 인해 계산 복잡도가 약간 증가한다는 단점이 있다.
분석적 모델은 RD와 Q(또는 ρ) 간의 고정된 명시적 관계를 가정한다. 하지만, 실제로, 프레임의 실제 레이트-왜곡 데이터는, 동작적 레이트-왜곡 곡선이 종종 스무스(smooth)하지 않거나 전혀 구분적으로 스무스하지 않게 한다. 이러한 미스매치는 분석적 모델의 추정 정확도를 상당히 떨어뜨릴 수 있다. 복잡도는 여전히 낮추면서 높은 정확도를 보장하기 위해서, 경험적 접근법이 제안되었으며, 여기에서는, 선택된 Q의 작은 일부 세트에 대해 전체적인 인코딩만이 행해지고, 나머지 Q의 레이트-왜곡 데이터는 사용가능한 것으로부터 보간된다. 경험적 모델의 모델링 정확도가 분석적 모델보다 우수하지만, 이는 다수의 추가적 인코딩 동작을 요하며, 이는 여전히 상당한 양의 부가적인 계산 로드를 부과하며, 실시간 비디오 스트리밍 시스템에서 항상 수용가능하지 않을 수 있다.
또한 상당히 주목할 것은, R 모델링에 의해서, ρ-도메인 모델은 이미 높은 추정 정확도를 달성하고, 추가 개선의 범위는 매우 제한되어 있다는 것이다. 하지만, D 모델링에 의해서는, ρ-도메인 모델 및 기존의 Q-기반의 모델은 둘 다 ρ-도메인 R 모델만큼 우수한 추정 성능을 제공할 수 없다.
종래 기술의 상기 및 기타 단점 및 결점들은, 분석적이고 경험적인 하이브리드 인코딩 왜곡 모델링을 위한 방법 및 장치에 관한 본 발명에 의해 해결된다.
본 발명의 일 양상에 따라서 장치가 제공된다. 이 장치는, 비디오 인코딩 왜곡을 제1 부분 및 제2 부분으로 나누고, 경험적 계산을 이용해서 상기 제1 부분을 계산하고, 분석적 계산을 이용해서 상기 제2 부분을 계산함으로써 상기 비디오 인코딩 왜곡을 모델링하는 왜곡 계산기를 포함한다.
본 발명의 다른 양상에 따라서 장치가 제공된다. 이 장치는, 영상 데이터에 대한 비디오 인코딩 왜곡을 모델링함으로써 영상 데이터를 인코딩하는 비디오 인코더를 포함하고, 상기 인코더는, 상기 비디오 인코딩 왜곡을 제1 부분 및 제2 부분으로 나누고, 경험적 계산을 이용해서 상기 제1 부분을 계산하고, 분석적 계산을 이용해서 상기 제2 부분을 계산함으로써 상기 비디오 인코딩 왜곡을 모델링한다.
본 발명의 또 다른 양상에 따라서 방법이 제공된다. 이 방법은 비디오 인코딩 왜곡을 모델링하는 단계를 포함한다. 상기 비디오 인코딩 왜곡을 모델링하는 단계는, 상기 비디오 인코딩 왜곡을 제1 부분 및 제2 부분으로 나누는 단계, 경험적 계산을 이용해서 상기 제1 부분을 계산하는 단계, 및 분석적 계산을 이용해서 상기 제2 부분을 계산하는 단계를 포함한다.
본 발명의 상기 및 기타 양상, 특징 및 장점들은, 첨부 도면과 관련하여 기술될 예시적 실시예들의 후술하는 상세한 설명으로부터 명백해질 것이다.
본 발명은 후술하는 예시적 도면에 따라서 더욱 잘 이해될 것이다.
도 1은, 본 발명의 일 실시예에 따른, 하이브리드 왜곡 모델에 관한 예시적 방법에 대한 순서도이다.
도 2는, 본 발명의 일 실시예에 따른, 비디오 프레임의 D-QP 데이터를 추정하기 위한 예시적 방법에 대한 순서도이다.
도 3은, 본 발명의 일 실시예에 따른, 추정된 레이트-왜곡 모델 데이터의 생성에 관한 예시적 사전 분석기(pre-analyzer)에 대한 블록도이다.
도 4는, 본 발명의 일 실시예에 따른, 도 1의 하이브리드 왜곡 모델이 적용될 수 있는 예시적 프레임 레벨 레이트 제어기에 대한 블록도이다.
도 5는, 본 발명의 일 실시예에 따른, 일반적으로 프레임 레벨 및 MB-레벨 레이트 제어를 사용하는 예시적 비디오 인코더에 대한 블록도이다.
본 발명은, 분석적이고 경험적인 하이브리드 인코딩 왜곡 모델링을 위한 방법 및 장치에 관한 것이다.
본 설명은 본 발명을 기술한다. 따라서, 당업자는, 본 명세서에서 명확하게 기술 또는 도시되지 않더라도, 본 발명을 구체화하고 그 사상 및 범위내에 포함되 는 다양한 구성들을 고안할 수 있을 것이다.
본 명세서에서 언급된 모든 예들 및 조건부 언어들은, 발명자(들)에 의해 제공되는 본 발명의 원리 및 개념에 대한 독자들의 이해를 도와 그 기술을 증진시키는 교육학적 목적을 위한 것이고, 그러한 특정하게 언급된 예들 및 조건들로 제한되지는 않는 것으로 해석되어야 한다.
또한, 본 발명의 특정 예뿐만 아니라, 본 발명의 원리, 양상 및 실시예들을 인용하는 본 명세서의 모든 설명들은 그 구조적 및 기능적 등가물들을 모두 포함하는 것으로 의도된다. 또한, 이러한 등가물들은 현재 공지된 등가물뿐만 아니라 미래에 개발될 등가물, 즉, 구조에 관계없이 동일한 기능을 행하도록 개발된 임의의 구성 요소들을 모두 포함하는 것으로 의도된다.
따라서, 예를 들어, 당업자는, 본 명세서에서 제시된 블록도들이 본 발명을 구현하는 예시적 회로의 개념도를 나타내는 것임을 이해할 것이다. 마찬가지로, 임의의 플로차트, 순서도, 상태 전이도, 의사코드, 등이, 컴퓨터 또는 프로세서가 명확하게 도시되는지 여부에 관계없이, 실질적으로 컴퓨터 판독가능 매체로 표현되어 컴퓨터 또는 프로세서에 의해 실행될 수 있는 다양한 프로세스를 나타낸다는 것을 이해할 것이다.
도면에 도시된 다양한 구성 요소들의 기능은, 전용 하드웨어뿐만 아니라 적절한 소프트웨어와 결합되어 소프트웨어를 실행시킬 수 있는 하드웨어를 통해 제공될 수 있다. 프로세서에 의해 제공될 때, 기능들은 단일의 전용 프로세서, 단일의 공유 프로세서, 또는 일부가 공유될 수도 있는 복수의 개별 프로세서에 의해 제공 될 수 있다. 또한, "프로세서" 또는 "제어기"라는 용어의 명시적 사용은 소프트웨어를 실행할 수 있는 하드웨어를 배타적으로 지칭하는 것으로 해석되어서는 안 되며, 디지털 신호 프로세서(DSP;digital signal processor) 하드웨어, 소프트웨어를 저장하기 위한 ROM(read only memory), RAM(random access memory), 및 불휘발성 저장 장치를 제한 없이 함축적으로 포함할 수 있다.
다른 하드웨어, 관용 및/또는 주문도 포함될 수 있다. 마찬가지로, 도면에 도시된 임의의 스위치들은 단지 개념적인 것이다. 이들의 기능은, 프로그램 로직의 동작을 통해서, 전용 로직을 통해서, 프로그램 제어 및 전용 로직의 상호작용을 통해서, 또는 수동으로도 수행될 수 있으며, 특정 기술은 문맥으로부터 보다 명확하게 이해되는 바와 같이 구현자에 의해 선택가능하다.
본 명세서의 청구항에서, 특정 기능을 수행하기 위한 수단으로서 표시되는 임의의 구성 요소는, 예를 들어, a) 그 기능을 수행하는 회로 소자의 조합 또는 b) 소프트웨어가 그 기능을 수행하도록 하는 적절한 회로와 결합된, 펌웨어, 마이크로코드 등을 포함하는 임의의 형태의 소프트웨어를 포함하는, 그 기능을 수행하는 임의의 수단을 포괄하는 것으로 의도된다. 이러한 청구항에 의해 정의되는 바와 같은 본 발명은, 다양한 인용된 수단들에 의해 제공되는 기능성들이 청구항이 청구하는 식으로 함께 결합되어 얻어진다는 사실에 근거한다. 따라서, 이러한 기능성들을 제공할 수 있는 임의의 수단은 본 명세서에 도시된 것과 동일한 것으로 간주된다.
본 발명의 명세서에서 "일 실시예" 또는 "실시예"로 참조하는 것은, 그 실시 예와 관련하여 기술된 특정 특징, 구조, 특성 등이 본 발명의 적어도 일 실시예에 포함된다는 것을 의미한다. 따라서, 명세서 전체에 걸쳐서 다양하게 나타나는 "일 실시예에서" 또는 "실시예에서"라는 문구는 반드시 모두 동일한 실시예를 지칭하는 것은 아니다.
본 발명의 하나 이상의 실시예들이 MPEG-4 AVC 표준과 관련하여 본 명세서에서 기술되었지만, 본 발명은 이러한 표준만으로 제한되는 것은 아니며, 따라서, 본 발명의 사상을 유지하면서, 다른 비디오 코딩 표준, 권고, 및 그 확장들(MPEG-4 AVC 표준의 확장을 포함함)과 관련해서 활용될 수 있다.
또한, 본 명세서에서 본 발명의 하나 이상의 실시예들이 휘도 성분의 왜곡을 사용해서 기술되었지만, 본 발명은 크로미넌스(chrominance) 성분의 왜곡에도 동일하게 적용될 수 있다는 것이 이해될 것이다. 따라서, 본 발명은, 본 발명의 사상을 유지하면서 휘도 성분 및/또는 크로미넌스 성분의 왜곡에 대해서 이용될 수 있다.
또한, 예를 들어, "A 및/또는 B"의 경우에서와 같이 "및/또는"이라는 용어의 사용은 첫번째 열거된 옵션 (A)의 선택, 두번째 열거된 옵션 (B)의 선택, 또는 두 옵션 (A 및 B)의 선택을 포괄하는 것으로 의도됨을 이해할 것이다. 다른 예로서, "A, B, 및/또는 C"의 경우에, 이러한 문구는 첫번째 열거된 옵션 (A)의 선택, 두번째 열거된 옵션 (B)의 선택, 세번째 열거된 옵션 (C)의 선택, 첫번째 및 두번째 열거된 옵션 (A 및 B)의 선택, 첫번째 및 세번째 열거된 옵션 (A 및 C)의 선택, 두번째 및 세번째 열거된 옵션 (B 및 C)의 선택, 또는 모든 세 옵션 (A 및 B 및 C)의 선택을 포괄하는 것으로 의도된다. 이는, 당업자에게 매우 명백한 바와 같이, 다수의 아이템들이 열거되는 것으로 확장될 수 있다.
본 명세서에서 사용되는 바와 같이, "경험적"이라는 용어는 관련된 코딩 비트 (R) 또는 코딩 왜곡 (D) 양의 계산을 언급하는데 사용된다. 일부 실시예에서, 이러한 계산은 완전(exhaustive)할 수 있다. 본 명세서에서 사용되는 바와 같이, "완전한" 및 "실질적으로 완전한"은 어떠한 모델링 간략화 또는 근사화없이 양자화 왜곡을 정확하게 계산하는 것을 지칭한다.
또한, 본 명세서에서 사용되는 바와 같이, "분석적"이라는 용어는, 분석적 모델링을 통해 관련된 코딩 비트 (R) 또는 코딩 왜곡 (D) 양의 계산을 언급하는데 사용된다.
또한, 본 명세서에서 사용되는 바와 같이, "비-제로(non-zero) 양자화된 계수"라는 문구는 특정 Q와의 양자화 후에 제로가 되지 않을 변환 계수를 언급하는데 사용된다. 즉, "비-제로 양자화된 계수"라는 문구는 특정 Q와의 양자화 후에 비-제로 값을 가질 변환 계수를 언급한다.
또한, 본 명세서에서 사용되는 바와 같이, "제로 양자화된 계수"라는 문구는 특정 Q와의 양자화 후에 제로가 될 변환 계수를 언급하는데 사용된다. 즉, "제로 양자화된 계수"라는 문구는 특정 Q와의 양자화 후에 제로 값을 가질 변환 계수를 언급한다.
상술한 바와 같이, 본 발명은 분석적이고 경험적인 하이브리드 인코딩 왜곡 모델링을 위한 방법 및 장치에 관한 것이다.
또한 상술한 바와 같이, R 모델링에 의해서, ρ-도메인 모델은 이미 높은 추정 정확도를 달성하고, 추가 개선의 범위는 매우 제한된다. 하지만, D 모델링에 의해서는, ρ-도메인 모델 및 기존의 Q-기반의 모델은 둘 다 ρ-도메인 R 모델만큼 우수한 추정 성능을 제공할 수 없다.
본 발명에 따라서, 새로운 하이브리드 왜곡 모델로 이 갭(gap)이 매워지고, 이 모델은 모든 다른 기존의 모델들보다 우수하며 최적에 가까운 모델링 성능을 달성한다.
따라서, 일 실시예에서, 프레임의 소스 코딩 평균 제곱 오차 왜곡 특성을 추정하기 위한 방법 및 장치가 제공된다. 분석적 또는 경험적 방법 중 하나인 선행자와 달리, 이 제안된 방법은 분석적이고 경험적인 하이브리드 모델이다. 이 하이브리드 모델의 일 실시예는 효과적인 테이블 룩업 접근법으로 구현된다. 그 결과적 모델은 분석적 모델링(낮은 계산 복잡도를 가짐)의 장점 및 경험적 모델링(높은 모델링 정확도를 가짐)의 장점을 모두 가지며, 일반적으로, 개선된 최적화 성능을 위한 임의의 프레임 레벨 레이트-왜곡 최적화 관련 과제(예를 들어, 프레임 레벨 비트 할당 또는 프레임의 채널 코딩과 소스 간의 비트 할당)에 적용될 수 있다.
도 1을 참조하면, 하이브리드 왜곡 모델에 관한 예시적 방법이 전체적으로 참조 번호 100으로 표시된다.
이 방법은, 제어를 기능 블록 110으로 보내는 개시 블록 105를 포함한다. 기능 블록 110은, A 화소를 갖는 일 블록에 대해, 이산 코사인 변환(DCT)을 적용하고, 변환 결과를 특정 양자화 값(Q)로 양자화하고, 제어를 기능 블록 115로 보낸 다. 기능 블록 115는 특정 양자화 값 Q, D(Q)=0에 관한 왜곡을 계산하고, 제어를 루프단(loop limit) 블록 120으로 보낸다. 루프단 블록 120은 각각의 양자화된 변환 계수 i에 대해 루프를 행하고, 제어를 판정 블록 125로 보낸다. 판정 블록 125는 현재 양자화된 변환 계수 i가 제로인지 여부를 결정한다. 만약 이 계수 i가 제로이면, 제어는 기능 블록 130으로 보내진다. 그렇지 않으면, 제어는 기능 블록 150으로 보내진다.
기능 블록 130은 다음과 같이 왜곡
Figure 112009012420406-PCT00001
을 정확하게 계산하도록 경험적 계산을 수행하고, 제어를 기능 블록 135로 보낸다.
기능 블록 135는 D(Q)=D(Q)+Di(Q)를 계산하고, 제어를 루프단 블록 140으로 보낸다. 루프단 블록 140은 각각의 양자화된 변환 계수 i에 대한 루프를 종료하고, 제어를 기능 블록 145로 보낸다. 기능 블록 145는
Figure 112009012420406-PCT00002
를 계산하고, 제어를 종료 블록 199로 보낸다.
기능 블록 150은 다음과 같이 왜곡
Figure 112009012420406-PCT00003
을 모델링하기 위해서 분석적 계산을 수행하고, 제어를 기능 블록 135로 보낸다.
도 1에 도시된 바와 같이, 하이브리드 왜곡 모델은 2개의 구성 요소, 즉, 제로 양자화된 계수로부터 경험적으로 계산된 왜곡 기여부와, 비-제로 양자화된 계수로부터 분석적으로 계산된 왜곡 기여부를 포함한다.
일 실시예에서, 테이블 룩업으로 소스 코딩 왜곡에 대해 분석적이고 경험적 인 하이브리드 모델을 사용하는 것은, 모든 양자화 스케일에 대해 평균 제곱 오차 양자화 왜곡을 정확하게 추정하고, 이에 따라, 높은 모델링 정확도와 낮은 계산 복잡도를 동시에 모두 달성하는 모델을 제공한다.
기본적인 레이트-왜곡 모델링 과제에 있어서, 통상적으로, 변환, 양자화 및 엔트로피 코딩에 대한 입력 신호가 이용가능하고, 레이트-왜곡 모델링의 목적은 이 입력 신호에 상이한 QP들을 적용한 레이트-왜곡 결과를 추정하는 것이라고 가정한다. 예를 들어, MPEG-4 AVC 표준에서, 관련된 입력 신호는 움직임 보상 예측 또는 인트라 예측(intra-prediction) 후의 레지듀 신호이다. 레이트-왜곡 모델을 실제 과제에 적용하는 경우, 변환 코딩 전에 정확한 입력 신호를 통상적으로 알 수 없을 것임을 주지해야 한다. 예를 들어, 프레임 레벨 비트 할당의 과제에서, 어떤 프레임의 코딩도 없이 모든 관련 프레임들의 레이트-왜곡 데이터를 추정해야만 한다. 따라서, 프레임 레벨 비트 할당시의 프레임의 매크로 블록 코딩 모드와 정확한 예측 기준 프레임을 아는 것은 불가능하다. 비트 할당에서 가정되는 기준 및 코딩 모드와 실제 인코딩에서 채택되는 기준 및 코딩 모드 간의 미스매치는 기본적 레이트-왜곡 모델링의 정확도를 떨어뜨린다.
일 실시예에 따라서, 소정의 프레임 및 소정의 양자화 스케일 Q에 대해, 결과적 평균 제곱 오차 왜곡 D(Q)는 2개의 부분, 즉, 비-제로 양자화된 계수 Dnz(Q)의 왜곡 기여부와 제로 양자화된 계수 Dz(Q)의 왜곡 기여부로 분할된다. 실제로, 관련 왜곡은 통상적으로 휘도 성분만의 왜곡이라는 것을 주지해야 한다. 따라서, 편의 상, 본 명세서에서는 휘도 왜곡으로도 지칭한다. 하지만, 상술한 바와 같이, 제안된 모델은 휘도 성분 및 크로미넌스 성분 둘 다를 포함하는 왜곡에도 물론 적용된다. 본 명세서에서는 또한, 클리핑(clipping) 영향을 무시하고, 주파수 도메인에서의 왜곡이 공간 도메인에서의 왜곡과 동일하다고 가정한다. 따라서, 다음의 수학식 1을 얻는다:
Figure 112009012420406-PCT00004
여기에서,
Figure 112009012420406-PCT00005
Figure 112009012420406-PCT00006
는 프레임의 원 화소 및 재생(reconstructed) 화소를 나타내고, A는 프레임의 화소의 전체 수를 나타낸다. MPEG-4 AVC 표준에서, QP는 0에서 51의 범위에 있고, QP와 Q의 관계는 대략적으로 다음과 같다:
Figure 112009012420406-PCT00007
비-제로 양자화된 계수의 양자화 오차를 균일한 분포의 랜덤 변수로서 모델링하고, 이에 따라, 비-제로 계수의 왜곡은 다음과 같이 쉽게 계산될 수 있다:
Figure 112009012420406-PCT00008
여기서, ρ(Q)는, Q와 일대일 매핑되는, 프레임의 모든 변환 계수들 중 제로 양자화된 계수의 비율을 나타낸다. 제로 양자화된 계수의 왜곡은 다음과 같이 정확하게 계산된다:
Figure 112009012420406-PCT00009
여기에서, Coeffz(Q)는 양자화 스케일 Q로 제로로 양자화될 계수의 크기를 나타낸다. 요약하면, 전체 소스 코딩 왜곡은 다음 수학식 5와 같이 추정된다:
Figure 112009012420406-PCT00010
실제로, 프레임의 D-Q 관계는 실제 인코딩 전에 사전분석 프로세스를 통해 추정될 수 있으며, 수학식 5로부터의 결과적 추정된 왜곡은 프레임 레벨 비트 할당 또는 레이트 제어에서 사용될 것이다. 상술한 바와 같이, 사전 분석에서 가정되는 기준 및 코딩 모드와 실제 인코딩에서 채택되는 기준 및 코딩 모드 간에는 필연적인 미스매치가 존재하고, 이는 기본적 레이트-왜곡 모델링의 정확도를 떨어뜨릴 것이다. 미스매치 영향을 보상하기 위해서, 다음과 같이 최종 왜곡 추정치를 계산하도록 새로운 모델 파라미터가 도입될 수 있다. 여기에서, DModel(Q)는 수학식 5로부터 모델링된 왜곡이고, DEst(Q)는 최종 왜곡 추정치이고, α는 모델 파라미터이다. 실제로 α는 과거 프레임의 실제 인코딩 왜곡 결과로 적응적으로 갱신될 수 있다.
Figure 112009012420406-PCT00011
분석적 또는 경험적 중 하나인 기존의 왜곡 모델과 달리, 제안된 모델은 하 이브리드 솔루션이며, 여기에서 분석적 함수는 비-제로 계수 왜곡에 대해 가정되고, 제로 계수에 대해서 그 정확한 왜곡 기여가 계산된다. 비-제로 계수 양자화 에러에 대한 균일한 분포의 가정, 및 제로 계수에 대한 현재(as-is) 왜곡의 계산이 소스 코딩 왜곡 모델링에서 개별적으로 사용되었다는 것을 주지해야 한다. 하지만, 본 발명의 제안된 모델과 달리, 기존의 솔루션들은 모두, 다양한 구분적 분석 왜곡 모델을 초래하는, 상대적인 Q 대 σ 크기의 상이한 값들에 따라서, 전체 소스 코딩 왜곡의 추정에 있어서 2개의 방법 중 하나를 적용한다. 구체적으로, 이러한 기존의 모델들에서, 특정 Q에 대해, Q/σ가 임계치보다 작으면, 대부분의 계수는 아마도 양자화 후에 비-제로가 될 것이고, 이에 따라 전체 왜곡은 Q2/12로 추정된다. Q/σ가 임계치보다 크면, 아마도 대부분의 계수가 제로로 양자화될 것이다. 이 경우에, 전체 왜곡은 간단히 σ2로 추정된다. 제로 평균의 가정시에, σ2는 바로 모든 계수가 제로로 양자화될 때의 왜곡이다. 반대로, 본 발명의 하이브리드 모델은 이러한 2개의 효과적인 추정을 실제 비-제로 및 제로 양자화된 계수에 각각 개별적으로 적용하고, 이는 기존의 구분적 모델보다 더 정확한 모델이다.
사실상, 본 발명의 모델에서 부정확성을 야기할 수 있는 유일한 팩터는 비-제로 계수에 대한 균일한 분포 가정이다. 다양한 실험을 통해서, 추정된 왜곡이 실제 왜곡 값과 항상 매우 근접하기 때문에, 이러한 가정이 실제로 매우 정확한 가정이라는 것을 발견하였다. 반대로, ρ-도메인 모델 종래 기술 접근법의 분석적 D-(ρ,σ) 관계 가정, 및 레이트-왜곡 최적화 프레임 레벨 비트 레이트 할당 종래 기술 접근법의 보간을 위한 스무스 곡선 가정은 둘 다 본 발명의 가정보다 강한 모델링 가정이며, 본 발명에서 제안하는 모델에 비해 추정 정확도가 낮게 된다. 실험에서, 본 명세서에서 기술된 ρ-도메인 분석 모델의 추정 성능과 본 발명의 모델의 추정 성능을 비교하였다. 결과는 본 발명의 모델이 기존의 모델보다 지속적으로 우수한 성능을 달성한다는 것을 보여준다.
계산 복잡도의 측면에서, 기존의 ρ-도메인 모델과 유사하게, 본 발명의 모델 또한 변환 도메인에서의 왜곡을 추정한다. 따라서, 이는 일 회의 변환 동작을 요구하며, 이는 복잡도를 약간 증가하게 할 뿐이다. 특히, MPEG-4 AVC 표준에서, 적응된 변환은 원래의 이산 코사인 변환에 대한 근사(approximation)이고, 이는 계산 복잡도가 더 낮다. 본 발명의 모델에 의해 관련될 수 있는 복잡도는 제로 양자화된 계수의 왜곡 및 비율의 계산에 관련된다. 최악의 경우에는, 각 Q에 대해, 모든 변환 계수로 양자화를 행해야만 하고, 제로 양자화된 계수의 왜곡 및 수를 완전히 계수해야 하고, 이는 상당한 계산 복잡도를 요구할 것이다. 다행히, 실제로는, ρ 계산에 대한 고속 룩업 테이블 알고리즘이 존재하며, 이는 Dz(Q) 계산에 대한 본 발명의 경우로 확장될 수 있다. 이러한 고속 알고리즘으로, 모든 Q들에 대한 Dz(Q) 및 ρ(Q)가 모든 계수들에 대한 하나의 원 패스(one-pass)의 테이블 룩업 계산으로 획득될 수 있으며, 이 또한 복잡도를 약간 증가시킬 뿐이다. 하지만, 룩업 테이블의 저장을 위해 메모리 공간이 일부 추가로 소비된다.
실제로, 제안된 모델은 최적화된 프레임 레벨 비트 할당에 대한 프레임의 왜 곡 특성을 추정하는데 사용될 수 있다.
도 2 및 도 3은, 비디오 프레임의 D-Q 데이터를 추정하기 위한, 예시적 사전 분석 방법 및 예시적 사전 분석기를 각각 도시한다. 그 다음 결과적 데이터가 도 4에 도시된 바와 같이 프레임 레벨 비트 할당 또는 레이트 제어를 위해 사용된다. 도 4는 프레임 레벨 비트 할당 또는 레이트 제어를 위한 결과적 데이터의 사용을 도시하지만, 본 명세서에서 제시된 본 발명의 교시로서, 당업자는, 본 발명의 사상을 유지하면서, 프레임 레벨 비트 할당 및/또는 레이트 제어를 위한 결과적 데이터의 사용을 확장시킬 수 있다(예를 들어, 일부 실시예에서, 이 데이터는 둘 다를 위해 사용될 수 있다). 프레임 레벨 및 MB 레벨 레이트 제어 모듈을 포함하는 예시적 비디오 인코더가 도 5에 도시된다. 이들 도면에서, 일반적인 화상 집합(GOP;group-of-picture) 코딩 구조가 가정된다. 보통, 각 GOP의 제1 프레임은 I 프레임으로서 코딩될 것이다. 도 2 및 도 3에 도시된 바와 같이, 명료성 및 낮은 복잡도를 위해서, 인터 16×16 모드만이 사전 분석에서 가정된다. 물론, 본 발명이 인터 16×16 모드만으로 제한되는 것은 아니며, 따라서 본 발명의 사상을 유지하면서 다른 모드들도 사용될 수 있다. 또한, 사전 분석 가정된 기준 프레임과 실제 인코딩으로부터 나온 기준 프레임 간의 미스매치를 줄이기 위해서, 예측 기준에 대해 원래의 입력 프레임을 사용하는 대신에, 기준에 대한 근사화된 인코더 재생 프레임을 생성하도록 양자화가 적용될 수 있고, 여기에서 양자화 파라미터(QP)는 최종 인코딩된 GOP의 소정 평균 QP일 수 있다.
사전 분석 후에, 도 4에 도시된 바와 같이, 추정된 R-Q 및 D-Q 데이터는 프 레임 레벨 레이트 제어 모듈에서 사용되어 프레임 레벨 비트 할당을 수행할 것이다. 여기에서, RTarget은 타겟 비트 레이트를 나타내고, Ri -1, actual 및 Di -1, actual은 각각, 비트의 실제 인코딩된 수 및 인코딩 최종 코딩된 프레임, 즉, 프레임 i-1의 왜곡 값을 나타낸다. Ri , allocated는 현재 프레임, 즉, 프레임 i에 대해 최종적으로 할당된 비트 버짓(bit budget)이다. 과거의 인코딩 결과들, 즉, Ri -1, actual 및 Di -1, actual은 R 및 D 모델들의 파라미터, 예를 들어, 수학식 6의 제안된 D 모델에 대해서와 같이 파라미터 α를 적응적으로 갱신하는데 사용될 수 있다. 제안된 하이브리드 왜곡 모델을 통해 추정된 D-Q 데이터는 프레임 레벨 비트 할당을 최적화하기 위해 다양한 방법으로 적용될 수 있다. 예를 들어, 모든 잔여 프레임들을 고려하고 잔여 전체 비트 버짓의 제한을 만족시키면서, 최적 비트 할당이, 평균 왜곡을 최소화하거나 잔여 프레임의 최대 왜곡을 최소화하는 것으로 일반적으로 정의된다. 그 다음 프레임의 할당된 비트 버짓은 MB 레벨 레이트 제어 모듈로 보내지고, 이는 각 매크로블록(MB)에 대한 적절한 QP를 최종적으로 결정할 것이고, 할당된 비트 버짓을 정확하게 달성하게 된다. 이는 도 5에 도시된다.
도 2를 참조하면, 비디오 프레임의 D-QP 데이터를 추정하기 위한 예시적 방법이 전체적으로 참조 번호 200으로 표시된다.
방법(200)은 루프단 블록 210으로 제어를 보내는 개시 블록 250을 포함한다. 루프단 블록 210은 비디오 시퀀스의 각 프레임에 대해 루프를 행하고, 제어를 기능 블록 215로 보낸다. 기능 블록 215는, 레지듀 데이터를 생성하는 움직임 보상 예 측을 수행하고, 제어를 기능 블록 220으로 보낸다. 기능 블록 220은 각 프레임에 대해 다음 식,
Figure 112009012420406-PCT00012
을 계산하고, 제어를 루프단 블록 225로 보낸다. 루프단 블록 225는 각 프레임의 각 블록 i에 대해 루프를 행하고, 제어를 기능 블록 230으로 보낸다. 기능 블록 230은 현재 블록에 대한 계수를 생성하는 이산 코사인 변환(DCT)을 행하고, 제어를 기능 블록 235로 보낸다. 기능 블록 235는 {ρi(QP),Dz ,i(QP)}QP에 대해 고속 룩업 테이블 계산을 행하고, 제어를 각 블록 i에 대한 루프를 종료하는 루프단 블록 240으로 보내고, 제어를 기능 블록 245로 보낸다. 기능 블록 245는 각 프레임에 대해 다음 식,
Figure 112009012420406-PCT00013
을 계산하고, 제어를 루프단 블록 250으로 보낸다. 이 루프단 블록은 각 프레임에 대한 루프를 종료하고, 제어를 기능 블록 255로 보낸다. 기능 블록 255는 프레임 레벨 평균화를 행하여 {ρ(QP),Dz(QP)}QP를 얻고, 제어를 기능 블록 260으로 보낸다. 기능 블록 260은
Figure 112009012420406-PCT00014
Figure 112009012420406-PCT00015
를 계산하고, 제어를 종료 블록 299로 보낸다.
도 3을 참조하면, 추정된 레이트-왜곡 모델 데이터의 생성에 관한 예시적 사전 분석기가 전체적으로 참조 번호 300으로 표시된다.
사전 분석기(300)는, 변환기(310)의 입력과 신호 통신으로 접속된 출력을 갖는 합성기(305)를 포함한다. 변환기(310)의 출력은 고속 룩업 테이블(315)의 입력 및 양자화기(325)의 입력과 신호 통신으로 접속된다. 고속 룩업 테이블(315)의 출 력은 프레임 레벨 ρ-Q 데이터 및 D-Q 데이터 계산기(320)의 입력과 신호 통신으로 접속된다.
양자화기(325)의 출력은 역 양자화기(330)의 입력과 신호 통신으로 접속된다. 역 양자화기(330)의 출력은 역 변환기(335)의 입력과 신호 통신으로 접속된다. 역 변환기(335)의 출력은 합성기(340)의 제1 비반전 입력과 신호 통신으로 접속된다. 합성기(340)의 출력은 참조 화상 버퍼(345)의 입력과 신호 통신으로 접속된다. 참조 화상 버퍼(345)의 출력은 움직임 추정기(350)의 제2 입력과 신호 통신으로 접속된다. 움직임 추정기(350)의 출력은 움직임 보상기(355)의 입력과 신호 통신으로 접속된다. 움직임 보상기(355)의 출력은 합성기(340)의 제2 비반전 입력 및 합성기(305)의 반전 입력과 신호 통신으로 접속된다.
합성기(305)의 입력 및 움직임 추정기(350)의 입력은, 입력 비디오 프레임을 수신하기 위한, 사전 분석기(300)에 대한 입력으로서 이용가능하다. 프레임 레벨 ρ-Q 데이터 및 D-Q 데이터 계산기(320)의 출력은, 프레임 레벨 레이트 제어 데이터를 출력하기 위한, 사전 분석기(300)의 출력으로서 이용가능하다.
고속 룩업 테이블(315)은 각 매크로블록(MB)의 ρ-Q 데이터 및 Dz-Q 데이터를 계산하는데 사용된다. 프레임 레벨 ρ-Q 데이터 및 D-Q 데이터 계산기(320)는 제안된 하이브리드 모델을 이용해서 ρ-Q 데이터 및 D-Q 데이터를 계산한다. 움직임 추정기(350)는 인터 16×16 모드를 사용해서, 움직임 보상기(355)에 의해 사용될 움직임 추정을 생성하고, 이어서 움직임 보상기(355)는 움직임 보상된 예측을 생성한다.
이제, 도 2 또는 도 3의 블록 레벨 고속 룩업 테이블 및 프레임 레벨 평균화에 대한 2개의 관련 블록에 관한 설명이 각각 제공된다.
먼저, 변환 블록의 ρ(QP) 및 Dz(QP) 계산에 대한 고속 룩업 테이블 알고리즘을 설명한다. 전체 프레임의 관련 양은 이들의 대응하는 블록 레벨 양으로부터 나올 수 있다. 상이한 비디오 코딩 표준은 상이한 변환 및/또는 변환 블록 사이즈를 가질 수 있다는 것을 주지해야 한다. 예를 들어, ITU-T H.263 권고(이후, "H.263 권고") 및 MPEG-4 AVC 표준의 단순 프로파일에서, 적응된 변환은 이산 코사인 변환이고, 이는 프레임의 각 8×8 블록에서 수행되며, MPEG-4 AVC 표준의 현 버전(즉, 비 단순 프로파일)에서, 이 변환은 4×4 블록에 대한 수정된 이산 코사인 변환이다. 각각의 변환된 블록에 대해, 고속 룩업 테이블 알고리즘은 다음과 같다.
블록 레벨 고속 계산:
(1) 초기화: ∀QP,
Figure 112009012420406-PCT00016
(2) 원 패스 테이블 룩업: 각 계수 Coeffi에 대해:
(a) Leveli = |Coeffi|.
(b) QPi = QP_level_Table[Leveli]. QP_level_Table은, 각 계수 레벨에 대해, 제로가 될 그 특정 레벨의 계수를 양자화할 최소 양자화 파라미터(QP)를 나타내는 테이블이다.
(c) ρ(QPi) = ρ(QPi)+1, Dz(QPi) = Dz(QPi)+Coeffi 2.
(3) 합: 각 QP에 대해, QPmin에서 시작해서 QPmax 까지:
Figure 112009012420406-PCT00017
프레임의 모든 블록에 대해 {ρ(QP),Dz(QP)}QP를 얻은 후에, 이 데이터를 각각 평균화하여, 아래에 나타내는 바와 같이 대응하는 프레임 레벨 양을 얻을 수 있다. 여기에서, B는 프레임의 블록들의 전체 수를 나타낸다.
프레임 레벨 평균화: 각 QP에 대해:
(1)
Figure 112009012420406-PCT00018
(2) ρ(QP)>0이면,
Figure 112009012420406-PCT00019
그렇지 않으면,
Figure 112009012420406-PCT00020
위로부터, 모든 양자화 파라미터들의 ρ 및 Dz가 모든 변환 계수에 대한 QP_level_Table 룩업의 원 패스로 계산될 수 있으며, 발생된 계산 비용이 상당히 낮다는 것을 알 수 있다.
상술한 고속 계산 알고리즘으로, 제안된 하이브리드 왜곡 모델은 매우 낮은 계산 복잡도로 매우 정확한 왜곡 추정을 달성할 수 있다. MPEG-4 AVC 표준 단순 프로파일 인코더에서 이 모델을 구현하였고, 광범위한 실험을 통해서 그 성능을 완전히 조사하였다. 그 결과는, 제안된 하이브리드 왜곡 모델이 지속적으로 최적에 가까운 추정 정확도를 달성한다는 것, 즉, 추정된 왜곡이 항상 실제 왜곡에 근접한다는 것을 보여준다. 이러한 추정 성능은 다른 공지된 왜곡 모델보다 개선되었다. 또한, 발생되는 계산 비용이 상당히 낮다. 따라서, 제안된 왜곡 모델은 일반적으로 비트 할당 과제에 기초한 임의의 레이트-왜곡 최적화에 적용되어 기존의 왜곡 모델을 대체하고, 이에 따라, 비디오 코딩 시스템의 전체 성능을 개선할 수 있다.
도 4를 참조하면, 도 1의 하이브리드 왜곡 모델이 적용될 수 있는 예시적 프레임 레벨 레이트 제어기가 전체적으로 참조 번호 400으로 표시된다.
프레임 레벨 레이트 제어기(400)는, 프레임 레벨 비트 할당기(410)의 제1 입력과 신호 통신하는 출력을 갖는 제1 갱신기(405)를 포함한다. 프레임 레벨 레이트 제어기(400)는 또한 프레임 레벨 비트 할당기(410)의 제2 입력과 신호 통신으로 접속된 출력을 갖는 제2 갱신기(415)를 포함한다.
제1 갱신기(405)의 제1 입력은, RTarget을 수신하기 위한, 프레임 레벨 레이트 제어기(400)에 대한 입력으로서 이용가능하다.
제1 갱신기(405)의 제2 입력 및 제2 갱신기(415)의 제1 입력은, Ri -1, actual을 수신하기 위한, 프레임 레벨 레이트 제어기(400)에 대한 입력으로서 이용가능하다.
제2 갱신기(415)의 제2 입력은, Di -1, actual을 수신하기 위한, 프레임 레벨 레이트 제어기(400)의 입력으로서 이용가능하다.
제2 갱신기(415)의 제3 입력은, 예를 들어, 도 3의 사전 분석기(300)로부터, R-Q 및 D-Q 데이터에 대한 추정 값을 수신하기 위한, 프레임 레벨 레이트 제어 기(400)의 입력으로서 이용가능하다.
프레임 레벨 비트 할당기(410)의 출력은, Ri , allocated을 출력하기 위한, 프레임 레벨 레이트 제어기(400)의 출력으로서 이용가능하다.
제1 갱신기(405)는 현재 GOP의 잔여 프레임에 대한 잔여 비트를 갱신하기 위한 것이다. 제2 갱신기(415)는 R 및 D 모델링 파라미터를 갱신하기 위한 것이다. 프레임 레벨 비트 할당기(410)는 현재 GOP의 잔여 프레임에 대한 프레임 레벨 비트 할당을 수행하기 위한 것이다.
도 5를 참조하면, 본 발명이 적용될 수 있는 예시적 인코더가 전체적으로 참조 번호 500으로 표시된다.
인코더(500)는 변환기(510)의 입력과 신호 통신하는 출력을 갖는 합성기(505)를 포함한다. 변환기(510)의 출력은 양자화기(515)의 제1 입력과 신호 통신으로 접속된다. 양자화기(515)의 제1 출력은 가변 길이 코더(VLC;variable length coder)(555)의 입력과 신호 통신으로 접속된다. 가변 길이 코더(555)의 제1 출력은, 매크로블록 레벨 레이트 제어기(560)의 제1 입력 및 프레임 레벨 실제 인코딩된 비트 계산기(565)의 입력과 신호 통신으로 접속된다. 매크로블록 레벨 레이트 제어기(560)의 출력은, 양자화기(515)의 제2 입력 및 역 양자화기(520)의 제2 입력과 신호 통신으로 접속된다. 양자화기(515)의 제2 출력은 역 양자화기(520)의 제1 입력과 신호 통신으로 접속된다. 역 양자화기(520)의 출력은 역 변환기(525)의 입력과 신호 통신으로 접속된다. 역 변환기(525)의 출력은 합성 기(530)의 제1 비 반전 입력과 신호 통신으로 접속된다. 합성기(530)의 출력은 프레임 레벨 실제 인코딩된 왜곡 계산기(550)의 제2 입력 및 참조 화상 버퍼(535)의 입력과 신호 통신으로 접속된다. 참조 화상 버퍼(535)의 출력은 움직임 추정기 및 코딩 모드 선택기(540)의 제2 입력과 신호 통신으로 접속된다. 움직임 추정기 및 코딩 모드 선택기(540)의 출력은 움직임 보상기(545)의 입력과 신호 통신으로 접속된다. 움직임 보상기(545)의 출력은, 합성기(505)의 반전 입력 및 합성기(530)의 제2 비 반전 입력과 신호 통신으로 접속된다. 프레임 레벨 실제 인코딩된 비트 계산기(565)의 출력은 프레임 레벨 레이트 제어기(570)의 제1 입력과 신호 통신으로 접속된다. 프레임 레벨 레이트 제어기(570)의 출력은 매크로블록 레벨 레이트 제어기(560)의 제2 입력과 신호 통신으로 접속된다. 프레임 레벨 실제 인코딩된 왜곡 계산기(550)의 출력은 프레임 레벨 레이트 제어기(570)의 제2 입력과 신호 통신으로 접속된다.
합성기(505)의 비 반전 입력, 움직임 추정기(540)의 제1 입력, 및 프레임 레벨 실제 인코딩된 왜곡 계산기(550)의 제1 입력은, 입력 비디오 프레임을 수신하기 위한 인코더(500)의 입력으로서 이용될 수 있다.
가변 길이 코더(555)의 제2 출력은, 인코딩된 비디오 비트스트림을 출력하기 위한 인코더(500)의 출력으로서 이용될 수 있다.
이제, 본 발명의 다수의 부수적 장점/특징들의 일부에 대해서 설명될 것이며, 이들의 일부는 상술하였다. 예를 들어, 일 장점/특징은, 비디오 인코딩 왜곡을 제1 부분 및 제2 부분으로 나누고, 경험적 계산을 이용해서 제1 부분을 계산하 고, 분석적 계산을 이용해서 제2 부분을 계산함으로써, 비디오 인코딩 왜곡을 모델링하기 위한 왜곡 계산기를 갖는 장치이다.
다른 장점/특징은 상술한 바와 같은 왜곡 계산기를 갖는 장치이고, 여기에서 경험적 계산은 실질적으로 완전한 것이다.
또 다른 장점/특징은 상술한 바와 같은 왜곡 계산기를 갖는 장치이고, 여기에서 왜곡 계산기는, 제1 부분에 대해 제로 양자화된 계수 왜곡을 할당하고, 제2 부분에 대해 비 제로(non-zero) 양자화된 계수 왜곡을 할당함으로써 비디오 인코딩 왜곡을 나눈다.
또한, 다른 장점/특징은, 상술한 바와 같이 제1 부분에 대해 제로 양자화된 계수 왜곡을 할당하고, 제2 부분에 대해 비 제로 양자화된 계수 왜곡을 할당함으로써 비디오 인코딩 왜곡을 나누는 왜곡 계산기를 갖는 장치이고, 여기에서 제로 양자화된 계수 왜곡은 정확하게 계산된다.
또한, 다른 장점/특징은, 상술한 바와 같이 제1 부분에 대해 제로 양자화된 계수 왜곡을 할당하고, 제2 부분에 대해 비 제로 양자화된 계수 왜곡을 할당함으로써 비디오 인코딩 왜곡을 나누는 왜곡 계산기를 갖는 장치이고, 여기에서 왜곡 계산기는, 모든 제로 양자화된 계수에 대해 원 패스 룩업을 사용해서 모든 양자화 스텝 사이즈에 대한 제로 양자화된 계수 왜곡의 값을 계산한다.
또한, 다른 장점/특징은, 상술한 바와 같이 제1 부분에 대해 제로 양자화된 계수 왜곡을 할당하고, 제2 부분에 대해 비 제로 양자화된 계수 왜곡을 할당함으로써 비디오 인코딩 왜곡을 나누는 왜곡 계산기를 갖는 장치이고, 여기에서 비 제로 양자화된 계수 왜곡은 균일한 분포의 랜덤 변수를 사용해서 추정된다.
또한, 다른 장점/특징은, 상술한 바와 같은 왜곡 계산기를 갖는 장치이고, 여기에서 왜곡 계산기는 비디오 인코딩 왜곡을 사용해서 프레임 비트 버짓을 할당하는 비디오 인코더에 포함된다.
또한, 다른 장점/특징은, 상술한 바와 같은 왜곡 계산기를 갖는 장치이고, 여기에서 비디오 인코딩 왜곡은 소스 코딩 평균 제곱 오차 왜곡이다.
다른 장점/특징은, 영상 데이터에 대한 비디오 인코딩 왜곡을 모델링함으로써 영상 데이터를 인코딩하기 위한 비디오 인코더를 갖는 장치이다. 인코더는 비디오 인코딩 왜곡을 제1 부분 및 제2 부분으로 나누고, 경험적 계산을 이용해서 제1 부분을 계산하고, 분석적 계산을 이용해서 제2 부분을 계산함으로써 비디오 인코딩 왜곡을 모델링한다.
또 다른 장점/특징은, 상술한 바와 같은 비디오 인코더를 갖는 장치이고, 여기에서 경험적 계산은 실질적으로 완전한 것이다.
또한, 다른 장점/특징은 상술한 바와 같은 비디오 인코더를 갖는 장치이고, 여기에서 비디오 인코더는, 제1 부분에 대해 제로 양자화된 계수 왜곡을 할당하고, 제2 부분에 대해 비 제로 양자화된 계수 왜곡을 할당함으로써 비디오 인코딩 왜곡을 나눈다.
또한, 다른 장점/특징은, 상술한 바와 같이 제1 부분에 대해 제로 양자화된 계수 왜곡을 할당하고, 제2 부분에 대해 비 제로 양자화된 계수 왜곡을 할당함으로써 비디오 인코딩 왜곡을 나누는 비디오 인코더를 갖는 장치이고, 여기에서 제로 양자화된 계수 왜곡은 정확하게 계산된다.
또한, 다른 장점/특징은, 상술한 바와 같이 제1 부분에 대해 제로 양자화된 계수 왜곡을 할당하고, 제2 부분에 대해 비 제로 양자화된 계수 왜곡을 할당함으로써 비디오 인코딩 왜곡을 나누는 비디오 인코더를 갖는 장치이고, 여기에서 비디오 인코더는, 모든 제로 양자화된 계수에 대해 원 패스 룩업을 사용해서 모든 양자화 스텝 사이즈에 대한 제로 양자화된 계수 왜곡의 값을 계산한다.
또한, 다른 장점/특징은, 상술한 바와 같이 제1 부분에 대해 제로 양자화된 계수 왜곡을 할당하고, 제2 부분에 대해 비 제로 양자화된 계수 왜곡을 할당함으로써 비디오 인코딩 왜곡을 나누는 비디오 인코더를 갖는 장치이고, 여기에서 비 제로 양자화된 계수 왜곡은 균일한 분포의 랜덤 변수를 사용해서 추정된다.
또한, 다른 장점/특징은, 상술한 바와 같은 비디오 인코더를 갖는 장치이고, 여기에서 비디오 인코딩 왜곡은 소스 코딩 평균 제곱 오차 왜곡이다.
본 발명의 상기 및 기타 특징 및 장점들은 본 명세서의 교시에 기초해서 당업자에 의해 용이하게 확인될 수 있을 것이다. 본 발명의 교시가 다양한 형태의 하드웨어, 소프트웨어, 펌웨어, 전용 프로세서, 또는 이들의 조합으로 구현될 수 있다는 것을 이해할 것이다.
가장 바람직하게, 본 발명의 교시는 하드웨어 및 소프트웨어의 조합으로서 구현된다. 또한, 소프트웨어는 프로그램 저장부에 실재적으로 구현되는 애플리케이션 프로그램으로서 구현될 수 있다. 애플리케이션 프로그램은 임의의 적합한 구조를 갖는 기기로 업로드되어 이 기기에 의해 실행될 수 있다. 바람직하게, 기기 는, 하나 이상의 중앙 처리 장치(CPU), RAM, 및 입/출력(I/O) 인터페이스와 같은 하드웨어를 갖는 컴퓨터 플랫폼으로 구현된다. 컴퓨터 플랫폼은 또한 운영 체계 및 마이크로명령어 코드를 포함할 수 있다. 본 명세서에서 기술된 다양한 프로세스 및 기능들은, CPU에 의해 실행될 수 있는, 마이크로명령어 코드의 일부 또는 애플리케이션 프로그램의 일부, 또는 이들의 임의의 조합일 수 있다. 또한, 추가의 데이터 저장부 및 인쇄부와 같은 다양한 다른 주변부들이 컴퓨터 플랫폼에 연결될 수 있다.
또한, 첨부 도면에 도시된 구성 시스템 요소 및 방법들의 일부가 양호하게 소프트웨어로 구현되기 때문에, 시스템 구성 요소들 또는 프로세스 기능 블록들 간의 실제 접속은, 본 발명이 프로그램되는 방식에 따라서 달라질 수 있다. 본 명세서의 교시를 통해서, 당업자는 본 발명의 상기 및 유사 구현들 또는 구성들을 고안할 수 있을 것이다.
예시적 실시예들이 첨부 도면을 참조해서 본 명세서에서 기술되었지만, 본 발명은 이러한 명확한 실시예들로 제한되는 것은 아니며, 본 발명의 범위 또는 사상에서 벗어나지 않으면서 다양한 변경 및 수정들이 당업자에 의해 이루어질 수 있다는 것을 이해해야 한다. 이러한 모든 변경 및 수정들은 첨부된 청구항에서 정의되는 바와 같이 본 발명의 범위 내에 포함되는 것으로 의도된다.

Claims (23)

  1. 비디오 인코딩 왜곡을 제1 부분 및 제2 부분으로 나누고, 경험적 계산을 이용해서 상기 제1 부분을 계산하고, 분석적 계산을 이용해서 상기 제2 부분을 계산함으로써 비디오 인코딩 왜곡을 모델링하는 왜곡 계산기(315, 320)를 포함하는 장치.
  2. 제1항에 있어서,
    상기 경험적 계산은 실질적으로 완전한(exhaustive) 것인 장치.
  3. 제1항에 있어서,
    상기 왜곡 계산기(315, 320)는, 상기 제1 부분에 대해 제로(zero) 양자화된 계수 왜곡을 할당하고, 상기 제2 부분에 대해 비 제로(non-zero) 양자화된 계수 왜곡을 할당함으로써 상기 비디오 인코딩 왜곡을 나누는 장치.
  4. 제3항에 있어서,
    상기 제로 양자화된 계수 왜곡은 정확하게 계산되는 장치.
  5. 제3항에 있어서,
    상기 왜곡 계산기(315, 320)는, 모든 제로 양자화된 계수에 대해 원 패스 룩 업(one-pass look-up)을 사용해서 모든 양자화 스텝 사이즈에 대한 제로 양자화된 계수 왜곡의 값을 계산하는 장치.
  6. 제3항에 있어서,
    상기 비 제로 양자화된 계수 왜곡은 균일한 분포의 랜덤 변수를 사용해서 추정되는 장치.
  7. 제1항에 있어서,
    상기 왜곡 계산기(315, 320)는, 상기 비디오 인코딩 왜곡을 사용해서 프레임 비트 버짓(bit budget)을 할당하는 비디오 인코더에 포함되는 장치.
  8. 제1항에 있어서,
    상기 비디오 인코딩 왜곡은 소스 코딩 평균 제곱 오차 왜곡인 장치.
  9. 영상 데이터에 대한 비디오 인코딩 왜곡을 모델링함으로써 영상 데이터를 인코딩하는 비디오 인코더(500)를 포함하고, 상기 인코더는, 상기 비디오 인코딩 왜곡을 제1 부분 및 제2 부분으로 나누고, 경험적 계산을 이용해서 상기 제1 부분을 계산하고, 분석적 계산을 이용해서 상기 제2 부분을 계산함으로써 상기 비디오 인코딩 왜곡을 모델링하는 장치.
  10. 제9항에 있어서,
    상기 경험적 계산은 실질적으로 완전한 것인 장치.
  11. 제9항에 있어서,
    상기 비디오 인코더(500)는, 상기 제1 부분에 대해 제로 양자화된 계수 왜곡을 할당하고, 상기 제2 부분에 대해 비 제로 양자화된 계수 왜곡을 할당함으로써 상기 비디오 인코딩 왜곡을 나누는 장치.
  12. 제11항에 있어서,
    상기 제로 양자화된 계수 왜곡은 정확하게 계산되는 장치.
  13. 제11항에 있어서,
    상기 비디오 인코더(500)는, 모든 제로 양자화된 계수에 대해 원 패스 룩업을 사용해서 모든 양자화 스텝 사이즈에 대한 제로 양자화된 계수 왜곡의 값을 계산하는 장치.
  14. 제11항에 있어서,
    상기 비 제로 양자화된 계수 왜곡은 균일한 분포의 랜덤 변수를 사용해서 추정되는 장치.
  15. 제9항에 있어서,
    상기 비디오 인코딩 왜곡은 소스 코딩 평균 제곱 오차 왜곡인 장치.
  16. 비디오 인코딩 왜곡을 모델링하는 단계를 포함하고, 상기 모델링하는 단계는,
    상기 비디오 인코딩 왜곡을 제1 부분 및 제2 부분으로 나누는 단계;
    경험적 계산을 이용해서 상기 제1 부분을 계산하는 단계(130); 및
    분석적 계산을 이용해서 상기 제2 부분을 계산하는 단계(150)
    를 포함하는 방법.
  17. 제16항에 있어서,
    상기 경험적 계산은 실질적으로 완전한(130) 방법.
  18. 제16항에 있어서,
    상기 나누는 단계는, 상기 제1 부분에 대해 제로 양자화된 계수 왜곡을 할당하고(130), 상기 제2 부분에 대해 비 제로 양자화된 계수 왜곡을 할당(150)함으로써 상기 비디오 인코딩 왜곡을 나누는 방법.
  19. 제18항에 있어서,
    상기 제로 양자화된 계수 왜곡은 정확하게 계산되는(130) 방법.
  20. 제18항에 있어서,
    상기 제1 부분을 계산하는 단계는, 모든 제로 양자화된 계수에 대해 원 패스 룩업을 사용해서 모든 양자화 스텝 사이즈에 대한 제로 양자화된 계수 왜곡의 값을 계산하는 단계(235)를 포함하는 방법.
  21. 제18항에 있어서,
    상기 제2 부분을 계산하는 단계는, 균일한 분포의 랜덤 변수를 사용해서 추정되는 비 제로 양자화된 계수 왜곡을 추정하는 단계(260)를 포함하는 방법.
  22. 제16항에 있어서,
    상기 방법은, 상기 비디오 인코딩 왜곡(200)을 사용해서 프레임 비트 버짓을 할당하는(570, 410) 비디오 인코더(500)에서 수행되는 방법.
  23. 제16항에 있어서,
    상기 비디오 인코딩 왜곡은 소스 코딩 평균 제곱 오차 왜곡(235, 260)인 방법.
KR1020097004287A 2006-08-30 2007-08-21 분석적이고 경험적인 하이브리드 인코딩 왜곡 모델링을 위한 방법 및 장치 KR101377833B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US82394206P 2006-08-30 2006-08-30
US60/823,942 2006-08-30
PCT/US2007/018481 WO2008027250A2 (en) 2006-08-30 2007-08-21 Method and apparatus for analytical and empirical hybrid encoding distortion modeling

Publications (2)

Publication Number Publication Date
KR20090057236A true KR20090057236A (ko) 2009-06-04
KR101377833B1 KR101377833B1 (ko) 2014-03-26

Family

ID=39032145

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097004287A KR101377833B1 (ko) 2006-08-30 2007-08-21 분석적이고 경험적인 하이브리드 인코딩 왜곡 모델링을 위한 방법 및 장치

Country Status (7)

Country Link
US (1) US8265172B2 (ko)
EP (1) EP2060125B1 (ko)
JP (1) JP5087624B2 (ko)
KR (1) KR101377833B1 (ko)
CN (1) CN101513072B (ko)
DE (1) DE602007013775D1 (ko)
WO (1) WO2008027250A2 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8982947B2 (en) * 2007-07-20 2015-03-17 The Hong Kong University Of Science And Technology Rate control and video denoising for noisy video data
KR20120084168A (ko) * 2011-01-19 2012-07-27 삼성전자주식회사 비디오 인코딩 모드 선택 방법 및 이를 수행하는 비디오 인코딩 장치
EP2544450B1 (en) * 2011-07-07 2016-04-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Model parameter estimation for a rate- or distortion-quantization model function
KR102114252B1 (ko) 2013-07-05 2020-05-22 삼성전자 주식회사 영상을 부호화하기 위한 영상 예측 모드 결정 방법 및 장치
JP6145069B2 (ja) * 2014-04-30 2017-06-07 日本電信電話株式会社 主観画質推定装置及び主観画質推定プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1157080A (zh) 1995-04-25 1997-08-13 菲利浦电子有限公司 用于编码视频图像的装置和方法
US6434196B1 (en) * 1998-04-03 2002-08-13 Sarnoff Corporation Method and apparatus for encoding video information
JP2003530736A (ja) * 1999-11-29 2003-10-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチメディアデータの符号化及び復号化方法
JP2002185966A (ja) 2000-12-15 2002-06-28 Matsushita Electric Ind Co Ltd 映像符号化装置
US6687294B2 (en) * 2001-04-27 2004-02-03 Koninklijke Philips Electronics N.V. Distortion quantizer model for video encoding
US7194035B2 (en) 2003-01-08 2007-03-20 Apple Computer, Inc. Method and apparatus for improved coding mode selection
WO2004080050A2 (en) * 2003-03-03 2004-09-16 Koninklijke Philips Electronics N.V. Video encoding
CN1774931A (zh) * 2003-04-17 2006-05-17 皇家飞利浦电子股份有限公司 对编码视频数据的内容分析
US7327786B2 (en) * 2003-06-02 2008-02-05 Lsi Logic Corporation Method for improving rate-distortion performance of a video compression system through parallel coefficient cancellation in the transform
KR100594056B1 (ko) * 2003-09-01 2006-07-03 삼성전자주식회사 효율적인 비트율 제어를 위한 h.263/mpeg 비디오인코더 및 그 제어 방법
JP2006140758A (ja) 2004-11-12 2006-06-01 Toshiba Corp 動画像符号化方法、動画像符号化装置および動画像符号化プログラム

Also Published As

Publication number Publication date
JP5087624B2 (ja) 2012-12-05
US20090232225A1 (en) 2009-09-17
KR101377833B1 (ko) 2014-03-26
CN101513072A (zh) 2009-08-19
CN101513072B (zh) 2011-07-27
DE602007013775D1 (de) 2011-05-19
EP2060125B1 (en) 2011-04-06
US8265172B2 (en) 2012-09-11
WO2008027250A2 (en) 2008-03-06
WO2008027250A3 (en) 2008-05-22
EP2060125A2 (en) 2009-05-20
JP2010503265A (ja) 2010-01-28

Similar Documents

Publication Publication Date Title
KR100484148B1 (ko) 개선된 비트율 제어 방법과 그 장치
US7889790B2 (en) Method and apparatus for dynamically adjusting quantization offset values
KR101169108B1 (ko) 적응형 레이트 제어를 구비한 인코더
KR100238066B1 (ko) 양자화활동도를 이용한 비트 발생량 제어방법 및 그 영상 부호화장치
KR100960249B1 (ko) Min-max 접근법을 이용하여 비디오 코딩을 하기 위한2 패스 레이트 제어 기술
JP2006140758A (ja) 動画像符号化方法、動画像符号化装置および動画像符号化プログラム
CA2692782C (en) Video encoding apparatus and method, video encoding program, and storage medium which stores the program
WO2005004335A2 (en) Cauchy-distribution based coding system and method
KR20080066684A (ko) 레이트-왜곡 특징들을 사용하는 비디오 코딩을 위한 2 패스레이트 제어 기술들
KR101282193B1 (ko) 칼만 필터와 fir 필터를 사용한 동영상 인코더에서의 비트율 제어 방법
KR101377833B1 (ko) 분석적이고 경험적인 하이브리드 인코딩 왜곡 모델링을 위한 방법 및 장치
KR20150095591A (ko) 시각적 인지 특성을 이용한 pvc 방법
KR20040007818A (ko) 동영상 부호화를 위한 dct연산량 조절 방법 및 그 장치
KR100790148B1 (ko) 실시간 영상 복잡도 측정 방법
KR101336445B1 (ko) 비디오 인코딩 데이터율 제어 방법
KR100797396B1 (ko) 매크로블록 복잡도를 이용한 트랜스코딩 비트율 제어 방법및 장치
KR100800838B1 (ko) 비디오 인코딩 데이터율 제어 방법
KR101058524B1 (ko) 비트량 제어장치 및 제어방법
KR100835661B1 (ko) 다수 필터 결정법을 이용한 동영상 압축 부호화 장치 및방법
KR100911098B1 (ko) H.263 영상 부호화에 의한 왜곡량 예측 장치 및 그 방법
KR100207419B1 (ko) 부호화 비트발생율 제어방법 및 그 제어장치
KR100207418B1 (ko) 부호화 비트발생율 제어방법 및 그 제어장치
KR20040028332A (ko) 실시간 h.263 영상 부호율 제어를 위한 비트량 예측 장치및 그 방법
KR100207416B1 (ko) 부호화 비트발생율 제어방법 및 그 제어장치
KR100569388B1 (ko) 동영상 양자화 장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee