KR20060133953A - 비디오 픽처를 인코딩하는 프로세스 및 장치 - Google Patents

비디오 픽처를 인코딩하는 프로세스 및 장치 Download PDF

Info

Publication number
KR20060133953A
KR20060133953A KR1020067004318A KR20067004318A KR20060133953A KR 20060133953 A KR20060133953 A KR 20060133953A KR 1020067004318 A KR1020067004318 A KR 1020067004318A KR 20067004318 A KR20067004318 A KR 20067004318A KR 20060133953 A KR20060133953 A KR 20060133953A
Authority
KR
South Korea
Prior art keywords
macroblock
picture
encoding
parameter
control
Prior art date
Application number
KR1020067004318A
Other languages
English (en)
Inventor
토비아스 힌즈
헤이코 슈와츠
토마스 위갠드
Original Assignee
톰슨 라이센싱
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 톰슨 라이센싱 filed Critical 톰슨 라이센싱
Publication of KR20060133953A publication Critical patent/KR20060133953A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • H04N19/194Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

오늘날의 비디오 코덱은 다수의 코딩 옵션들 간의 현명한 선택을 요구한다. 이러한 선택은 라그랑쥬 코더 제어를 사용하여 효과적으로 행해질 수 있다. 그러나, 라그랑쥬 코더 제어는 일부 미지의 전송 레이트에 대응하는 특정 라그랑쥬 파라미터가 주어져야만 결과를 제공한다. 한편, 레이트 제어 알고리즘은 라그랑쥬 코더 제어의 최적화 성능 없이 주어진 비트레이트에서 코딩 결과를 제공한다.
하이브리드 비디오 코딩에 대한 레이트 제어 및 라그랑쥬 최적화의 조합이 검토된다. 이들 두개의 공지된 방법은 매크로블록 모드 결정 및 양자기 적용을 사용하여 비디오 코더 제어에 사용하기 위한 새로운 접근법이 제안된다. 제안된 접근법의 레이트-왜곡 성능은 실험 결과를 통해 유효화되고 분석된다. 대부분의 비트-레이트에 대해, 픽처 당 일정 수의 비트를 발생하는 결합된 레이트 제어 및 라그랑쥬 최적화는 단지 라그랑쥬 최적화만을 사용하는 일정 기울기의 경우와 마찬가지로 유사한 레이트 왜곡 성능을 얻는다.
매크로블록, 추정, 비디오, 픽처, 레이트, 코딩, 파라미터,

Description

비디오 픽처를 인코딩하는 프로세스 및 장치{PROCESS AND ARRANGEMENT FOR ENCODING VIDEO PICTURES}
본 발명은 비디오 픽처를 인코딩하는 프로세스 및 장치에 관한 것이다. 특히, 본 발명은 매크로블록 층의 동작 제어에 관한 것이고, 비디오 시퀀스를 인코딩하는데 이용가능하다.
MPEG-2 비주얼 [1], H.263 [2], MPEG-4 비주얼 [3] 및 H.264/AVC [4]를 포함하는 대부분의 블록 기반 하이브리드 비디오 인코딩 표준의 상세는 상호 운용가능 하게 하기 위해 단지 비트-스트림 구문(syntax) 및 디코딩 프로세스 만을 제공한다. 인코딩 프로세스는 유연하게 구현하기 위한 범위 밖에 있다. 그러나, 소스 인코더의 동작 제어는 비디오 압축에서 중요한 문제이다. 비디오 소스의 인코딩을 위해, 양자화 파라미터, 매크로블록 및 블록 모드, 움직임 벡터, 및 양자화 변환 계수와 같은 다양한 코딩 파라미터가 결정되어야 한다. 한편으로는, 선택된 값은 주어진 디코더에 대해 생성된 비트-스트림의 레이트-왜곡 효율을 결정한다. 다른 한편으로는, 이들 파라미터 또한 요구된 전송 레이트 및 디코딩 지연을 결정한다.
고정 레이트 채널을 통한 실시간 비디오 통신에서, 동작 코더 제어의 일반적인 목적은, 전송 레이트 및 디코딩 지연에 주어진 조건을 유지하면서 최상의 가능 한 비디오 품질을 획득하는 것이다. 관계된 대규모의 파라미터 공간에 기인하여, 이것은 사소한 문제가 아니다. 또한, 동작 코더 제어는 실시간 애플리케이션에 적용될 수 있도록 복잡도가 낮은 것이 요구된다.
레이트-왜곡 최적화 인코딩에 대해 광범위하게 수용되는 접근법은 라그랑쥬(Lagrangian) 비트-할당 기술이다. 이 접근법의 대중화는 효율성 및 간소화에 기인한다. 매크로블록에 대하여 고정 양자화 파라미터(QP)가 주어지면, 매크로블록 모드 뿐만 아니라 관련 블록 모드 및 움직임 벡터가 라그랑쥬 비용 함수
Figure 112006015160137-PCT00001
를 최소화함으로써 결정되며, 여기에서 왜곡 측정(D)은 라그랑쥬 곱수(λ)를 사용하여 레이트 항(R)에 부가된다. 라그랑쥬 곱수(λ)는 단지 주어진 매크로블록 양자화 파라미터(QP)에만 의존한다. 이 라그랑쥬 코더 제어는 저자 [5, 6, 7, 8]에 의해 H.263, MPEG-4 비주얼 및 H.264/AVC에 성공적으로 적용되었다. 모든 경우에, 이러한 향상된 인코딩 전략은, 비디오 소스가 고정 양자화 파라미터(QP)를 사용하여 코딩되는 경우, 이전의 인코딩 전략인 H.263, MPEG-4 비주얼 및 H.264/AVC 각각에 비하여 가시적인 성능 이득을 제공한다.
블록 기반 하이브리드 비디오 코더를 동작시키는 간단하고 효율적인 매크로블록 레이트-제어 알고리즘은 [9]에 제공되어 있다. 픽처에 대한 목표 비트 수 및 픽처 내부의 모든 매크로블록의 예측 에러 신호가 주어지면, 매크로블록 양자화 파라미터(QP)는 목표 비트 수가 상당히 정확하게 적중(hit)되면서 픽처의 왜곡은 최소화되는 방식으로 조정된다.
라그랑쥬 비트-할당 기술 및 매크로블록 기반 레이트 제어 알고리즘의 이들 두개의 코더 제어 전략의 결합은, 다음의 상호 의존성이 고려되어야 하기 때문에 간단하지 않다:
- 레이트 제어에 대하여, 매크로블록 양자화 파라미터(QP)의 결정은 잔여 신호 및 추정된 움직 벡터 뿐만 아니라 선택된 매크로블록 및 블록 코딩 모드에 의존한다.
- 라그랑쥬 최적화에 대하여, 움직임 추정 및 매크로블록/블록 모드 결정은, 왜곡 측정이 라그랑쥬 곱수(λ)를 사용하는 레이트 텀에 부가되는 라그랑쥬 비용 함수의 최소화에 기초한다. 라그랑쥬 곱수(λ(QP))가 양자화 파라미터(QP)의 함수이기 때문에, 잔여 신호 또한 양자화 파라미터에 의존한다.
또한, 동작 코더 제어의 성능은, 상기 두개의 아이템이 파라미터(QP 및 λ)에 기인하여 제안됨에 따라 다수의 인코딩의 회피를 포함하는 복잡도 고려와 결부하여 항상 알 수 있어야 한다.
따라서, 본 발명에 의해 해결된 기술적 문제는 비디오 픽처를 인코딩하는 프로세스 및 장치 뿐만 아니라 라그랑쥬 비트-할당 기술 및 레이트 제어 특성의 레이트-왜곡 효율을 제공하는 적당한 컴퓨터 프로그램 및 적당한 저장 매체를 제공하는 것이다.
이러한 작업 할당은 청구범위 제1항, 제10항, 제11항 및 제12항의 특징에 의해 본 발명에 따라 해결된다.
본 발명은, 적어도 매크로블록의 일부에 대해, 인코딩 프로세스를 지원하는 적어도 하나의 제어 파라미터가 적어도 하나의 추정 파라미터에 근거하여 결정되도록 수행되는 사전-분석(pre-analysis) 단계, 및 상기 사전-분석 단계에서 결정된 제어 파라미터에 기초하여 계산된 인코딩 파라미터를 사용하여 픽처가 인코딩되는 제2 단계에 따른 방식으로 상기 문제를 해결한다.
비디오 픽처를 인코딩하는 장치는, 적어도 매크로블록의 일부에 대해, 인코딩 프로세스를 지원하는 적어도 하나의 제어 파라미터가 적어도 하나의 추정 파라미터에 근거하여 결정되도록 수행되는 사전-분석 단계, 및 상기 사전-분석 단계에서 결정된 제어 파라미터에 기초하여 계산된 인코딩 파라미터를 사용하여 픽처가 인코딩되는 제2 단계의 방식에 따라 비디오 픽처를 인코딩하는 프로세스가 실행될 수 있고, 그러한 방식으로 설치된 적어도 하나의 칩 및/또는 프로세서를 포함한다.
몇몇 경우에, 비디오 픽처를 인코딩하는 프로세스는 바람직하게도 컴퓨터 프로그램에 의해 실행된다. 그러한 컴퓨터 프로그램은, 컴퓨터 메모리에 저장된 후 비디오 픽처를 인코딩하는 프로세스를 컴퓨터가 실행가능하게 하는 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은, 적어도 매크로블록의 일부에 대해, 인코딩 프로세스를 지원하는 적어도 하나의 제어 파라미터가 적어도 하나의 추정 파라미터에 근거하여 결정되도록 수행되는 사전-분석 단계, 및 상기 사전-분석 단계에서 결정된 제어 파라미터에 기초하여 계산된 인코딩 파라미터를 사용하여 픽처가 인코딩되는 제2 단계의 방식에 따라 비디오 픽처를 인코딩하는 프로세스를 실행하는 프로그래밍 코드를 포함한다.
예를 들면, 그러한 컴퓨터 프로그램은 다운로드간으한 데이터 파일로서 통신 네트워크 또는 데이터 전송용 네트워크에서 (무료 또는 유료로) 이용가능할 수 있다. 이러한 방식으로 이용가능한 컴퓨터 프로그램은 청구범위 제11항에 기술된 바와 같이 컴퓨터 프로그램이, 예를 들면, 인터넷 같은 데이터 전송용 네트워크로부터 상기 네트워크에 접속되어 있는 데이터 프로세싱 유닛으로 다운로드되는 프로세스에 의해 얻어질 수 있다.
비디오 픽처에 대한 인코딩을 수행하기 위해, 바람직하게도, 프로그램이 저장되고, 컴퓨터 메모리에 저장된 후 비디오 픽처를 인코딩하는 프로세스를 컴퓨터가 실행가능하게 하는 컴퓨터 판독가능 저장 매체가 사용되며, 상기 컴퓨터 프로그램은, 적어도 매크로블록의 일부에 대해, 인코딩 프로세스를 지원하는 적어도 하나의 제어 파라미터가 적어도 하나의 추정 파라미터에 근거하여 결정되도록 수행되는 사전-분석 단계, 및 상기 사전-분석 단계에서 결정된 제어 파라미터에 기초하여 계산된 인코딩 파라미터를 사용하여 픽처가 인코딩되는 제2 단계의 방식에 따라 비디오 픽처를 인코딩하는 프로세스를 실행하는 프로그래밍 코드를 포함한다.
본 발명의 바람직한 실시예에서, 오리지날 매크로블록 샘플 및 그들의 예측 간 차를 나타내는 상기 매크로블록의 잔여 신호의 에너지 측정은, 상기 사전-분석 단계에서의 적어도 하나의 추정된 파라미터를 기초로 결정되는 제어 파라미터로서 사용된다.
본 발명의 또 다른 바람직한 실시예에서, 상기 잔여 신호의 에너지 측정은 수학식
Figure 112006015160137-PCT00002
에 따라 변환 코딩용으로 사용되는 매크로블록(i)의 내부의 휘도 및 크로미넌스의 잔여 신호의 분산의 평균으로서 계산되고, 여기에서, NB 및 NP는 매크로블록 내부의 변환 코딩용으로 사용되는 블록의 수(휘도 및 크로미넌스) 및 그러한 블록의 내부의 샘플의 수를 각각 나타내고, di ,j는 매크로블록(i) 내부의 블록(j)의 잔여 신호이며,
Figure 112006015160137-PCT00003
는 di ,j의 평균을 나타낸다.
본 발명의 또 다른 바람직한 실시예에서, 인트라 코딩 픽처에 있는 매크로블록의 예측 신호는 제로 값을 갖는 샘플로 구성되고 따라서 잔여 신호가 오리지날 매크로블록 샘플에 대응하는 것으로 가정하면, 예측 코딩 픽처에 대하여, 상기 제어 파라미터를 결정하는데 사용되는 매크로블록의 예측 신호는 상기 사전-분석 단계에서 추정된 하나 이상의 변위 벡터 및 기준 인덱스를 사용하는 움직임 보상 예측에 의해 추정된다.
본 발명의 또 다른 바람직한 실시예에서, 상기 사전-분석 단계는 라그랑쥬 비용 함수인
Figure 112006015160137-PCT00004
를 최소화함으로써 변위 벡터(m) 및 기준 인덱스(r)를 추정하는 단계를 포함하고, 여기에서,
Figure 112006015160137-PCT00005
는 왜곡 항을 결정하며, s(...,t) 및 s'(...,tr)는 오리지날 픽처의 휘도 샘플 어레이 및 기준 인덱스(r)에 의해 주어진 디코딩된 기준 픽처를 각각 나타내며, RMV(m,r)는 변위 벡터[mx,my]T의 모든 컴포넌트 및 기준 인덱스(r)를 전송하는데 소요되는 비트수를 특정하고, B는 변위 벡터 및 기준 인덱스가 추정되는 매크로블록, 매크로블록 파티션(partition) 또는 서브-매크로블록 파티션의 영역이며, λmotion≥0는 라그랑쥬 곱수이다.
본 발명의 또 다른 바람직한 실시예에서, 상기 사전 분석 단계에서 변위 벡터 추정용으로 사용되는 라그랑쥬 곱수(λmotion)는 다음의 식에 따라 결정되고;
Figure 112006015160137-PCT00006
여기에서,
Figure 112006015160137-PCT00007
는 동일한 픽처 유형의 마지막 인코딩 픽처의 평균 양자화 파라미터를 나타낸다.
본 발명의 또 다른 바람직한 실시예에서, 상기 사전-분석 단계에서의 변위 벡터 추정은 16×16 휘도 샘플의 영역을 커버하는 전체 매크로블록에 대하여 행해지고, 기준 인덱스(r)는 추정되는 것이 아니라 디코딩된 픽처 버퍼에 저장된 시간적으로 가장 가까운 픽처를 참조하는 방식으로 결정된다.
본 발명을 사용하여, 레이트-왜곡 최적화 인코더의 레이트-왜곡 효율 [5, 6, 7, 8] 뿐만 아니라 저지연(low-delay) 대화형 애플리케이션에 적당한 정확한 레이트 제어를 제공하는 블록 기반 하이브리드 비디오 코덱에 대하여 동작 코더 제어를 수행하는 것이 가능하다. MPEG-4 비주얼 및 H.264/AVC에 대한 시뮬레이션 결과로부터, 제안된 인코딩 전략은 레이트 제어없는 레이트-왜곡 최적화 인코더와 마찬가지로 실질적으로 동일한 레이트-왜곡 성능을 얻는다는 것을 알 수 있다.
본 발명은 매크로블록층의 동작 제어에 관한 것이다. 주어진 글로벌 레이트 제어는 전송 레이트 및 디코딩 지연 조건이 유지되도록 픽처에 대한 목표 비트 수를 설정하는 것으로 가정한다. 매크로블록층의 동작 제어는 상기 목표 비트수가 가능한 한 정확하게 적중하면서 픽처의 왜곡이 최소화되는 방식으로 양자화 파라미터, 매크로블록 및 블록 모드, 움직임 벡터, 및 양자화 변환 계수를 결정한다.
후술하는 예를 들어 본 발명을 보다 상세히 설명한다. 이들 예는 설명을 위한 것이지 본 발명을 한정하고자 하는 것은 아니다.
도 1은 Foreman 시퀀스(QCIF, 초당 10 픽처)에 대한 레이트 제어(실선) 없는 레이트-왜곡 최적 인코딩 전략[8]에 본 출원인이 제안한 인코딩 전략(점)을 비교한 레이트-왜곡 성능을 도시한다.
도 2는 Tempete 시퀀스(CIF, 초당 30 픽처)에 대한 레이트 제어(실선) 없는 레이트-왜곡 최적 인코딩 전략 [8]에 본 출원인이 제안한 인코딩 전략(점)을 비교한 레이트-왜곡 성능을 도시한다.
도 3은 제안된 인코딩 전략에 대한 목표 비트 레이트에 비교한 획득된 평균 비트-레이트를 도시한다.
다음 섹션에서, 본 발명은 비디오 픽처에 대하여 진보적인 인코딩 프로세스를 사용하는 동작 코더 제어에 의해 설명된다. 설명된 동작 코더 제어는 라그랑쥬 비트-할당 기술의 레이트-왜곡 효율 뿐만 아니라 [9]의 레이트-제어 특성의 두가지 접근법의 잇점을 조합한다.
[5]에서, 라그랑쥬 움직임 추정은 H.263 기준선 코딩용으로 사용되는 경우 레이트 왜곡 성능에 매우 작은 충격을 주는 것이 관찰되었다. 이것은, 16×16 블록에 할당된 움직임 벡터에 의해 소모되는 비트 레이트가 매우 작고 움직임 추정 프로세스에 대한 λ의 부적절한 선택의 충격이 매우 작기 때문이다. 따라서, 본 출원의 새로운 인코딩 전략에서, 매크로블록 양자화 파라미터(QP)의 결정은 16×16 블록만을 사용하여 잔여 신호의 초기 추정에 근거한다. 이를 위해, 라그랑쥬 파라미터(λ)는 동일 픽처 유형의 마지막 인코딩된 픽처의 평균 양자화 파라미터(
Figure 112006015160137-PCT00008
)를 사용하여 설정된다. 양자화 파라미터(QP)(및 대응하는 라그랑쥬 파라미터(λ))는 추정된 예측 에러 신호 및 나머지 비트의 버짓을 사용하는 [9]의 접근법과 유사하게 선택된다. 이들 파라미터를 기초로, 움직임 추정 벡터 뿐만 아니라 매크로블록 및 블록 모드는 대응하는 라그랑쥬 비용 함수를 최소화함으로써 선택된다.
본 발명의 과제는 매클로블록층의 동작 제어에 관련된 두개의 접근법의 적절한 조합이기 때문에, 전체적인 동작 제어 알고리즘은 개념의 오해를 피하기 위해 간략하게 설명된다. 주요하게 기여하는 것은 라그랑쥬 비트-할당 기술 및 레이트 제어 접근법 간의 상호의존성 문제의 간단한 저비용 해결책이다. 이러한 문제는 단지 16×16 블록 및 단일의 기준 픽처를 사용하는 저비용 사전-분석/사전-추정 단계를 도입함으로써 해결된다. 결과적으로, [9]의 레이트 제어 접근법의 일부 알고리즘 상세가 적용되어야 한다.
다음의 섹션 1 및 섹션 2에서, 매크로블록층의 동작 제어의 전체적인 알고리즘이 설명된다. 제안된 알고리즘의 성능과 단지 라그랑쥬 최적화만을 사용하는 일 정 기울기의 접근법을 비교한 실험결과가 섹션 3에 주어진다.
1. 매크로블록층 동작 제어의 초기화
픽처에 대한 비트의 목표 수(Rtotal)는 글로벌 레이트 제어 알고리즘에 의해 설정된다. 상기 픽처의 매크로블록층 구문 요소를 전송하기 위한 비트 버짓(RB)은 수학식 1과 같이 초기화된다:
Figure 112006015160137-PCT00009
여기에서, Rheader는 픽처를 인코딩하는데 소요되는 비트의 평균 수 및/또는 주어진 픽처 유형의 슬라이스 헤더 정보를 나타낸다.
예측 코딩 픽처를 위해, 16×16 블록 및 시간적으로 가장 가까운 기준 픽처에 대한 초기 움직임 추정 단계는 픽처의 모든 매크로블록(i)에 대해 수행된다. 대응하는 초기 움직임 벡터(
Figure 112006015160137-PCT00010
)는 라그랑쥬 비용 함수인 수학식 2를 최소화함으로써 얻어진다:
Figure 112006015160137-PCT00011
여기에서, 왜곡 항은 수학식 3과 같이 주어진다:
Figure 112006015160137-PCT00012
s(...,t) 및 s(...,t-△t)는 오리지날 픽처 및 디코딩된 기준 픽처의 휘도 신호를 각각 나타낸다. RMV(i,m)는 움직임 벡터 [mx,my]T의 모든 컴포넌트를 전송하는데 소요되는 비트 수를 특정하고, 여기에서 M은 움직임 벡터 검색 범위이고, Bi는 i번째 매크로블록의 영역을 나타낸다.
이러한 초기 추정 단계를 위해, 라그랑쥬 곱수(λmotion)은 동일한 픽처 유형의 마지막 인코딩된 픽처의 평균 양자화 파라미터(
Figure 112006015160137-PCT00013
)를 사용하여 설정된다:
Figure 112006015160137-PCT00014
Figure 112006015160137-PCT00015
초기 추정 또는 오리지날 소스 데이터(인트라 픽처에 대한)를 기초로, 분산 측정(σi 2)은 본 발명에 따라 각 블록에 대하여 수학식 6과 같이 계산된다:
Figure 112006015160137-PCT00016
여기에서, NB 및 NP는 매크로블록 내부의 변환 코딩용으로 사용되는 (휘도 및 크로미넌스) 블록의 수 및 그러한 블록 내부의 샘플의 수를 각각 나타낸다. di,j는 매크로블록(i) 내부의 블록(j)의 잔연 신호를 나타내고, 그의 평균은 (
Figure 112006015160137-PCT00017
)으로 정의된다. 인트라 픽처에 대해, 이 잔여 신호는 오리지날 매크로블록 샘플에 대응하고, 예측 코딩 픽처에 대해서는, 예측 에러 신호를 나타낸다.
분산 측정을 기초로, 가중 팩터(αi)는 수학식 7에 따라 각 매크로블록(i)에 할당된다([9] 참조):
Figure 112006015160137-PCT00018
여기에서, N은 픽처 내부의 매크로블록의 수이다.
다음의 파라미터는 그들의 초기값으로 설정된다 [9]:
- 남아있는 복잡도 측정:
Figure 112006015160137-PCT00019
- 남아있는 매크로블록: N1=N
- 남아있는 비트 버짓: B1=RB
- 모델 파라미터: K1=KN(동일 유형의 마지막 픽처)
C1=CN(동일 유형의 마지막 픽처)
jK=0
제1 픽처의 시퀀스에 대해, 모델 파라미터 K1 및 C1은 몇몇 사전정의된 값으 로 설정된다.
2. 매크로블록층의 동작 제어
2.1 목표 양자화 파라미터 설정
i번째 매크로블록에 대한 목표 양자화 단계 크기(Qi *)는 수학식 8에 따라 설정된다([9] 참조):
Figure 112006015160137-PCT00020
여기에서, Qmin 및 Qmax는 구문에 의해 지원되는 최소 및 최대 양자화 단계 크기이다.
상기 목표 양자화 단계 크기를 기초로, 목표 양자화 파라미터(QPi *)는 수학식 9에 따라 설정된다([9] 참조):
Figure 112006015160137-PCT00021
여기에서, QPi - 1는 마지막 매크로블록의 양자화 파라미터이고 △QPmax는 (구문에 의해 주어지거나 사용자 정의된) 최대의 허여 양자화기 변위이다. 함수 fQ(..)는 양자화 단계 크기의 양자화 파라미터로의 매핑을 특정하고; 이것은 그 아래의 구문에 의존한다.
2.2. 매크로블록 움직임 추정 및 모드 결정
매크로블록(i)의 모드 결정 및 움직임 추정에 사용되는 라그랑쥬 곱수는 수학식 10 및 수학식 11의 선택된 목표 양자화 파라미터를 기초로 [5]에 따라 설정된다:
Figure 112006015160137-PCT00022
Figure 112006015160137-PCT00023
모든 움직임 보상 매클록블록/블록 모드에 대해, 관련된 움직임 벡터(m i) 및 기준 인덱스(ri)(H.263 Annex U 및 H.264/AVC)는 라그랑쥬 함수인 수학식 12를 최소화함으로써 얻어진다(수학식 2와 비교):
Figure 112006015160137-PCT00024
여기에서, 왜곡 항은 수학식 13과 같이 주어진다:
Figure 112006015160137-PCT00025
여기에서, R은 디코딩된 픽처 버퍼에 저장된 기준 픽처의 세트를 정의하고, M은 기준 픽처 내부의 움직임 벡터 검색 영역을 특정하고, tr은 기준 인덱스(r)에 의해 기준으로 되는 기준 픽처의 샘플링 시간이고, s(...,t) 및 s'(...,tr)는 오리지날 픽처 및 디코딩된 기준 픽처의 휘도 신호를 각각 나타내며, RMV(i,m,r)는움직임 벡터 m=[mx,my]T의 모든 컴포넌트 뿐만 아니라 기준 인덱스(r)를 전송하는 소요되는 비트수를 특정한다.
주어진 매클로블록(블록)에 대한 매클록블록(또는 블록) 모드의 결정은 기본적으로 동일한 접근법으로 이어진다. 주어진 세트의 가능한 매크로블록/블록 모드(Smode)로부터, 후속하는 라그랑쥬 비용 함수 함수를 최소로 하는 수학식 14의 모드(pi)가 선택된다:
Figure 112006015160137-PCT00026
왜곡 측정은 오리지날 매크로블록/블록 샘플(s)과 재구성된 샘플(s') 간의 차의 제곱의 합으로 표현된다:
Figure 112006015160137-PCT00027
여기에서, B는 대응하는 매크로블록/블록 샘플의 세트를 특정한다. Rall(i,p|QPi *)는 모드(p)와 양자화 파라미터(QPi *)의 선택과 관계된 비트수이고, 이것은 매크로블록 헤더에 대한 비트, 움직임 벡터 및 기준 인덱스 뿐만 아니라 모든 휘도 및 크로미넌스 블록의 양자화된 변환 계수를 포함한다.
2.3. 양자화 파라미터의 최종 설정
매클로블록 구문 요소를 전송하는데 사용되는 양자화 파라미터(QPi)는 선택된 매크로블록 모드 및 양자화 변환 계수로서 관계된 파라미터에 의존한다. 구문이 선택된 매크로블록 파라미터에 대해 양자화기 변위를 가능하게하면, QPi=QPi *의 양자화 파라미터가 선택되고, 그렇지 않으면, 마지막 매크로블록으로부터 양자화 파라미터 QPi=QPi -1이 취해진다.
2.4. 동작 매크로블록층 제어를 위한 모델 업데이트
매크로블록의 인코딩이 종료된 후에, 동작 코더 제어의 모델 파라미터가 업데이트된다. 제1 단계에서, 소위 매크로블록 파라미터(KMB 및 CMB)가 본 발명의 수학식 16 및 수학식 17에 따라 계산된다:
Figure 112006015160137-PCT00028
Figure 112006015160137-PCT00029
여기에서, Qi**는 목표 양자화 파라미터
Figure 112006015160137-PCT00030
에 대응하는 양자화 단계 크기를 정의한다. Rall은 모든 구문 요소를 포함하는 고려되는 매크로블록을 인코딩하는데 사용되는 비트수이고,
Figure 112006015160137-PCT00031
는 움직임 벡터(
Figure 112006015160137-PCT00032
)와 관계된 비트수이며, 이 움직임 벡터는 초기화 단계(섹션 1)에서 추정되었다.
현재 인코딩된 픽처의 평균 모델 파라미터 KF 및 CF는 수학식 18, 수학식 19 및 수학식 20에 따라서 설정된다:
Figure 112006015160137-PCT00033
이들 파라미터를 기초로, 다음의 매크로블록을 인코딩하는데 사용되는 모델 파라미터는 다음과 같이 업데이트된다([9] 참조):
- 남아있는 복잡도 측정: Si +1=Siiㆍσi
- 남아있는 매크로블록: Ni +1=Ni-1
- 남아있는 비트 버짓: Bi +1=Bi-Rall ,i
- 모델 파라미터: Ki +1=KFㆍi/N+K1ㆍ(N-i)/N (21)
Ci+1=CFㆍi/N+C1ㆍ(N-i)/N (22)
3. 실험 결과
본 출원의 인코딩 전략의 효율은 (전체 시퀀스에 대한 양자화 파라미터의 고정값에 대해) 라그랑쥬 최적화만을 사용하는 인코딩 전략에 본 출원의 인코딩 전략을 비교함으로써 H.264/AVC 비디오 인코딩 표준에 대해 증명된다. 인코더 모두 시퀀츠의 초기에 단지 하나의 인트라 픽처만을 사용하고, 모든 후속 픽처가 예측 코딩 P-픽처로서 코딩된다. 두 경우 모두 다섯개의 기준 픽처가 사용된다. 움직임 추정은 [-32...32]×[-32...32] 샘플의 범위 및 후속의 1/2 및 1/4 픽셀 세분(refinement)을 통해 대수의 정수-픽셀 검색에 의해 행해진다. 엔트로피 코딩은 CABAC(context-adaptive binary arithmetic coding)을 사용하여 행해진다.
우리의 새로운 인코딩 전략을 위해, 다음의 간단한 글로벌 레이트 제어 기술이 사용되었다. 인코딩될 픽처의 수(N), kbit/sec의 목표 평균 비트-레이트(R), 및 Hz의 픽처 레이트(F)가 주어지면, 제1 인트라 픽처(i=1)에 대하여 목표 비트수(B1 *)는 다음에 의해 결정된다:
Figure 112006015160137-PCT00034
모든 남아있는 P-픽처(i>1)에 대하여, 목표 비트 버짓은 다음과 같이 설정되고,
Figure 112006015160137-PCT00035
여기에서, Bk는 k번째 픽처에 의해 실제적으로 소모되는 비트 수를 정의한다.
도 1 및 도 2에서, 두개의 인코더의 레이트-왜곡 성능은 서로 다른 특징을 갖는 두개의 테스트 시퀀스에 대하여 비교된다. 곡선은 위도 컴포넌트의 평균 PSNR 대 완전한 비트-스트림의 측정된 평균 비트-레이트를 나타낸다. 본 출원이 제안하는 인코딩 전략은 레이트 제어없이 [8] 레이트-왜곡 최적화 인코더로서 실질적으로 동일한 레이트-왜곡 효율을 제공하지만 목표 비트-레이트는 정확히 적중한다는 것을 알 수 있다.
본 출원인이 제안한 인코더에 대해 얻어진 평균 비트-레이트는 목표 비트-레이트와 함께 표 1에 도시되어 있다.
References
[1] ITU-T and ISO/IEC JTC1, "Generic coding of moving pictures and associated audio information Part 2: Video," ITU-T Recommendation H.262 ISO/IEC 13818-2 (MPEG-2), Nov. 1994.
[2] ITU-T, "Video coding for low bitrate communication," ITU-T Recommendation H.263; version 1, Nov. 1995; version 2, Jan. 1998.
[3] ISO/IEC JTC1, "Coding of audio-visual objects Part 2: Visual,"ISO/IEC 14496-2 (MPEG-4 visual version 1), Apr. 1999; Amendment 1 (version 2), Feb. 2000.
[4] T. Wiegand, G. Sullivan, A. Luthra, "Draft ITU-T Recommendation and Final Draft International Standard of Joint Video Specification (ITU-T Rec. H.264 | ISO/IEC 14496-10 AVC)," Joint Video Team (JVT) of ISO/IEC MPEG and ITU-T VCEG, JVT-G050r1, May 2003.
[5] T. Wiegand, B. D. Andrews, "An Improved H.263 Coder Using Rate-Distortion Optimization," Doc. ITU-T/SG17/Q15-D-13, Apr. 1998.
[6] G. J. Sullivan, T. Wiegand, "Rate-Distortion Optimization for Video Compression," in IEEE Signal Processing Magazine, vol. 15, no. 6, pp. 74-90, Nov. 1998.
[7] H. Schwarz, T. Wiegand, "An Improved MPEG-4 Coder Using Lagrangian Coder Control," ITU-T/SG16/Q6/VCEG-M49, April 2001, Austin, Texas, USA.
[8] H. Schwarz, T. Wiegand, "An Improved H.26L Coder Using Lagrangian Coder Control," ITU-T/SG16/Q6/VCEG-D146, June 2001, Porto Seguro, Brasil.
[9] J. Ribas-Corbera, S. Lei, "Rate Control in DCT Video Coding for Low-Delay Communications,"in IEEE Transactions on Circuit and Systems for Video Technology, vol. 9, no. 1, Feb. 1999.

Claims (13)

  1. 비디오 픽처를 인코딩하는 프로세스로서,
    적어도 매크로블록의 일부에 대해, 인코딩 프로세스를 지원하는 적어도 하나의 제어 파라미터가 적어도 하나의 추정 파라미터에 근거하여 결정되도록 수행되는 사전-분석(pre-analysis) 단계, 및
    상기 사전-분석 단계에서 결정된 제어 파라미터에 기초하여 계산된 인코딩 파라미터를 사용하여 픽처가 인코딩되는 제2 단계
    를 포함하는 것을 특징으로 하는 인코딩 프로세스.
  2. 제1항에 있어서,
    오리지날 매크로블록 샘플 및 그들의 예측 간 차를 나타내는 상기 매크로블록의 잔여(residual) 신호의 에너지 측정은, 상기 사전-분석 단계에서의 적어도 하나의 추정된 파라미터를 기초로 결정되는 제어 파라미터로서 사용되는 것을 특징으로 하는 인코딩 프로세스.
  3. 제2항에 있어서,
    상기 잔여 신호의 에너지 측정은, 수학식
    Figure 112006015160137-PCT00036
    에 따라 변환 코딩용으로 사용되는 매크로블록(i) 내부의 휘도 및 크로미넌스의 잔여 신호 의 분산의 평균으로서 계산되고,
    여기에서, NB 및 NP는 매크로블록 내부의 변환 코딩용으로 사용되는 (휘도 및 크로미넌스) 블록의 수 및 그러한 블록의 내부의 샘플의 수를 각각 나타내고,
    di ,j는 매크로블록(i) 내부의 블록(j)의 잔여 신호이며,
    Figure 112006015160137-PCT00037
    는 di ,j의 평균을 나타내는 것을 특징으로 하는 인코딩 프로세스.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    예측 코딩 픽처에 대하여, 상기 제어 파라미터를 결정하는데 사용되는 매크로블록의 예측 신호는 상기 사전-분석 단계에서 추정된 하나 이상의 변위 벡터 및 기준 인덱스를 사용하는 움직임 보상 예측에 의해 추정되는 것을 특징으로 하는 인코딩 프로세스.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 사전-분석 단계는 라그랑쥬 비용 함수
    Figure 112006015160137-PCT00038
    를 최소화함으로써 변위 벡터(m) 및 기준 인덱스(r)를 추정하는 단계를 포함하고,
    여기에서,
    Figure 112006015160137-PCT00039
    는 왜곡 항(term)을 결정하며, s(...,t) 및 s'(...,tr)는 오리지날 픽처의 휘도 샘플 어레이 및 기준 인덱스 (r)에 의해 주어진 디코딩된 기준 픽처를 각각 나타내며, RMV(m,r)는 변위 벡터[mx,my]T의 모든 컴포넌트 및 기준 인덱스(r)를 전송하는데 소요되는 비트수를 특정하고, B는 변위 벡터 및 기준 인덱스가 추정되는 매크로블록, 매크로블록 파티션(partition) 또는 서브-매크로블록 파티션의 영역이며, λmotion≥0는 라그랑쥬 곱수인 것을 특징으로 하는 인코딩 프로세스.
  6. 제5항에 있어서,
    상기 사전 분석 단계에서 변위 벡터 추정용으로 사용되는 라그랑쥬 곱수(λmotion)는 다음의 수학식에 따라 결정되고;
    Figure 112006015160137-PCT00040
    여기에서,
    Figure 112006015160137-PCT00041
    는 동일한 픽처 유형의 마지막 인코딩 픽처의 평균 양자화 파라미터를 나타내는 것을 특징으로 하는 인코딩 프로세스.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 사전-분석 단계에서의 변위 벡터 추정은 16×16 휘도 샘플의 영역을 커버하는 전체 매크로블록에 대하여 행해지고, 기준 인덱스(r)는 추정되는 것이 아니라 디코딩된 픽처 버퍼에 저장된 시간적으로 가장 가까운 픽처를 참조하는 방식으 로 결정되는 것을 특징으로 하는 인코딩 프로세스.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서,
    각각의 매크로블록(i)에 대한 상기 인코딩 프로세스 동안, 상기 사전-분석 단계에서 추정된 제어 파라미터에 의존하여 목표 양자화 파라미터(QPi *)가 결정되는 것을 특징으로 하는 인코딩 프로세스.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서,
    상기 매크로블록 인코딩 프로세스는 상기 목표 양자화 파라미터(QPi *)가 주어지면,
    Figure 112006015160137-PCT00042
    에 따라 매크로블록(i)의 모드 결정 및 움직임 추정용으로 사용되는 라그랑쥬 곱수를 계산하는 단계,
    모든 움직임 보상 매크로블록/블록 모드에 대하여, 왜곡 항이
    Figure 112006015160137-PCT00043
    로 주어지는 라그랑쥬 함수
    Figure 112006015160137-PCT00044
    를 최소화함으로써 관련된 움직임 벡터(mi) 및 기준 인덱스(ri)를 계산하는 단계 - 여기에서, 상기 s(...,t) 및 s'(...,tr)는 오리지날 픽처의 휘도 샘플 어레이 및 기준 인덱스(r)에 의해 주어진 디코딩된 기 준 픽처를 각각 나타내고, R은 디코딩된 픽처 버퍼에 저장된 기준 픽처의 세트를 정의하고, M은 기준 픽처 내부의 움직임 벡터 검색 범위를 특정하며, tr은 기준 인덱스(r)에 의해 기준으로 되는 기준 픽처의 샘플링 시간이고, B는 대응하는 블록 또는 매크로블록의 영역이며, RMV(i,m,r)는 움직임 벡터 m=[mx,my]T의 모든 컴포넌트 및 기준 인덱스(r)를 전송하는데 소요되는 비트수를 특정함 -,
    라그랑쥬 비용 함수
    Figure 112006015160137-PCT00045
    를 최소화함으로써 매크로블록(i)의 매크로블록/블록 인코딩 모드(pi)를 결정하는 단계 - 여기에서,
    Figure 112006015160137-PCT00046
    Figure 112006015160137-PCT00047
    로서 정의되고, 상기 s(...) 및 s'(...)는 오리지날 매크로블록 샘플의 어레이 및 그들의 재구성을 각각 나타내며, B는 대응하는 매크로블록/블록 샘플의 세트를 특정하고, Rall(i,p|QPi *)는 매크로블록/블록 모드에 대한 비트, 움직임 벡터 및 기준 인덱스 뿐만 아니라 모든 휘도 및 크로미넌스 블록의 양자화된 변환 계수를 포함하는, 모드(p) 및 양자화 파라미터(QPi *)를 선택하는 것과 관계된 비트의 수이고, Smode는 가능한 매크로블록/블록 모드의 주어진 세트임 - 를 포함하는 것을 특징으로 하는 인코딩 프로세스.
  10. 적어도 매크로블록의 일부에 대해, 인코딩 프로세스를 지원하는 적어도 하나 의 제어 파라미터가 적어도 하나의 추정 파라미터에 근거하여 결정되도록 수행되는 사전-분석 단계, 및 상기 사전-분석 단계에서 결정된 제어 파라미터에 기초하여 계산된 인코딩 파라미터를 사용하여 픽처가 인코딩되는 제2 단계의 방식에 따라 비디오 픽처를 인코딩하는 프로세스가 실행될 수 있고, 그러한 방식으로 설치된 적어도 하나의 칩 및/또는 프로세서를 구비한 장치.
  11. 컴퓨터 메모리에 저장된 후 비디오 픽처를 인코딩하는 프로세스를 컴퓨터가 실행가능하게 하는 컴퓨터 프로그램으로서,
    상기 컴퓨터 프로그램은, 적어도 매크로블록의 일부에 대해, 인코딩 프로세스를 지원하는 적어도 하나의 제어 파라미터가 적어도 하나의 추정 파라미터에 근거하여 결정되도록 수행되는 사전-분석 단계, 및 상기 사전-분석 단계에서 결정된 제어 파라미터에 기초하여 계산된 인코딩 파라미터를 사용하여 픽처가 인코딩되는 제2 단계의 방식에 따라 비디오 픽처를 인코딩하는 프로세스를 실행하는 프로그래밍 코드를 포함하는 컴퓨터 프로그램.
  12. 프로그램이 저장되고, 컴퓨터 메모리에 저장된 후 비디오 픽처를 인코딩하는 프로세스를 컴퓨터가 실행가능하게 하는 컴퓨터 판독가능 저장 매체로서,
    상기 컴퓨터 프로그램은, 적어도 매크로블록의 일부에 대해, 인코딩 프로세스를 지원하는 적어도 하나의 제어 파라미터가 적어도 하나의 추정 파라미터에 근거하여 결정되도록 수행되는 사전-분석 단계, 및 상기 사전-분석 단계에서 결정된 제어 파라미터에 기초하여 계산된 인코딩 파라미터를 사용하여 픽처가 인코딩되는 제2 단계의 방식에 따라 비디오 픽처를 인코딩하는 프로세스를 실행하는 프로그래밍 코드를 포함하는 컴퓨터 판독가능 매체.
  13. 제11항에 기술된 컴퓨터 프로그램이, 예를 들면, 인터넷 같은 데이터 전송용 네트워크로부터 상기 네트워크에 접속된 데이터 프로세싱 유닛으로 다운로딩되는 프로세스.
KR1020067004318A 2003-09-03 2004-08-23 비디오 픽처를 인코딩하는 프로세스 및 장치 KR20060133953A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03090282A EP1513350A1 (en) 2003-09-03 2003-09-03 Process and arrangement for encoding video pictures
EP03090282.9 2003-09-03

Publications (1)

Publication Number Publication Date
KR20060133953A true KR20060133953A (ko) 2006-12-27

Family

ID=34130266

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067004318A KR20060133953A (ko) 2003-09-03 2004-08-23 비디오 픽처를 인코딩하는 프로세스 및 장치

Country Status (7)

Country Link
US (1) US8014447B2 (ko)
EP (2) EP1513350A1 (ko)
JP (1) JP2007504727A (ko)
KR (1) KR20060133953A (ko)
CN (1) CN1846446B (ko)
MX (1) MXPA06002367A (ko)
WO (1) WO2005022924A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101389408B1 (ko) * 2007-03-13 2014-04-28 한스-게오르그 무스만 하이브리드 비디오 코딩을 위한 양자화

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6735253B1 (en) * 1997-05-16 2004-05-11 The Trustees Of Columbia University In The City Of New York Methods and architecture for indexing and editing compressed video over the world wide web
US7143434B1 (en) 1998-11-06 2006-11-28 Seungyup Paek Video description system and method
US7339992B2 (en) 2001-12-06 2008-03-04 The Trustees Of Columbia University In The City Of New York System and method for extracting text captions from video and generating video summaries
US7720154B2 (en) * 2004-11-12 2010-05-18 Industrial Technology Research Institute System and method for fast variable-size motion estimation
WO2006096612A2 (en) * 2005-03-04 2006-09-14 The Trustees Of Columbia University In The City Of New York System and method for motion estimation and mode decision for low-complexity h.264 decoder
CN101116343A (zh) 2005-03-22 2008-01-30 松下电器产业株式会社 编码装置及具有编码装置的运动图像记录系统
US8135063B2 (en) * 2006-09-08 2012-03-13 Mediatek Inc. Rate control method with frame-layer bit allocation and video encoder
US20100111163A1 (en) * 2006-09-28 2010-05-06 Hua Yang Method for p-domain frame level bit allocation for effective rate control and enhanced video encoding quality
US8804829B2 (en) * 2006-12-20 2014-08-12 Microsoft Corporation Offline motion description for video generation
US8908765B2 (en) * 2007-11-15 2014-12-09 General Instrument Corporation Method and apparatus for performing motion estimation
WO2009126785A2 (en) 2008-04-10 2009-10-15 The Trustees Of Columbia University In The City Of New York Systems and methods for image archaeology
WO2009155281A1 (en) 2008-06-17 2009-12-23 The Trustees Of Columbia University In The City Of New York System and method for dynamically and interactively searching media data
CN101742299B (zh) * 2008-11-21 2012-06-27 中国科学院空间科学与应用研究中心 一种符合ccsds标准的图像无损压缩处理系统及方法
US8671069B2 (en) 2008-12-22 2014-03-11 The Trustees Of Columbia University, In The City Of New York Rapid image annotation via brain state decoding and visual pattern mining
EP3399745A1 (en) 2009-09-10 2018-11-07 Guangdong OPPO Mobile Telecommunications Corp., Ltd. Speedup techniques for rate distortion optimized quantization
CN104935935B (zh) * 2009-10-21 2018-04-03 Sk电信有限公司 视频编码方法、视频解码方法和视频解码装置
KR101040087B1 (ko) * 2010-01-13 2011-06-09 전자부품연구원 H.264 svc를 위한 효율적인 부호화 방법
US20120057629A1 (en) 2010-09-02 2012-03-08 Fang Shi Rho-domain Metrics
JP5426506B2 (ja) * 2010-09-06 2014-02-26 日本電信電話株式会社 適応量子化方法,適応量子化装置および適応量子化プログラム
ES2897209T3 (es) 2011-06-16 2022-02-28 Ge Video Compression Llc Codificación entrópica de diferencias de vector de movimiento
CN102256126A (zh) * 2011-07-14 2011-11-23 北京工业大学 混合图像的编码方法
UA114674C2 (uk) 2011-07-15 2017-07-10 ДЖ.І. ВІДІЕУ КЕМПРЕШН, ЛЛСі Ініціалізація контексту в ентропійному кодуванні
US9781449B2 (en) * 2011-10-06 2017-10-03 Synopsys, Inc. Rate distortion optimization in image and video encoding
US9338463B2 (en) 2011-10-06 2016-05-10 Synopsys, Inc. Visual quality measure for real-time video processing
CA2849038C (en) * 2012-01-17 2018-04-03 Genip Pte. Ltd. Method of applying edge offset
US10230956B2 (en) 2012-09-26 2019-03-12 Integrated Device Technology, Inc. Apparatuses and methods for optimizing rate-distortion of syntax elements
US10277907B2 (en) 2012-10-25 2019-04-30 Integrated Device Technology, Inc. Rate-distortion optimizers and optimization techniques including joint optimization of multiple color components
RU2720605C2 (ru) * 2012-12-26 2020-05-12 Сони Корпорейшн Устройство обработки изображения и способ
CN103313058B (zh) * 2013-06-08 2016-08-17 中国计量学院 针对芯片实现的hevc视频编码多模块优化方法和系统
CN106063271B (zh) * 2013-12-26 2019-09-03 三星电子株式会社 用于执行基于子块的预测的层间视频解码方法及其设备以及用于执行基于子块的预测的层间视频编码方法及其设备
GB2523736B (en) * 2014-02-19 2020-03-25 Advanced Risc Mach Ltd Rate control in video encoding
TWI508531B (zh) * 2014-06-04 2015-11-11 Hon Hai Prec Ind Co Ltd 視訊編碼裝置及方法
US20150373326A1 (en) * 2014-06-19 2015-12-24 Magnum Semiconductor, Inc. Apparatuses and methods for parameter selection during rate-distortion optimization
CN104320657B (zh) * 2014-10-31 2017-11-03 中国科学技术大学 Hevc无损视频编码的预测模式选择方法及相应的编码方法
US10432952B2 (en) * 2015-11-19 2019-10-01 Qualcomm Incorporated System and methods for fixed-point approximations in display stream compression (DSC)
CN108696750A (zh) * 2017-04-05 2018-10-23 深圳市中兴微电子技术有限公司 一种预测模式的判决方法及装置
US20220201317A1 (en) * 2020-12-22 2022-06-23 Ssimwave Inc. Video asset quality assessment and encoding optimization to achieve target quality requirement
CN112929663B (zh) * 2021-04-08 2022-07-15 中国科学技术大学 一种基于知识蒸馏的图像压缩质量增强方法
CN113706368A (zh) * 2021-10-29 2021-11-26 湖北亿咖通科技有限公司 图像数据处理方法和装置、电子设备、存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0892560B1 (en) * 1993-04-09 2002-03-13 Sony Corporation Picture encoding method and picture encoding apparatus
JP3358620B2 (ja) * 1993-04-09 2002-12-24 ソニー株式会社 画像符号化方法及び画像符号化装置
JPH07177464A (ja) * 1993-12-16 1995-07-14 Pioneer Video Corp リアルタイム画像圧縮処理装置
JPH07322267A (ja) * 1994-05-25 1995-12-08 Nippon Telegr & Teleph Corp <Ntt> 画像信号符号化装置
JPH09322176A (ja) * 1995-12-20 1997-12-12 Sanyo Electric Co Ltd 符号化モード選択方法、動画像符号化装置、符号化方法、記録方法、及び伝送方法
US6192154B1 (en) * 1998-01-26 2001-02-20 International Business Machines Corporation Two-pass encoding method of digital motion video sequences for constant-or variable bit rate
JP3630565B2 (ja) * 1998-08-26 2005-03-16 沖電気工業株式会社 動画像の符号化方法及び装置
US7177358B2 (en) * 2000-06-27 2007-02-13 Mitsubishi Denki Kabushiki Kaisha Picture coding apparatus, and picture coding method
EP1189451A1 (en) * 2000-09-13 2002-03-20 Kabushiki Kaisha Toshiba Digital video encoder
JP4644939B2 (ja) * 2001-01-17 2011-03-09 日本電気株式会社 動画像符号化装置および動画像符号化方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101389408B1 (ko) * 2007-03-13 2014-04-28 한스-게오르그 무스만 하이브리드 비디오 코딩을 위한 양자화

Also Published As

Publication number Publication date
EP1513350A1 (en) 2005-03-09
US8014447B2 (en) 2011-09-06
US20080298464A1 (en) 2008-12-04
WO2005022924A1 (en) 2005-03-10
JP2007504727A (ja) 2007-03-01
CN1846446B (zh) 2010-12-29
EP1661410A1 (en) 2006-05-31
CN1846446A (zh) 2006-10-11
MXPA06002367A (es) 2006-06-20

Similar Documents

Publication Publication Date Title
CN1846446B (zh) 编码视频图像的方法和布置
KR101232420B1 (ko) 컨텍스트-적응형 가변 길이 코딩 (cavlc) 을 위한 레이트-왜곡 양자화
EP1971153B1 (en) Method for decoding video information, a motion compensated video decoder
US6167162A (en) Rate-distortion optimized coding mode selection for video coders
US7376186B2 (en) Motion estimation with weighting prediction
CN100463523C (zh) 帧层速率控制的视讯编码方法和系统
US20070009025A1 (en) Method and apparatus for operational frame-layer rate control in video encoder
US20080056354A1 (en) Transcoding Hierarchical B-Frames with Rate-Distortion Optimization in the DCT Domain
US20070098067A1 (en) Method and apparatus for video encoding/decoding
US5486863A (en) Method for determining whether to intra code a video block
EP1833257A1 (en) Method and apparatus for bit rate control in scalable video signal encoding using a Rate-Distortion optimisation
US8295623B2 (en) Encoding and decoding with elimination of one or more predetermined predictors
KR20120084168A (ko) 비디오 인코딩 모드 선택 방법 및 이를 수행하는 비디오 인코딩 장치
US20090041119A1 (en) Method and Device for Coding a Video Image
KR101048599B1 (ko) 비디오 데이터 스트림을 인코딩하는 장치
US9628791B2 (en) Method and device for optimizing the compression of a video stream
Girod et al. High-order motion compensation for low bit-rate video
KR100809013B1 (ko) 복잡도 가변형 동영상 부호화 장치 및 그 방법
Ban et al. A novel method rate distortion optimization for HEVC based on improved SSIM
Yang et al. Real time implementation of rate-distortion optimized coding mode selection for H. 263 video coders
Atta Optimal bit allocation for subband video coding
Pantoja et al. Low complexity rate control for VC-1 to H. 264 transcoding
Wang et al. Enhanced SAITD Cost Function for H. 264/AVC Intra 4× 4 Mode Decision
Pantoja et al. A two-level rate control approach for video transcoding
Atta OPTIMAL BIT ALLOCATION FOR SUBBAND IMAGE/VIDEO CODING

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid