KR101089325B1 - 디지털 화상 시퀀스를 위한 인코딩 방법, 디코딩 방법 및 인코딩 장치 - Google Patents

디지털 화상 시퀀스를 위한 인코딩 방법, 디코딩 방법 및 인코딩 장치 Download PDF

Info

Publication number
KR101089325B1
KR101089325B1 KR1020067013282A KR20067013282A KR101089325B1 KR 101089325 B1 KR101089325 B1 KR 101089325B1 KR 1020067013282 A KR1020067013282 A KR 1020067013282A KR 20067013282 A KR20067013282 A KR 20067013282A KR 101089325 B1 KR101089325 B1 KR 101089325B1
Authority
KR
South Korea
Prior art keywords
frame
anchor
group
frames
macroblock
Prior art date
Application number
KR1020067013282A
Other languages
English (en)
Other versions
KR20060111659A (ko
Inventor
하이코 쉬바르쯔
토비아스 힌쯔
토마스 위간트
Original Assignee
톰슨 라이센싱
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 톰슨 라이센싱 filed Critical 톰슨 라이센싱
Publication of KR20060111659A publication Critical patent/KR20060111659A/ko
Application granted granted Critical
Publication of KR101089325B1 publication Critical patent/KR101089325B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]

Abstract

일정한 비디오 품질을 달성하기 위해, 다른 프레임 타입(I, P, 및 B)의 앵커(anchor) 및 비-앵커(non-anchor) 프레임이 다른 수의 비트를 이용해서 인코딩된다. 하지만, 비디오 시퀀스는 일반적으로 폭넓게 변화하는 화상 콘텐츠를 포함하고, 이전에 코딩된 프레임은 주어진 프레임을 예측하기 위해 사용되므로, 프레임 목표 비트율의 적절한 할당은 특히 비-앵커 프레임에 대해 결정하기가 어렵다. 본 발명에 따라, 비-앵커 프레임은 고정된 양자화 매개변수를 사용해서 코딩된다. 비-앵커 프레임의 인코딩을 위해 사용되는 양자화 매개변수는 이전에 인코딩된 앵커 프레임의 평균적인 양자화 매개변수로부터 직접적으로 도출되므로, 이러한 접근법은 일정한 비디오 품질을 보장한다. 이외에도, 아무런 매크로블록-레벨 비율 제어가 비-앵커 프레임의 인코딩을 위해 적용되지 않기 때문에, 비율 제어 전략의 복잡성이 감소된다.

Description

디지털 화상 시퀀스를 위한 인코딩 방법, 디코딩 방법 및 인코딩 장치{ENCODING METHOD, DECODING METHOD, AND ENCODING APPARATUS FOR A DIGITAL PICTURE SEQUENCE }
본 발명은 디지털 화상 시퀀스를 위한 인코딩 방법 및 디코딩 방법 및 인코딩 장치와 관련이 있으며, 상기 화상 시퀀스의 프레임은 픽셀 블록을 포함하는 매크로블록에서 정렬되고, 프레임은 B, P 및 I 타입 코딩을 사용해 인코딩된다.
비디오 시퀀스는 일반적으로 폭넓게 변하는 화상 콘텐츠를 포함하고, 이전에 코딩된 프레임은 현재의 프레임을 예측하기 위해 사용된다. ITU-T 및 ISO/IEC JTC1, "동화상 및 연관된 오디오 정보의 일반적인 코딩 - 2부: 비디오", ITU-T 권장안 H.262 ISO/IEC 13818-2 (MPEG-2 비디오) 1994년 11월,
ITU-T, "저 비트율 통신을 위한 비디오 코딩," ITU-T 권장안 H.263, 버전 1, 1995년 11월, 버전 2, 1998년 1월,
ISO/IEC JTC1, "오디오-비디오 객체의 코딩 - 2부: 비디오,", ISO/IEC 14496-2 (MPEG-4 비디오 버전 1), 1999년 4월, 개정안 1 (버전 2), 2000년 2월,
T. Wiegand (편집자), "합동 비디오 명세서의 합동 최종 위원회 초안 (JFCD)(ITU-T 권장안, H.264 | ISO/IEC 14496-10 AVC)", ISO/IEC MPEG 및 ITU-T VCEG, JVT-D157 의 합동 비디오 팀(JVT), 2002년 7월과 같은 블록 기반의 하이브리드 비디오 코더에서, 매크로블록의 인코딩을 위해 요구되는 비트 수뿐만 아니라 매크로블록의 왜곡은 매크로블록의 양자화 매개변수에 의해 주로 제어된다. 비율 제어 매커니즘의 일반적인 목적은 전송률과 디코딩 지연에 대한 주어진 조건을 유지하면서, 가능한 최적의 비디오 품질을 제공하는 것이다. 일반적으로, 비율 제어는 프레임층 제어 및 매크로블록층 제어를 포함한다. 일정한 비디오 품질을 얻기 위해, 다른 코딩 타입{I (인트라 코딩된), P(예측 코딩된) 및 B(양방향 예측 코딩된)}의 앵커 프레임과 비-앵커 프레임은 각 코딩 타입에 대해 다른 비트 수를 사용해서 인코딩되어야만 한다. 예를 들면, MPEG-2 비디오에서, B 프레임이 재구성된 P 프레임을 기반으로 하여 재구성될 수 있기 이전에, P 프레임이 디코더에서 재구성되어야 하기 때문에, P 타입으로서 인코딩될 인코더 입력 프레임을 위한 코드는, 그 프레임이 B 타입으로서 인코딩될 프레임의 뒤에 나오는 인코딩 입력에 존재하며, B 프레임을 위한 코드가 출력되기 이전에 인코더에 의해 출력된다. 전송율과 디코딩 지연 조건이 유지되도록 프레임층 제어가 프레임에 대한 목표 비트수를 할당하는 반면에, 매크로블록층 제어는 이 목표가 성취되는 방식으로 매크로블록 양자화 매개변수를 선택한다.
다른 프레임 타입을 코딩할 때, 목표 비트 수를 설정하기 위해 폭넓게 사용되는 방법은 테스트 모델 5 (ISO/IEC JTC1/SC29/WG11/N0400, "테스트 모델 5, 초안 개정 2", 1993년 4월)에서 설정된 프레임층 비율 제어이다. 이 문서는 MPEG-2 비디오를 위한 인코더 전략을 설명한다. 프레임 목표의 할당은 소위 전역 복잡성 측정 치에 기반을 두고 있다. 각 프레임 타입에 대해(I, P, B), 제각기의 프레임 타입의 각 프레임의 인코딩 이후에 갱신되는 특별한 복잡성 측정치가 존재한다. 각 프레임에 대해 목표 비트 수는 이 전역 복잡성 측정치를 사용해서 화상 그룹(의 나머지 프레임)을 위해 이용 가능한 비트 수를 가중함으로써 결정된다.
하지만, 결정이 시간의 다른 간격에 대한 측정치에 기반을 두고 있으므로, 이 개념은, 이용 가능한 비트 예산을 (일정한 주관적인 비디오 품질의 목적을 가지고) 다른 프레임 타입으로 적정하게 배분하는 것이 가능하지 않은 일반적인 단점을 가지고 있다. 특히, 양방향으로 코딩된 프레임 (또는, 보다 일반적으로, 비-앵커 프레임)에 대한 프레임 목표는 결정하기 어렵고, 만약 H.263(부록 O를 가진), MPEG-4 비디오 또는 H.264/AVC와 같은 보다 최근의 비디오 코딩 표준에 적용된다면, 매크로블록의 큰 부분이 변환 계수없이 코딩되고, 따라서 매크로블록 양자화 매개변수가 적절하게 조절될 수 없기 때문에, 매크로블록의 비-앵커 프레임을 위한 매크로블록층 비율 제어가 특히 저 비트율에서 비효과적이 되는 문제점이 발생한다.
매우 낮은 디코딩 지연을 요구하는 애플리케이션에서, 프레임의 코딩 순서는 디스플레이 순서와 동일해야 하며, 따라서 MPEG-2 비디오, H.263 (부록 O를 가진), 또는 MPEG-4 비디오가 사용될 수 없다. JVT/H.264에서, 양방향성 B 화상 개념은 이중-예측 B 화상으로 일반화되지만, '고전적인' 양-방향성 화상이 여전히 지지된다. 이러한 매우 낮은 지연 애플리케이션 종류에 대해, 전역 비율 제어 알고리즘이 거의 일정한 목표 비트 수를 각 프레임에 할당해야 한다.
매우 낮은 디코딩 지연을 요구하지 않는 애플리케이션에서, 프레임층 비율 제어의 주 목적은, 일정한 주관적인 비디오 품질 레벨이 다른 프레임 또는 화상 타입에서 유지되도록, 다른 프레임 또는 화상 타입에 대하여 프레임 비트수를 할당하는 것이다. 여러 프레임의 복잡한 분석 또는 사전-코딩을 허용하지 않는 실시간 애플리케이션에서, 이 결정은 이전에 코딩된 프레임에 기초하여 내려진다. 하지만, 비디오 시퀀스의 폭넓게 변화하는 화상 콘텐츠에 기인하여, 다른 시간 간격을 기반으로 하는 결정은 종종 적절하지 않고, 하나 이상의 이전에 코딩된 화상이 주어진 화상을 예측하기 위해 사용되지 않기 때문에, 다른 프레임 타입을 위해 관련된 최적 목표 비트수를 결정하기 위해 사용될 수 있는 간단한 모델이 존재하지 않는다. 특히, 만약 비-앵커 프레임이 사용되면, 다른 프레임 타입중에서 비트 자원의 적절한 배분이 적절하게 추정될 수 없다.
본 발명에 의해 해결될 문제점은, 다른 프레임에 대해 일정한 주관적인 비디오 코딩 또는 비디오 품질이 달성되도록, 향상된 비트율 제어를 제공하는 것이다. 이 문제점은 제1청구항에 개시된 인코딩 방법에 의해, 그리고 제10청구항에서 개시된 디코딩 방법에 의해 해결된다. 이 인코딩 방법을 활용하는 장치는 제2청구항에서 개시된다.
본 발명은 지연 제약이 완화되어, 그 결과 비디오 시퀀스의 프레임이 디코더 측에서 출력되는 디스플레이 순서로 인코딩될 필요가 없게 되는 애플리케이션을 위한 프레임층 비율 제어와 관련이 있으며, 여기서, 하나의 앵커 프레임과 여러 개의 비-앵커 프레임(예를 들면, 고전적인 B-프레임에서 'B..BP')을 포함하는 그룹을 위한 목표 비트수는 일정할 것이 요구되지 않는다.
본 발명에 따라, 인코딩하기 전에 목표 비트수를 각 타입의 프레임에 할당하는 문제점은 회피된다. 대신에, 비-앵커 프레임이 고정된 양자화 매개변수를 사용해서 인코딩되고, 아무런 매크로블록층 비율 제어도 사용되지 않는다. 비-앵커 프레임이나 현재 그룹의 프레임에서 단일 비-앵커 프레임의 인코딩을 위해 사용되는 양자화 매개변수는 이 그룹에 속하는 이전에 인코딩 앵커 프레임의 평균적인 양자화 매개변수로부터 직접적으로 도출된다(앵커 프레임은 디코터 단에서 이 비-앵커 프레임을 뒤따른다). 그럼으로써, 거의 일정한 (객관적인) 비디오 품질이 이롭게 보장될 수 있다. 다른 프레임 타입중에서 비트 예산의 배분은 단지 앵커 프레임에 대해 적절한 목표 비율을 설정하는 것에 의해, 제어될 수 있다.
고-레벨 전역 비율 제어는 목표 비트 수를, 단일 앵커 프레임(화상)과 여러 비-앵커 프레임(화상)으로 이루어진 상기 언급된 프레임 또는 화상 그룹에 할당해야만 하는데, 여기서, 비-앵커 프레임은 코딩 순서상 앵커 프레임(화상)을 뒤따르며, 예를 들면, 고전적인 B 프레임 경우에서 'B...BI'와 'B...BP'와 같이 디스플레이 순서상 앵커 프레임에 선행된다. 이러한 종류의 비트 배분은 모든 코딩 타입(I, P와 B)을 포함하는 프레임 중의 알려진 분리적인 비트 배분보다 상당히 쉽게 제어될 수 있다. 다른 말로 하자면, 비-앵커 프레임은 고정된 양자화 매개변수를 사용해서 코딩된다. 비-앵커 프레임의 코딩을 위해 사용되는 양자화 매개변수는 이전에 인코딩된 앵커 프레임의 평균적인 양자화 매개변수로부터 도출되므로, 이러한 접근법은 일정한 비디오 품질을 보장한다. 이것 외에도, 비율 제어 전략의 복잡성이 감소되는데, 이는 아무런 매크로블록-레벨 비율 제어도 비-앵커 프레임의 코딩을 위해 적용되지 않기 때문이다.
원리상, 본 발명의 인코딩 방법은 화상 시퀀스를 디지털 인코딩하는 것과 관련이 있으며, 상기 화상 시퀀스의 프레임은 픽셀 블록을 포함하는 매크로블록에서 정렬되고, 상기 프레임은 제각기 B, P 및 I로 표시되는 양방향 예측, 예측 및/또는 인트라 코딩 타입에서 인코딩되고, 전체적 비트율 제어 목적을 위해서 적응적으로, 특정한 프레임 목표 비트수가 이 코딩 타입의 각각에 할당되고, 상기 전체 비트율 제어는 프레임층 비율 제어와 매크로블록 양자화 매개변수를 선택하는 매크로블록층 비율 제어를 포함하며, 상기 방법은:
- 비트의 목표 수를 앵커 프레임에만, 또는 단일 앵커 프레임과 적어도 하나의 하나의 비-앵커 프레임으로 이루어진 각 프레임 그룹에 할당하기 위한 단계;
- 적응적인 매크로블록 양자화 매개변수에 의해 앵커 프레임을 코딩하고, 고정된 매크로블록 양자화 매개변수를 사용함으로써 매크로블록층 비율 제어 없이 비-앵커 프레임을 코딩하는 단계를 포함한다.
원리상, 본 발명의 인코딩 장치는 화상 시퀀스를 디지털 인코딩하기 위해 적절하고, 상기 화상 시퀀스의 프레임은 픽셀 블록을 포함하는 매크로블록에서 정렬되고, 상기 프레임은 제각기 B, P 및 I로 표시되는 양방향 예측, 예측 및/또는 인트라 코딩 타입에서 인코딩되고, 전체적 비트율 제어 목적을 위해서 적응적으로, 비트의 특정한 프레임 목표 수가 이 코딩 타입의 각각에 할당되고, 상기 전체 비트율 제어는 프레임층 비율 제어와 매크로블록 양자화 매개변수를 선택하는 매크로블록층 비율 제어를 포함하며, 상기 장치는:
- 목표 비트수를 앵커 프레임에만, 또는 단일 앵커 프레임과 적어도 하나의 하나의 비-앵커 프레임으로 이루어진 각 프레임 그룹에 할당하기 위한 수단;
- 적응적인 매크로블록 양자화 매개변수에 의해 매크로블록층 비율 제어를 사용해서 앵커 프레임을 코딩하고, 고정된 매크로블록 양자화 매개변수를 사용함으로써 매크로블록층 비율 제어 없이 비-앵커 프레임을 코딩하는 수단을 포함한다.
원리상, 본 발명의 디코딩 방법은 인코딩된 화상 시퀀스를 디지털 디코딩하는 것과 관련이 있으며, 여기서 상기 화상 시퀀스의 프레임은 픽셀 블록을 포함하는 매크로블록에서 정렬되고, 상기 프레임은 B, P 및 I로 제각기 표시된 양방향성 예측, 예측 및/또는 인트라 코딩 타입에서 인코딩되었고, 적응적으로, 전체적인 비트율 제어의 목적을 위해서, 특정한 프레임 목표 비트수가 이 코딩 타입의 각각에 할당되었고, 상기 전체적인 비트율 제어는 프레임층 비율 제어와 매크로블록 양자화 매개변수를 선택했던 매크로블록층 비율 제어를 포함했고, 목표 비트 수는 단지 앵커에만 또는 단일 앵커 프레임과 적어도 하나의 비-앵커 프레임으로 이루어진 각 프레임 그룹에 할당되었고, 앵커 프레임은 적응적인 매크로블록층 양자화 매개변수에 의해 매크로블록층 비율 제어를 사용해서 코딩되었고, 비-앵커 프레임은 고정된 매크로블록 양자화 매개변수을 사용함으로써 매크로블록층 비율 제어 없이 코딩되었으며, 상기 방법은:
대응되게 적응적인 매크로블록 양자화 매개변수를 사용해서 상기 앵커 프레임을 디코딩하고, 고정된 매크로블록 양자화 매개변수를 사용해서 상기 비-앵커 프레임을 디코딩하는 단계를 포함한다
본 발명의 이로운 추가적인 실시예는 제각기의 종속항에 개시된다.
도 1은 대응하는 제어 단계에 의해 본 발명의 코더 제어를 포함하는 본 발명의 인코딩의 블록도.
도 1에서, 입력 비디오 신호(input video signal: IVS)는 차감기(11), 동작 추정 단계(18)의 제1 입력과 코더 제어기(10)에 입력된다. 이 코딩은 예를 들면 4개의 조명 픽셀 블록에서 정렬된 16*16개의 조명 픽셀과 대응하는 크로미넌스 픽셀 블록을 각각 포함하는 매크로블록(MB)으로 분리 또는 분할된 프레임(FRM)에 기반을 두고 있다. 차감기(11)의 출력은 변환, 스케일링 및 양자화 단계(12)와 스케일링, (대응하는) 역양자화 및 (대응하는) 역변환 단계(13)를 통과하여 가산기(14)로 전달된다. 상기 변환은 바람직하게 픽셀 블록상의 DCT 변환이다. 단계(12)로부터 오는 양자화된 변환 계수(quantised transform coefficient: QTC)는 엔트로피 인코딩 단계(19)에 또한 입력된다. 가산기(14)의 출력은 선택적인 디블로킹 필터(15)를 거쳐 (매크로블록 기반의) 동작 보상 단계(17)와 (매크로블록 기반의) 동작 추정 단계(18)로 통과하며, 따라서 디코딩된 출력 비디오 신호(decoded output video signal: DOVS)를 제공한다. 동작 보상 단계(17)는 요구되는 예를 들면, (매크로블록 기반의) 동작 벡터와 같은 동작 데이터(motion data: MD)를 단계(18)로부터 수 신한다. 단계(17) 및/또는 단계(18)는 적어도 하나의 화상 메모리를 포함한다. 동작 보상 단계(17)의 출력 또는 인트라-프레임 예측 단계(16)의 출력은 스위치(SW)를 거쳐 차감기(11)의 차감 입력과 가산기(14)의 제2 입력에 공급된다. 코더 제어기(10)는 단계(12, 13, 16, 17, 18)와 스위치(SW)를 제어한다. 대응하는 제어 데이터(CD)와 단계(18)로부터의 동작 데이터(MD) 출력이 데이터가 엔트로피 인코딩되는 엔트로피 인코딩 단계(19)로 또한 공급되는데, 이 엔트로피 인코딩은 예를 들면, VLC(variable length encoding: 가변 길이 인코딩)과 부속 정보 멀티플렉싱과 아마도 에러 보호를 포함하고, 전송 또는 전달될 인코딩된 비디오 신호(EOVS)로 이어진다. 단계(13) 내지 단계(17)은 디코더를 함께 나타내는데, 즉, 인코더는 디코딩 동작을 포함한다.
고-레벨 전역 비율 제어 처리는 코더 제어기(10)를 사용해서, P 프레임(또한 H.264에서 B 프레임) 또는 I 프레임으로 코딩된 앵커 프레임과 고전적인 B 프레임 경우에 대해 예를 들면, 'B...BP' or 'B...BI' 그룹과 같은 여러 비-앵커 프레임 으로 이루어진 각 프레임 그룹에 대한 많은 목표 비트(
Figure 112006047320679-pct00001
또는
Figure 112006047320679-pct00002
)를 할당하며, 그럼으로써 이러한 그룹은 여러 개의 B 프레임 대신에 단지 하나의 B 프레임을 또한 포함할 수 있다. 고-레벨 전역 비율 제어는, 거의 일정한 비디오 품질이 인코딩된 출력 비디오 신호(EVOS)에서와 디코더에서 대응하는 디코딩된 비디오 신호에서 제각기 달성되도록 설정되는 것에 유의해야 한다. 이것은 이미지 품질 (예를 들면, 평균 제곱 에러의 견지에서) 또는 이미 코딩된 앵커 프레임의 평균적 인 양자화 매개변수를 제어함으로써 달성될 수 있다.
하나의 앵커 및 여러 개의 비-앵커 프레임에 대한 본 발명의 비율 제어는 비디오 시퀀스의 인코딩 동안에 적응적으로 제어되는 두 개의 가중치 인자(fGroup-BP와 fGroup-I)를 사용한다. 이 인자(fGroup-BP와 fGroup-I)는, 비-앵커 프레임의 인코딩을 위해 사용되는 비트수와, 만약 앵커 프레임이 P/B-프레임으로 코딩된다면 앵커 프레임을 코딩하기 위해 요구되는 비트수(RA-BP)의, 또는 만약 앵커 프레임이 I-프레임으로 인코딩되면 비트수(RA-I)로의 추정된 비율:
Figure 112006047320679-pct00003
,
Figure 112006047320679-pct00004
.
을 지정한다.
정의
만약 이 현재 프레임 이전에 인코딩된 모든 프레임이 디스플레이 순서상 이 현재 프레임을 선행한다면, 현재 프레임은 '앵커 프레임'이라고 불린다.
만약 순서상 이 현재 프레임을 뒤따르는 적어도 하나의 이전에 인코딩된 프레임이 존재한다면, 현재 프레임은 '비-앵커 프레임'이라고 불린다.
초기화
초기화를 위해, 시퀀스의 시작에서, 인자(fGroup-BP와 fGroup-I)는 예를 들면, 제 어기(10)에 의해 예를 들면,
Figure 112006047320679-pct00005
,
Figure 112006047320679-pct00006
과 같은 미리 한정된 값으로 설정된다.
목표 비율 앵커 프레임을 결정하기
앵커와 여러 개의 비-앵커 프레임 그룹의 목표 비트수(
Figure 112006047320679-pct00007
또는
Figure 112006047320679-pct00008
)가 주어졌을 때, 이 인자는 이 그룹내에서 P/B 프레임(또는 I-프레임)으로 코딩된 앵커 프레임에 대한 프레임 목표(
Figure 112006047320679-pct00009
또는
Figure 112006047320679-pct00010
)를 할당하기 위해 제어기(10)에서 사용되며:
앵커 프레임이 P/B 프레임으로 코딩된 경우:
Figure 112006047320679-pct00011
,
앵커 프레임이 I-프레임으로 코딩된 경우:
Figure 112006047320679-pct00012
이다.
NNA (NNA ≥ 0)는 관련된 프레임 그룹 내에서 비-앵커 프레임의 수를 가리킨다. 대응하는 앵커 프레임은 제각기 목표 비율(
Figure 112006047320679-pct00013
또는
Figure 112006047320679-pct00014
)을 가지고 정확한 매크로블록층 비율 제어를 사용해서 인코딩된다.
만약 앵커 프레임이 한쌍의 필드 화상으로서 코딩되면, 로컬 비율-제어는 두 필드 화상 중에서 프레임 목표 비율을 배분할 것이다.
비-앵커 프레임을 인코딩하기
앵커 프레임과 여러 개의 비-앵커 프레임으로 구성된 그룹의 비-앵커 프레임은
Figure 112006047320679-pct00015
의 고정된 양자화 단계 크기를 사용해서 인코딩되고,
Figure 112006047320679-pct00016
는 하나의 앵커와 여러 개의 비-앵커 프레임의 대응하는 그룹의 앵커 프레임을 인코딩하기 위해 사용된 평균적인 양자화 단계 크기를 표시한다. 이것은 양자화 매개변수(QP)를 위한 다음의 관계:
MPEG-2, H.263, MPEG-4:
Figure 112006047320679-pct00017
,
JVT/H.264:
Figure 112006047320679-pct00018
를 인도한다.
여기서 QPmax는 구문(syntax)에 의해 지지되는 최대 양자화 매개변수를 표시한다. 비-앵커 프레임이 먼저 디스플레이되지만, 비-앵커 프레임은 대응하는 앵커 프레임 이후에 전송된다.
인코딩 이후의 모델 갱신
앵커 프레임과 여러 개의 비-앵커 프레임이 완전히 인코딩된 이후에, 만약 인코딩된 비-앵커 화상의 수가 0보다 크다면, 가중치 인자(fGROUP-BP 및 fGROUP-I)는 제어기(10)에서 갱신된다. 먼저, {지속적으로 증가하는 인덱스(nGROUP-BP 및 nGROUP-I)를 가진} 방금 인코딩된 그룹에 대한 가중치 인자는,
앵커 프레임이 P/B-프레임이면:
Figure 112006047320679-pct00019
에 의해,
앵커 프레임이 I-프레임이면:
Figure 112006047320679-pct00020
에 의해 결정되어 갱신되고,
제각기, RNA(k)는 이 그룹내에서 k번째 비-앵커 프레임을 위해 사용된 비트 수이고, RA-BP 및 RA-I는 제각기 P/B 프레임으로서 그리고 I-프레임으로서 앵커 프레임을 인코딩하기 위해 사용되는 비트 수이다.
다음 그룹의 앵커 프레임을 위해 사용되는 비트 자원의 목표의 일부를 결정하기 위해 사용되는 가중치 인자는 마지막, 예를 들면 하나의 앵커 프레임과 0이 아닌 개수의 비-앵커 프레임의 5개의 인코딩된 그룹에 대해 평균치로서 제어기(10)에서:
앵커 프레임이 P/B-프레임이라면:
Figure 112006047320679-pct00021
에 의해,
앵커 프레임이 I-프레임이라면:
Figure 112006047320679-pct00022
에 의해 계산된다. 다른 프레임층 비율 제어 전략과의 근본적인 차이는 가중치 인자(fGROUP-BP 및 fGROUP-I)는 하나의 앵커와 여러 개의 비-앵커 프레임의 그룹 내에서의 앵커 프레임을 위한 적정한 목표 비트수를 추정하기 위해서만 사용된다. 비- 앵커 프레임을 인코딩하기 위해 사용되는 비트수뿐만 아니라 품질도, 대응하는 앵커 프레임의 평균적인 양자화 매개변수(QP)에 의해서만 결정된다. 따라서, 비-앵커 프레임을 인코딩하기 위해 사용되는 비트수가 변할 수 있으면서, 상당히 일정한 비디오 품질이 달성된다.
단일 가중치 인자의 사용
특히, 만약 인트라 프레임이 드물게 코딩된다면, 모든 가중치 인자(fGROUP-BP 및 fGROUP-I)가 동시에 갱신되는 것이 적절하다. 이것은 본 발명의 특징을 화상 그룹('B...BP'와 'B...BI')에 대해 목표 비율(
Figure 112006047320679-pct00023
Figure 112006047320679-pct00024
)을 설정하는 상기 언급된 고-레벨 비율 제어와 결합함으로써 수행될 수 있다. 예시로서, 고-레벨 비율 제어는 적응적으로 제어되는 가중치 인자(fBP-I)를 사용하여 목표 비율(
Figure 112006047320679-pct00025
Figure 112006047320679-pct00026
)을 할당하는데, 이 가중치 인자는 일정한 품질 인코딩을 위해 적절한 P/B 프레임으로 코딩된 앵커 프레임과 I-프레임으로 코딩된 앵커 프레임의 추정된 비트율의 비율(fBP-I=RA-BP/RA-I)을 지정한다. 목표 비율(
Figure 112006047320679-pct00027
Figure 112006047320679-pct00028
)은
Figure 112006047320679-pct00029
을 이용해서 설정된다.
이것은 두 가중치 인자(fGroup-I와 fGroup-I) 사이의 다음의 관계:
Figure 112006047320679-pct00030
를 유도한다.
대응하는 역 단계는 인코딩된 화상 시퀀스의 대응하는 디코딩에서 수행된다.
본 발명은 디지털 화상 시퀀스를 위한 인코딩 방법 및 디코딩 방법 및 인코딩 장치에 이용 가능하다.

Claims (17)

  1. 화상 시퀀스를 디지털 인코딩(10-19)하기 위한 방법으로서, 상기 화상 시퀀스의 화상(FRM)은 픽셀 블록을 포함하는 매크로블록(macroblock: MB)으로 정렬되고, 상기 화상은 양방향 예측 코딩 타입(B) 또는 예측 코딩 타입(P) 또는 인트라 코딩 타입(I)으로 인코딩되고, 상기 화상은 화상 그룹을 형성하고, 각 그룹은 하나의 앵커 화상 또는 프레임 및 여러 개의 비-앵커 화상 또는 프레임을 포함하며, 만약 현재 프레임 이전에 인코딩된 모든 프레임이 디스플레이 순서상 이러한 현재 프레임을 선행한다면, 현재 프레임은 앵커 프레임이라고 불리고, 만약 디스플레이 순서상 현재 프레임을 뒤따르는 적어도 하나의 이전에 인코딩된 프레임이 존재한다면, 현재 프레임은 '비-앵커 프레임'이라고 불리며, 전체적 비트율 제어 목적을 위해서 적응적으로, 비트의 특정한 프레임 목표 수가 양방향 예측 코딩 타입(B) 또는 예측 코딩 타입(P) 또는 인트라 코딩 타입(I)에 할당되고, 상기 전체 비트율 제어는 프레임층 비율 제어와 매크로블록 양자화 매개변수를 선택하는 매크로블록층 비율 제어를 포함하는, 화상 시퀀스를 디지털 인코딩(10-19)하기 위한 방법에 있어서,
    - 비트의 목표 수를 앵커 프레임에는 할당하지만, 비트의 목표 수를 비-앵커 프레임에는 할당하지 않는 단계(10);
    - 적응적인 매크로블록 양자화(12) 매개변수에 의한 매크로블록층 비율 제어(10)를 사용해서 상기 앵커 프레임(P, I)의 매크로블록을 코딩하고, 고정된 매크로블록 양자화(12) 매개변수를 사용함으로써 매크로블록층 비율 제어(10) 없이 상기 비-앵커 프레임(B)의 매크로블록을 코딩하는 단계를 특징으로 하는, 화상 시퀀스를 디지털 인코딩하기 위한 방법.
  2. 제 1항에 있어서, 현재 프레임 그룹에서 비-앵커 프레임의 코딩을 위해 사용되는 양자화(12) 매개변수는 이 그룹에 속하는 이전에 인코딩된 앵커 프레임의 평균적인 양자화(12) 매개변수로부터 직접적으로 도출되는(10), 화상 시퀀스를 디지털 인코딩하기 위한 방법.
  3. 제 1항 또는 제 2항에 있어서, 상기 그룹 중의 현재 한 그룹 내에서 앵커 및 비-앵커 프레임을 위한 비트율 제어를 위해서, 가중치 인자(fGROUP-BP 또는 fGROUP-I)가 사용되며, 이 가중치 인자는 상기 화상 시퀀스의 인코딩 동안에 적응적으로 제어되고, 만약 상기 프레임이 P 또는 B 프레임으로 인코딩되면 앵커 프레임을 인코딩하기 위해 요구되는 RA-BP 개수의 비트로, 만약 상기 프레임이 I-프레임으로 코딩되면 앵커 프레임을 인코딩하기 위해 요구되는 RA-I 개수의 비트로의, 비-앵커 프레임을 인코딩하기 위해 사용되는 RNA 개수의 비트의 추정된 비율:
    Figure 112009067263096-pct00031
    ,
    Figure 112009067263096-pct00032
    을 지정하는
    화상 시퀀스를 디지털 인코딩하기 위한 방법.
  4. 제 3항에 있어서, 화상 시퀀스를 인코딩하는 것의 시작에서의 초기화를 위해, 상기 가중치 인자(fGROUP-BP 또는 fGROUP-I)는:
    Figure 112009067263096-pct00033
    ,
    Figure 112009067263096-pct00034
    으로 지정되는, 화상 시퀀스를 디지털 인코딩하기 위한 방법.
  5. 제 3항에 있어서, 상기 그룹 중의 현재 그룹에 대한
    Figure 112009067263096-pct00035
    또는
    Figure 112009067263096-pct00036
    개수의 목표 비트를 기반으로, 상기 앵커 프레임에 대한 프레임 목표 비트 개수
    Figure 112009067263096-pct00037
    또는
    Figure 112009067263096-pct00038
    는: 제각기
    Figure 112009067263096-pct00039
    또는
    Figure 112009067263096-pct00040
    이고,
    NNA는 이 현재 그룹 내에서 비-앵커 프레임 수를 가리키고, 이에 따라 대응하는 정확한 매크로블록층의 비율 제어가 사용되는, 화상 시퀀스를 디지털 인코딩하기 위한 방법.
  6. 제 3항에 있어서, 상기 그룹 중의 현재 그룹의 비-앵커 프레임 또는 비-앵커 프레임들은
    Figure 112009067263096-pct00041
    의 고정된 양자화 단계 크기를 사용해서 인코딩되고,
    Figure 112009067263096-pct00042
    는 이 그룹의 앵커 프레임을 인코딩하기 위해 사용되는 평균적인 양자화 단계 크기를 표시하는, 화상 시퀀스를 디지털 인코딩하기 위한 방법.
  7. 제 3항에 있어서, 상기 그룹 중의 현재 그룹이 완전히 인코딩된 이후에, 상기 가중치 인자(
    Figure 112011013968340-pct00062
    Figure 112011013968340-pct00063
    )가 제각기
    Figure 112011013968340-pct00043
    또는
    Figure 112011013968340-pct00044
    에 의해 결정되어 갱신되고,
    RNA(k)는 상기 현재 그룹내에서 k번째 비-앵커 프레임을 위해 사용된 비트 수이고, RA-BP 및 RA-I는 제각기 P/B 프레임으로서 또는 I-프레임으로서 상기 앵커 프레임을 인코딩하기 위해 사용되는 비트 수이고, nGroup-BP 및 nGroup-I는 상기 가중치 인자에 대해 지속적으로 증가하는 인덱스이고, 그 다음에 나오는 그룹을 위해 사용될 가중치 인자는 마지막으로 인코딩된 5개의 그룹을 위해 사용되는 가중치 인자의 대응하는 평균 값으로서 각각 계산되는, 화상 시퀀스를 디지털 인코딩하기 위한 방법.
  8. 제 3항에 있어서, 만약 I 프레임이 드물게 코딩된다면, 상기 가중치 인자(fGroup-BP 및 fGroup-I) 모두는 적응적으로 제어되는 가중치 인자(fBP-I=RA-BP/RA-I)를 사용해서 동시에 갱신되고,
    Figure 112009067263096-pct00045
    이도록 P/B-프레임으로 코딩된 앵커 프레임과 I-프레임으로 코딩된 앵커 프레임의 추정된 비트율을 지정하는, 화상 시퀀스를 디지털 인코딩하기 위한 방법.
  9. 인코딩된 화상 시퀀스를 디지털 디코딩하기 위한 방법으로서, 상기 화상 시퀀스의 화상(FRM)은 픽셀 블록을 포함하는 매크로블록(MB)으로 정렬되고, 상기 화상은 양방향 예측 코딩 타입(B) 또는 예측 코딩 타입(P) 또는 인트라 코딩 타입(I)으로 인코딩되고, 상기 화상은 화상 그룹을 형성하고, 각 그룹은 하나의 앵커 화상 또는 프레임 및 여러 개의 비-앵커 화상 또는 프레임을 포함하며, 만약 현재 프레임 이전에 인코딩된 모든 프레임이 디스플레이 순서상 이러한 현재 프레임을 선행한다면, 현재 프레임은 앵커 프레임이라고 불리고, 만약 디스플레이 순서상 현재 프레임을 뒤따르는 적어도 하나의 이전에 인코딩된 프레임이 존재한다면, 현재 프레임은 '비-앵커 프레임'이라고 불리며, 적응적으로, 전체적인 비트율 제어의 목적을 위해서, 특정한 프레임 목표 비트수가 양방향 예측 코딩 타입(B) 또는 예측 코딩 타입(P) 또는 인트라 코딩 타입(I)에 할당되었고, 상기 전체적인 비트율 제어는 프레임층 비율 제어와 매크로블록 양자화 매개변수를 선택했던 매크로블록층 비율 제어를 포함했고, 비트의 목표 수가 앵커 프레임에는 할당되었지만, 비-앵커 프레임에는 할당되지 않았고, 상기 앵커 프레임(P, I)의 매크로블록은 적응적인 매크로블록 양자화(12) 매개변수에 의해 매크로블록층 비율 제어(10)를 사용해서 코딩되었고, 상기 비-앵커 프레임(B)의 매크로블록은 고정된 매크로블록 양자화(12) 매개변수를 사용함으로써 매크로블록층 비율 제어(10)를 사용하지 않고 코딩되는, 인코딩된 화상 시퀀스를 디지털 디코딩하기 위한 방법에 있어서,
    대응되게 적응적인 매크로블록 양자화 매개변수를 사용해서 상기 앵커 프레임(P, I)을 디코딩하고, 고정된 매크로블록 양자화 매개변수를 사용해서 상기 비-앵커 프레임(B)을 디코딩하는 단계를 포함하는, 인코딩 화상 시퀀스를 디지털 디코딩하기 위한 방법.
  10. 화상 시퀀스를 디지털 인코딩(10-19)하기 위한 장치로서, 상기 화상 시퀀스의 화상(FRM)은 픽셀 블록을 포함하는 매크로블록(macroblock: MB)으로 정렬되고, 상기 화상은 양방향 예측 코딩 타입(B) 또는 예측 코딩 타입(P) 또는 인트라 코딩 타입(I)으로 인코딩되고, 상기 화상은 화상 그룹을 형성하고, 각 그룹은 하나의 앵커 화상 또는 프레임 및 여러 개의 비-앵커 화상 또는 프레임을 포함하며, 만약 현재 프레임 이전에 인코딩된 모든 프레임이 디스플레이 순서상 이러한 현재 프레임을 선행한다면, 현재 프레임은 앵커 프레임이라고 불리고, 만약 디스플레이 순서상 현재 프레임을 뒤따르는 적어도 하나의 이전에 인코딩된 프레임이 존재한다면, 현재 프레임은 '비-앵커 프레임'이라고 불리며, 전체적 비트율 제어 목적을 위해서 적응적으로, 비트의 특정한 프레임 목표 수가 양방향 예측 코딩 타입(B) 또는 예측 코딩 타입(P) 또는 인트라 코딩 타입(I)에 할당되고, 상기 전체 비트율 제어는 프레임층 비율 제어와 매크로블록 양자화 매개변수를 선택하는 매크로블록층 비율 제어를 포함하는, 화상 시퀀스를 디지털 인코딩(10-19)하기 위한 장치에 있어서,
    - 비트의 목표 수를 앵커 프레임에는 할당하지만, 비트의 목표 수를 비-앵커 프레임에는 할당하지 않기 위한 수단(10)과;
    - 적응적인 매크로블록 양자화(12) 매개변수에 의한 매크로블록층 비율 제어(10)를 사용해서 상기 앵커 프레임(P, I)의 매크로블록을 코딩하고, 고정된 매크로블록 양자화(12) 매개변수를 사용함으로써 매크로블록층 비율 제어 없이 상기 비-앵커 프레임(B)의 매크로블록을 코딩하기 위한 수단을 특징으로 하는, 화상 시퀀스를 디지털 인코딩하기 위한 장치.
  11. 제 10항에 있어서, 현재 프레임 그룹에서 비-앵커 프레임의 코딩을 위해 사용되는 양자화(12) 매개변수는 이 그룹에 속하는 이전에 인코딩된 앵커 프레임의 평균적인 양자화(12) 매개변수로부터 직접적으로 도출되는(10), 화상 시퀀스를 디지털 인코딩하기 위한 장치.
  12. 제 10항 또는 제 11항에 있어서, 상기 그룹 중의 현재 한 그룹 내에서 앵커 및 비-앵커 프레임을 위한 비트율 제어를 위해서, 가중치 인자(fGROUP-BP 또는 fGROUP-I)가 사용되며, 이 가중치 인자는 상기 화상 시퀀스의 인코딩 동안에 적응적으로 제어되고, 만약 상기 프레임이 P 또는 B 프레임으로 인코딩되면 앵커 프레임을 인코딩하기 위해 요구되는 RA-BP 개수의 비트로, 만약 상기 프레임이 I-프레임으로 코딩되면 앵커 프레임을 인코딩하기 위해 요구되는 RA-I 개수의 비트로의, 비-앵커 프레임을 인코딩하기 위해 사용되는 RNA 개수의 비트의 추정된 비율:
    Figure 112009067263096-pct00047
    ,
    Figure 112009067263096-pct00048
    을 지정하는, 화상 시퀀스를 디지털 인코딩하기 위한 장치.
  13. 제 12항에 있어서, 화상 시퀀스를 인코딩하는 것의 시작에서의 초기화를 위해, 상기 가중치 인자(fGROUP-BP 또는 fGROUP-I)는:
    Figure 112009067263096-pct00049
    ,
    Figure 112009067263096-pct00050
    으로 지정되는, 화상 시퀀스를 디지털 인코딩하기 위한 장치.
  14. 제 12항에 있어서, 상기 그룹 중의 현재 그룹에 대한
    Figure 112009067263096-pct00051
    또는
    Figure 112009067263096-pct00052
    개수의 목표 비트를 기반으로, 상기 앵커 프레임에 대한 프레임 목표 비트 개수
    Figure 112009067263096-pct00053
    또는
    Figure 112009067263096-pct00054
    는: 제각기
    Figure 112009067263096-pct00055
    또는
    Figure 112009067263096-pct00056
    이고,
    NNA는 이 현재 그룹 내에서 비-앵커 프레임 수를 가리키고, 이에 따라 대응하는 정확한 매크로블록층의 비율 제어가 사용되는, 화상 시퀀스를 디지털 인코딩하기 위한 장치.
  15. 제 12항에 있어서, 상기 그룹 중의 현재 그룹의 비-앵커 프레임 또는 비-앵커 프레임들은
    Figure 112009067263096-pct00057
    의 고정된 양자화 단계 크기를 사용해서 인코딩되고,
    Figure 112009067263096-pct00058
    는 이 그룹의 앵커 프레임을 인코딩하기 위해 사용되는 평균적인 양자화 단계 크기를 표시하는, 화상 시퀀스를 디지털 인코딩하기 위한 장치.
  16. 제 12항에 있어서, 상기 그룹 중의 현재 그룹이 완전히 인코딩된 이후에, 상기 가중치 인자(
    Figure 112011013968340-pct00064
    Figure 112011013968340-pct00065
    )가 제각기
    Figure 112011013968340-pct00059
    또는
    Figure 112011013968340-pct00060
    에 의해 결정되어 갱신되고,
    RNA(k)는 상기 현재 그룹내에서 k번째 비-앵커 프레임을 위해 사용된 비트 수이고, RA-BP 및 RA-I는 제각기 P/B 프레임으로서 또는 I-프레임으로서 상기 앵커 프레임을 인코딩하기 위해 사용되는 비트 수이고, nGroup-BP 및 nGroup-I는 상기 가중치 인자에 대해 지속적으로 증가하는 인덱스이고, 그 다음에 나오는 그룹을 위해 사용될 가중치 인자는 마지막으로 인코딩된 5개의 그룹을 위해 사용되는 가중치 인자의 대응하는 평균 값으로서 각각 계산되는, 화상 시퀀스를 디지털 인코딩하기 위한 장치.
  17. 제 12항에 있어서, 만약 I 프레임이 드물게 코딩된다면, 상기 가중치 인자(fGroup-BP 및 fGroup-I) 모두는 적응적으로 제어되는 가중치 인자(fBP-I=RA-BP/RA-I)를 사용해서 동시에 갱신되고,
    Figure 112009067263096-pct00061
    이도록 P/B-프레임으로 코딩된 앵커 프레임과 I-프레임으로 코딩된 앵커 프레임의 추정된 비트율을 지정하는, 화상 시퀀스를 디지털 인코딩하기 위한 장치.
KR1020067013282A 2004-01-05 2004-11-04 디지털 화상 시퀀스를 위한 인코딩 방법, 디코딩 방법 및 인코딩 장치 KR101089325B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP04290022A EP1551185A1 (en) 2004-01-05 2004-01-05 Encoding method, decoding method, and encoding apparatus for a digital picture sequence
EP04290022.5 2004-01-05
PCT/EP2004/012480 WO2005069632A1 (en) 2004-01-05 2004-11-04 Encoding method, decoding method, and encoding apparatus for a digital picture sequence

Publications (2)

Publication Number Publication Date
KR20060111659A KR20060111659A (ko) 2006-10-27
KR101089325B1 true KR101089325B1 (ko) 2011-12-02

Family

ID=34560277

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067013282A KR101089325B1 (ko) 2004-01-05 2004-11-04 디지털 화상 시퀀스를 위한 인코딩 방법, 디코딩 방법 및 인코딩 장치

Country Status (6)

Country Link
US (1) US8526492B2 (ko)
EP (2) EP1551185A1 (ko)
JP (1) JP4890263B2 (ko)
KR (1) KR101089325B1 (ko)
CN (1) CN1902939A (ko)
WO (1) WO2005069632A1 (ko)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100515082C (zh) * 2006-05-23 2009-07-15 中国科学院声学研究所 通过解码质量控制降低视频解码复杂度的方法
CN100531383C (zh) * 2006-05-23 2009-08-19 中国科学院声学研究所 视频播放中视频帧的分级处理方法
CN1925616B (zh) * 2006-09-14 2010-05-12 清华大学 一种宏块对级帧场自适应编解码方法
WO2010005691A1 (en) * 2008-06-16 2010-01-14 Dolby Laboratories Licensing Corporation Rate control model adaptation based on slice dependencies for video coding
CN101562741B (zh) * 2009-05-11 2011-08-24 华为技术有限公司 多层编码的码率控制方法及装置
US10063873B2 (en) 2010-03-25 2018-08-28 Mediatek Inc. Method for adaptively performing video decoding, and associated adaptive complexity video decoder and adaptive audio/video playback system
US9172980B2 (en) 2010-03-25 2015-10-27 Mediatek Inc. Method for adaptively performing video decoding, and associated adaptive complexity video decoder and adaptive audio/video playback system
CN102316313B (zh) * 2010-06-29 2013-08-28 凌阳科技股份有限公司 嵌入式实时视频压缩系统中的低复杂度的比特率控制方法
TWI543627B (zh) * 2010-07-05 2016-07-21 聯發科技股份有限公司 自適應視頻解碼方法、複雜度自適應視頻解碼器以及自適應音頻/視頻播放系統
US8717418B1 (en) * 2011-02-08 2014-05-06 John Prince Real time 3D imaging for remote surveillance
EP4228264A1 (en) 2011-06-23 2023-08-16 Sun Patent Trust Image decoding device, image encoding device
USRE47366E1 (en) 2011-06-23 2019-04-23 Sun Patent Trust Image decoding method and apparatus based on a signal type of the control parameter of the current block
TWI581615B (zh) 2011-06-24 2017-05-01 Sun Patent Trust A decoding method, a coding method, a decoding device, an encoding device, and a coding / decoding device
WO2012176465A1 (ja) 2011-06-24 2012-12-27 パナソニック株式会社 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置及び画像符号化復号装置
EP2725793A4 (en) 2011-06-27 2014-12-03 Panasonic Ip Corp America IMAGE DECODING METHOD, IMAGE ENCODING METHOD, IMAGE DECODING DEVICE, IMAGE ENCODING DEVICE, AND IMAGE ENCODING / DECODING DEVICE
RU2602671C2 (ru) 2011-06-28 2016-11-20 Сан Пэтент Траст Способ декодирования изображений, способ кодирования изображений, устройство декодирования изображений, устройство кодирования изображений и устройство кодирования и декодирования изображений
KR102006032B1 (ko) * 2011-06-29 2019-07-31 선 페이턴트 트러스트 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치 및 화상 부호화 복호 장치
CN107181948B (zh) 2011-06-30 2020-03-13 太阳专利托管公司 图像编码方法、图像编码装置及图像编码解码装置
US9060173B2 (en) * 2011-06-30 2015-06-16 Sharp Kabushiki Kaisha Context initialization based on decoder picture buffer
WO2013001769A1 (ja) 2011-06-30 2013-01-03 パナソニック株式会社 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置及び画像符号化復号装置
RU2714371C2 (ru) 2011-07-11 2020-02-14 Сан Пэтент Траст Способ декодирования изображений, способ кодирования изображений, устройство декодирования изображений, устройство кодирования изображений и устройство кодирования и декодирования изображений
CN103327329B (zh) * 2013-06-09 2017-04-12 深圳市云宙多媒体技术有限公司 一种图像质量跳变的量化调整方法及系统
US9537779B2 (en) 2013-10-11 2017-01-03 Huawei Technologies Co., Ltd. System and method for real-time traffic delivery
FR3024313B1 (fr) * 2014-07-25 2017-12-08 Allegro Dvt Codeur de video a debit variable
US10091504B2 (en) * 2015-01-08 2018-10-02 Microsoft Technology Licensing, Llc Variations of rho-domain rate control
CN106550269A (zh) * 2015-09-17 2017-03-29 联发科技股份有限公司 自适应视频解码方法、解码器以及音频/视频播放系统
WO2018023554A1 (en) * 2016-08-04 2018-02-08 SZ DJI Technology Co., Ltd. System and methods for bit rate control
US10638127B2 (en) * 2017-05-15 2020-04-28 Qualcomm Incorporated Adaptive anchor frame and quantization parameter decision in video coding
US10855988B2 (en) 2018-12-19 2020-12-01 Qualcomm Incorporated Adaptive prediction structures

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5835149A (en) * 1995-06-06 1998-11-10 Intel Corporation Bit allocation in a coded video sequence
US6690833B1 (en) * 1997-07-14 2004-02-10 Sarnoff Corporation Apparatus and method for macroblock based rate control in a coding system
US6366704B1 (en) * 1997-12-01 2002-04-02 Sharp Laboratories Of America, Inc. Method and apparatus for a delay-adaptive rate control scheme for the frame layer
WO1999049664A1 (en) * 1998-03-20 1999-09-30 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. Moving pictures encoding with constant overall bit rate
US6434196B1 (en) * 1998-04-03 2002-08-13 Sarnoff Corporation Method and apparatus for encoding video information
US6480539B1 (en) * 1999-09-10 2002-11-12 Thomson Licensing S.A. Video encoding method and apparatus
EP1204279A3 (en) * 2000-10-31 2002-05-15 Interuniversitair Microelektronica Centrum Vzw A method and apparatus for adaptive encoding framed data sequences
US7110452B2 (en) * 2001-03-05 2006-09-19 Intervideo, Inc. Systems and methods for detecting scene changes in a video data stream
US6891889B2 (en) * 2001-09-05 2005-05-10 Intel Corporation Signal to noise ratio optimization for video compression bit-rate control
JP2005303576A (ja) * 2004-04-09 2005-10-27 Sony Corp 画像信号処理装置および方法、記録媒体、プログラム、並びにビデオカメラ

Also Published As

Publication number Publication date
JP4890263B2 (ja) 2012-03-07
EP1702471A1 (en) 2006-09-20
JP2007518300A (ja) 2007-07-05
US8526492B2 (en) 2013-09-03
WO2005069632A1 (en) 2005-07-28
EP1551185A1 (en) 2005-07-06
KR20060111659A (ko) 2006-10-27
US20070274384A1 (en) 2007-11-29
CN1902939A (zh) 2007-01-24

Similar Documents

Publication Publication Date Title
KR101089325B1 (ko) 디지털 화상 시퀀스를 위한 인코딩 방법, 디코딩 방법 및 인코딩 장치
Wang et al. Rate-distortion optimization of rate control for H. 264 with adaptive initial quantization parameter determination
KR101362590B1 (ko) 화상 처리 장치 및 방법
EP1992169B1 (en) Method and apparatus for bit rate control in scalable video signal encoding using a rate-distortion optimisation
US8406297B2 (en) System and method for bit-allocation in video coding
JP4344476B2 (ja) 3:2プルダウンビデオ情報を含むビデオ情報ストリームの適応エンコーディング速度制御を実行する方法および装置
US7095784B2 (en) Method and apparatus for moving picture compression rate control using bit allocation with initial quantization step size estimation at picture level
KR20080085909A (ko) 동화상 부호화/복호화 방법과 장치 및 프로그램
WO1999063760A1 (en) Sequence adaptive bit allocation for pictures encoding
US7373004B2 (en) Apparatus for constant quality rate control in video compression and target bit allocator thereof
US20120002724A1 (en) Encoding device and method and multimedia apparatus including the encoding device
US20100002765A1 (en) Image encoding apparatus and method
JP2000197049A (ja) 動画像可変ビットレート符号化装置および方法
KR100588795B1 (ko) 부호화 장치 및 부호화 방법
JP3508916B2 (ja) 動画像可変ビットレート符号化方法および装置
JP3641214B2 (ja) 動画像符号化装置および動画像符号化方法
JP5649296B2 (ja) 画像符号化装置
KR100708182B1 (ko) 동영상 부호화기의 비트율 제어 장치 및 방법
Yin et al. A rate control scheme for H. 264 video under low bandwidth channel
KR100336497B1 (ko) 공간예측 오차 모델을 이용한 동영상 부호화기의 율제어장치 및 방법
JP2004165894A (ja) 符号化器のビットレート制御方法
JPH0775095A (ja) レート制御回路
JP4035747B2 (ja) 符号化装置および符号化方法
JP2008153802A (ja) 動画像符号化装置及び動画像符号化プログラム
KR100778473B1 (ko) 비트율 제어 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20141031

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20151030

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20161028

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20171027

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20181112

Year of fee payment: 8