KR20060009879A

KR20060009879A - 픽쳐 코딩 방법

Info

Publication number: KR20060009879A
Application number: KR1020057020570A
Authority: KR
Inventors: 미스카 한눅셀라
Original assignee: 노키아 코포레이션
Priority date: 2003-04-30
Filing date: 2004-04-29
Publication date: 2006-02-01
Also published as: WO2004098195A1; MY140227A; KR100772139B1; CN1781313A; NO20055043D0; AU2004234896B2; CA2524219A1; US7403660B2; TWI280059B; US20040218816A1; NO20055043L; JP2006524948A; TW200427333A; AU2004234896A1; EP1618746A1

Abstract

인코딩된 픽쳐들은 하나 또는 그 이상의 독립적으로 디코딩될 수 있는 프레임들, 기준 프레임들, 및 예측 프레임들을 포함한다. 본 발명에 따른 방법에서 픽쳐들을 인코딩 순서로 정렬하기 위한 정렬 단계가 수행되고, 제공 순서에 대한 정보가 인코딩된 픽쳐들에 대하여 정의된다. 본 발명에 따른 해당 방법에서, 송신 단계는 상기 인코딩된 픽쳐를 디코더로 송신하기 위한 송신 단계가 수행되고, 인코딩된 픽쳐들을 디코딩하여 디코딩된 픽쳐들을 형성하기 위한 디코딩 단계가 수행되며, 디코딩된 픽쳐들을 제공 순서대로 정렬하는 재정렬 단계가 수행된다. 한 픽쳐당 제공 순서의 증가치의 기대치가 정의되고, 증가 기대치 및 실재 증가치 간의 차이를 지시하는 파라미터가 연산된다. 연산된 파라미터는 가변장 부호화(VLC) 코딩되고, 가변장 부호화(VLC) 코딩된 파라미터는 송신되는데, 여기서 가변장 부호화(VLC) 코딩된 파라미터는 디코딩된 픽쳐들을 정확한 제공 순서대로 정렬하기 위하여 디코더 내에서 사용된다.

Description

픽쳐 코딩 방법{Picture coding method}

본 발명은 픽쳐들을 인코딩 및 디코딩하기 위한 방법으로서, 디코딩 페이즈에서 디코딩된 인코딩된-픽쳐들을 정렬하는데 사용되는 제1 값을 정의하는 단계, 및 상기 제1 값의 기대치를 지시하는 제2 값을 정의하는 단계를 포함하는 방법에 관한 것이다. 또한, 본 발명은 시스템, 송신 장치, 수신 장치, 인코더, 디코더, 전자 장치, 소프트웨어 프로그램, 저장 매체, 및 신호에 관련된다.

비디오 코딩 표준으로서 발행된 것들에는 ITU-T H.261, ITU-T H.263, ISO/IEC MPEG-1, ISO/IEC MPEG-2, 및 ISO/IEC MPEG-4 Part 2 등이 포함된다. 이러한 표준들은 종래의 비디오 코딩 표준들로서 본 명세서에서 참조된다.

비디오 통신 시스템들

비디오 통신 시스템들은 대화형(conversational) 및 비-대화형(non-conversational) 시스템들로 구분될 수 있다. 대화형 시스템들에는 비디오 화상 회의(video conferencing) 및 비디오 전화(video telephony) 등이 포함된다. 이러한 시스템들의 예를 들면 ITU-T 권고안 H.320, H.323, 및 H.324 등이 있는데, 이들은 각각 ISDN, IP, 및 PSTN 네트워크들을 구동하는 비디오 화상 회의/전화 시스템들을 정의한다. 대화형 시스템들은 단-대-단 지연(end-to-end delay)을 최소화함 으로써(오디오-비디오 신호를 캡쳐하고 원격지에서 오디오-비디오를 제공할 때까지의 지연을 최소화함으로써) 사용자가 경험하는 장치의 동작을 개선하고자 하는 의도가 중요하다는 점에서 특징을 가진다.

비-대화형 시스템들에는 저장된 콘텐츠들을 재생하는 서비스를 포함하는데, 저장된 콘텐츠에는 디지털 다기능 디스크(DVD) 또는 재생 장치, 디지털 텔레비전, 및 스트리밍의 대용량 메모리에 저장된 비디오 파일들이 포함된다. 이러한 기술 분야에 대한 중요한 표준들에 대한 간략한 복습이 후술된다.

디지털 비디오 소비자들을 위한 전자 장치에서 가장 널리 사용되는 표준은 MPEG-2이며, 비디오 압축, 오디오 압축, 저장, 및 전송(transport) 동작을 위한 규격들을 포함한다. 코딩된 비디오의 저장 및 전송 동작은 기본 스트림(elementary stream)의 개념에 기반한다. 기본 스트림은 단일 소스(예를 들어, 비디오)로부터의 코딩된 데이터 및 소스 정보의 동기화, 식별(identification), 및 특징화(characterization)를 위하여 요구되는 보조 데이터(ancillary data)를 포함한다. 기본 스트림은 등장(constant-length) 또는 가변장(variable-length) 패킷들 중 하나로 패킷화되어 패킷화된 기본 스트림(PES, Packetized Elementary Stream)을 형성한다. 각 패킷화된 기본 스트림(PES) 패킷은 헤더 및 이에 후속하며 페이로드라고 불리는 스트림 데이터를 포함한다. 다양한 기본 스트림들로부터의 패킷화된 기본 스트림(PES) 패킷들이 결합되어 프로그램 스트림(PS) 또는 트랜스포트 스트림(TS) 중 하나를 형성한다. 프로그램 스트림(PS)은 저장-후-재생 타입 어플리케이션들과 같이, 송신 에러가 거의 없는 어플리케이션을 겨냥한 것이다. 트랜스포트 스트림(TS)은 송신 에러에 민감한 어플리케이션들을 겨냥한 것이다. 그러나, 트랜스포트 스트림(TS)은 네트워크의 처리율(throughput)이 일정하도록 보장되는 것으로 가정한다.

ITU-T 및 ISO/IEC의 조인트 비디오 팀(JVT, Joint Video Team)에서 진행중인 표준화 노력이 있다. 조인트 비디오 팀(JVT)의 작업은 H.26L 이라고 불리는 ITU-T의 이전 표준화 프로젝트에 기반한다. 조인트 비디오 팀(JVT) 표준화의 목적은 ITU-T 권고안 H.264 및 ISO/IEC 국제 표준 14496-70(MPEG-4 Part 10)과 동일한 표준 텍스트를 릴리스하는 것이다. 표준 초안은 이러한 어플리케이션 내의 조인트 비디오 팀(JVT) 코딩 표준이라고 불리며, 이 표준 초안에 따른 코덱(codec)은 조인트 비디오 팀(JVT) 코덱이라고 불린다.

이하, 비디오 정보에 관련된 몇 가지 용어들이 명확하게 정의된다. 한 프레임은 루마 샘플(luma samples)의 한 어레이 및 상응하는 크로마 샘플(chroma samples)들의 두 개의 어레이들을 포함한다. 한 프레임은 두 개의 필드로서, 탑 필드(top field) 및 바텀 필드(bottom field)를 포함한다. 한 픽쳐는 한 프레임이거나 한 필드이다. 한 필드는 한 프레임의 교호되는(altenate) 행들의 모음(assembly)이다. 코딩된 픽쳐는 코딩된 프레임이거나 코딩된 필드이다. 조인트 비디오 팀(JVT) 코딩 표준에서, 코딩된 픽쳐는 하나 또는 그 이상의 슬라이스(slice)들을 포함한다. 한 슬라이스는 정수 개의 매크로블록(macroblock)들을 포함하고, 디코딩된 한 개의 매크로블록은 16x16 블록의 루마 샘플들 및 두 개의 상응하는 크로마 샘플들의 블록들에 상응한다. 조인트 비디오 팀(JVT) 코딩 표준에 서, 한 슬라이스는 I(intra), P(predicted), B(bi-predictive), SI(switching intra), SP(switching predicted) 중 한 개의 코딩 타입에 따라서 코딩된다. 한 개의 코딩된 픽쳐는 상이한 타입의 슬라이스들을 포함할 수 있다. 모든 타입의 픽쳐들이 P, B, 및 SP 슬라이스들을 위한 기준 픽쳐(reference pictures)로서 사용될 수 있다. 동시 디코더 리프레시(IDR, instantaneous decoder refresh) 픽쳐는 I 또는 SI 슬라이스 타입을 가지는 슬라이스들만을 포함하는 코딩된 픽쳐의 특정 타입이다. 어떤 후속 픽쳐도 디코딩 순서에서 동시 디코더 리프레시(IDR) 픽쳐보다 선행하는 픽쳐들을 참조할 수 없다. 어떤 비디오 코딩 표준들에서는, 코딩된 비디오 시퀀스는 시퀀스 마크(sequence mark) 이전의 해당 비트스트림 내의 모든 픽쳐들을 포함하는 엔티티(entity)이다. 조인트 비디오 팀(JVT) 코딩 표준에서는, 코딩된 비디오 시퀀스는 디코딩 순서에서 어떤 동시 디코더 리프레시(IDR) 픽쳐(inclusive)로부터 후속 동시 디코더 리프레시(IDR) 픽쳐(exclusive) 까지의 모든 코딩된 픽쳐들을 포함하는 엔티티이다. 다시 말하면, 조인트 비디오 팀(JVT) 코딩 표준에 따라서 코딩된 비디오 시퀀스는 MPEG-2 비디오에 따르는 폐쇄된 픽쳐들의 그룹(GOP, group of pictures)에 상응한다.

코덱 사양 자체에 대해서 살펴보면, 이는 개념적으로 비디오 코딩 계층(VCL, video coding layer) 및 네트워크 추상화 계층(NAL, network abstraction layer)들로 구분된다. 비디오 코딩 계층(VCL)은 코덱의 신호 처리 기능 및 변환, 양자화(quantization), 동작 검색/보상, 및 루프 필터와 같은 장치들을 포함한다. 비디오 코딩 계층(VCL)은 현존하는 비디오 코덱의 거의 모든 것들의 일반적 개념을 따 르며, 동작 보상 기능을 가지는 인터 픽쳐 예측 기능 및 잔여 신호(residual signal)의 변환 코딩을 이용하는 매크로블록에 기반한 코더를 따른다. 비디오 코딩 계층(VCL)의 출력은 슬라이스들로서, 정수 개의 매크로블록들에 대한 매크로블록 데이터 및 슬라이스 헤더에 대한 정보(슬라이스 내의 제1 매크로블록의 공간적 주소, 최초 양자화 파라미터, 및 이와 같은 것들을 포함한다)를 포함한다. 슬라이스들 내의 매크로블록은 상이한 매크로블록 할당 동작이 한정되지 않는다면 소위 유연한 매크로블록 오더링 신택스(Flexible Macroblock Ordering syntax)를 이용함으로써 스캔 순서(scan order)대로 정렬된다. In-picture 예측법은 오직 한 슬라이스 내에서만 사용된다.

네트워크 추상화 계층(NAL)은 비디오 코딩 계층(VCL)의 슬라이스 출력을 네트워크 추상화 계층 유닛들(NALUs, Network Abstraction Layer Units)로 캡슐화(encapsulate)하는데, 네트워크 추상화 계층 유닛들(NALUs)은 패킷 네트워크를 통하여 송신되기에 적합하거나 패킷 기준의 멀티플렉스 환경(packet oriented multiplex environment)에서 사용되기에 적합하다. 조인트 비디오 팀(JVT)의 부록(Annex) B는 이와 같은 네트워크 추상화 계층 유닛들(NALUs)을 바이트-스트림 기준의 네트워크들(byte-stream oriented network)을 통하여 송신하기 위한 캡슐화 단계(encapsulation process)를 정의한다.

H.263 및 MPEG-4 Part 2의 NEWPRED 코딩 툴(coding tool)의 선택적 기준 픽쳐 선택 모드는 각 픽쳐 세그먼트 마다의(예를 들어 H.263에서의 각 슬라이스마다의) 동작 보상을 위한 기준 프레임을 선택하는 것을 가능하게 한다. 더 나아가, H.263 및 조인트 비디오 팀(JVT) 코딩 표준의 선택적 향상된 기준 픽쳐 선택 모드(Enhanced Reference Picture Selection mode)는 각 매크로블록마다 개별적으로 기준 프레임을 선택하는 것을 가능하게 한다.

파라미터 집합 개념(Parameter Set Concept)

조인트 비디오 팀(JVT) 코덱의 가장 기본적인 설계 개념은, 자급자족식(self-contained) 패킷들을 생성함으로써, 헤더 복제(header duplication)와 같은 매커니즘이 불필요하도록 하는 것이다. 이와 같은 것이 실현되는 방법에는, 해당 미디어 스트림 중 한 개 이상의 슬라이스에 관련되는 정보를 디커플링(decouple)하는 것이다. 이와 같은 고수준의 계층 메타 정보는 안정적이고 비동기식으로 전송되어야 하고, 해당 슬라이스 패킷들을 포함하는 RTP 패킷으로부터 사전에 전송되어야 한다. 또한, 이러한 정보는 해당 목적에 적합한 대역폭 외(out-of-band) 트랜스포트 채널(transport channel)을 가지지 않는 어플리케이션들에서는 대역폭 내(in-band)에서 전송될 수도 있다. 고수준 파라미터들의 조합은 파라미터 집합(Parameter Set)이라고 불린다. 파라미터 집합은 픽쳐 크기, 디스플레이 윈도우, 채택된 선택적 코딩 모드, 매크로블록 할당 맵, 및 다른 것과 같은 정보를 포함한다.

파라미터 집합 업데이트를 동기적으로 슬라이스 패킷 스트림에 송신할 필요 없이 픽쳐 파라미터(픽쳐 크기와 같은 파라미터)를 변경시킬 수 있도록 하기 위하여, 인코더 및 디코더는 하나 이상의 파라미터 집합의 목록을 유지할 수 있다. 각 슬라이스 헤더는 사용될 파라미터 집합을 지시하는 코드워드(codeword)를 포함한 다. 조인트 비디오 팀(JVT) 코딩 표준에 따르면, 두 가지 종류의 파라미터 집합이 존재하는데, 그 중 하나는 시퀀스를 위한 것(시퀀스 파라미터 집합)이며, 다른 하나는 픽쳐들을 위한 것(픽쳐 파라미터 집합)이다.

이와 같은 매커니즘에 의하면, 패킷 스트림으로부터 파라미터 집합의 송신을 디커플링하고, 파라미터 집합들을 외부 수단(예를 들어 기능 교환(capability exchange)의 부수적 효과와 같은)을 이용하여 송신하거나 제어 프로토콜(신뢰성이 있거나 없거나)을 통하여 송신하는 것이 가능해진다. 파라미터 집합들이 절대로 송신되지 않는 반면 어플리케이션 설계 사양에 의하여 확정되는 것 역시 가능할 것이다.

송신 순서(Transmission order)

종래 기술에 의한 비디오 코딩 표준에서는, 픽쳐들의 디코딩 순서는 B 픽쳐들을 제외하고는 디스플레이 순서와 동일하다. 종래 기술에 의한 B 픽쳐내의 블록은 두 개의 기준 픽쳐들로부터 시간적으로(temporally) 양방향 예측될 수 있는데, 두 개의 기준 픽쳐들 중 하나는 디스플레이 순서에서 시간적으로 선순위이며 다른 기준 픽쳐는 시간적으로 후속한다. 디코딩 순서에서 가장 최근의 기준 픽쳐만이 디스플레이 순서에서 B 픽쳐에 후속할 수 있다(예외: H.263 에서의 인터레이스 코딩(interlaced coding)은 예외인데, 여기선 시간적으로 후속하는 기준 프레임의 두 개의 필드 픽쳐들 모두가 디코딩 순서에서 B 픽쳐에 선행할 수 있다). 종래 기술에 의한 B 픽쳐는 시간적 예측을 위한 기준 픽쳐로서 사용될 수 없으며, 때문에 종래의 B 픽쳐는 다른 어떤 픽쳐들의 디코딩에도 영향을 미치지 않은 채 처분될 수 없다.

조인트 비디오 팀(JVT) 코딩 표준은 이전의 표준들에 비하여 다음과 같은 신규한 기술적 특징들을 포함한다.

- 픽쳐들의 디코딩 순서는 디스플레이 순서로부터 디커플링된다. 프레임 번호는 디코딩 순서를 지시하고 픽쳐 순서 카운트는 디코딩 순서를 지시한다.

- B 픽쳐 내의 어떤 블록에 대한 기준 픽쳐는 디코딩 순서에서 해당 B 픽쳐보다 선행할 수도 있고 후행할 수도 있다. 결과적으로, B 픽쳐는 양방향(bi-directional) 픽쳐대신에 양방향 예측 픽쳐(bi-predictive picture)를 대표한다.

- 기준 픽쳐들로서 사용되지 않는 픽쳐들은 명확히 표시된다. 모든 타입(intra, inter, B 등과 같은 타입들)의 픽쳐는 기준 픽쳐 또는 비-기준 픽쳐가 될 수 있다. (그러므로, B 픽쳐는 다른 픽쳐들의 시간적 예측을 위한 기준 픽쳐로서 사용될 수 있다)

- 픽쳐는 상이한 코딩 타입으로 코딩되는 슬라이스들을 포함할 수 있다. 다시 말하면, 코딩된 픽쳐는 예를 들어 인트라-코딩된(intra-coded) 슬라이스 및 B-코딩된 슬라이스를 포함할 수 있다.

디스플레이 순서를 디코딩 순서로부터 디커플링하면, 압축 효율성 및 탄력성(resiliency) 측면에서 유리하다.

압축 효율을 잠재적으로 개선하는 예측 구조(prediction structure)의 일 실시예가 도 1에 제공된다. 박스들은 픽쳐를 나타내고, 박스 내의 대문자는 코딩 타입을 나타내고, 박스 내의 숫자들은 조인트 비디오 팀(JVT) 코딩 표준에 따르는 프 레임 번호를 나타내고, 화살표는 예측 의존성(prediction dependencies)을 나타낸다. 픽쳐 B17이 픽쳐 B18의 기준 픽쳐임에 주의한다. 압축 효율은 잠재적으로 종래 기술에 의한 코딩법에 비하여 향상되는데, 그 이유는 픽쳐 B18을 위한 기준 픽쳐들이 종래의 PBBP 또는 PBBBP 코딩된 픽쳐 패턴을 이용하여 코딩하는 것에 비하여 시간적으로 근접하기 때문이다. 압축 효율은 종래의 PBP 코딩된 픽쳐 패턴에 비하여 향상되는데, 그 이유는 기준 픽쳐들의 일부가 양방향으로 예측되기 때문이다.

도 2는 오류 탄력성(error resiliency)을 개선하기 위하여 사용될 수 있는 인트라 픽쳐 연기법(intra picture postponement method)의 일 실시예를 제공한다. 통상적으로, 인트라 픽쳐는 예를 들어 커팅된 장면(scene cut) 직후에 코딩되거나 또는 만료된(expired) 인트라 픽쳐 리프레시 주기(refresh period)에 대한 응답으로서 코딩된다. 인트라 픽쳐 연기법에서, 어떤 인트라 픽쳐를 코딩할 필요성이 대두되는 즉시 코딩되지 않고, 시간적으로 후속하는 픽쳐가 인트라 픽쳐로서 선택된다. 코딩된 인트라 픽쳐 및 인트라 픽쳐의 종래 지점 간의 각 픽쳐는 시간적으로 그 다음 후속하는 픽쳐로부터 예측된다. 도 2에 도시된 바와 같이, 인트라 픽쳐 연기법은 두 개의 독립적인 인터 픽쳐 예측 체인(inter picture prediction chain)을 생성하는데 반하여, 종래 기술에 의한 코딩 알고리즘은 단일 인터 픽쳐 체인만을 생성한다. 종래 기술에 의한 단일 체인을 이용한 접근법에 비하여 두 개의 체인을 이용하는 접근법이 삭제 에러(erasure error)에 대해 견실할 것이라는 것은 직관적으로 명백하다. 만일 단일 체인에 패킷 손실이 발생하더라도 다른 체인은 여전히 정확하게 수신될 수 있다. 종래 기술에 의한 코딩법에서, 패킷 손실이 발생되면, 언제나 잔여 인터 픽쳐 예측 체인 전체에 에러가 전달되는 현상(error propagation)이 야기된다.

통상적으로, 순서 정보 및 타이밍 정보의 두 개의 타입이 디지털 비디오와 관련되는데, 이것들은 디코딩 순서 및 제공 순서(presentation order, order)이다. 이하, 관련된 기술에 대해서 자세히 살펴본다.

디코딩 타임스탬프(DTS, decoding timestamp)는 코딩된 데이터 유닛이 디코딩되어야 할, 기준 클록에 대한 상대적인 시간을 지시한다. 만일 디코딩 타임스탬프(DTS)가 코딩 및 송신되면, 디코딩 타임스탬프(DTS)는 두 가지 목적을 수행하는데, 첫째는 픽쳐들의 디코딩 순서가 출력 순서와 다르다면 디코딩 타임스탬프(DTS)가 명확하게 디코딩 순서를 지시한다는 점이다. 두 번째 목적은, 수신율(reception rate)이 어느 시점에서나 송신률에 근접하다면, 디코딩 타임스탬프(DTS)는 특정 사전-디코더 버퍼링 동작(pre-decoder buffering behavior)을 보장한다. 단-대-단 레이턴시(end-to-end latency)가 변동되는 네트워크에서는, 디코딩 타임스탬프(DTS)를 사용하는 두 번째 목적은 거의 아무런 역할을 수행하지 않는다. 대신에, 압축되지 않은 픽쳐들을 위한 사후-디코더(post-decoder) 내의 공간이 존재한다면, 수신된 데이터는 가능한 한 빨리 디코딩된다.

디코딩 타임스탬프(DTS)를 운반(carriage)하는 것은 사용중인 통신 시스템 및 비디오 코딩 표준에 따라 좌우된다. MPEG-2 시스템에서, 디코딩 타임스탬프(DTS)는 패킷화된 기본 스트림(PES) 패킷의 헤더에 단일 아이템으로서 선택적으로 송신될 수 있다. 조인트 비디오 팀(JVT) 코딩 표준에서는, 디코딩 타임스탬프(DTS)는 보완 확장 정보(SEI, Supplemental Enhancement Information)의 일부로서 선택적으로 운반될 수 있으며, 디코딩 타임스탬프(DTS)는 선택적 가정적 기준 디코더(Hypothetical Reference Decoder)의 동작에서 사용된다. ISO 베이스 미디어 파일 포맷(Base Media File Format)에서는, 디코딩 타임스탬프(DTS)는 자신 스스로의 박스 타입인 샘플 박스까지의 디코딩 시간(Decoding Time to Sample Box) 내에 전용으로 포함된다. RTP-기반의 스트리밍 시스템들과 같은 많은 시스템들에서, 디코딩 타임스탬프(DTS)는 아예 운반되지 않는데, 그 이유는 디코딩 순서가 송신 순서와 동일하다고 가정되고 정확한 디코딩 시간이 중요한 역할을 수행하지 않기 때문이다.

H.263 선택적 부록 U 및 부록 W.6.12는 디코딩 순서에서 사전 기준 픽쳐에 대해 1만큼 증가되는 픽쳐 번호를 한정한다. 조인트 비디오 팀(JVT) 코딩 표준에서, 프레임 번호 코딩 요소는 H.263의 픽쳐 번호와 유사하게 한정된다. 조인트 비디오 팀(JVT) 코딩 표준에서, 프레임 번호는 동시 디코더 리프레시(IDR) 픽쳐에서 0으로 리셋 된다.

H.263 픽쳐 번호는 기준 픽쳐들의 디코딩 순서를 복원하는데 사용될 수 있다. 유사하게, 조인트 비디오 팀(JVT) 프레임 번호는, 디코딩 순서에서 어느 동시 디코더 리프레시(IDR) 픽쳐(inclusive) 및 후속 동시 디코더 리프레시(IDR) 픽쳐(exclusive) 간에 존재하는 프레임들의 디코딩 순서를 복원하는데 사용될 수 있다. 그러나, 상보적(complementary) 기준 필드 쌍(상이한 패리티를 가지는 필드들로서 코딩된 연속 픽쳐들)이 동일한 프레임 번호를 공유하므로, 그들의 디코딩 순서는 프레임 번호들로부터 재구성될 수 없다.

H.263 픽쳐 번호 또는 비-기준 픽쳐의 조인트 비디오 팀(JVT) 프레임 번호는 디코딩 순서에 있어서, 이전 기준 픽쳐의 픽쳐 또는 프레임 번호에 1을 더한 값과 같도록 한정된다. 만일 수 개의 비-기준 픽쳐들이 디코딩 순서에 있어서 연속된다면, 그들은 동일한 픽쳐 또는 프레임 번호를 공유한다. 또한, 비-기준 픽쳐의 픽쳐 또는 프레임 번호는 디코딩 순서에 있어서 후속하는 기준 픽쳐의 픽쳐 또는 프레임 번호와 동일하다. 연속적인 비-기준 픽쳐들의 디코딩 순서는 H.263의 시간적 기준(Temporal Reference) 코딩 요소 또는 조인트 비디오 팀(JVT) 코딩 표준의 픽쳐 순서 카운트(POC, Picture Order Count) 개념을 이용하여 복원될 수 있다.

픽쳐 또는 프레임 번호의 값은 특정 최대치를 가진다. 최대치 이후에 해당 값이 더 증가되면 픽쳐 또는 프레임 번호는 0으로 된다. 전형적으로, 픽쳐 또는 프레임 번호는 N-비트의 무부호 정수로서 코딩 및 송신되기 때문에, 결과적으로 픽쳐 또는 프레임 번호의 최대치는 2^N-1과 동일하다.

제공 타임스탬프(PTS, presentation timestamp)는 픽쳐가 디스플레이 되어야 하는 기준 클록에 대한 상대적인 시간을 지시한다. 제공 타임스탬프(PTS)는 디스플레이 타임스탬프, 출력 타임스탬프, 및 합성 타임스탬프(composition timestamp)라고도 불린다.

제공 타임스탬프(PTS)를 운반(carriage)하는 것은 사용중인 통신 시스템 및 비디오 코딩 표준에 따라 좌우된다. MPEG-2 시스템에서, 제공 타임스탬프(PTS)는 패킷화된 기본 스트림(PES) 패킷의 헤더에 단일 아이템으로서 선택적으로 송신될 수 있다. 조인트 비디오 팀(JVT) 코딩 표준에서는, 제공 타임스탬프(PTS)는 보완 확장 정보(SEI)의 일부로서 선택적으로 운반될 수 있으며, 제공 타임스탬프(PTS)는 선택적 가정적 기준 디코더(Hypothetical Reference Decoder)의 동작에서 사용된다. ISO 베이스 미디어 파일 포맷에서는, 제공 타임스탬프(PTS)는 자신 스스로의 박스 타입인 샘플 박스까지의 디코딩 시간(Decoding Time to Sample Box) 내에 전용으로 포함되고, 제공 타임스탬프(PTS)는 상응하는 디코딩 타임스탬프에 대하여 상대적으로 코딩된다. RTP에서, RTP 패킷 헤더 내의 RTP 타임스탬프가 제공 타임스탬프(PTS)에 상응한다.

종래 기술에 의한 비디오 코딩 표준들은 여러 측면에서 제공 타임스탬프(PTS)에 유사한 시간적 기준(TR, Temporal Reference) 코딩 요소를 가진다. 시간적 기준(TR)의 값은 시간적으로 선행하는 기준 픽쳐 헤더 내의 자신의 값을 1만큼 증가시킨 값에다가 시전에 송신된 것으로부터의 픽쳐 클록 주파수에서의 스킵된 픽쳐 또는 비-기준 픽쳐들의 개수를 합산함으로써 형성된다. 전형적으로 시간적 기준(TR)은 고정된 길이의(N-비트) 무부호 정수로서 코딩되기 때문에, 시간적 기준(TR)을 이용한 연산에서는 모듈로(modulo) 2^N계산이 사용된다. MPEG-2 비디오와 같은 종래 기술에 의한 몇 가지 코딩 표준에서는, 시간적 기준(TR)은 픽쳐들의 그룹(GOP)의 개시 시점에서 0으로 리셋 된다.

조인트 비디오 팀(JVT) 코딩 표준에서, 비디오 코딩 계층에는 시간 개념이 존재하지 않는다. 픽쳐 순서 카운트는, 디코딩 순서에서 사전 동시 디코더 리프레시(IDR)에 대하여 또는, 모든 기준 픽쳐들을 "기존으로 사용되지 않음(unused for reference)"라고 표시하는 메모리 관리 제어 동작을 포함하는 사전 픽쳐에 대하여 출력 순서에 있어서 증가하는 픽쳐 위치(picture position) 만큼 증가되는 값을 가지는 변수로서 정의된다. 픽쳐 순서 카운트는 각각의 프레임 및 필드에 대하여 유도된다. 조인트 비디오 팀(JVT) 코딩 표준에서는, 픽쳐 순서 카운트는 B 슬라이스를 디코딩하는 동안의 기준 픽쳐들의 최초 픽쳐 순서를 결정하는데 사용됨으로써, 시간적 다이렉트 모드(temporal direct mode)에서의 동작 벡터(motion vector) 유도를 위하거나, B 슬라이스들에서의 암시적 모드 가중치 예측(implicit mode weighted prediction)을 위하거나, 디코더 출력 순서 적합성 확인(conformance checking)을 위하여, 프레임들 또는 필드들 간의 픽쳐 순서 차이값을 표시한다. 많은 인코더들은 픽쳐 순서 카운트가 픽쳐들의 샘플ㄱ링 시간에 비례하도록 설정한다.

멀티미디어 스트림의 송신

멀티미디어 스트리밍 시스템은 스트리밍 서버 및 네트워크를 통하여 상기 서버에 액세스하는 다수 개의 플레이어들을 포함한다. 전형적으로, 네트워크는 패킷-지향 적이고 서비스의 품질을 보장할 수단을 거의 제공하지 않거나 아예 제공하지 않는다. 플레이어들은 사전-저장된 멀티미디어 콘텐츠 또는 실시간 멀티미디어 콘텐츠를 서버로부터 패치(fetch)하고 해당 콘텐츠가 다운로드중인 동안에 실시간으 로 콘텐츠를 재생한다. 통신 타입은 점-대-점(point-to-point) 방식이거나 멀티캐스트 방식일 수 있다. 점-대-점 스트리밍에서는, 서버는 각 플레이어로의 개별 커넥션을 제공한다. 멀티캐스트 스트리밍에서는, 서버는 단일 데이터 스트림을 다수 개의 플레이어들에 제공하고, 네트워크 요소들은 필요할 경우에만 해당 스트림을 복제(duplicate)한다.

플레이어가 서버로의 커넥션을 설립하고 어떤 멀티미디어 스트림을 요청하면, 서버는 요청된 스트림을 송신하기 시작한다. 플레이어는 해당 스트림을 즉시 재생하지 않고, 전형적으로는 수 초 동안 수신되는 데이터를 버퍼링 한다. 여기서, 버퍼링 동작은 초기 버퍼링(initial buffering)이라고 불린다. 초기 버퍼링은 정지되지 않는 재생 동작을 유지할 수 있도록 돕는데, 그 이유는 때때로 송신 지연이 증가되거나 또는 네트워크 처리율이 저하되면, 플레이어가 버퍼링된 데이터를 디코딩 및 재생할 수 있기 때문이다.

송신 에러

송신 에러에는 두 가지 주요 타입이 존재하는데, 그것은 비트 에러 및 패킷 에러이다. 전형적으로, 비트 에러는 이동 통신에서의 무선 액세스 네트워크 커넥션과 같은 회로-교환식 채널(circuit-switched channel)에 관련되고, 비트 에러는 무선 방해(radio interference)와 같은 물리적 채널들의 비완전성(imperfection)에 의하여 야기된다. 이와 같은 비완전성은 송신된 데이터에서 비트 반전(bit inversion), 비트 삽입, 및 비트 삭제 현상이 발생되도록 야기할 수 있다. 패킷 에러들은 전형적으로 패킷-교환식(packet-switched) 네트워크의 요소들에 의하여 야기된다. 예를 들어, 패킷 라우터(packet router)는 처리량이 많아 혼잡(congested)하게 될 수 있다. 즉, 패킷 라우터는 입력으로서 너무 많은 패킷을 가지기 때문에 동일한 속도로 패킷들을 출력할 수 없는 현상이 발생될 수 있다. 이러한 경우에, 패킷 라우터의 버퍼는 오버플로우되고, 패킷들 중 몇 개는 손실될 수 있다. 패킷 복제 현상 및 송신된 순서와 다른 순서로 패킷이 전달(packet delivery)되는 현상도 가능하지만, 이들은 전형적으로는 패킷 손실처럼 일반적으로 일어나는 것은 아닌 것으로 간주된다. 또한, 패킷 에러는 기사용된 트랜스포트 프로토콜 스택(used transport protocol stack)을 구현함에 의하여 야기될 수도 있다. 예를 들어, 어떤 프로토콜들은 송신기에서 연산되고 소스-코딩된 데이터에 캡슐화되는 체크섬(checksum)들을 이용한다. 만일 데이터 내에 비트 반전 에러가 존재한다면, 수신기에서의 체크섬이 동일해질 수 없기 때문에 수신기는 수신된 패킷을 폐기하여야 할 수 있다.

GPRS, UMTS, 및 CDMA-2000 등을 포함하는 2세대(2G) 및 3세대(3G) 이동 통신 네트워크들은 두 가지 기본 타입의 무선 링크 커넥션을 제공하는데, 이들은 확인된(acknowledged) 타입 및 미확인된(non-acknowledge) 타입이다. 확인된 커넥션은, 무선 링크 프레임의 무결성(integrity)이 수신기(이동국(MS, Mobile Station), 또는 기지국 서브시스템(BSS, Base Station Subsystem) 중 하나인 수신기) 측에서 체크되고, 송신 에러가 발생될 경우에는 무선 링크의 다른 쪽 말단(end)으로 재송신 요청이 전달되는 커넥션이다. 링크 계층 재송신을 수행해야 할지 모르기 때문에 소스측(originator)은 해당 프레임의 수신이 잘 이루어졌다는 긍정적인 확인이 수 신될 때까지 무선 링크 프레임을 버퍼링해야 한다. 열악한 무선 환경에서는, 소스측의 버퍼가 오버플로우되어 데이터 손실이 발생될 수 있다. 그럼에도 불구하고, 스트리밍 서비스를 위하여는 확인된 무선 링크 프로토콜 모드를 사용하는 것이 바람직하다는 점이 증명되었다. 미확인된 타입의 커넥션은 에러가 발생된 무선 링크 프레임들이 전형적으로 폐기되는 커넥션이다.

거의 모든 비디오 압축 알고리즘들은 시간적으로 예측된 인터(INTER) 또는 P 픽쳐를 생성한다. 그 결과로, 한 픽쳐에 데이터가 손실되면, 손실된 픽쳐로부터 시간적으로 예측된 후속 픽쳐들에도 시각적인 열화가 발생되게 된다. 손실된 프레임으로부터 독립적인 프레임이 수신될 때까지, 비디오 통신 시스템들은 디스플레이된 이미지에 존재하는 손실을 숨기거나 손실되지 않은 가장 최근의 픽쳐를 스크린에 고정적으로 표시할 수 있다.

종래 기술에 의한 비디오 코딩 표준에서, 디코딩 순서는 출력 순서치와 커플링된다. 다시 말하면, I 픽쳐 및 P 픽쳐의 디코딩 순서는 그들의 출력 순서와 동일하고, B 픽쳐의 디코딩 순서는 출력 순서에 있어서 해당 B 픽쳐의 후속 기준 픽쳐의 디코딩 순서를 즉시 따른다. 결과적으로, 공지된 출력 순서로부터 디코딩 순서를 복원하는 것이 가능하다. 전형적으로, 출력 순서는 시간적 기준(TR) 필드 내의 기본 비디오 스트림 내에서 전달되고, 또한 RTP 헤더 내와 같이 시스템 멀티플렉스 계층 내에서도 전달된다. 그러므로, 종래의 비디오 코딩 표준에서는 제공된 문제점들이 존재하지 않는다.

버퍼링

전형적으로, 스트리밍 클라이언트들은 상대적으로 방대한 양의 데이터를 저장할 수 있는 수신기 버퍼를 가진다. 최초에, 스트리밍 세션이 설립되면, 클라이언트는 즉시 스트림을 재생 시작하지 않고, 오히려 전형적으로는 수 초동안 수신되는 데이터를 버퍼링한다. 이러한 버퍼링 동작은 연속적인 재생을 유지하도록 돕는데, 그 이유는 가끔 송신 지연이 증가되거나 네트워크의 처리율이 저하되는 경우에, 클라이언트는 버퍼링된 데이터를 디코딩 및 재생할 수 있기 때문이다. 반면에, 초기 버퍼링을 수행하지 않으면, 클라이언트는 디코딩을 중지하고, 수신되는 데이터를 대기한다. 또한, 버퍼링은 모든 프로토콜 레벨에서의 자동 재송신 또는 선택적 재송신 모두를 위하여도 필요하다. 만일 픽쳐의 어느 부분이 손실된다면, 재송신 메커니즘이 손실된 데이터를 재전송하는데 사용된다. 만일 재송신된 데이터가 애초 스케줄링 되었던 디코딩 시간 또는 재생 시간 이전에 수신된다면, 손실은 완전하게 복원될 수 있다.

본 발명은 크기를 감소시키는 방법으로, 시간적 기준 및/또는 픽쳐 순서 카운트에 관련된 정보를 송신할 수 있도록 한다. 본 발명에서, 기대된 증가치 및 실제 증가치 간의 차이를 지시하는 파라미터가 연산되며, 연산된 파라미터는 허프만 코딩(Huffman coding), 산술적 코딩(arithmetic coding), 또는 다른 타입의 엔트로피 코딩(entropy coding)과 같은 가변장 코딩법을 이용하여 코딩되고, 가변장 부호화(VLC) 코딩된 파라미터는 송신되는데, 여기서 가변장 부호화(VLC) 코딩된 파라미터는 디코딩된 픽쳐들을 정확한 제공 순서(presentation order)로 정렬하기 위하여 디코더 내에서 사용된다.

본 발명에서, 시퀀스-레벨 시그널링(sequence-level signalling)이 픽쳐 번호 또는 프레임 번호의 증가치 당 기대된 시간적 기준 또는 픽쳐 순서 카운트 차이를 한정하기 위하여 정의된다. 그러면, 시간적 기준 및 픽쳐 순서 카운트는 기대된 시간적 기준 또는 픽쳐 순서 카운트를 각 픽쳐당 연산함으로써 코딩된다. 그러면, 기대된 픽쳐 순서 카운트 및 실제 픽쳐 순서 카운트 간의 차이가 각 픽쳐에 대하여 정의되고, 비트스트림 형태로 수신기에 송신된다. 바람직하게는, 차이값은 송신되기 이전에 가변장 코딩됨으로써 송신될 정보의 크기를 감소시킬 수 있다.

본 발명에 대한 후술되는 상세한 설명에서, 본 발명은 인코더-디코더 기반 시스템을 이용하여 설명되지만, 본 발명은 비디오 신호들이 저장되는 시스템에도 구현될 수 있음은 명백하다. 저장된 비디오 신호들은 인코딩이전에 저장된 코딩되지 않은 신호들이거나, 인코딩 이후의 코딩된 신호들이거나, 인코딩 및 디코딩 단계가 수행된 이후에 저장된 디코딩된 신호들일 수 있다. 예를 들어, 인코더는 디코딩 순서대로 비트스트림을 생성한다. 파일 시스템은 예를 들어, 디코딩 순서대로 캡슐화되고 파일로서 저장된 오디오 및/또는 비디오 비트스트림을 수신한다.

본 발명에 따른 인코딩 방법은 주위적으로 제1 값 및 제2 값 간의 차이를 지시하는 적어도 하나의 파라미터를 연산하는 단계 및 적어도 하나의 상기 파라미터를 비트스트림으로 코딩하는 단계를 포함하는 것을 특징으로 한다. 본 발명에 따른 디코딩 방법은 주위적으로, 순서치의 기대치를 지시하는 제1 값을 형성하는 단계; 상기 비트스트림으로부터 적어도 하나의 파라미터를 디코딩하여 제2 값을 획득하는 단계로서, 적어도 하나의 디코딩된 상기 파라미터는 상기 순서치 및 상기 제1 값 간의 차이를 지시하는 단계 및 상기 제1 값 및 상기 제2 값을 이용하여 상기 순서치를 획득하는 단계를 포함하는 것을 특징으로 한다. 본 발명에 따른 시스템은, 주위적으로, 제1 값 및 제2 값 간의 차이를 지시하는 적어도 하나의 파라미터를 연산하기 위한 연산 수단; 적어도 하나의 상기 파라미터를 비트스트림으로 코딩하기 위한 코더; 상기 비트스트림으로부터 적어도 하나의 파라미터를 디코딩하여 제2 값을 획득하기 위한 디코딩 수단으로서, 적어도 하나의 디코딩된 상기 파라미터는 상기 순서치 및 상기 제1 값 간의 차이를 지시하는 디코딩 수단 및 상기 제1 값 및 상기 제2 값을 이용하여 상기 순서치를 획득하기 위한 수단을 포함하는 것을 특징으로 한다. 본 발명에 따른 송신 장치는 주위적으로, 제1 값 및 상기 제2 값 간의 차이를 지시하는 적어도 하나의 파라미터를 연산하기 위한 연산 수단 및 적어도 하나의 상기 파라미터를 비트스트림으로 코딩하기 위한 코더를 포함하는 것을 특징으로 한다. 본 발명에 따른 수신 장치는 주위적으로, 비트스트림으로부터 적어도 하나의 파라미터를 디코딩하여 제2 값을 획득하기 위한 디코딩 수단으로서, 적어도 하나의 디코딩된 상기 파라미터는 상기 순서치 및 상기 제1 값 간의 차이를 지시하는 디코딩 수단 및 상기 제1 값 및 상기 제2 값을 이용하여 상기 순서치를 획득하는 수단을 포함하는 것을 특징으로 한다. 본 발명에 따른 소프트웨어 프로그램은 주위적으로, 제1 값 및 상기 제2 값 간의 차이를 지시하는 적어도 하나의 파라미터를 연산하는 단계 및 적어도 하나의 상기 파라미터를 상기 비트스트림으로 코딩하는 단계를 포함하는 동작을 수행하도록 구현되는 것을 특징으로 한다. 본 발명에 따른 저장 매체는 주위적으로, 비트스트림으로부터 적어도 하나의 파라미터를 디코딩하여 제2 값을 획득하는 단계로서, 적어도 하나의 디코딩된 상기 파라미터는 상기 순서치 및 상기 제1 값 간의 차이를 지시하는 단계 및 상기 제1 값 및 상기 제2 값을 이용하여 상기 순서치를 획득하는 단계를 포함하는 동작을 수행하도록 구현되는, 기계에 의하여 실행될 수 있는 소프트웨어 프로그램을 포함하는 것을 특징으로 한다. 본 발명에 따른 반송파는 주위적으로, 제1 값 및 제2 값 간의 차이로서 비트스트림 내에 코딩된 차이를 지시하는 적어도 하나의 파라미터를 포함하는 것을 특징으로 한다.

본 발명을 이용함으로써, 송신될 정보량을 더욱 감소시키는 것이 가능하다. 따라서, 멀티미디어 정보의 송신 속도를 더욱 가속화하는 것이 가능하다.

도 1은 잠재적으로 압축 효율을 향상시키기 위한 예측 구조의 일 실시예를 제공한다.

도 2는 에러 탄력성을 향상시키기 위하여 사용될 수 있는 인트라 픽쳐 연기법의 일 실시예를 제공한다.

도 3은 본 발명에 따른 시스템의 바람직한 일 실시예를 도시한다.

도 4는 본 발명에 따른 인코더의 바람직한 일 실시예를 도시한다.

도 5는 본 발명에 따른 디코더의 바람직한 일 실시예를 도시한다.

이하, 본 발명은 도 3에 도시된 시스템, 도 4에 도시된 인코더(1) 및 도 5에 도시된 디코더(2)를 참조하여 상세히 설명될 것이다. 예를 들어, 인코딩될 픽쳐들은, 예를 들어 카메라, 비디오 녹화기 등과 같은 비디오 소스(3)로부터의 비디오 스트림의 픽쳐들일 수 있다. 비디오 스트림의 픽쳐들(프레임들)은 슬라이스와 같이 더 작은 부분들로 나뉠 수 있다. 더 나아가, 슬라이스들도 블록들로 나누어질 수 있다. 인코더(1)에서, 비디오 스트림은 인코딩됨으로써 송신 채널(4)을 통하여 송신될 정보량을 감소시키거나, 저장 매체(미도시)로 전달될 정보량을 감소시킨다. 비디오 스트림의 픽쳐들은 인코더(1)로 입력된다. 인코더(1)는 인코딩될 픽쳐들의 일부를 일시적으로 저장하기 위한 인코딩 버퍼(1.1)(도 4 참조)를 포함한다. 또한, 인코더(1)는 본 발명에 따른 인코딩 작업이 적용되는 메모리(1.3) 및 프로세서(1.2)를 포함한다. 메모리(1.3) 및 프로세서(1.2)는 송신 장치(6)와 공유될 수 있고, 또는 송신 장치(6)는 송신 장치(6)의 다른 기능을 수행하기 위한 다른 프로세서 및/또는 메모리(미도시)를 더 포함할 수 있다. 인코더(1)는 동작 예측(motion estimation) 및/또는 다른 몇 가지 작업들을 수행함으로써 비디오 스트림을 압축한다. 동작 예측 과정에서, 인코딩될 픽쳐(현재 픽쳐) 및 이전 및/또는 이후 픽쳐 간의 유사성(similarities)이 검색된다. 만일 유사성이 발견된다면, 비교된 픽쳐(compared picture) 또는 그 픽쳐의 일부분이 인코딩될 픽쳐의 기준 픽쳐로서 사용된다. 조인트 비디오 팀(JVT) 코딩 표준에서, 픽쳐들의 디스플레이 순서 및 디코딩 순서는 반드시 같아야 하는 것은 아니고, 기준 픽쳐는 기준 픽쳐로서 사용되기만 하면 단지 기준 픽쳐는 버퍼(예를 들어, 인코딩 버퍼(1.1)와 같은 버퍼) 내에 저장되어야 할 뿐이다. 또한, 인코더(1)는 픽쳐들의 디스플레이 순서에 대한 정보 를 비트스트림 내에 삽입한다.

인코딩 프로세스로부터, 인코딩된 픽쳐들은 필요할 경우 인코딩된 픽쳐 버퍼(5.2)로 이동된다. 인코딩된 픽쳐들은 인코더(1)로부터 송신 채널(4)을 통해 디코더(2)로 송신된다. 디코더(2)에서, 인코딩된 픽쳐들은 디코딩됨으로써 가급적 인코딩된 픽쳐와 많이 상응하는 압축 해제된 픽쳐들을 형성한다. 디코딩된 각 픽쳐들은, 그것이 실질적으로 디코딩된 직후에 디스플레이되고 기준 픽쳐로서 사용되지 않는다면, 디코더(2)의 디코딩된 픽쳐 버퍼(DPB, 2.1) 내에 버퍼링된다. 바람직하게는, 기대치 픽쳐 버퍼링 및 디스플레이 픽쳐 버퍼링은 결합되고, 동일한 디코딩된 픽쳐 버퍼(DPB, 2.1)를 사용하는 것이 바람직하다. 이와 같이 동작하면, 상이한 위치에 동일한 픽쳐들을 저장하여야 할 필요가 없어지므로, 디코더(2)의 메모리 요구 조건이 완화된다.

또한, 디코더(2)는 메모리(2.3) 및 프로세서(2.2)를 포함하는데, 본 발명에 따른 디코딩 작업이 프로세서(2.2) 및 메모리(2.3)에서 적용될 수 있다. 메모리(2.3) 및 프로세서(2.2)는 수신기 장치(8)와 공용으로 사용될 수 있고, 또는 수신기 장치(8)는 수신기 장치(8)의 다른 기능들을 수행하기 위한 다른 프로세서 및/또는 메모리(미도시)를 더 포함할 수도 있다.

인코딩

이제 인코딩-디코딩 프로세스를 살펴본다. 비디오 소스(3)로부터의 픽쳐들은 인코더(1)에 입력되고, 바람직하게는 인코딩 버퍼(1.1)에 저장된다. 인코딩 프로세스는 반드시 제1 픽쳐가 인코더(1)에 도달하자마자 개시되어야 하는 것이 아니 고, 어느 정도의 양에 해당하는 픽쳐들이 인코딩 버퍼(1.1) 내에 사용 가능하게 된 이후에 개시될 수 있다. 그러면, 인코더(1)는 이러한 픽쳐들 중에서 기준 프레임으로서 사용되기에 적합한 후보(candidate)들을 검색한다. 그러면, 인코더(1)는 인코딩을 수행하여 인코딩된 픽쳐들을 형성한다. 예를 들어, 인코딩된 픽쳐들은 예측된 픽쳐들(P), 양방향-예측 픽쳐들(B), 및/또는 인트라-코딩된 픽쳐들(I)일 수 있다. 인트라-코딩된 픽쳐들(I)은 다른 픽쳐를 이용하지 않고 디코딩될 수 있으나, 다른 타입의 픽쳐들은 그들이 디코딩되기 이전에 적어도 하나의 기준 픽쳐가 필요하다. 언급된 픽쳐 타입들 중 모든 타입의 픽쳐들이 기준 픽쳐로서 사용될 수 있다.

이하, 시간적 기준(TR)이라는 용어가 사용되는데, 시간적 기준(TR) 대신에 픽쳐 순서 카운트(POC, picture order count)도 사용될 수 있음은 명백하다. 시간적 기준(TR)은 현재 비디오 시퀀스의 개시 지점에 대한 제공 타임스탬프(PTS)를 나타낸다. 시간적 기준(TR)의 정밀도(precision) 및 코딩 모드는 시퀀스-레벨의 문제들이다. 이들은 오직 동시 디코더 리프레시(IDR) 픽쳐에서만 변경될 수 있다.

본 발명의 바람직한 일 실시예에서, "없음(none)", "델타(delta)", 및 "독립적(independent)" 모드와 같은 상이한 시간적 기준(TR)들이 존재할 수 있다. "없음" 모드는 시간적 기준(TR)들이 슬라이스 헤더에서 운반되지 않는다는 것을 나타낸다. "델타" 모드는 시간적 기준(TR)들이 프레임 번호에 대해 상대적으로 코딩됨을 나타낸다. "독립적" 모드는 H.263 표준에서의 경우와 유사하게, 시간적 기준(TR)들이 프레임 번호와는 독립적으로 코딩됨을 나타낸다. 이하, "델타" 모드에 대해서만 더욱 상세히 고려한다.

조인트 비디오 팀(JVT) 코딩 표준에서, 프레임 번호는 동시 디코더 리프레시(IDR) 픽쳐에서 0으로 리셋 된다. 또한, 전형적으로 시간적 기준(TR)은 시퀀스 또는 픽쳐들의 그룹(GOP)의 개시 지점에서 0으로 리셋되고, 픽쳐 순서 카운트는 조인트 비디오 팀(JVT) 코딩 표준에 따른 동시 디코더 리프레시(IDR) 픽쳐에서 0으로 리셋 된다. 동시 디코더 리프레시(IDR) 픽쳐는 인코더 및 디코더의 기준 픽쳐 버퍼들이 비워지도록 한다. 또한, 특정 명령에 의하여 기준 픽쳐 버퍼를 비우고 픽쳐 순서 카운트를 리셋하는 것도 가능한데, 이러한 특정 명령은 조인트 비디오 팀(JVT) 코딩 표준에서의 memory-management_control_operation 이라고 불리고 5와 동일하다. 비-기준 픽쳐의 프레임 번호는, 디코딩 순서에 있어서 이전 기준 픽쳐의 프레임 번호에 1을 더한 값과 동일하다. 만일, 몇 개의 비-기준 픽쳐들이 디코딩 순서에서 연속된다면, 그들은 동일한 프레임 번호를 공유한다. 또한, 비-기준 픽쳐의 프레임 번호는 디코딩 순서에 있어서 후속하는 기준 픽쳐의 프레임 번호와 동일하다(디코딩 순서에 있어서 후속하는 기준 픽쳐가 동시 디코더 리프레시(IDR) 픽쳐가 아니라면). 이제, 코딩 패턴이 IBBPBBP인 다음과 같은 예에 대해서 고려한다. 프레임들이 B2 B2 P1 B3 B3 P2 와 같은 코딩 패턴에 따라서 코딩되어야 한다고 한다(여기서, 숫자는 프레임 번호를 나타낸다). 또한, B-프레임들(B2, B3)은 두 개의 인코딩된 프레임들로부터 양방향으로 예측된다고 가정한다. 코딩 패턴으로부터, 프레임 번호 증가분 당 시간적 기준(TR)의 기대되는 차이값은 3이라는 것을 알 수 있다. 인코더가 제1 픽쳐(I0)를 인코딩하면, 인코더는 시간적 기준(TR) 을 0으로 리셋한다. 그러면, 인코더는 제2 기준 픽쳐를 인코딩하는데, 이 경우에는 픽쳐 P1이 이에 해당한다. 픽쳐 P1의 시간적 기준(TR)은 3이고, 이것은 프레임 번호(1)에 기대되는 차이값(3)을 승산 함으로써 연산될 수 있다. 이제, 인코더는 두 개의 기준 프레임들인 I0, P1 모두를 자신의 메모리에 포함하고, 그 사이에서 B 프레임들을 예측할 수 있다. 제1 B2 프레임의 시간적 기준(TR)은 다음과 같이 연산될 수 있다. 즉, 프레임 번호(2)는 기대되는 차이값(3)에 의하여 승산 됨으로써, 6이라는 값이 얻어지고, 이것은 제1 B2 프레임의 기대된 시간적 기준(TR) 값이다. 그러나, 제1 B2 프레임의 정확한 순서값은 1이다. 그러므로, 실제 값 및 기대치 사이에는 -5라는 차이가 존재한다. 이러한 차이(또는 에러)는 본 명세서에서 상세히 후술되는 바와 같이, 수신기 측에 시그널링 된다. 후속하는 B2 프레임의 기대되는 시간적 기준(TR) 값 및 실제 시간적 기준(TR)값들 간의 차이도 유사한 방식으로 연산될 수 있다. 그러므로, 기대치는 프레임 번호*기대된 시간적 기준(TR)값인 2*3으로서 6이라는 값을 얻는다. 그러면, 시간적 기준(TR) 예측 에러는 실제값 - 예측된 시간적 기준(TR)값인 2-6에 해당되므로 -4가 된다.

인코더는 후속하는 제3 기준 프레임인 P2를 인코딩한다. 기대치 및 실재 시간적 기준(TR)값은 2*3=6이다. P2 프레임이 인코딩된 이후, 제2 프레임인 P1 및 제3 기준 픽쳐인 P2 간의 B3 프레임이 인코딩될 수 있다. 에러값을 연산하는 동작은 전술된 예시의 경우와 유사하다. 제1 B3 프레임의 에러값은 4-3*3=-5이고, 제2 B3 프레임의 에러값은 5-3*3=-4이다.

다른 바람직한 실시예에서, 저장되지 않은 픽쳐의 시간적 기준(TR) 값은 자 신의 프레임 번호에 오프셋(offset) 값을 감산한 값에 상대적일 수 있다. 바람직하게는, 오프셋은 1 또는 2인 것이 바람직하다. 그러므로, 만일 픽쳐가 저장되지 않은 픽쳐라면, 시간적 기준(TR) 값은 다음과 같이 연산된다.

(frame_num-offset)*expectedDeltaPN + TRPredictionError

여기서, frame_num 은 프레임 번호이고(허용되는 값의 범위 내에서는 제한이 없는 값이다),

offset은 전술된 바와 같으며,

expectedDeltaPN 은 기대된 시간적 기준 차이값이고,

TRPredictionError 는 시간적 기준 예측 에러이다.

만일 어느 픽쳐가 저장된 픽쳐라면, 시간적 기준(TR) 값은 다음과 같이 연산된다.

frame_num*expectedDeltaPN + TRPredictionError

여기서 TRPredictionError는 시간적 기준 예측 에러이다.

이 실시예에서, 시간적 기준(TR) 예측 에러들은, 이전 예시에서와 같이 프레임들이 코딩된다면(즉, I0 B2 B2 P1 B3 B3 P2 순서대로 코딩된다면), 다음 표 1에 제공된 바와 같다.

프레임	TR 예측 에러	시간적 기준값
I0	0	TR=0
B2	1	TR=(2-0)*3-5=1
B2	2	TR=(2-0)*3-4=2
P1	0	TR=1*3=3
B3	1	TR=(3-0)*3-5=4
B3	2	TR=(3-0)*3-4=5
P2	0	TR=2*3=6

본 발명에 따르면, 시간적 기준(TR) 값의 기대치 또는 실재 값이 송신되지 않으며, 에러값에 대한 정보가 송신된다. 바람직하게는, 에러값은 송신되기 이전에 가변장 부호화(VLC)-인코딩된다. 에러값은 가변장 부호화(VLC)-인코딩될 수 있고, 그러면, 가변장 부호화(VLC)-코딩된 값이 송신된다. 또한, 에러값의 절대치가 가변장 부호화(VLC)-코딩되고, 그러면 가변장 부호화(VLC)-코딩된 값 및 해당 에러값의 부호에 대한 정보가 송신되는 것도 가능하다. 다른 바람직한 실시예에서는, 에러값이 0과 같을 경우 에러값을 송신할 필요가 없으며, 오직 에러값이 0이라는 것을 지시하는 플래그(예를 들어 1비트의 정보)만이 송신될 수 있다.

RTP-기반의 시스템들과 같은 몇 가지 시스템들에서, 비디오 패킷 스트림 내에 제공 타임스탬프(PTS)를 명백하기 시그널링할 필요가 없으며, 그 이유는 해당 정보는 송신 프로토콜에서 암시적으로(implicitly) 전달되기 때문이다. 디코딩 타임스탬프가 사전-디코더 버퍼의 동작을 제어하는데 사용된다. 대화형 어플리케이션들은 타임스탬프를 디코딩하는 동작을 필요로 하지 않을 수 있는데, 그 이유는 이러한 어플리케이션들은 전형적으로 자신들이 수행할 수 있는 가장 빠른 방법으로 디코딩 동작을 수행하기 때문이다. 그러므로 시스템들은 어떤 타임스탬프 정보를 송신하여야 할지에 대한 결정 자유도(freedom to decide)를 가져야 한다. 어떤 시스템들에서는, 시간적 기준(TR) 차이의 기댓값 및 시간적 기준(TR) 예측 에러값을 디코더(2)로 시그널링 하는 것이 필요하다. 에러값은 예측된 각 프레임에 대하여 시그널링 된다. 시간적 기준(TR) 차이값의 기댓값은 각 픽쳐들의 그룹(GOP)에 대하여 시그널링 되거나, 연속되는 픽쳐들의 그룹(GOP)들 간의 기대되는 시간적 기준(TR) 차이값에 변화가 없다면, 이보다 덜 빈번하게 시그널링 된다. 예를 들어, 시그널링 동작은 파라미터 집합 메커니즘(Parameter Set mechanism)을 이용함으로써 수행될 수 있다.

이하, 슬라이스 헤더 정보의 일 실시예가 설명된다. 슬라이스 헤더는 다음과 같은 필드들을 포함한다.

TRPE: (시간적 기준(TR) 예측 에러의 절대치)+1,

TRPES: 시간적 기준(TR) 예측 에러의 부호,

TR: 시간적 기준(TR).

TRPE 는 가변장 코드이며 시간적 기준(TR) 예측 에러값을 포함한다. 만일, TRPE가 0이라면, 해당 픽쳐에 대하여 이전에 연산된 시간적 기준(TR)이 사용된다. TRPE가 0보다 크다면, 시간적 기준(TR)은 다음과 같이 연산된다. 심벌 PPN은 덮어쓰기(wrapper)가 발생되지 않는(즉, 프레임의 절대치에 대한 제한이 없는) 누적적 프레임 번호이다. TRPES는 TRPE가 1보다 클 때에만 존재한다. 만일 TRPE=0이라면, 해당 슬라이스 헤더에는 더 이상 TR 정보가 운반되지 않으며, TR의 값은 동일한 픽쳐의 다른 어떤 슬라이스 헤더에서 운반되는 값과 동일하다. 만일 TRPE=1이라면, TR은 PPN*(시간적 기준(TR) 차이 기댓값)으로 연산된다. TRPE>1 인 상황에서, 시간적 기준(TR) 예측 에러 부호(TRPES)가 검사된다. 만일, TRPES=1이라면(즉, 에러값이 양의 값이라면), TR=TPN*(시간적 기준(TR) 차이 기대값)+TRPE-1 이다. 만일, TRPES=0이라면(즉, 에러값이 음의 값이라면), TR=TPN*(시간적 기준(TR) 차이 기대값)-TRPE+1 이다. 이러한 예에서, 디코더로 시그널링 되는 시간적 기준(TR) 예측 에러값은 실제 시간적 기준(TR) 예측 에러값이 1만큼 증가된 값이다. 그러므로 디코더는 각 프레임 당 정확한 시간적 기준(TR) 값을 연산하는데 있어서, 이를 고려한다.

디코딩

이하, 수신기(8)의 동작에 대해서 설명한다. 수신기(8)는 한 픽쳐에 속하는 모든 패킷들을 수집하고, 적당한(reasonable) 순서로 그들을 정렬한다. 순서의 엄격함(strictness)은 채택된 프로파일에 의존한다. 수신된 패킷들은 수신 버퍼(사전-디코딩 버퍼)(9.1)내에 저장된다. 수신기(8)는 사용할 수 없는 것들은 폐기하고, 나머지를 디코더(2)로 전달한다.

만일 디코더(2)가 디코딩 작업을 시작하기에 충분한 프레임을 가지고 있다면, 디코더는 프레임들을 디코딩하기 시작한다. 우선, 정확한 디코딩 순서가 식별되어야 한다. 이러한 동작은 수신된 프레임들의 디코딩 타임스탬프를 검사함으로써 수행될 수 있다. 명칭이 암시하는 바와 같이, 독립적으로 디코딩가능한 프레임들은 다른 프레임들과 관계없이 디코딩될 수 있다. 하나 또는 그 이상의 예측 프레임들을 위한 기준 프레임들인 디코딩된 프레임들은 기준 프레임 버퍼 내에 저장되는데, 기준 프레임 버퍼는 디코더(2)의 디코딩된 픽쳐 버퍼(DPB, 2.1)의 일부일 수 있다. 만일, 어느 예측 프레임의 모든 기준 프레임들이 해당 예측 프레임 이전에 송신되도록 송신 순서가 정해진다면, 디코더는 예측 프레임들을 저장할 필요가 없으며, 예측 프레임들은 실질적으로 수신된 직후에 디코딩될 수 있다. 디코딩된 프레임들은 제공되기 위하여 정확한 순서로 정렬되어야 한다. 이러한 동작은 인코딩된 시간적 기준(TR) 예측 에러 정보 및 기대된 시간적 기준(TR) 차이값을 이용함으로써 수행될 수 있다. 이하, 순서 정렬 프로세스의 일 실시예에 대해서 설명된다. 이러한 예시에서, 프레임들은 I0 P1 B2 B2 P2 B3 B3의 순서대로 수신되는 것으로 가정한다. 또한, 프레임들의 시간적 기준(TR) 예측 에러가 각각 0, 0, -5, -4, 0, -5, -4인 것으로 가정된다. 디코더(2)는 시간적 기준(TR) 차이의 기댓값에 대한 정보를 수신한다. 예를 들어서, 기댓값은 3인 것으로 가정한다. 디코더(2)는 각 프레임당 기대된 시간적 기준(TR) 차이값, 프레임 번호, 및 시간적 기준(TR) 예측 에러값들을 이용함으로써 시간적 기준(TR)을 연산한다. 제1 프레임 I0 에 대해서, 시간적 기준(TR) 값을 연산하면, 에러를 합산하기 이전에, 0의 결과를 얻게 된다(0*3=0). 에러가 0이므로, 시간적 기준(TR)값이 0이다. 유사하게, 다른 시간적 기준(TR)값들도 연산될 수 있다. 그 결과들이 표 2에 제공된다.

프레임	TR 예측 에러	시간적 기준값
I0	0	TR=0
P1	0	TR=1*3+0=3
B2	-5	TR=2*3-5=1
B2	-4	TR=2*3-4=2
P2	0	TR=2*3+0=6
B3	-5	TR=3*3-5=4
B3	-4	TR=3*3-4=5

이제, 프레임들은 정확한 순서로 제공될 수 있다.

하나의 프레임은 두 개의 필드를 포함한다. 픽쳐 순서 카운트 번호는 하나의 전체 프레임에 대해서 한정될 수도 있고, 또는 그 프레임의 필드들 모두를 위하여 개별적으로 한정될 수도 있다. 한 프레임의 하나의 필드의 픽쳐 순서 카운트 번호는 해당 프레임의 다른 필드의 픽쳐 순서 카운트 번호와 같은 다른 스킴(scheme)으로 코딩될 수도 있다. 예를 들어, 해당 프레임의 다른 필드의 픽쳐 순서 카운트 값은 해당 프레임의 제1 필드에 대해 상대적으로 코딩될 수 있다.

본 발명은 단지 전술된 바와 같은 실시예들에만 한정되지 않으며, 첨부된 청구의 범위의 기술적 사상에서 벗어나지 않는 범위에서 변형될 수 있음이 명백하다.

본 발명은 대화형 및 비-대화형 비디오 통신 시스템들에 적용될 수 있다. 있다. 대화형 시스템들에는 비디오 화상 회의 및 비디오 전화 등이 포함된다. 이러한 시스템들의 예를 들면 ITU-T 권고안 H.320, H.323, 및 H.324 등이 있는데, 이들은 각각 ISDN, IP, 및 PSTN 네트워크들을 구동하는 비디오 화상 회의/전화 시스템들을 정의한다. 대화형 시스템들은 단-대-단 지연(end-to-end delay)을 최소화함으로써(오디오-비디오 신호를 캡쳐하고 원격지에서 오디오-비디오를 제공할 때까지의 지연을 최소화함으로써) 사용자가 경험하는 장치의 동작을 개선하고자 하는 의도가 중요하다는 점에서 특징을 가진다.

Claims

픽쳐들을 비트스트림으로 인코딩하는 방법에 있어서,

- 디코딩 페이즈에서 디코딩된 인코딩된-픽쳐들을 정렬하는데 사용되는 제1 값을 정의하는 단계;

- 상기 제1 값의 기대치(expected value)를 지시하는 제2 값을 정의하는 단계;

- 상기 제1 값 및 상기 제2 값 간의 차이를 지시하는 적어도 하나의 파라미터를 연산하는 단계 및

- 적어도 하나의 상기 파라미터를 상기 비트스트림으로 코딩하는 단계를 포함하는 것을 특징으로 하는 인코딩 방법.
제1항에 있어서,

하나 또는 그 이상의 독립적으로 디코딩될 수 있는(independently decodable) 픽쳐들, 하나 또는 그 이상의 기준 픽쳐들(reference pictures), 및 하나 또는 그 이상의 예측 픽쳐들(predicted pictures)을 상기 비트스트림으로 인코딩하는 단계를 더 포함하는 것을 특징으로 하는 인코딩 방법.
제1항에 있어서,

인코딩된 상기 픽쳐들을 디코더로 송신하는 송신 단계를 더 포함하는 것을 특징으로 하는 인코딩 방법.
제1항에 있어서,

연산된 상기 파라미터를 가변장 부호화(VLC) 코딩하는 단계 및

가변장 부호화(VLC) 코딩된 상기 파라미터를 송신하는 단계를 더 포함하는 것을 특징으로 하는 인코딩 방법.
비트스트림으로부터 픽쳐들을 디코딩하는 방법으로서, 픽쳐들의 순서를 지시하는 순서치(ordering value)가 형성되는 디코딩 방법에 있어서,

- 상기 순서치의 기대치를 지시하는 제1 값을 형성하는 단계;

- 상기 비트스트림으로부터 적어도 하나의 파라미터를 디코딩하여 제2 값을 획득하는 단계로서, 적어도 하나의 디코딩된 상기 파라미터는 상기 순서치 및 상기 제1 값 간의 차이를 지시하는 단계 및

- 상기 제1 값 및 상기 제2 값을 이용하여 상기 순서치를 획득하는 단계를 포함하는 것을 특징으로 하는 디코딩 방법.
제5항에 있어서,

디코딩된 인코딩된-픽쳐들을 정렬하는데 상기 순서치를 이용하는 단계를 더 포함하는 것을 특징으로 하는 디코딩 방법.
제6항에 있어서,

인코딩된 픽쳐들을 디코딩하여 디코딩된 픽쳐들을 형성하는 디코딩 단계 및

상기 순서치를 이용하여 상기 디코딩된 인코딩된-픽쳐들을 제공 순서(presentation order)로 정렬하는 단계를 더 포함하는 것을 특징으로 하는 디코딩 방법.
제5항에 있어서,

동작 보상(motion compensation)을 위하여 상기 순서치를 이용하는 단계를 더 포함하는 것을 특징으로 하는 디코딩 방법.
제5항에 있어서,

프레임 번호에 상기 제2 값을 승산함으로써 상기 기대치를 지시하는 단계를 더 포함하는 것을 특징으로 하는 디코딩 방법.
픽쳐들을 비트스트림으로 인코딩하는 인코더에 있어서,

- 디코딩 페이즈에서 디코딩된 인코딩된-픽쳐들을 정렬하는데 사용되는 제1 값;

- 상기 제1 값의 기대치를 지시하는 제2 값;

- 상기 제1 값 및 상기 제2 값 간의 차이를 지시하는 적어도 하나의 파라미터를 연산하기 위한 연산 수단 및

- 적어도 하나의 상기 파라미터를 상기 비트스트림으로 코딩하기 위한 코더를 포함하는 것을 특징으로 하는 인코더.
픽쳐들을 비트스트림으로 인코딩하는 인코더를 포함하는 송신 장치에 있어서,

- 디코딩 페이즈에서 디코딩된 인코딩된-픽쳐들을 정렬하는데 사용되는 제1 값;

- 상기 제1 값의 기대치를 지시하는 제2 값;

- 상기 제1 값 및 상기 제2 값 간의 차이를 지시하는 적어도 하나의 파라미터를 연산하기 위한 연산 수단 및

- 적어도 하나의 상기 파라미터를 상기 비트스트림으로 코딩하기 위한 코더를 포함하는 것을 특징으로 하는 송신 장치.
제11항에 있어서,

상기 제2 값을 시퀀스 파라미터 집합(sequence parameter set)에 포함시키기 위한 수단을 포함하는 것을 특징으로 하는 송신 장치.
제11항에 있어서,

상기 연산 수단은, 상기 제1 값의 상기 기대치에 프레임 번호의 증가에 대하여 통지하도록(inform) 구현되는 것을 특징으로 하는 송신 장치.
제11항에 있어서,

적어도 하나의 상기 파라미터를 슬라이스 헤더(slice header)내에 포함시키기 위한 수단을 포함하는 것을 특징으로 하는 송신 장치.
제11항에 있어서,

상기 코더는, 연산된 상기 파라미터를 가변장 부호화(VLC) 코딩하기 위한 가변장 부호화(VLC) 코더를 포함하고,

상기 송신 장치는, 가변장 부호화(VLC) 코딩된 파라미터를 송신하기 위한 송신기를 더 포함하는 것을 특징으로 하는 송신 장치.
비트스트림으로부터 픽쳐들을 디코딩하는 디코더로서, 픽쳐들의 순서를 지시하는 순서치가 형성되는 디코더에 있어서,

- 상기 순서치의 기대치를 지시하는 제1 값;

- 상기 비트스트림으로부터 적어도 하나의 파라미터를 디코딩하여 제2 값을 획득하기 위한 디코딩 수단으로서, 적어도 하나의 디코딩된 상기 파라미터는 상기 순서치 및 상기 제1 값 간의 차이를 지시하는 디코딩 수단 및

- 상기 제1 값 및 상기 제2 값을 이용하여 상기 순서치를 획득하기 위한 수단을 포함하는 것을 특징으로 하는 디코더.
비트스트림으로부터 픽쳐들을 디코딩하는 디코더를 포함하는 수신 장치로서, 픽쳐들의 순서를 지시하는 순서치가 형성되는 수신 장치에 있어서, 상기 디코더는,

- 상기 순서치의 기대치를 지시하는 제1 값;

- 상기 비트스트림으로부터 적어도 하나의 파라미터를 디코딩하여 제2 값을 획득하기 위한 디코딩 수단으로서, 적어도 하나의 디코딩된 상기 파라미터는 상기 순서치 및 상기 제1 값 간의 차이를 지시하는 디코딩 수단 및

- 상기 제1 값 및 상기 제2 값을 이용하여 상기 순서치를 획득하는 수단을 포함하는 것을 특징으로 하는 수신 장치.
비트스트림으로부터 픽쳐들을 디코딩하는 디코더를 포함하는 클라이언트로서, 픽쳐들의 순서를 지시하는 순서치가 형성되는 클라이언트에 있어서, 상기 디코더는,

- 상기 순서치의 기대치를 지시하는 제1 값;

- 상기 비트스트림으로부터 적어도 하나의 파라미터를 디코딩하여 제2 값을 획득하기 위한 디코더로서, 적어도 하나의 디코딩된 상기 파라미터는 상기 순서치 및 상기 제1 값 간의 차이를 지시하는 디코더 및

- 상기 제1 값 및 상기 제2 값을 이용하여 상기 순서치를 획득하기 위한 수단을 포함하는 것을 특징으로 하는 클라이언트.
- 픽쳐들을 비트스트림으로 인코딩하는 인코더로서,

- 디코딩 페이즈에서 디코딩된 인코딩된-픽쳐들을 정렬하는데 사용되는 제1 값 및

- 상기 제1 값의 기대치를 지시하는 제2 값을 포함하는 인코더;

- 상기 제1 값 및 상기 제2 값 간의 차이를 지시하는 적어도 하나의 파라미터를 연산하기 위한 연산 수단;

- 적어도 하나의 상기 파라미터를 상기 비트스트림으로 코딩하기 위한 코더;

- 상기 비트스트림을 송신 채널로 송신하기 위한 송신기;

- 상기 비트스트림을 상기 송신 채널로부터 수신하기 위한 수신기 및

- 비트스트림으로부터 픽쳐들을 디코딩하는 디코더로서, 픽쳐들의 순서를 지시하는 순서치가 형성되는 디코더로서,

- 상기 순서치의 기대치를 지시하는 제1 값;

- 상기 비트스트림으로부터 적어도 하나의 파라미터를 디코딩하여 제2 값을 획득하기 위한 디코딩 수단으로서, 적어도 하나의 디코딩된 상기 파라미터는 상기 순서치 및 상기 제1 값 간의 차이를 지시하는 디코딩 수단 및

- 상기 제1 값 및 상기 제2 값을 이용하여 상기 순서치를 획득하기 위한 수단을 포함하는 디코더를 포함하는 것을 특징으로 하는 시스템.
비트스트림 내에 인코딩된 픽쳐들을 포함하는 반송파(carrier wave)로서,

- 디코딩 페이즈에서 디코딩된 인코딩된-픽쳐들을 정렬하는데 사용되는 제1 값;

- 상기 제1 값의 기대치를 지시하는 제2 값 및

- 상기 제1 값 및 상기 제2 값 간의 차이로서 상기 비트스트림 내에 코딩된 차이를 지시하는 적어도 하나의 파라미터를 포함하는 것을 특징으로 하는 반송파.
제20항에 있어서,

상기 제2 값을 시퀀스 파라미터 집합 내에 배달하는 수단을 포함하는 것을 특징으로 하는 반송파.
제20항에 있어서,

상기 제2 값은, 상기 제1 값의 상기 기대치에 프레임 번호의 증가에 대하여 통지하는데 사용되는 것을 특징으로 하는 반송파.
제20항에 있어서,

적어도 하나의 상기 파라미터를 슬라이스 헤더 내에 배달하기 위한 수단을 포함하는 것을 특징으로 하는 반송파.
픽쳐들을 비트스트림 내에 인코딩하기 위한, 기계에 의하여 실행될 수 있는 단계들을 포함하는 소프트웨어 프로그램에 있어서, 상기 기계에 의하여 실행될 수 있는 단계들은,

- 디코딩 페이즈에서 디코딩된 인코딩된-픽쳐들을 정렬하는데 사용되는 제1 값을 정의하는 단계;

- 상기 제1 값의 기대치를 지시하는 제2 값을 정의하는 단계;

- 상기 제1 값 및 상기 제2 값 간의 차이를 지시하는 적어도 하나의 파라미터를 연산하는 단계 및

- 적어도 하나의 상기 파라미터를 상기 비트스트림으로 코딩하는 단계를 포함하는 것을 특징으로 하는 소프트웨어 프로그램.
디코딩을 위한 기계에 의하여 실행될 수 있는 단계들을 포함하는 소프트웨어 프로그램으로서, 픽쳐들의 순서를 지시하는 순서치가 형성되는 소프트웨어 프로그램에 있어서, 상기 디코딩을 위한 기계에 의하여 실행될 수 있는 단계들은,

- 상기 순서치의 기대치를 지시하는 제1 값을 형성하는 단계;

- 상기 비트스트림으로부터 적어도 하나의 파라미터를 디코딩하여 제2 값을 획득하는 단계로서, 적어도 하나의 디코딩된 상기 파라미터는 상기 순서치 및 상기 제1 값 간의 차이를 지시하는 단계 및

- 상기 제1 값 및 상기 제2 값을 이용하여 상기 순서치를 획득하는 단계를 포함하는 것을 특징으로 하는 소프트웨어 프로그램.
디코딩을 위한 기계에 의하여 실행될 수 있는 단계들을 포함하는 소프트웨어 프로그램이 저장된 저장 매체로서, 픽쳐들의 순서를 지시하는 순서치가 형성되는 저장 매체에 있어서, 상기 디코딩을 위한 기계에 의하여 실행될 수 있는 단계들은,

- 상기 순서치의 기대치를 지시하는 제1 값을 형성하는 단계;

- 상기 비트스트림으로부터 적어도 하나의 파라미터를 디코딩하여 제2 값을 획득하는 단계로서, 적어도 하나의 디코딩된 상기 파라미터는 상기 순서치 및 상기 제1 값 간의 차이를 지시하는 단계 및

- 상기 제1 값 및 상기 제2 값을 이용하여 상기 순서치를 획득하는 단계를 포함하는 것을 특징으로 하는 저장 매체.