KR101273479B1

KR101273479B1 - 화상 시퀀스 및 로고를 포함하는 비디오 콘텐츠를 코딩하는 방법 및 디바이스

Info

Publication number: KR101273479B1
Application number: KR1020077030401A
Authority: KR
Inventors: 필립페 보더스; 필립페 구일로텔; 프랑크 히론
Original assignee: 톰슨 라이센싱
Priority date: 2005-07-06
Filing date: 2006-07-03
Publication date: 2013-06-14
Also published as: CN101218827B; CN101218827A; US20090180702A1; WO2007003627A1; JP5356812B2; JP2008545351A; US8369397B2; KR20080029973A; BRPI0613124B1; EP1908290A1; BRPI0613124A2; EP1908290B1

Abstract

본 발명은 화상 시퀀스 및 적어도 하나의 로고를 포함하는 비디오 콘텐츠를 코딩하는 방법에 관한 것이다. 본 발명은, - 제 1 코딩 방법에 의해 화상 시퀀스를 코딩하는 단계로서, 이 단계는 화상 시퀀스에 관련한 코딩된 데이터를 생성하는 단계; - 제 2 코딩 방법 및 로고에 관련한 추가정보에 의해 로고를 코딩하는 단계로서, 이 추가 정보는 시퀀스의 화상에서 로고의 위치 설정에 관련한 최소한의 정보를 포함하며, 이 단계는 로고에 관련한 코딩된 데이터를 생성하는 단계; 및 - 로고에 관련한 코딩된 데이터와 화상 시퀀스에 관련한 코딩된 데이터를 별개로 포함하는 단일 데이터 스트림을 생성하는 단계를 포함한다.

로고, 화상, 비디오, 콘텐츠, 코딩

Description

화상 시퀀스 및 로고를 포함하는 비디오 콘텐츠를 코딩하는 방법 및 디바이스{METHOD AND DEVICE FOR CODING A VIDEO CONTENT COMPRISING A SEQUENCE OF PICTURE AND A LOGO}

본 발명은 코딩된 데이터 스트림을 생성할 수 있는 화상 시퀀스 및 로고를 포함하는 비디오 콘텐츠를 코딩하는 디바이스 및 방법에 대한 것이다. 또한, 본 발명에 따른 방법 및 코딩 디바이스에 의해 발생된 코딩된 데이터 스트림을 디코딩하는 방법 및 디바이스에 관한 것이다.

비디오 콘텐츠는 이들의 생성 및 엔드 유저에게로의 배포 사이의 다양한 네트워크를 넘게 된다. 비디오 콘텐츠는 예를 들면, 필름 또는 더 일반적으로는 가능하게는 로고가 삽입되는 화상 시퀀스이다. 일반적으로, 스튜디오에서의 생성이후, 비디오 콘텐츠는 소위 배포 네트워크를 통하여 트랜스미터로 배포된다. 이러한 네트워크상에서, 콘텐츠는 화상 전문가(즉, 콘텐츠 제작자, 스튜디오, 트랜스미터 등)에 의해 조작 및/또는 변형된다. 그 후, 가능하게는 변형된 콘텐츠는 트랜스미터에 의해 배포 네트워크를 통하여 엔드 유저에 발송된다.

일반적인 방식으로, 비디오 콘텐츠는 이들의 생성(예를 들면, 카메라로 입수 또는 화상 합성에 의해)과 엔드 유저로의 배포사이의 여러 변형을 겪게 된다. 이 콘텐츠 생성이후 신속히, 콘텐츠는 일반적으로 고 비트율로 압축되어 저장 및/또는 전송 비용을 최소화하게 되며, 전송은 네트워크의 대역폭에 의해 제한된다. 고 비트율로의 비디오 콘텐츠 압축은 콘텐츠의 초기 품질을 저하시키지 않도록 하는 것이 특히 가능하게 한다. 더욱이, 이러한 콘텐츠는 일반적으로 예를 들면 콘텐츠의 제작자에 의한 로고의 삽입과 같은 다양한 처리과정을 겪게 된다. 더욱이, 텔레비젼 채널의 확산 및 다양한 배포 네트워크(케이블, RF, 위성, 인터넷 등)으로, 이러한 콘텐츠는 또한 자기 자신의 로고를 삽입하길 원하는 다른 회사에 의해 다른 네트워크상 종종 판매/사용된다. 전형적으로, 텔레비젼 채널은 일정 기간동안 콘텐츠를 구매하여 일정한 상황하에서 전송할 수 있다. 빈번히, 로고를 이미 포함하는 비디오 콘텐츠를 구매하는 채널은 이러한 로고를 숨기거나 또는 삭제한다. 또한, 자기 자신의 로고를 삽입하길 원할 수 있다. 현재, 로고는 시퀀스의 화상에 대한 일부분을 형성하여, 따라서 후자와 코딩된다. 따라서, 로고를 삭제 및 숨기는 기술은 복잡한데, 이들 기술은 비디오 콘텐츠의 디코딩을 요구하기 때문이다. 따라서, 로고를 숨기는 기술은 비디오 콘텐츠(즉, 화상 시퀀스 및 따라서 로고에 대한) 디코딩, 새로운 로그로 현재 로그의 숨김 및 전체의 재인코딩을 요구한다. 마찬가지로, 이미 코딩된 화상 시퀀스에 로그의 삽입은 이러한 시퀀스의 디코딩, 시퀀스의 화상으로의 로고 삽입 및 전체의 재인코딩을 요구한다. 더욱이, 모든 이들 기술은 특히 사용된 숨김 기술 및 콘텐츠의 재인코딩으로 인해, 다양한 시각적 결함(예컨대, 블 러링)을 야기한다.

본 발명은 이들 단점 중 적어도 하나를 완화하는데 목적이 있다.

이러한 목적을 위하여, 본 발명은 예를 들면, 사용자가 비디오 콘텐츠에 로고를 더하거나 또는 콘텐츠로부터 로고를 삭제하길 원하는 경우, 디코딩 및 재인코딩 단계의 연속을 피하는 것을 특히 가능하게 하는 비디오 콘텐츠를 코딩하는 방법을 제안한다.

본 발명은 화상 시퀀스 및 그 자체가 적어도 하나의 화상을 포함하는 적어도 하나의 로고를 포함하는 비디오 콘텐츠를 코딩하는 방법에 관한 것이다. 본 방법은 화상 시퀀스에 관련한 코딩된 데이터 스트림을 생성하는 화상 시퀀스를 코딩하는 단계를 포함한다. 본 방법은 다음 단계를 더 포함한다:

- 상기 적어도 하나의 로고 및 적어도 하나의 로고에 관련한 추가 정보를 코딩하는 단계로서, 상기 추가 정보는 상기 시퀀스의 화상에서 상기 적어도 하나의 로고의 위치 설정(positioning)에 관련한 정보를 적어도 포함하며, 상기 단계는 상기 적어도 하나의 로고에 관련한 코딩된 데이터를 생성하는 단계인, 코딩하는 단계; 및

- 상기 화상 시퀀스에 관련한 상기 코딩된 데이터 스트림에 직접 적어도 하나의 로고에 관련한 코딩된 데이터를 삽입함으로써 화상 시퀀스에 관련한 상기 코딩된 데이터 및 상기 적어도 하나의 로고와 관련한 상기 코딩된 데이터를 별도로 포함하는 단일 비디오 데이터 스트림을 생성하는 단계.

유리하게는, 로고에 관련한 코딩된 데이터 및 화상에 관련한 코딩된 데이터를 동기화하기 위한 추가 시간 정보 동기화 정보가 요구되지 않는다.

유리하게는, 로고에 관련한 코딩된 데이터는 부가 개선 정보(SEI : "Supplemental Enhancement Information") 타입의 메시지로서 코딩된다.

선호적으로는, 상기 적어도 하나의 로고에 관련한 상기 추가 정보는 상기 적어도 하나의 로고의 초기 크기에 관련한 정보를 더 포함한다.

특정 실시예에 있어서, 상기 적어도 하나의 로고에 관련한 상기 추가 정보는 디스플레이동안 상기 적어도 하나의 로고의 투명성과 상기 적어도 하나의 로고에 대한 디스플레이 크기에 관련한 정보의 관리를 가능하게 하는 정보를 더 포함한다.

상기 화상 시퀀스는, 선호적으로는,

- MPEG-2;

- MPEG-4 파트2; 및

- MPEG-4 AVC를 포함하는 표준 세트에 속하는 코딩 표준 중 하나와 호환가능한 코딩 방법으로 코딩된다.

이 로고는, 유리하게는,

- MPEG-2;

- MPEG-4 파트 2;

- MPEG-4 AVC;

- JPEG; 및

- JPEG 2000을 포함하는 표준 세트에 속하는 코딩 표준 중 하나와 호환가능한 코딩 방법으로 코딩된다.

또한, 본 발명은 적어도 하나의 화상을 포함하는 적어도 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 코딩하는 코딩 디바이스에 관한 것이다. 상기 코딩 디바이스는 상기 화상 시퀀스를 코딩하는 수단을 포함하되, 상기 수단은 상기 화상 시퀀스에 관련한 코딩된 데이터 스트림을 생성한다. 상기 코딩 디바이스는 다음 수단을 더 포함한다:

- 적어도 하나의 로고 및 적어도 하나의 로고에 관련한 추가 정보를 코딩하는 수단으로서, 상기 추가 정보는 상기 시퀀스의 화상에서 상기 적어도 하나의 로고의 위치 설정에 관련한 정보를 적어도 포함하며, 상기 수단은 상기 적어도 하나의 로고에 관련한 코딩된 데이터를 생성하는 수단인, 코딩하는 수단; 및

- 상기 화상 시퀀스에 관련한 상기 코딩된 데이터 스트림에 직접 적어도 하나의 로고에 관련한 코딩된 데이터를 삽입함으로써 화상 시퀀스에 관련한 상기 코딩된 데이터 및 상기 적어도 하나의 로고와 관련한 상기 코딩된 데이터를 별도로 포함하는 단일 비디오 데이터 스트림을 생성하는 수단.

또한, 본 발명은 MPEG 타입의 신택스(syntax)에 따라 코딩된 데이터의 스트림에 관한 것으로서, 이 코딩된 데이터의 스트림은 화상 시퀀스에 관련한 코딩된 데이터의 적어도 하나의 제 1 부분을 포함하되, SEI 메시지로 불리는, SEI 타입의 메시지로서 코딩된 로고에 관련한 코딩된 데이터의 제 2 부분을 별도로 포함한다.

유리하게는, 상기 SEI 메시지는 상기 시퀀스의 화상에서 상기 적어도 하나의 로고의 수평 방향으로의 위치 설정에 관련한 적어도 하나의 필드, 및 상기 시퀀스의 화상에서 상기 적어도 하나의 로고의 수직 방향으로의 위치 설정에 관련한 적어도 하나의 필드를 포함한다.

본 발명은 첨부된 도면을 참조하여, 구현의 모드와 전체적으로 비제한적인 유리한 예시적인 실시예를 써서 더 잘 이해되고 예시될 것이다.

도 1은 종래 기술에 따라 코딩된 데이터 스트림을 나타내는 도면.

도 2는 화상 시퀀스의 화상에서 로고의 위치를 나타내는 도면.

도 3은 로고에 관련한 데이터를 포함하고, 본 발명에 따라 코딩된 데이터 스트림을 나타내는 도면.

도 4는 본 발명에 따른 코딩 디바이스를 나타내는 도면.

본 발명은 화상 시퀀스와 로고를 포함하는 비디오 콘텐츠를 코딩하는 방법에 대한 것이다. 로고는 화상 또는 화상 시퀀스이며, 각 화상은 예를 들면, 휘도 성분(luminance component) Y 및 2개의 색신호 성분(chrominance component) U 및 V인 2개 이상의 성분을 포함한다. 각 성분은 그 자체로 픽셀 또는 화상 포인트로 구성되는 화상의 형태로 표현될 수 있는데, 이들 각각의 픽셀 또는 화상 포인트는 하나의 값(예를 들면, 휘도의 값 Y 또는 색신호의 값 U 또는 V)과 관련된다. 더 정확히, 본 발명에 따른 방법은 화상 시퀀스와 무관하게 하나 이상의 로고를 코딩하는데 있다. 또한, 본 발명은 화상 시퀀스에 관련한 코딩된 데이터 및 로고에 관련한 코딩된 데이터는 분리되어 데이터 스트림에서 명확하게 그들을 식별할 수 있는 코딩된 데이터 스트림을 발생시키는 단계로 구성된다. 이러한 목적을 위하여, 로고에 관련한 추가 정보가 코딩되어 화상 시퀀스에 관련한 코딩된 데이터 스트림에 더해지게 되어 코딩된 데이터의 단일 스트림을 형성한다. 이러한 코딩된 추가 정보는 디코딩된 화상 시퀀스 내로 삽입될 로고를 재구성하고, 로고의 위치를 디코딩된 화상 시퀀스에서 결정하고, 가능하게는 로고를 다시 필요한 크기로 나타내는(re-dimension) 것을 허용한다. 또한, 이러한 추가 정보는 다른 화상을 통하여 화상을 보는 것을 가능하게 하는 투명 효과{또한, "브렌딩(blending)" 또는 "알파 브렌딩"으로 알려짐}와 같은 특별한 시각적 효과의 관리를 가능하게 한다.

일반적으로, 코딩된 데이터 스트림은 비트의 부집합(subset) 연관(concatenation)이다. 제 1 실시예에 따르면, 화상 시퀀스는 제 1 코딩 방법(예를 들면, MPEG-2, MPEG-4 AVC 등)에 의해 코딩되어 비디오 기본 스트림으로 불리는, 이러한 시퀀스에 관련한 코딩된 데이터의 스트림을 생성한다. 이러한 제 1 코딩 방법은 화상 시퀀스를 코딩하는 것을 가능하게 하는 임의 코딩 방법이 될 수 있다. 도 1은 화상 시퀀스에 관련한 코딩된 데이터의 이러한 스트림을 예시한다. 본 도 1에서, S₁, S₂ 및 S₃로 참조 번호가 매겨진(referenced) 비트에 대한 3개의 부집합이 표현된다. 이들 부집합은 선택적으로 스트림에서 랜덤 액세스를 허용하는 M1 또는 M2로 참조 번호가 매겨진 동기화 마커, H_V1, H_V2 또는 H_V3로 참조 번호가 매겨진 헤더 및 화상 시퀀스에 대한 압축되고 코딩된 콘텐츠에 대응하는 V1, V2 또는 V3로 참조 번호가 매겨진 데이터로 시작한다. 따라서, 본 발명은 화상 시퀀스에 관련한 코딩된 데이터로부터 독립적이고 상이한 방식으로 로고에 관련한 추가 정보를 코딩하는 단계로 구성된다. 로고에 관련한 코딩된 추가 정보는 또한 코딩된 추가 정보 및 화상을 코딩하기 위한 제 2 방법에 의해 코딩된 로고의 다양한 성분을 포함한다. 이러한 추가 정보는 특히 로고를 화상 시퀀스에 위치시키는 것을 가능하게 하는 정보를 포함한다. 예를 들면, 도 2를 참조하면, 로고(20)는 화상(21) 내로 삽입되어 로고의 상단 좌측 모서리에 위치되는 픽셀(22)의 세로 좌표 및 가로 좌표는 각기 x_o 및 y_o과 같다. 따라서, 시퀀스의 화상에서 로고의 위치에 관련한 정보(즉, x_o 및 y_o)와 로고(20)의 다양한 성분이 코딩된다. 또한, 추가 정보는 일정한 경우에 필수적일 수 있고, 따라서 스트림에서 코딩되어야만 하는 로고의 초기 크기에 관련한 정보(즉, 폭 W 및 높이 H)를 포함한다. 로고의 초기 크기는 코딩된 데이터의 스트림에서 코딩되도록 로고의 크기가 되는 것으로 한정된다. 유리하게는, 예를 들면, 투명도의 관리에 관한 데이터뿐만 아니라 로고의 재 크기재정(re-dimensioning)의 경우에 초기 크기와 다를 수 있는 시퀀스의 화상에서 로고의 디스플레이에 대한 크기, 즉 폭 W_d 및 높이 H_d와 같은 다른 추가 정보가 코딩될 수 있다. 예를 들면, 알파 브렌딩 기술인 투명도 관리는 전체 로고(예를 들면, 0.8)를 위한 고유한 투명도값을 코딩하거나 또는 그 밖에 알파 브렌딩 기술에서와 같이 로고에 속하는 각 픽셀을 위한 상이한 값을 코딩하는 과정으로 구성된다.

추가 정보는 도 3의 H_L로 참조 번호가 매겨진 헤더나, 또는 L로 참조 번호가 매겨진 비트의 부분집합에서 이 정보의 타입(즉, 로고의 위치, 성분, 로고의 초기 크기 등)에 따라 코딩된다. 따라서, 로고의 위치, 초기 크기 및 디스플레이 크기, 및 가능하게는 만일 고유하다면 투명도값과 같은 추가 정보가 도 3에서 H_L로 참조 번호가 매겨진 헤더에서 코딩된다. 가능하게는 투명도에 관련한 성분을 포함하여 로고의 다양한 성분에 관련한 추가 정보는 L에서 헤더 H_L에 뒤이어 코딩된다. 헤더 H_L은 그 자체로, 스트림에서 랜덤 액세스를 허용하는 ML로 참조 번호가 매겨진 마커가 그 앞에 올 수 있다. 로고에 관련한 코딩된 데이터(즉, 헤더 H_L, 데이터 L, 및 가능하게는 마커 ML)에 관련한 코딩된 데이터는 도 3에 의해 예시된 코딩된 데이터의 단일 스트림을 발생시키기 위해 화상 시퀀스에 관련한 코딩된 데이터에 직접 삽입됨으로써 추가된다. 일반적으로, 로고가 긴 구간 동안 고정된 채로 남아있게 되면, 유리한 구현은 랜덤 액세스 포인트{즉, RAP(Random Access Point)}에서만 화상 시퀀스에 관련한 코딩된 데이터의 스트림에 로고에 관련한 코딩된 데이터를 직접 추가/삽입하는 과정으로 구성된다. 이들 랜덤 액세스 포인트는 예를 들면, MPEG4 AVC 표준에 따른 스트림에서 IDR("Instantaneous Decoding Refresh: 순시 디코딩 리프레쉬") 타입 또는 I 타입의 화상이 되며, 이 MPEG4 AVC 표준은 또한 "Information technology -- Coding of audio-visual objects-- Part10"로 명칭된 문서 ISO/IEC 14496-10에서 정의된 H.264, 및 "Information technology - Generic Coding of moving pictures and associated audio:Systems"로 명칭된 문서 ITU T Rec. H.222.0 ｜ ISO /IEC 13818 1(2판, 2000년)에서 정의된 MPEG2-TS 트랜스포트층에서 트랜스포트 패킷 TS로 표시된 RAI("Random Access Indicator")에 의해 알려져 있다. 따라서, 코딩된 데이터의 스트림에 대한 디코딩 이후, 디코딩된 로고는 예를 들면, 로고 바로 앞에서 디코딩된 제 1 랜덤 액세스 포인트(RAP1)를 뒤 이은 시퀀스의 모든 디코딩된 화상에 삽입된다. 또한, 이러한 로고를 RAP1에 뒤 이은 시퀀스의 모든 디코딩된 화상에 다음 랜덤 액세스 포인트까지 삽입하거나, 또는 그 밖에 여러 로고의 경우 다음 랜덤 액세스 포인트까지 삽입하는 것을 생각할 수 있다.

예시적인 실시예가 SEI 메시지(SEI : "Supplemental Enhancement Information")를 사용하는 MPEG4 AVC 코딩 표준의 프레임워크내에서 제안된다. 이 표준은 코딩된 데이터의 임의 스트림이 이러한 표준과 호환가능하게 되도록 따라야만 하는 신택스를 정의한다. 이 신택스는 특히, 정보의 다양한 아이템이 어떻게 코딩되는 지를 정의한다(예를 들면, 시퀀스, 모션 벡터 등에 포함된 화상에 관련한 데이터). 따라서, 화상 시퀀스는 이러한 표준에 따른 제 1 코딩 방법에 따라 코딩되어 이러한 시퀀스에 관련한 코딩된 데이터의 스트림을 생성시킨다. 더욱이, 이 표준은 SEI라 명명된 추가 정보가 코딩되는 방식인 문서 ISO/IEC 14496-10의 별책 D에서 정의된다. 화상 시퀀스에 대한 조작을 위하여 사용된 이러한 추가 정보는 payloadType 라 불리는 필드에 의해 신택스에서 참조된다. 이는 특히 디스플레이의 새로운 기능성을 정의하는 것을 가능하게 한다. 만일 디코딩 디바이스가 자신의 사용을 위하여 필요한 기능성을 가지고 있지 못하면, 이러한 정보는 무시됨을 주목하라. 따라서, 본 발명은 정보 SEI의 새로운 타입을 정의하는 과정으로 구성되어 로고에 관련한 추가 정보를 코딩한다. 화상 시퀀스에 독립적으로 코딩된 이러한 정보는 이러한 시퀀스에 관련한 코딩된 데이터의 스트림에서 추가/삽입되는데, 즉 이러한 시퀀스에 관련한 코딩된 데이터의 스트림과 다중화된다(multiplexed). 이러한 목적을 위하여, 필드 payloadType를 위한 새로운 값은 아직 사용되지 않는 값중에서 한정된다(예를 들면, payloadType은 22와 동일). 특히, payloadType (0 내지 21)의 제 1 값(22)은 이미 19와 동일한 payloadType에 대응하는 필름의 그레인에 대한 특성과 같은 특정 정보를 코딩화하기 위해 이미 사용된다. 새로운 신택스는 문서 ISO/IEC 14496-10에서와 같은 동일한 협정으로 의사-코드의 형태로 어레이로 이하에서 보여진다. 특히, 연산자 '=='는 "동일"을 의미한다. 연산자 '!'는 "NOT"의 논리 연산자이다. 이러한 어레이에서, 로고에 관련한 추가된 정보는 이태릭체이다.

SEI 데이터(즉, sei_payload)의 신택스는 다음 방식으로 확장된다:

로고에 관련한 정보를 포함한 SEI 메시지(logo_info)의 신택스는 다음 방식으로 정의된다.

payloadSize는 로고 또는 더 정확히는 로고의 다양한 성분(예를 들면, 휘도 성분 및 2개의 색신호, 가능하게는 투명도 성분)을 코딩하기 위해 사용된 바이트의 개수를 나타낸다.

pic _ width _ msb는 삽입될 로고의 픽셀 개수에서 초기 폭의 고순차 비트를 나타낸다.

pic _ width _ Isb는 삽입될 로고의 픽셀 개수에서 초기 폭의 저순차 비트를 나타낸다.

pic _ height _ msb는 삽입될 로고의 픽셀 개수에서 초기 높이의 고순차 비트를 나타낸다.

pic _ height _ Isb는 삽입될 로고의 픽셀 개수에서 초기 높이의 저순차 비트를 나타낸다.

pic_start_w_msb는 시퀀스의 화상에 삽입되어야만 하는 로고의 제 1 픽셀(즉, 상단 좌측에 있는 로고의 모서리에 위치됨)의 수평축(도 2를 참조하여 x_o)을 따라 위치의 고순차 비트를 나타낸다.

pic_start_w_Isb는 시퀀스의 화상에 삽입되어야만 하는 로고의 제 1 픽셀의 수평축(도 2를 참조하여 y_o)을 따라 위치의 저순차 비트를 나타낸다.

pic_start_h_msb는 시퀀스의 화상에 삽입되어야만 하는 로고의 제 1 픽셀의 수직축을 따라 위치의 고순차 비트를 나타낸다.

pic_start_h_Isb는 시퀀스의 화상에 삽입되어야만 하는 로고의 제 1 픽셀의 수직축을 따라 위치의 저순차 비트를 나타낸다.

pic_transparency는 시퀀스의 화상에 로고를 삽입하기 위해 사용된 투명 계수를 나타낸다.

pic _ format은 로고를 코딩하기 위해 사용된 코딩 포맷을 지정한다. 예를 들면, 다른 코딩 포맷으로 확장될 수 있는 아래의 어레이에 의해 지정된다. 따라서, 이 어레이는 인트라 신택스 MPEG-2 인코딩의 포맷에 대응하는 pic _ format = 2 으로 참조된 코딩 포맷을 추가함으로써 완성될 수 있다.

로고의 다양한 성분을 나타내는 화소는 제 2 코딩 방법에 따른 필드 pic_format에 의해 정의된 코딩 포맷에 따라 각 코딩된 매크로블럭(즉, 픽셀 블럭)으로 분할된다. 이 필드는 유리하게는 다른 필드 앞에서 코딩되어 디코더는 다음 필드(예를 들면, pic _ width _ msb , pic _ width _ Isb , pic _ height _ msb , 및 pic_height_Isb)의 일부가 스트림내에 존재하지 않는 다는 것을 pic _ format = 1이 되는 때에 알게 될 수 있다.

data _ pic _ avc(payloadSize) SEI message syntax는 인트라 모드에서 코딩된 로고의 매크로블럭의 세트를 설명하는 H.264/AVC 신택스에 따라 코딩된 데이터 스트림의 일부를 나타낸다.

data _ pic _ jpeg(payloadSize) SEI message syntax

는 로고의 매크로블럭 세트를 기술하는 JPEG 신택스에 따라 코딩된 데이터 스트림의 일부를 나타낸다. 로고가 이러한 신택스를 따라 코딩된 경우에서, 로고의 초기 크기에 관련한 필드(pic _ width _ msb , pic _ width _ Isb , pic _ height _ msb , 및 pic_height_Isb)는 가능하게는 이러한 정보가 스트림 data _ pic _ jpeg(payloadSize)의 일부에서 이미 코딩된 한에 있어서는 스트림내에 존재하지 않을 수 있다. 따라 서, 각 이미지를 위하여 SEI 메시지를 추가함으로써, 애니메이션화된 로고를 다루는 것이 가능하다. 위 예시에 있어서, 투명도는 필드 pic _ transparency에 의해 코딩된 단일 계수에 의해 관리된다. 이 경우, 하나 및 동일 값이 로고의 픽셀 세트를 위하여 사용된다. 다른 실시예에 따르면, 투명도는 로고의 추가 성분으로 관리된다. 이 경우, 투명값은 로고의 각 픽셀과 관련된다. 따라서, 이러한 추가 성분은 도 3에서 L로 참조된 로고 데이터에 대응하는 스트림 부분에서 다른 성분(예를 들면, 휘도 및 색신호)과 같이 코딩되고, 필드 pic _ transparency는 따라서 사용되지 않는다. 다른 실시예에 따르면, 투명도 정보는 코딩되지 않아 필드 pic_transparency는 사용되지 않는다.

일부 응용을 위하여, 로고의 디코딩후 화상의 시퀀스로 로고 삽입전에 로고를 다시 크기를 나타내는 것이 바람직할 수 있다. 로고가 W x H 픽셀의 초기 크기로 코딩되므로, 따라서, W_d(각기 H_d)가 가능하게는 W(각기 H)보다 크거나 또는 작은 W_d x H_d 픽셀의 디스플레이 크기로 시퀀스의 화상에서 디스플레이된다. 이 경우, 로고의 디스플레이에 대한 폭 W_d 및 높이 H_d를 코딩하는 것이 필수적이다. 이러한 목적을 위하여, 4개의 추가 필드(pic _ disp _ width _ msb , pic _ disp _ width _ Isb , pic_height_msb, 및 pic _ disp _ height _ Isb)는 로고의 디스플레이 크기, 즉 후자가 시퀀스의 화상으로 한번 삽입될 크기를 코딩하기 위하여, 예를 들면 필드 pic_height_Isb에 후속하여 헤더 HL에 추가된다. 첫 두 필드, pic _ disp _ width _ msb , pic_disp_width_Isb는 각기 삽입될 로그의 픽셀 개수에서 디스플레이 폭인 고순차 및 저순차 비트를 나타내며, 마지막 두 필드, pic _ disp _ height _ msb 및 pic _ disp _ height _ Isb는 각기 삽입될 로고의 픽셀 개수에서 디스플레이 높이인 고순차 및 저순차 비트를 나타낸다.

다른 실시예가 MPEG-4 AVC 코딩 표준의 프레임 워크 내에서 이하에 기술된다. 비디오 코딩 표준은 "Information technology -- Coding of audio-visual objects -- Part 10: Advanced Video Coding"라 명칭된 문서 ISO/IEC 14496-10에 기술된다. 이들 실시예는 애니메이션화된 로고를 다루는 것을 허용하는데, 즉 로고는 화상 시퀀스를 포함한다. 투명도는 만일 알파 화상이 존재하면 알파 브렌딩 기술을 사용하여 지원된다. 만일 로고 시퀀스에서 화상 개수가 1차 시퀀스에서 화상 개수보다 작다면, 로고 시퀀스는 루프된다(looped). 1차 화상은 코딩될 초기 시퀀스의 이미지에 관련한 시각 정보(예를 들면, 휘도, 색신호)를 포함한다.

로고에 연관된 데이터는 다음과 같다: logo_id, 로고 상태, 로고 화상(들), 만일 있다면, 알파 화상, 이들 화상에 의해 사용된 pic_parameter_set_id, 및 1차 디코딩된 화상에서 로고의 위치. 표준 문서에 기술된 스트림 구조는 당업자에 의해 잘 알려져 있다(예를 들면, 화상 파라메타 세트, 시퀀스 파라메타 세트, 네트워크 적응층 유닛...). 슬라이스는 매크로블록의 그룹이다. 네트워크 적응층 유닛은 또한 비디오 코딩층 데이터{VCL(Video Coding Layer) 데이터}를 캡슐화하는 공지된 구조이다. 다음 실시예에 의해 사용된 3개의 MPEG-4 AVC 지정 구성요소가 먼저 제공된다: 보조 코딩된 화상, 중복(redundant) 코딩된 화상 및 FMO로 알려진 유연 매크로블록 어더링(Flexible Macrobloc Ordering).

원래, 보조 코딩된 화상이 도입되어 알파 브렌딩을 요구하는 응용에서 사용되었다. 이러한 기능성은 선택 툴로서 MPEG-4 AVC의 FRext 프로파일에서 추가되어 있다. 보조 코딩된 화상은 단색성의 중복 코딩된 화상과 동일한 신택스적이고 의미론상 제한을 가지며, 1차 코딩된 화상과 동일한 매크로블럭의 개수를 포함해야만 한다. 이러한 화상의 예가 도 5에 의해 예시된다.

보조 코딩된 화상의 신택스 :

시퀀스 파라메타 세트 확장 RBSP(SPSext: Sequence Parameter Set extension)에 있어서, 일부 파라메타는 보조 코딩된 화상을 참조하고 사용할 알파 브렌딩 공식을 지정한다:

...

aux _ format _ idc

if ( aux _ format _ idc !=0 ) {// (0: 보조 코딩된 화상없음)

bit _ depth _ aux _ minus8

alpha _ incr _ flag

alpha _ opaque _ value

alpha _ transparent _ value

}

...

RBSP는 Raw Byte Sequence Payload를 나타낸다. 이것은 NAL 유닛에서 캡슐화되는 바이트의 정수 개수를 포함하는 신택스 구조이다. RBSP는 신택스 구성요소를 포함하는 데이터 비트의 스트링의 형태를 가지거나 또는 비어 있게 되고, 이후 RBSP 정지 비트가 이어지고, 0 또는 0과 동일한 더 후속하는 비트가 이어진다.

보조 코딩된 화상은 1차 코딩된 화상과 동일한 폭 및 높이를 갖는다. 코딩된 비디오 시퀀스의 각 액세스 유닛에서 정확히 하나의 보조 코딩된 화상이 존재한다. 보조 코딩된 화상을 위하여 nal_unit_type는 19이다. 도 6은 이러한 보조 코딩된 화상을 포함하는 스트림을 묘사한다.

중복 코딩된 화상은 패킷 손실에 대한 견고성(robustness)을 향상시키기 위해 표준에 소개된 에러 회복 툴(error resilient tools) 중의 하나이다. 중복 화상은 1차 화상의 코딩된 표현 또는 1차 화상의 일부이다. 중복 화상의 콘텐츠는 대응하는 1차 화상이 패킷 손실로 인해 소실되는 경우를 제외하고는 디코딩되지 않을 것이다. 중복 코딩된 화상은 1차 화상과 정확히 동일한 방식으로 코딩될 것이다. 그러나, 만일 또한 더 적은 비트를 사용하여 더 낮은 품질로 코딩될 수 있다.

중복 코딩된 화상의 신택스 :

- 화상 파라메타 세트에 있어서, redundant_pic_cnt_present_flag는 중복 화상이 존재하는지 안하는 지를 가리킨다.

- 슬라이스 헤더에 있어서, 만일 redundant_pic_cnt_present_flag==true이고 redunant_pic_cnt>0이면, 현재 슬라이스는 중복 코딩된 화상에 속한다.

FMO는 코딩된 화상을 여러 개의 서로 다른 형상의 슬라이스 그룹으로 분리하는 것을 허용하는 툴이다. FMO 툴을 사용하는 화상의 예가 도 7에 묘사된다.

FMO 의 신택스 :

- 화상 파라메타 세트에 있어서, 만일 num-slice_groups_minus1>0이면 화상은 여러 개의 슬라이스를 포함한다. 만일 slice_group_map_type==2이면, 슬라이스의 형상은 직사각형이다.

if ( num _ slice _ groups _ minus1 >0) {

slice _ group _ map _ type = 2

...

if ( slice _ group _ map _ type == 2 )

for( iGroup = 0; iGroup < num _ slice _ groups _ minus1 ;

iGroup ++ ) {

top _left[ iGroup ]

bottom _right[ iGroup ]

}

다음의 실시예에 따르면, 로고의 코딩된 투명도 및 휘도/색신호(luminance/chrominance) 성분은 SEI 로고 메시지와는 별도의 NAL 유닛에서 코딩된다.

제 2 실시예는 트랜스포트 배경 화상에 보조 코딩된 화상 원리를 사용하는 과정으로 구성된다. 배경 코딩된 화상은 컬러 중복 코딩된 화상과 동일한 신택스 및 의미론적 제한을 가지며, 1차 코딩된 화상과 동일한 매크로블럭의 개수를 포함한다. 코딩된 비디오 시퀀스의 각 액세스 유닛에서 정확히 하나의 배경 코딩된 화 상이 있다. 배경 코딩된 화상을 위한 nal_unit_type는 예를 들면, 24로 설정되고 redundant_pic_cnt=0으로 설정된다. 만일 존재한다면, 배경 코딩된 화상은 만일 있다면 즉시 보조 코딩된 화상을 따라야 하고, 그렇지 않고 만일 있다면 중복 코딩된 화상(들)을 따라야하고, 그 밖에 다른 1차 코딩된 화상을 따라야한다. 사용할 알파 브렌딩 공식이 aux_format_idc에 의해 지정된다. 이러한 해결책은 도 8 및 도 9에 의해 예시된다.

이러한 제안은 보조 화상과 보충적이며, 배경 화상의 사용은 로고 삽입 이외의 다른 목적을 위하여 사용될 수 있다. 이러한 해결책으로 코딩된 모든 로고(들)의 제거 또는 대치는 간단한데, 이는 보조 및 배경 화상을 단지 제거 또는 대치함으로써 이루어지기 때문이다. 더욱이 이 해결책은 애니메이션화된 로고의 취급을 허용한다.

도 10에 묘사된 제 3 실시예는 로고 슬라이스를 사용하는 과정으로 구성된다. 더 정확히는, 제 3 실시예는 정확하게 로고를 위치 설정하고 로그를 1차 화상으로 크기를 만들기(sizing) 위하여 FMO를 사용하는 과정, 로고 컬러 샘플값를 위하여 알파 마스크(보조 화상과 같이) 및 중복 코딩된 화상 신택스를 트랜스포팅하기 위해 단색 화상을 사용하는 과정으로 구성된다. 이한 해결책은 슬라이스 그룹 ID 0이 로고에 대응하는 도 7에서와 같은 2개의 슬라이스로 FMO를 설명하는 새로운 PPS를 생성하는 과정으로 구성된다. 이러한 PPS는 1차 코딩된 화상에 의해 사용된 SPS를 참조한다.

- 중복 코딩된 화상과 동일한 신택스 및 의미론적 제한을 갖는 로고 코딩된 슬라이스, 여기서 단지 슬라이스 그룹 ID 0이 사용되고(다른 하나는 존재하지 않음) redundant_pic_cnt=logo_id(비교: 마지막 섹션에 기술된 SEI 로고 메시지 신택스).

- 보조 코딩된 화상과 동일한 방식으로 코딩된 알파 코딩된 슬라이스. 이 슬라이스는 단색 화상(0으로 추론된 chroma_format_idc)이지만, 그러나 단지 슬라이스 그룹 ID 0이 사용되고(다른 하나는 존재하지 않음) redundant_pic_cnt=0이다. 알파 코딩된 슬라이스는 필수적인 존재는 아니지만, 그러나 만일 존재한다면, 즉시 대응하는 로고 코딩된 슬라이스를 따라야만 한다. 이들 2개의 코딩된 슬라이스는, 예를 들면 24와 같은 nal_unit_type 바이트값을 가질 것이다. 모든 1차 코딩된 슬라이스가 반드시 로고 코딩된 슬라이스 이전일 필요는 없다. 사용자는 가능하게는 num_slice_groups_minus1=nl을 사용함으로써 여러 개의 (nl) 로고를 삽입할 수 있다. 또한, 이는 다른 로고 정보(예를 들면, 로고 디스플레이 상태?)를 위하여 하나의 SEI 로고 메시지를 형성하는 과정으로 구성된다. 이러한 SEI 로고 메시지는 예를 들면 마지막 섹션에서 기술된 로고 메시지로서 특정 신택스 위에 온다.

이러한 제 3 실시예는 다음의 이점을 갖는다:

- 고 코딩 효율성;

- 애니메이션화된 로고의 지원{심지어 화상속 화상(pictures in pictures)...};

- 여러 개 로고의 지원: 복수의 로고 코딩된 슬라이스의 사용에 의해;

- 현재 신택스 및 툴(보조 화상과 같음)의 재사용에 오로지 기반함;

- 새로운 로고의 추가는 세 번째 줄의 도 11에 기술된 새로운 PPS, SEI 로고 메시지 및 새로운 로고(및 선택적으로 알파)코딩된 슬라이스에 의해 이루어진다;

- 현재 로고의 제거는 대응하는 PPS, SEI 로고 메시지 및 로고(및 알파) 코딩된 슬라이스를 제거함으로써 이루어진다.

도 12에 기술된 제 4 실시예는 로고 화상을 사용하는 과정으로 구성된다. 유리하게는, 이전의 실시예에서와 같이 FMO(복수-슬라이스)의 사용을 피한다. 로고의 위치는 SEI 로고 메시지에서 지정된다. 로고의 크기는 새로운 SPS에서 지정된다. 따라서, 해결책은 로고 화상 크기, 이러한 SPS를 참조하는 새로운 PP2 및 로고를 1차 화상으로 위치 설정하기 위한(및 다른 정보를 위하여) 특정 SEI 메시지를 포함하는 새로운 SPS를 생성하는 과정으로 구성된다. 새로운 SPS와 PPS는 도 12의 두 번째 라인에 나와 있다. 이러한 SEI 메시지는 예를 들면, 마지막 섹션에 기술된 특정 신택스를 따른다.

또한, 이 메시지는 이러한 PPS를 사용하여 2개의 코딩된 화상을 생성하는 것으로 구성된다:

- nal_unit_type 바이트값이 일례로 24이고 redundant_pic_cnt=logo_id인 새로운 PPS를 사용하여, 1차 코딩된 화상인 로고 코딩된 화상.

- nal_unit_type 바이트값이 일례로 24이고 redundant_pic_cnt=0을 갖는 단색 화상(chroma_format_idc는 0으로 추론됨)인 선택적인 알파 코딩된 화상.

만일 알파 코딩된 화상이 존재한다면, 즉시 로고 코딩된 화상을 따라야 한다. 알파 브렌딩 등식은 aux_format_idc=1인 보조 화상을 위해 지정된 알파 브렌딩 공식을 사용한다. 모든 1차 코딩된 화상은 반드시 로고 코딩된 슬라이스 이전일 필요는 없다. 이러한 제 4 실시예는 제 3 실시예와 같은 동일한 이점을 갖는다. 그러나, 이 제 4 실시예는 복수 슬라이스, 즉 FMO 툴을 사용하지 않는다.

제 3 및 제 4 실시예에 의해 사용된 SEI 메시지는 예를 들면, 이하에서 기술된 특정 신택스를 따른다. 이러한 목적을 위하여, 새로운 타입(예를 들면, payloadType==22)의 SEI 메시지가 생성된다. 이러한 새로운 SEI 메시지는 디코딩 단계에서, 로고 삽입을 실행하기 위해 요구된 일부 정보를 logo_info(payloadSize) 페이로드내에 포함한다. 3개의 로고 상태는 도 13에 기술된 바와 같이 한정된다: 가시적(visible), 일시 가시적, 비가시적. 가시적 또는 일시 가시적으로 설정된 경우, 로고는 디스플레이된다. 그렇지 않은 경우(즉 비가시적 상태), 로고는 디스플레이되지 않는다. 그러므로, 디코더는 각 상이한 logo_id 값을 위하여 수신된 마지막 SEI 로고 메시지의 리스트를 유지해야만 한다. 만일 소정의 logo_id에 대응하는 로고가 가시적 또는 일시 가시적 상태에 있다면, 로고는 SEI 로고 메시지를 뒤 이은 제 1 NAL 유닛 슬라이스의 화상 순서 카운트보다 높거나 또는 동일한 화상 순서 카운트를 가지는 모든 디코딩된 화상내에 삽입되어야만 하고, 화상 순서 카운트가 리셋된 이후 모든 후속 디코딩된 화상에 삽입되어야 한다. 만일 소정의 logo_id에 대응하는 로고가 비가시적 상태에 있다면, 로고는 삽입되지 않아야 한다. 이 경우, pic_parameter_set_id를 참조하는 로고 코딩된 화상 및 알파 코딩된 화상은 디코딩되지 않을 것이다.

MPEG-4 AVC를 위한 신택스 확장 예가 이하에 주어진다:

SEI 페이로드 신택스 확장:

로고 정보 SEI 메시지 신택스 :

logo id

각 SEI 로고 메시지는 고유한 로고 번호 식별자(logo_id)를 지닌다. 이는 여러 개 로고를 디코딩된 비디오로 삽입하는 것을 허용한다. 덧붙여, 콘텐츠 제작자 또는 비디오 서비스 제공자(TV 방송자, VOD 서비스....)는 여러 개 로고 id를 관리하기 위해 일부 특정 규칙을 한정할 수 있다. 만일 2개의 SEI 로고 메시지가 동일한 logo_id값을 가지고, logo_new_flag가 1이라면, 마지막 로고는 이전 로고를 대치할 것이다. 유일 로고 번호 식별자 logo_id는 pic_parameter_set_id를 참조한다.

pic parameter set id

각 SEI 로고 메시지는 고유 pic_parameter_set_id를 지닌다. 이는 이 pic_parameter_set_id를 사용하는 로고 코딩된 화상 및 알파 코딩된 화상에 SEI 로고 메시지를 연관시키는 것을 허용한다.

pic_parameter_set_id는 로고 코딩된 화상(즉 슬라이스) 및 알파 코딩된 화상(즉 슬라이스)에서 참조되는 화상 파라메타 세트를 식별한다. pic_parameter_set_id의 값은 0 내지 255의 범위(0과 225도 포함)내에 있어야 한다.

nb 화상

애니메이션화된 로고에 있어서, nb_picture는 로고 시퀀스 애니메이션에서 로고 화상의 개수이다. 정지 로고의 경우, nb_picture=1이다. 만일 로고 화상의 개수가 미결정되어 있다면, nb_picture=0이고, 그렇지 않은 경우 로고 시퀀스는 루프된다.

로그 고정 프래그( logo permanent flag )

logo_permanent_flag는 로고의 디스플레이 상태를 제어한다. 도 13에 기술된 상태도는 이들 상이한 상태사이에 가능한 천이를 제공한다.

로그 새로운 프래그( logo new flag )

log_new_flag가 1이라면, 로고 파라메타 및 관련 화상은 새롭고 logo_info() payload는 새로운 로고에 대응한다. 따라서, 만일 로고 상태가 가시적이라면, 로고 코딩된 화상(및 있다면 알파 코딩된 화상) 샘플이 디코딩되어야하고, 디코딩된 로고 화상은 삽입되어야 한다.

만일 logo_new_flag가 0이라면, 로고 파라메타 및 관련 화상, 즉 logo_info() payload는 동일 logo_id을 갖는 이전 SEI 로고 메시지에서와 동일하다. 그 결과로서, 만일 로고(및 있다면 알파)코딩된 화상이 미리 디코딩되어 저장된다면, 로고 코딩된 샘플은 무시될 수 있다.

로고 오리진 x( logo origin x) 는 현재 화상의 루마 샘플의 유닛내로 삽입될 로고 화상에 대한 상단 좌측 픽셀의 수평 위치를 지정한다.

로고 오리진 y( logo origin y) 는 현재 화상의 루마 샘플의 유닛내로 삽입될 로고 화상에 대한 상단 좌측 픽셀의 수직 위치를 지정한다.

마지막 2개의 구성요소: logo_origin_x 및 logo_origin_y는 제 4 실시예를 위해서만 요구되며, 제 3 실시예에 있어서는 회피될 수 있다.

제안된 해결책은 많은 이점을 제공한다. 특히, 이 해결책은, 코딩된 화상을 디코딩해야할 필요없이, 이미 코딩된 화상 시퀀스내로 로고를 용이하게 삽입하는 것을 가능하게 한다. 이를 실행하기 위해, 코딩된 데이터를 디코딩할 필요없이 비트의 부분집합(a subset of bits)을 코딩된 데이터의 현재 스트림에 삽입하는 것으로 충분하다. 더욱이, 또한 코딩된 데이터 스트림으로부터 로고를 삭제하는 것이 가능한데, 이는 예를 들면 자신의 헤더 HL에 의해 로고에 관련한 스트림의 일부를 식별하고 로고에 대응하는 비트의 부분집합을 삭제하는 것으로 충분하기 때문이다. 이 부분집합을 삭제하는 대신에, 이 부분집합은 다른 로고에 대응하는 비트의 다른 부분집합으로 대치될 수 있다. 따라서, 제안된 해결책은 이러한 비디오 콘텐츠의 최종 품질을 저하시키지 않으면서도 하나의 동일한 비디오 콘텐츠의 삭제 및/또는 삽입의 비제한 사이클 개수를 허용한다. 더욱이, 이 해결책은 종래 해결책보다 더 좋은 최종 품질 획득을 가능하게 하는데, 이는 이 해결책이 디코딩/재인코딩 단계를 삭제하고, 현재 로고를 숨기는 단계를 회피하게 하기 때문이다. 마지막으로, 이 제안된 해결책은 종래 비디오 처리{후처리, 비트율의 변화{"트랜스레이팅(translating)"}, 트랜스코딩, 레이아웃 등}와 독립적이고 호환가능하다. 더욱이, 제안된 해결책은 로고에 관련된 코딩된 데이터와 이미지의 시퀀스에 관련한 코딩된 데이터 사이의 어떠한 시간 동기화 정보를 요구하지 않는다. 실제로, 로고 정보는 직접 비디오 기본 스트림내로 삽입된다. 그러므로, 시스템 레벨의 추가 정보, 즉 타임스탬프가 로고에 관련된 코딩된 데이터 및 시퀀스의 화상에 관련된 코딩된 데이터를 동기화 시키기 위하여 요구된다. 그러므로, 이러한 해결책은 단순하고 임의의 트랜스포트층(예를 들면, MPEG-2 TS)에 독립적이다.

또한, 본 발명은 본 발명의 코딩 방법에 의해 발생된 코딩된 데이터 스트림을 디코딩하는 것을 가능하게 하는 디코딩 방법에 관한 것이다. 이 디코딩 방법은 화상 시퀀스에 관련한 데이터에 상응하는 코딩된 데이터의 스트림의 제 1 부분을 디코딩하여 디코딩된 화상 시퀀스를 생성시키는 과정으로 구성된다. 더욱이, 이 방법은 로고에 관련한 코딩된 데이터, 즉 로고의 다양한 성분, 로고의 초기 크기, 가능하게는 로고의 디스플레이 크기 및 투명도 효과 관리를 가능하게 하는 정보에 대응하는 코딩된 데이터의 스트림의 제 2 부분을 디코딩하는 과정으로 구성된다. 로고에 관련한 코딩된 데이터는 화상 시퀀스에 관련한 코딩된 데이터에 독립적으로 디코딩된다. 이 디코딩 방법은 가능하게는 로고를 로고에 관련한 디코딩된 정보에 따른 시퀀스의 디코딩된 화상으로 삽입한다. 또한, 시퀀스의 화상으로 로고의 삽입은 디코딩 방법과 다른 디스플레이 방법에 의해 수행될 수 있다.

본 발명은 이전에 기술된 코딩 방법을 구현하는 코딩 디바이스에 관한 것이다. 특히, 이 디바이스는 화상 시퀀스를 디코딩하여 화상 시퀀스에 관련한 코딩된 데이터의 스트림을 생성하는 수단(40), 로고에 관련한 코딩된 데이터의 스트림을 생성하기 위해 로고를 코딩하기 위한 수단(41), 및 시퀀스에 관련한 코딩된 데이터와 로고에 관련한 코딩된 데이터를 분리하여 포함하는 코딩된 데이터의 단일 스트림을 생성하기 위한 수단(42)을 포함한다. 화상 시퀀스를 코딩하기 위한 수단은 예를 들면, MPEG4 AVC 표준을 따른 코딩 디바이스이다.

더욱이, 본 발명은 이전에 기술된 디코딩 방법을 구현하는 디코딩 디바이스에 대한 것이다. 이 디코딩 디바이스는 디코딩된 화상 시퀀스를 생성하기 위해 화상 시퀀스에 관련한 데이터에 대응하는 코딩된 데이터의 스트림의 제 1 부분을 디코딩하기 위한 수단을 포함한다. 더욱이, 이 디코딩 디바이스는 로고에 관련한 코딩된 데이터, 즉 로고의 다양한 성분, 로고의 초기 크기, 가능하게는 로고의 디스플레이 크기 및 투명도 효과 관리를 가능하게 하는 정보에 대응하는 코딩된 데이터의 스트림의 제 2 부분을 화상 시퀀스와 독립적으로 디코딩하기 위한 수단을 포함한다. 선택적으로, 이 디코딩 디바이스는 로고에 관련한 디코딩된 정보에 따른 디코딩된 화상 시퀀스내로 로고를 삽입하기 위한 수단을 포함한다. 또한, 이 삽입 수단은 코딩 디바이스와 별개의 디스플레이 디바이스 내로 통합될 수 있다.

물론, 본 발명은 위에 언급된 예시적인 실시예로 제한되지 않는다. 특히, 두 개의 상이한 로고가 2개의 SEI 메시지에 코딩될 수 있다. 당업자라면 열거된 실시예로 임의 변형을 도입할 수 있으며, 이들 실시예의 다양한 이점으로부터 혜택을 보기 위해 이 변형예를 병합할 수 있다. 특히, 시퀀스의 제 1 부분을 갖는 제 1 로고와 시퀀스의 제 2 부분을 갖는 제 2 로고를 사용하는 것은 안출가능하다. 물론, 3개 이상의 로고를 코딩하는 것도 안출가능하다.

본 발명은 코딩된 데이터 스트림을 생성할 수 있는 화상 시퀀스 및 로고를 포함하는 비디오 콘텐츠를 코딩하는 디바이스 및 방법에 적용 가능하다. 또한, 본 발명에 따른 방법 및 코딩 디바이스에 의해 발생된 코딩된 데이터 스트림을 디코딩하는 방법 및 디바이스에 적용 가능하다.

Claims

하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 코딩하는 방법으로서,

상기 방법은 상기 화상 시퀀스를 코딩하는 단계를 포함하되, 상기 단계는 상기 화상 시퀀스에 관련한 코딩된 데이터 스트림을 생성하는 단계이고, 상기 방법은,

- 상기 하나의 로고 및 상기 하나의 로고에 관련한 추가 정보를 코딩하는 단계로서, 상기 추가 정보는 상기 시퀀스의 화상에서 상기 하나의 로고의 위치 설정에 관련한 정보를 포함하며, 상기 단계는 상기 하나의 로고에 관련한 코딩된 데이터를 생성하는 단계인, 하나의 로고 및 추가 정보를 코딩하는 단계; 및

- 상기 화상 시퀀스에 관련한 상기 코딩된 데이터 스트림에 하나의 로고에 관련한 코딩된 데이터를 삽입함으로써 상기 화상 시퀀스에 관련한 상기 코딩된 데이터 및 상기 하나의 로고와 관련한 상기 코딩된 데이터를 별도로 포함하는 단일 비디오 데이터 스트림을 생성하는 단계

를 더 포함하는, 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 코딩하는 방법.
제 1 항에 있어서,

상기 하나의 로고에 관련한 상기 코딩된 데이터의 적어도 일부는 부가 개선 정보(SEI : "Supplemental Enhancement Information") 메시지로서 코딩되는, 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 코딩하는 방법.
제 1 항 또는 제 2 항에 있어서,

상기 하나의 로고에 관련한 상기 추가 정보는 상기 하나의 로고의 초기 크기에 관련한 정보를 더 포함하는, 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 코딩하는 방법.
제 1 항 또는 제 2 항에 있어서,

상기 하나의 로고에 관련한 상기 추가 정보는 디스플레이 동안 상기 하나의 로고의 투명도의 관리를 가능하게 하는 정보를 더 포함하는, 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 코딩하는 방법.
제 1 항 또는 제 2 항에 있어서,

상기 적어도 하나의 로고에 관련한 상기 추가 정보는 상기 적어도 하나의 로고에 대한 디스플레이 크기에 관련한 정보를 더 포함하는, 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 코딩하는 방법.
제 1 항 또는 제 2 항에 있어서,

상기 적어도 하나의 로고에 관련한 코딩된 데이터는 랜덤 액세스 포인트에서만 상기 화상 시퀀스에 관련한 코딩된 데이터의 상기 스트림에 삽입되는, 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 코딩하는 방법.
제 1 항 또는 제 2 항에 있어서,

상기 화상 시퀀스는,

- MPEG-2;

- MPEG-4 파트2; 및

- MPEG-4 AVC를 포함하는 표준 세트에 속하는 코딩 표준 중 하나와 호환가능한 코딩 방법으로 코딩되는, 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 코딩하는 방법.
제 1 항 또는 제 2 항에 있어서,

상기 하나의 로고는,

- MPEG-2;

- MPEG-4 파트 2;

- MPEG-4 AVC;

- JPEG; 및

- JPEG 2000을 포함하는 표준 세트에 속하는 코딩 표준 중 하나와 호환가능한 코딩 방법으로 코딩되는, 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 코딩하는 방법.
하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 코딩하는 코딩 디바이스(4)로서,

상기 코딩 디바이스(4)는 상기 화상 시퀀스를 코딩하는 수단(40)을 포함하되, 상기 수단은 상기 화상 시퀀스에 관련한 코딩된 데이터 스트림을 생성하고, 상기 코딩 디바이스(4)는,

- 상기 하나의 로고 및 상기 하나의 로고에 관련한 추가 정보를 코딩하는 수단(41)으로서, 상기 추가 정보는 상기 시퀀스의 화상에서 상기 하나의 로고의 위치 설정에 관련한 정보를 포함하며, 상기 수단은 상기 하나의 로고에 관련한 코딩된 데이터를 생성하는, 하나의 로고 및 추가 정보를 코딩하는 수단(41); 및

- 상기 화상 시퀀스에 관련한 상기 코딩된 데이터 스트림에 하나의 로고에 관련한 코딩된 데이터를 삽입함으로써 상기 화상 시퀀스에 관련한 상기 코딩된 데이터 및 상기 하나의 로고와 관련한 상기 코딩된 데이터를 별도로 포함하는 단일 비디오 데이터 스트림을 생성하는 수단(42)

을 더 포함하는, 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 코딩하는 코딩 디바이스.
제 9 항에 있어서, 상기 하나의 로고에 관련한 상기 코딩된 데이터의 적어도 일부는 부가 개선 정보(SEI) 메시지로서 코딩되는, 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 코딩하는 코딩 디바이스.
MPEG 타입의 신택스(syntax)에 따라 코딩된 데이터의 스트림을 저장하는 컴퓨터 판독가능한 기록 매체로서,

화상 시퀀스에 관련한 코딩된 데이터의 하나의 제 1 부분을 포함하되, SEI 메시지로 불리는 부가 개선 정보 메시지로서 코딩된 로고에 관련한 코딩된 데이터의 제 2 부분을 별도로 포함하는, 컴퓨터 판독가능한 기록 매체.
제 11 항에 있어서,

상기 SEI 메시지는 상기 시퀀스의 화상에서 상기 하나의 로고의 수평 방향으로의 위치 설정에 관련한 하나의 필드, 및 상기 시퀀스의 화상에서 상기 하나의 로고의 수직 방향으로의 위치 설정에 관련한 하나의 필드를 포함하는, 컴퓨터 판독가능한 기록 매체.
적어도 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 디코딩하는 방법으로서,

상기 방법은 상기 화상 시퀀스 및 상기 적어도 하나의 로고에 관련한 코딩된 데이터의 스트림을 디코딩하는 단계를 포함하고,

- 코딩된 데이터의 상기 스트림의 제 1 부분을 디코딩된 화상 시퀀스로 디코딩하는 단계;

- 코딩된 데이터의 상기 스트림의 제 2 부분을 상기 적어도 하나의 로고 및 상기 적어도 하나의 로고에 관련한 추가 정보로 디코딩하는 단계로서, 상기 추가 정보는 상기 디코딩된 화상에서 상기 적어도 하나의 로고의 위치 설정에 관련한 정보를 포함하는, 디코딩 단계; 및

상기 적어도 하나의 로고를 상기 추가 정보에 따라 디코딩된 화상에 삽입하는 단계

를 더 포함하는, 적어도 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 디코딩하는 방법.
제 13 항에 있어서,

상기 제 2 부분의 적어도 일부는 부가 개선 정보 메시지인, 적어도 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 디코딩하는 방법.
제 13 항 또는 제 14 항에 있어서,

상기 적어도 하나의 로고에 관련한 상기 추가 정보는 상기 적어도 하나의 로고의 초기 크기에 관련한 정보를 더 포함하는, 적어도 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 디코딩하는 방법.
제 13 항 또는 제 14 항에 있어서,

상기 적어도 하나의 로고에 관련한 상기 추가 정보는 디스플레이 동안 상기 적어도 하나의 로고의 투명도의 관리를 가능하게 하는 정보를 더 포함하는, 적어도 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 디코딩하는 방법.
제 13 항 또는 제 14 항에 있어서,

상기 적어도 하나의 로고에 관련한 상기 추가 정보는 상기 적어도 하나의 로고에 대한 디스플레이 크기에 관련한 정보를 더 포함하는, 적어도 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 디코딩하는 방법.
제 13 항 또는 제 14 항에 있어서,

상기 적어도 하나의 로고는 상기 적어도 하나의 로고 바로 이전에 디코딩된 랜덤 액세스 포인트에 이어 다음 랜덤 액세스 포인트까지 디코딩된 화상에 삽입되는, 적어도 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 디코딩하는 방법.
적어도 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 디코딩하는 디코딩 디바이스로서,

상기 디코딩 디바이스는 상기 화상 시퀀스 및 상기 적어도 하나의 로고에 관련한 코딩된 데이터의 스트림을 디코딩하는 수단을 포함하고,

- 코딩된 데이터의 상기 스트림의 제 1 부분을 디코딩된 화상 시퀀스로 디코딩하는 수단;

- 코딩된 데이터의 상기 스트림의 제 2 부분을 상기 적어도 하나의 로고 및 상기 적어도 하나의 로고에 관련한 추가 정보로 디코딩하는 수단으로서, 상기 추가 정보는 상기 디코딩된 화상에서 상기 적어도 하나의 로고의 위치 설정에 관련한 정보를 포함하는, 디코딩 수단; 및

상기 적어도 하나의 로고를 상기 추가 정보에 따라 디코딩된 화상에 삽입하는 수단

를 더 포함하는, 적어도 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 디코딩하는 디바이스.
제 19 항에 있어서, 상기 제 2 부분의 적어도 일부는 부가 개선 정보 메시지인, 적어도 하나의 로고 및 화상 시퀀스를 포함하는 비디오 콘텐츠를 디코딩하는 디코딩 디바이스.