KR20050086692A

KR20050086692A - 자막 처리 데이터의 항목들을 코딩/디코딩하는 방법 및장치

Info

Publication number: KR20050086692A
Application number: KR1020057008819A
Authority: KR
Inventors: 해럴드 췰러; 덕 아돌프; 좁스트 호렌트럽; 랄프 오스터맨; 하트머트 피터스
Original assignee: 톰슨 라이센싱 에스.에이.
Priority date: 2002-11-18
Filing date: 2003-11-06
Publication date: 2005-08-30
Also published as: CN1729684A; WO2004047431A1; US20060056819A1; CN100471242C; AU2003293661A1; EP1563677A1; JP2006515965A; EP1420580A1; MXPA05005298A; BR0316338A

Abstract

자막 처리는 픽셀 데이터나 문자 데이터에 기초할 수 있다. 문자 데이터는 아주 효율적인 인코딩을 가능하게 하지만, 문자 스트링들만으로는, 자막 처리가 비디오상에 오버레이될 그래픽 표현으로 전환될 수 없다. 의도적 문자 세트, 폰트 및, 예를 들어, 폰트 사이즈가 자막 처리 비트스트림내에서 명시적으로 코딩되거나 그에 관한 암시적인 가정이 있어야 한다. 픽셀-기반 자막 처리에서는, 자막 처리 프레임들을 AV 스크린상의 픽셀 값들의 (통상적으로 직사각형) 영역들로 기술하는 것에 의해, 자막 처리 데이터를 위해 상당히 증가된 대역폭의 비용을 지불하고, 자막 처리 프레임들이 그래픽 표현들의 형태로 직접 전달된다. 본 발명에 따르면, 글리프들이 한번만 전송되면 되고 그후에는 AV 이벤트 동안의 비교적 간결한 문자 참조들에 의해 참조되기 때문에, 픽셀-기반 자막 처리 레터링의 효율적인 구현을 가능하게 하는 폰트 메모리가 사용된다. 이런 식으로, 본 발명은 순수한 픽셀-기반 및 순수한 문자-기반 자막 처리 방식들의 이점들을 실질적으로 조합하면서, 그들의 개별적인 단점들을 대부분 방지한다.

Description

자막 처리 데이터의 항목들을 코딩/디코딩하는 방법 및 장치 {METHOD AND APPARATUS FOR CODING/DECODING ITEMS OF SUBTITLING DATA}

본 발명은 자막 처리 데이터의 항목들을 코딩/디코딩하는 방법 및 장치에 관한 것으로서, 보다 구체적으로는, 블루레이(Blu-ray) 디스크 광학 저장 및 레코딩을 위한 자막 처리 및 그래픽에 관한 것이다.

미리 기록된 오디오-비주얼(AV;Audio-Visual) 자료에 대한 자막 처리 분야에는, 충돌하는 요구 사항들이 존재한다: 한편으로, 자막 처리 데이터는 효율적으로 인코딩되어야 하는데, 상당량의 자막 처리 서비스가 임의의 소정 AV 자료에 대해 제공되어야 하는 경우에 특히 그러하다. 이 경우에는, 적어도 평균적으로, 매 자막 처리 문자당 소수의 비트들만이 이용 가능할 수 있다.

다른 한편으로, 전문적인 콘텐츠의 소유자들은 스크린상의 자막 처리 문자들의 외관에 대해 완전한 제어를 갖고 싶어하며, 부가적으로, 간단한 페이딩(fading)으로부터 진짜 애니메이션들까지 특수 디스플레이 효과들의 풍성한 세트를 자유롭게 쓸 수 있기를 원한다. 이와 같이 높은 설계 자유도 및 코맨드는 통상적으로 높은 또는 아주 높은 자막 처리 대역폭으로만 실현될 수 있다.

미리-기록된 AV 데이터 신호들을 개개의 자막 처리 정보로 자막 처리하기 위한 현재의 최첨단 기술에는 2가지의 주된 접근 방법들이 존재한다: 자막 처리는 픽셀 데이터나 문자 데이터에 기초할 수 있다. 어느 경우에서든, 자막 처리 방식들은, 예를 들어, AV 시간 축을 따라 자막 처리 요소들의 동기화를 처리하는 일반적인 프레임워크를 구비한다.

문자-기반 자막 처리 접근 방법, 예를 들어, 유럽식의 아날로그 또는 디지털 TV에 대한 TELETEXT 시스템(ETSI: ETS 300 706 Enhanced Teletext specification, May 1997 참고)에서, 스트링들은 레터 코드들, 예를 들어, 본질적으로 아주 효율적인 인코딩을 허용하는, ASCII(ISO/IEC 8859: American Standard Code for Information Interchange - ASCII 참고) 또는 UNICODE(ISO/IEC 10646: Information technology --Universal Multiple-Octet Coded Character Set(UCS) 참고)의 시퀀스들로써 기술된다. 그러나 문자 스트링들만으로는, 자막이, 비디오상에 오버레이될 그래픽 표현으로 변환될 수 없다. 이를 위해서는, 의도적인 문자 세트, 폰트 및 소정의 폰트 파라미터들, 특히 폰트 사이즈가 자막 처리 비트스트림내에서 명시적으로 코딩되거나 적당하게 정의된 자막 처리 문맥내에서 그들에 관한 암시적인 가정이 이루어져야 한다. 또한, 이러한 접근 방법에서의 모든 자막 처리는, 사용되는 특정 폰트 또는 폰트들의 레터들 및 기호들로 표현될 수 있는 것으로 한정된다.

'기본적인 오브젝트, 문자' 또는 '복합 오브젝트, 문자 스트링'의 오브젝트 유형들을 가진 DVB 자막 처리 스펙(ETSI: ETS 300 743 Digital Video Broadcasting (DVB); Subtitling systems, Sep 1997, 및 EP-A-0 745 307: Van der Meer et al, Subtitling transmission system 참고)이 문자-기반 자막 처리에 대한 또 하나의 최신식 일례를 구성한다.

픽셀-기반 자막 처리 접근 방법에서는, 자막 처리 프레임들을 AV 스크린상의 픽셀 값들의 (통상적으로 직사각형) 영역들로 기술하는 것에 의해, 자막 처리 프레임들이 그래픽 표현들의 형태로 직접 전달된다. 비디오상에 겹쳐진 자막 처리 평면에서 무엇인가가 가시화될 때마다 그리고 가시화될 경우에는 언제나, 그것의 픽셀 값들이 인코딩되어, 적절한 동기화 정보와 함께, 자막 처리 비트스트림에 제공되어야 한다. 제3자 정의형 폰트들에 내재된 제한들을 제거하는 것은 분명하지만, 픽셀-기반 접근 방법은 적당한 자막 처리 데이터를 위해 상당히 증가된 대역폭의 패널티를 수반한다. DVD의 '서브-픽쳐(Sub-picture)' 개념(DVD Forum: DVD Specifications for Read-Only Disc / Part 3 Video Specifications / Version 1.0 August 1996 참고) 뿐만 아니라 DVB 자막 처리의 '비트맵 오브젝트' 개념(상술한 ETS 300 743 및 EP-A-0745 307 참고)에서 픽셀-기반 자막 처리 방식들의 예들을 찾아볼 수 있다.

발명의 개요

본 발명에 의해 해결되어야 할 문제는, 필요한 정보를 전달하기 위해 요구되는 데이터량을 크게 증가시키지 않으면서, 문자-기반 자막 처리의 효율적인 인코딩을 픽셀-기반 자막 처리로 실현될 수 있는 자막 처리 문자들의 외관에 대한 완전 제어와 조합하는 것이다. 이 문제는 청구항들(제1항 및 제7항)에 개시되어 있는 방법들에 의해 해결된다. 청구항 제4항에는 제1항의 방법을 이용하는 장치가 개시되어 있다.

본 발명은 픽셀-기반 자막 처리 방식에 기초한다. 이러한 자막 처리 시스템은, 폰트 지원을 다른 픽셀-기반 자막 처리 방식에 포함할 수 있게 하는 몇가지 컴포넌트들을 포함한다. 이러한 폰트 지원은,

a.1) 한 세트의 폰트 문자들을 픽셀 데이터 형태로 효율적으로 기술하기 위한 폰트 기술 데이터(Font Describing Data)용 구조;

a.2) 사용될 소정 폰트를 고유하게 식별하기 위한 폰트 식별 데이터(Font Identification Data)용 구조;

a.3) 전반적인 메모리 영역의 일부로서, 폰트 문자들을 보유하는데 전용되며 AV 출력에 직접적으로 드러나지는 않는, 폰트 메모리를 갖는다는 개념; 및

a.4) 폰트 메모리에 저장되어 있는 폰트 또는 폰트들 중에서 개개의 폰트 문자들을 효율적으로 참조하기 위한 문자 참조 데이터(Character Referencing Data)용 구조를 포함한다.

폰트 기술 데이터 뿐만 아니라 문자 참조 데이터는 AV 데이터와 함께 전송되거나 저장됨으로써 거의 분리될 수 없는 혼합 포맷을 갖거나, 완전히 별개의 전송 채널들 또는 저장 로케이션들을 사용하거나, 또는 양자의 혼합이다. 디코더 측에서, 폰트 기술 데이터는 폰트 메모리로 로딩될 한 세트의 임의적인 문자 글리프들 (glyphs; 문자의 그래픽 표현) 또는 다른 그래픽 구축 블록들을 발생시킨다. 개별적인 각각의 경우에서 사용될 문자 글리프들의 수 및 디자인은 완전히 콘텐츠 제공자의 제어하에 있다.

본 발명에 따르면, 폰트 기술 데이터는, 각각이 폰트의 하나 이상의 문자들에 대한 문자 파라미터 세트들을 구비하는 하나 이상의 문자 파라미터 부분들 및 각각이 폰트의 하나 이상의 문자들에 대한 픽셀 데이터를 구비하는 하나 이상의 문자 픽셀 데이터 부분들로 이루어진다. 문자의 픽셀 데이터는 문자 어레이, 즉, 픽셀 값들의 직사각형 어레이로 표현되는데, 어레이는 문자 특유의 폭과 높이를 가진다. 상기 문자 파라미터 세트들 각각은,

c.1) 문자 어레이의 폭;

c.2) 문자 어레이의 높이;

c.3) 픽셀 데이터를 포함하고 있는 문자 픽셀 데이터 부분에 대한 문자의 픽셀 데이터의 시작 어드레스;

c.4) 어레이의 경계들과 문자 참조 포인트간의 수평 오프셋;

c.5) 경계들과 문자 참조 포인트간의 수직 오프셋; 및

c.6) 문자와 이 문자에 선행하거나 이 문자를 뒤따르는 문자들간의 수평 거리를 기술하는 수평 증분의 임의 조합을 포함한다.

폰트 메모리의 창의적인 사용은, 글리프들이 한번만 전송되면 되고 그후에는 AV 이벤트 동안의 비교적 간결한 참조 문자들에 의해 참조되기 때문에, 픽셀-기반 자막 처리 레터링의 효율적인 구현을 제공한다.

한편, 글리프들은 픽셀-기반 형태로 효과적으로 제공되기 때문에, 자막 처리의 외관은 전체적으로 콘텐츠 제공자의 제어하에 놓이게 되고, 문자-기반 방식들에 통상적으로 수반되는, 폰트 식별, 폰트 선택, 폰트의 파라미터화, 및 문자 렌더링의 모든 문제들이 바람직하게 방지된다.

이런 식으로, 본 발명은 순수한 픽셀-기반 및 순수한 문자-기반 자막 처리 방식들의 이점들을 실질적으로 조합하면서, 그들의 개별적인 단점들을 대부분 극복한다.

기본적으로, 본 발명의 방법은 자막 처리 데이터의 항목들을 디코딩하기에 적합하고,

- 비디오 또는 오디오-비주얼 데이터 신호의 대응되는 부분들과 관련되어 있으며, 문자들의 시퀀스들 뿐만 아니라 디스플레이 메모리를 이용하여 참조 문자들을 가시화하는 시간 및/또는 방법 및/또는 상기 데이터 신호의 픽쳐들에서의 위치에 관한 정보를 기술하는, 문자 참조 데이터의 항목들을 검색하는 단계;

- 상기 문자 참조 데이터의 항목들로부터 문자 선택 정보 및 문자 배치 정보의 항목들을 도출하는 단계;

- 폰트 메모리로부터 상기 문자 선택 정보의 항목들에 의해 지시되는 상기 참조 문자들의 픽셀 데이터를 판독하는 단계; 및

- 상기 픽셀 데이터를 상기 문자 배치 정보의 항목들에 의해 지시되는 상기 디스플레이 메모리에 기입하는 단계를 포함한다.

기본적으로, 본 발명의 장치는 자막 처리 데이터의 항목들을 디코딩하기에 적합하고,

- 비디오 또는 오디오-비주얼 데이터 신호의 대응되는 부분들과 관련되어 있으며, 문자들의 시퀀스들 뿐만 아니라 디스플레이 메모리를 사용해 참조 문자들을 가시화해야 할 상기 데이터 신호의 픽쳐들에서의 장소 및/또는 시간 및/또는 방법에 관한 정보를 기술하는, 문자 참조 데이터의 항목들을 검색하기 위한 수단; 및

- 상기 문자 참조 데이터의 항목들로부터 문자 선택 정보 및 문자 배치 정보의 항목들을 도출하고;

폰트 메모리로부터 상기 문자 선택 정보의 항목들에 의해 지시되는 상기 참조 문자들의 픽셀 데이터를 판독하며;

상기 픽셀 데이터를 상기 문자 배치 정보의 항목들에 의해 지시되는 상기 디스플레이 메모리에 기입하기 위한 수단을 포함한다.

개개의 종속 청구항들에, 본 발명의 바람직한 추가적 실시예들이 개시되어 있다.

도 1 본 발명의 데이터 구조;

도 2 본 발명의 자막 처리 시스템의 블록도; 및

도 3 'font_id'를 DVD-ST 'object_data_segment'에 매입하기 위한 예시적인 데이터 구조를 나타내는, 첨부된 도면들을 참조하여 본 발명의 실시예들을 설명한다.

실시예들

도 1에 도시되어 있는 바와 같이, 폰트 기술 데이터(102) 뿐만 아니라 문자 참조 데이터(103)는 관련 AV 데이터(101)와 함께 전송, 저장, 또는 기록됨으로써, 전송 또는 저장은 거의 분리될 수 없는 혼합과 완전 별개의 전송 채널들 또는 저장 로케이션들의 사용간의 어떤 것일 수 있다.

디코더 측에서는, 도 2에 나타낸 바와 같이, 자막 처리 스트림(201)이 데이터 분리 수단(202)을 통과하는데, 데이터 분리 수단(202)은 문자 참조 데이터(203) 및 폰트 기술 데이터(204)를 제공한다. 폰트 기술 데이터를 프로세싱 수단으로 전달함으로써, 폰트 기술 데이터(204)는 폰트 메모리(208)로 로딩될 한 세트의 임의적인 문자 글리프들 또는 다른 그래픽 구축 블록들을 발생시킨다.

바람직하게도, 각각의 개별적인 사용 상황에서 사용될 문자 글리프들의 수 및 디자인은 완전히 콘텐츠 제공자의 제어하에 있다.

선택적으로, 이와 같이 기술되어 폰트 메모리(208)로 로딩되는 폰트에 대해, 상술한 폰트 식별 데이터가 관련될 수 있다.

문자 참조 데이터(203)는 문자 참조 데이터 프로세싱 수단(206)으로 하여금 문자 기술 데이터(209)로 지시된 문자 글리프들 세트의 개별적인 서브세트들을 폰트 메모리(208)로부터, 전반적인 시스템 메모리의 일부일 수 있는, 디스플레이 메모리(207)로 카피하게 한다. 디스플레이 메모리(207)의 콘텐츠는 비디오상에 오버레이되어 가시적인 자막으로 된다.

선택적으로, 문자 참조 데이터는 폰트 식별 데이터에 대한 참조들을 포함함으로써, 자막 처리 디코더로 하여금, 특정 자막 처리 스트림을 렌더링하는데 필요한 폰트가 여전히 폰트 메모리(208)로 로딩되어야 하는지, 아니면 이미 즉시 이용 가능한 상태인지 여부를 판단하게 할 수 있다.

제안된 자막 처리 시스템의 가능한 용도들 및 동작 모드들은,

b.1) 긴 AV 프로그램 전체에 걸쳐 사용하기 위한 하나 이상 폰트의 미리-로딩;

b.2) 레터들 중 하나 이상에 대한 하나 이상의 변화를 포함하는 폰트들의 사용으로써, 하부 픽셀의 정확한 레터 배치 또는 강조 (볼드/이탤릭) 지원을 포함하지만 이에 한정되지 않는 폰트들의 사용; 및

b.3) 예를 들어, 아시아 폰트들과 같이, 큰 폰트들의 드문 서브세트들이 사용되는 경우들에서의 AV 자료의 일부분들(예를 들어, 무비 챕터들)에 대한 폰트 서브세트들의 로딩 중 하나를 포함하지만, 이에 한정되는 것은 아니다.

폰트 기술 데이터의 부가적인 구조를 위해, 특정 실시예의 몇가지 변경예들이 다음과 같이 제안된다.

제 1 변경예에서는, 폰트가, 개개의 문자들이 가변 폭을 갖는 비례 폰트라면, 모든 문자 어레이들은 외관상 균일한 폭이 되도록 수평적으로 늘여지고, 늘여진 결과적 문자 어레이들은 폰트 어레이로 수직적으로 연결된다. 다음으로, 폰트 어레이는 관용적인 방식으로 라인-스캐닝되어 단일 문자 픽셀 데이터 부분을 형성한다.

다른 변경예에서는, 모든 문자 어레이들은 외관상 균일한 높이가 되도록 수직적으로 늘여지고, 늘여진 결과적 문자 어레이들은 폰트 어레이로 수평적으로 연결된다. 다음으로, 폰트 어레이는 단일 문자 픽셀 데이터 부분으로 관용적인 방식으로 라인-스캐닝된다.

상기 양자 변경예 모두의 경우, 단일 문자 픽셀 데이터 부분에는 폰트의 모든 문자들에 대한 문자 파라미터 세트들을 구비하는 단일 문자 파라미터 부분이 선행된다.

또 다른 변경예에서는, 폰트의 모든 문자들에 대해, 문자 파라미터 세트들 및 문자 어레이들을 교대로 연결하는 것에 의해, 폰트 기술 데이터가 생성된다.

또 다른 변경예에서는, 먼저 모든 문자 파라미터 세트들을 단일 문자 파라미터 부분으로 연결하고 그 부분에 모든 문자 어레이들을 구비하는 단일 문자 픽셀 데이터 부분을 첨부하는 것에 의해, 폰트 기술 데이터가 생성된다.

상기한 모든 변경들을 선택적으로 확장할 수 있는, 또 다른 변경예에서는, UNICODE(ISO/IEC 10646: Information technology -- Universal Multiple-Octet Coded Character Set(UCS) 참고) 코드가 폰트의 일부 문자들 또는 모든 문자들과 관련되어, UNICODE 코드가, 문제의 문자와 관련되어 있는 폰트 기술 데이터의 그 부분내의 식별 가능한 위치에 삽입되고 포함된다.

상기한 모든 변경들을 선택적으로 확장할 수 있는, 또 다른 변경에서는, 비-반복적인 문자 식별자가 폰트의 모든 문자와 관련되어, 식별자가, 문제의 문자와 관련되어 있는 폰트 기술 데이터의 그 부분내의 식별 가능한 위치에 삽입되고 포함된다.

상기한 모든 변경들에서, 폰트 기술 데이터는,

d.1) 매 데이터 항목당 하나의 코드 워드를 사용해 직접적으로 전송되거나,

d.2) 런 길이 코딩(runlength coding)에 의해 압축되거나,

d.3) PNG(W3C recommendation, PNG(Portable Network Graphics) Specification, Version 1. 0, 1996, http://www.w3.org/TR/REC-png.pdf 참고)에서 사용된 'zlib' 방법과 같은 무손실 압축을 위한 다른 방법들에 의해 압축될 수 있다.

폰트 식별 데이터의 구조를 위해, 특정 실시예의 몇가지 변경들이 다음과 같이 제안된다. 제 1 변화에서는, 폰트 식별 데이터 구조가 'PFR(Portable Font Resource)' 시스템(Bitstream Inc.: TrueDoc PER Specification, http://www.bitstream.com/pfrspec/index. html 참고)에서 정의된 'font_id'로서 구현된다.

다른 변경예에서는, PFR 'font_id' 형태의 폰트 식별 데이터 구조가, 도 3에 도시된 바와 같은 데이터 구조를 사용해, 상술된 DVB 자막 처리 시스템으로 구현된다.

또 다른 변경예에서는, 폰트 식별 데이터 구조가 (ISO/IEC 11578: 1996, Information technology - Open Systems Interconnection - Remote Procedure Call(RPC)의 UUID)에서 정의된 "UUI(Universally Unique Identifier)"로서 구현된다.

본 발명의 맥락에서, 문자 참조 데이터는, 그룹 배치 데이터가 각각 수반되는 하나 이상의 문자 참조 그룹들의 시퀀스로 이루어지고, 각각의 문자 참조 그룹은, 문자 배치 데이터가 각각 수반되는 하나 이상의 참조 문자들의 시퀀스로 이루어진다.

그룹 배치 데이터는 바람직하게도,

e.1) 비디오 이미지의 원점에 상대적인 그룹 참조 포인트의 절대적 수평 및 수직 좌표들;

e.2) 이전 문자 참조 그룹의 그룹 참조 포인트에 상대적인 상대적 수평 및 수직 좌표들; 및

e.3) 상술된 여타 참조 포인트에 상대적인 상대적 수평 및 수직 좌표들 중 하나로서 구현될 수 있다.

참조 문자들은 바람직하게도,

f.1) 폰트 기술 데이터내의 지시된 문자에 대한 암시적 위치를 의미하는 문자 인덱스들;

f.2) 임의 종류의 명확한 문자 식별자들;

f.3) ASCII 코드들이 문자들에 대해 명확하게 할당되었다면, ASCII 코드들; 및

f.4) UNICODE 코드들이 문자들에 대해 명확하게 할당되었다면, UNICODE 코드들 중 하나로서 구현될 수 있다.

문자 배치 데이터는 바람직하게도,

g.1) 개별적인 추가적 문자 배치 데이터가 불필요한 자동 진행(automatic advance)으로서, 이전 문자에 대한 문자 참조 포인트의 위치로부터 그리고 문제의 문자에 대한 수평 증분으로부터 추론될 수 있는, 자동 진행;

g.2) 문자 위치 오프셋 데이터를 가진 자동 진행으로서, 이 경우, 문자의 수평 뿐만 아니라 수직 위치를 위해, 이전 문자에 대한 문자 참조 포인트의 위치로부터 그리고 문제의 문자에 대한 수평 증분으로부터 추론된 제 1 값은 문자 배치 데이터에서 개별적으로 기술되는 제 2 값과 가산되는, 자동 진행;

g.3) 이전 문자에 대한 문자 참조 포인트와 관련하여 적용되는 상대적 문자 배치 데이터; 및

g.4) 비디오 이미지의 원점과 관련하여 적용되는 절대적 문자 배치 데이터 중 하나로서 구현될 수 있다.

Claims

자막 처리 데이터의 항목들을 디코딩하는 방법으로서,

비디오 또는 오디오- 비주얼 데이터 신호(101)의 대응되는 부분들과 관련되어 있으며, 문자들의 시퀀스들 뿐만 아니라 디스플레이 메모리(207)를 이용하여 참조 문자들을 가시화하는 시간 및/또는 방식 및/또는 상기 데이터 신호의 픽쳐들에서의 위치에 관한 정보를 기술하는, 문자 참조 데이터의 항목들(103, 203)을 검색하는 단계(202)와,

상기 문자 참조 데이터의 항목들(103, 203)로부터 문자 선택 정보 및 문자 배치 정보의 항목들을 도출하는 단계(206)와,

폰트 메모리로(208)부터 상기 문자 선택 정보의 항목들에 의해 지시되는 상기 참조 문자들의 픽셀 데이터를 판독하는 단계(206)와,

상기 픽셀 데이터를 상기 문자 배치 정보의 항목들에 의해 지시되는 상기 디스플레이 메모리(207)에 기입하는 단계

를 포함하는 디코딩 방법.
제 1 항에 있어서,

상기 문자 참조 데이터의 항목들(103, 203) 중 대응되는 것들에 관련된 폰트 기술 데이터의 항목들(102, 204)을 검색하는 단계(202)와,

상기 폰트 기술 데이터의 항목들을 상기 폰트 메모리(208)에 기입하는 단계(205)가,

상기 문자 참조 데이터의 항목들(103, 203)을 검색하는 단계 이전에 수행되는 디코딩 방법.
제1 항 또는 제2 항에 있어서,

상기 문자 기술 데이터의 항목들(103, 203)을 검색하는 단계 후,

상기 참조 문자들의 상기 픽셀 데이터가 이미 상기 폰트 메모리(208)에 저장되어 있는지의 여부를 점검하는 단계(208)와,

상기 픽셀 데이터가 상기 폰트 메모리에 저장되어 있지 않다면, 상기 참조 문자들을 포함하는 폰트 기술 데이터의 이러한 항목들(102, 204)을 검색하는 단계(202)와,

상기 폰트 기술 데이터의 항목들을 상기 폰트 메모리(208)에 기입하는 단계

를 수행하는 디코딩 방법.
자막 처리 데이터의 항목들을 디코딩하는 장치로서,

비디오 또는 오디오-비주얼 데이터 신호(101)의 대응되는 부분들과 관련되어 있으며, 문자들의 시퀀스들 뿐만 아니라 디스플레이 메모리(207)를 이용하여 참조 문자들을 가시화하는 시간 및/또는 방법 및/또는 상기 데이터 신호의 픽쳐들에서의 위치에 관한 정보를 기술하는, 문자 참조 데이터의 항목들(103, 203)을 검색하는 수단(202)과,

상기 문자 참조 데이터의 항목들(103, 203)로부터 문자 선택 정보 및 문자 배치 정보의 항목들을 도출하고, 폰트 메모리로(208)부터 상기 문자 선택 정보의 항목들에 의해 지시되는 상기 참조 문자들의 픽셀 데이터를 판독하며, 상기 픽셀 데이터를 상기 문자 배치 정보의 항목들에 의해 지시되는 상기 디스플레이 메모리(207)에 기입하는 수단

을 포함하는 디코딩 장치.
제4 항에 있어서,

상기 검색하는 수단(202)은, 상기 문자 참조 데이터의 항목들(103, 203)을 검색하기 전에, 상기 문자 참조 데이터의 항목들(103, 203) 중 대응되는 것들에 관련된 폰트 기술 데이터의 항목들(102, 204)을 검색하고,

상기 디코딩 장치는,

상기 폰트 기술 데이터의 항목들을 상기 폰트 메모리(208)에 기입하는 수단(205)을 더 포함하는 디코딩 장치.
제4 항 또는 제5 항에 있어서,

상기 문자 기술 데이터의 항목들(103, 203)을 검색한 후에, 상기 참조 문자들의 상기 픽셀 데이터가 이미 상기 폰트 메모리(208)에 저장되어 있는지의 여부를 점검하는 수단을 더 포함하고,

상기 픽셀 데이터가 상기 폰트 메모리에 저장되어 있지 않다면, 상기 참조 문자들을 포함하는 폰트 기술 데이터의 이러한 항목들(102, 204)이 검색되어 상기 폰트 메모리(208)에 기입되는 디코딩 수단.
자막 처리 데이터를 인코딩하는 방법으로서,

비디오 또는 오디오-비주얼 데이터 신호(101)에 문자 참조 데이터의 항목들(103, 203) 및 폰트 기술 데이터의 항목들(102, 204)을 포함하는 관련된 자막 처리 데이터를 첨부하는 단계를 포함하며,

그에 의해, 상기 문자 참조 데이터의 항목들(103, 203)은, 문자들의 시퀀스들 뿐만 아니라 디스플레이 메모리(207)를 이용하여 참조 문자들을 가시화하는 시간 및/또는 방법 및/또는 상기 데이터 신호의 픽쳐들에서의 위치에 관한 정보를 기술하고,

상기 문자 참조 데이터의 항목들(103, 203)은 문자 선택 정보 및 문자 배치 정보의 항목들을 포함하며,

상기 문자 선택 정보의 항목들은 자막 처리 디코더에서 폰트 메모리로부터 상기 참조 문자들의 픽셀 데이터를 판독하는데 사용될 수 있고, 상기 문자 배치 정보의 항목들은 상기 자막 처리 디코더에서 상기 픽셀 데이터를 상기 디스플레이 메모리에 기입하는데 사용될 수 있으며,

그에 의해, 상기 폰트 기술 데이터의 항목들(102, 204)은, 상기 참조 문자들의 상기 픽셀 데이터가 상기 폰트 메모리에 이미 저장되어 있는지의 여부를 점검하고, 그렇지 않다면, 상기 참조 문자들을 포함하는 폰트 기술 데이터의 이러한 항목들(102, 204)을 검색하여 상기 폰트 기술 데이터의 항목들을 상기 폰트 메모리에 기입하기 위해, 상기 자막 처리 디코더의 상기 폰트 메모리에 기입될 수 있는 인코딩 방법.
비디오 또는 오디오-비주얼 데이터 신호(101) 및 제7 항에 따른 방법을 사용해 디코딩되는 관련 자막 처리 데이터를 포함하는 데이터 캐리어.